Python使用定時調度任務的方式
摘要:
今天構建的大多數應用程序都需要某種方式的調度機制。輪詢 API 或數據庫、不斷檢查系統健康狀況、將日志存檔等是常見的例子。 Kubernetes
和Apache Mesos
等使用自動伸縮擴容技術(Auto-scaling
)的軟件需要檢查部署的應用程序的狀態,為此它們使用定期運行的存活探針(Liveness Probe
)。調度任務需要與業務邏輯解耦,因此我們要使用解耦的執行隊列,例如Redis
隊列。
Python
有幾種方法可以定時調度一個任務,這就是我們將在本文中學習的內容。我將使用以下方式討論調度任務:
- 簡單循環 (
Simple Loops
) - 簡單循環但是使用瞭線程 (
Simple Loops but Threaded
) - 調度庫 (
Schedule Library
) Python Crontab
- RQ 調度器作為解耦隊列 (
RQ Scheduler as decoupled queues
)
1、簡單循環 Simple loops
使用簡單循環來實現調度任務這是毫不費力的。使用無限運行的 while
循環定期調用函數可用於調度作業,但這不是最好的方法,不過它是很有效的。可以使用內置time模塊的slleep()
來延遲執行。不過這並不是大多數作業的調度方式,因為,它看起來很難看,而且與其他方法相比,它的可讀性較差。
import time def task(): print("Job Completed!") while 1: task() time.sleep(10)
當涉及到每天早上 9:00 或每周三晚上 7:45 等這些日程安排時,事情就變得比較棘手瞭。
import datetime def task(): print("Job Completed!") while 1: now = datetime.datetime.now() # schedule at every wednesday,7:45 pm if now.weekday == 3 and now.strftime("%H:%m") == "19:45": task() # sleep for 6 days time.sleep(6 * 24 * 60 * 60)
這是我的第一時間想到的解決辦法,不用謝!這種方法的一個問題是這裡的邏輯是阻塞的,即一旦在 python
項目中發現這段代碼,它就會卡在 while 1 循環中,從而阻塞其他代碼的執行。
2、簡單循環但是使用瞭線程Simple loops but threaded
線程是計算機科學中的一個概念。具有自己指令的小程序由進程執行並獨立管理,這就可以解決我們第一種方法的阻塞情況,讓我們看看怎麼樣。
import time import threading def task(): print("Job Completed!") def schedule(): while 1: task() time.sleep(10) # makes our logic non blocking thread = threading.Thread(target=schedule) thread.start()
線程啟動後,其底層邏輯無法被主線程修改,因此我們可能需要添加資源,程序通過這些資源可以檢查特定場景並根據它們執行邏輯。
3、定時調度庫 Schedule Library
早些時候,我說使用 while
循環進行調度看起來很醜陋,調度庫可以解決這個問題。
import schedule import time def task(): print("Job Executing!") # for every n minutes schedule.every(10).minutes.do(task) # every hour schedule.every().hour.do(task) # every daya at specific time schedule.every().day.at("10:30").do(task) # schedule by name of day schedule.every().monday.do(task) # name of day with time schedule.every().wednesday.at("13:15").do(task) while True: schedule.run_pending() time.sleep(1)
正如您所見,通過這樣我們可以毫不費力地創建多個調度計劃。我特別喜歡創建作業的方式和方法鏈(Method Chaining
),另一方面,這個片段有一個 while
循環,這意味著代碼被阻塞,不過我相信你已經知道什麼可以幫助我們解決這個問題。
4、Python Crontab
Liunx
中的 crontab
實用程序是一種易於使用且被廣泛接受的調度解決方案。Python
庫python-crontab
提供瞭一個 API 來使用 Python
中的 CLI
工具。在crontab
中,一個定時調度使用 unix-cron
字符串格式( *)來描述,它是一組五個值的一條線,這表明當作業應該被執行時,python-crontab
將在文件中寫入 crontab
的計劃轉換為寫入編程方法。
from crontab import CronTab cron = CronTab(user='root') job = cron.new(command='my_script.sh') job.hour.every(1) cron.write()
python-crontab
不會自動保存計劃,需要執行 write()
方法來保存計劃。還有更多功能,我強烈建議您查看他們的文檔。
5、RQ 調度器 RQ Scheduler
有些任務不能立即執行,因此我們需要根據 LIFO
或 FIFO
等隊列系統創建任務隊列並彈出任務。python-rq
允許我們做到這一點,使用 Redis
作為代理來排隊作業。新作業的條目存儲為帶有信息的哈希映射,例如created_at
, enqueued_at
, origin
, data
, description
.
排隊任務由名為 worker
的程序執行。workers
在 Redis
緩存中也有一個條目,負責將任務出列以及更新 Redis 中的任務狀態。任務可以在需要時排隊,但要安排它們,我們需要rq-scheduler
。
from rq_scheduler import Scheduler queue = Queue('circle', connection=Redis()) scheduler = Scheduler(queue=queue) scheduler.schedule( scheduled_time=datetime.utcnow(), # Time for first execution, in UTC timezone func=func, # Function to be queued args=[arg1, arg2], # Arguments passed into function when executed kwargs={'foo': 'bar'}, # Keyword arguments passed into function when executed interval=60, # Time before the function is called again, in seconds repeat=None, # Repeat this number of times (None means repeat forever) meta={'foo': 'bar'} # Arbitrary pickleable data on the job itself )
RQ worker
(RQ 工作器)必須在終端中單獨啟動或通過 python-rq
工作器啟動。一旦任務被觸發,就可以在工作終端中看到,在成功和失敗場景中都可以使用單獨的函數回調。
6、總結 Conclusion
還有一些用於調度的庫,但在這裡,我已經討論瞭最常見的庫。值得一提的是Celery
,celery
的另一個優點是用戶可以在多個代理之間進行選擇。我很感激你讀到最後。也可以看看我的其他文章。幹杯!
到此這篇關於Python使用定時調度任務的方式的文章就介紹到這瞭,更多相關Python使用定時調度任務方式內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Django定時任務Django-crontab的使用詳解
- 詳解Python利用APScheduler框架實現定時任務
- Python定時庫Apscheduler的簡單使用
- Python Celery定時任務詳細講解
- Windows自動執行python腳本操作步驟