python中BackgroundScheduler和BlockingScheduler的區別
APScheduler最基本的用法: “定時幾秒後啟動job”
兩種調度器: BackgroundScheduler和BlockingScheduler的區別,
job執行時間大於定時調度時間特殊情況的問題及解決方法
每個job都會以thread的方式被調度。
1、基本的定時調度
APScheduler是python的一個定時任務調度框架,能實現類似linux下crontab類型的任務,使用起來比較方便。它提供基於固定時間間隔、日期以及crontab配置類似的任務調度,並可以持久化任務,或將任務以daemon方式運行。
下面是一個最基本的使用示例:
from apscheduler.schedulers.blocking import BlockingScheduler def job(): print('job 3s') if __name__=='__main__': sched = BlockingScheduler(timezone='MST') sched.add_job(job, 'interval', id='3_second_job', seconds=3) sched.start()
它能實現每隔3s就調度job()運行一次,所以程序每隔3s就輸出’job 3s’。通過修改add_job()的參數seconds,就可以改變任務調度的間隔時間。
2、BlockingScheduler與BackgroundScheduler區別
APScheduler中有很多種不同類型的調度器,BlockingScheduler與BackgroundScheduler是其中最常用的兩種調度器。那他們之間有什麼區別呢? 簡單來說,區別主要在於BlockingScheduler會阻塞主線程的運行,而BackgroundScheduler不會阻塞。所以,我們在不同的情況下,選擇不同的調度器:
BlockingScheduler: 調用start函數後會阻塞當前線程。當調度器是你應用中唯一要運行的東西時(如上例)使用。
BackgroundScheduler: 調用start後主線程不會阻塞。當你不運行任何其他框架時使用,並希望調度器在你應用的後臺執行。
下面用兩個例子來更直觀的說明兩者的區別。
BlockingScheduler例子
from apscheduler.schedulers.blocking import BlockingScheduler import time def job(): print('job 3s') if __name__=='__main__': sched = BlockingScheduler(timezone='MST') sched.add_job(job, 'interval', id='3_second_job', seconds=3) sched.start() while(True): # 不會被執行到 print('main 1s') time.sleep(1)
運行這個程序,我們得到如下的輸出:
job 3s
job 3s
job 3s
job 3s
可見,BlockingScheduler調用start函數後會阻塞當前線程,導致主程序中while循環不會被執行到。
BackgroundScheduler例子
from apscheduler.schedulers.background import BackgroundScheduler import time def job(): print('job 3s') if __name__=='__main__': sched = BackgroundScheduler(timezone='MST') sched.add_job(job, 'interval', id='3_second_job', seconds=3) sched.start() while(True): print('main 1s') time.sleep(1)
可見,BackgroundScheduler調用start函數後並不會阻塞當前線程,所以可以繼續執行主程序中while循環的邏輯。
main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
job 3s
通過這個輸出,我們也可以發現,調用start函數後,job()並不會立即開始執行。而是等待3s後,才會被調度執行。
如何讓job在start()後就開始運行
如何才能讓調度器調用start函數後,job()就立即開始執行呢?
其實APScheduler並沒有提供很好的方法來解決這個問題,但有一種最簡單的方式,就是在調度器start之前,就運行一次job(),如下
from apscheduler.schedulers.background import BackgroundScheduler import time def job(): print('job 3s') if __name__=='__main__': job() # 執行一次就好瞭喲 sched = BackgroundScheduler(timezone='MST') sched.add_job(job, 'interval', id='3_second_job', seconds=3) sched.start() while(True): print('main 1s') time.sleep(1)
這樣就能得到如下的輸出
job 3s
main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
這樣雖然沒有絕對做到“讓job在start()後就開始運行”,但也能做到“不等待調度,而是剛開始就運行job”。
如果job執行時間過長會怎麼樣
如果執行job()的時間需要5s,但調度器配置為每隔3s就調用一下job(),會發生什麼情況呢?我們寫瞭如下例子:
from apscheduler.schedulers.background import BackgroundScheduler import time def job(): print('job 3s') time.sleep(5) if __name__=='__main__': sched = BackgroundScheduler(timezone='MST') sched.add_job(job, 'interval', id='3_second_job', seconds=3) sched.start() while(True): print('main 1s') time.sleep(1)
運行這個程序,我們得到如下的輸出:
main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
Execution of job “job (trigger: interval[0:00:03], next run at: 2018-05-07 02:44:29 MST)” skipped: maximum number of running instances reached (1)
main 1s
main 1s
main 1s
job 3s
main 1s
可見,3s時間到達後,並不會“重新啟動一個job線程”,而是會跳過該次調度,等到下一個周期(再等待3s),又重新調度job()。
為瞭能讓多個job()同時運行,我們也可以配置調度器的參數max_instances,如下例,我們允許2個job()同時運行:
from apscheduler.schedulers.background import BackgroundScheduler import time def job(): print('job 3s') time.sleep(5) if __name__=='__main__': job_defaults = { 'max_instances': 2 } sched = BackgroundScheduler(timezone='MST', job_defaults=job_defaults) sched.add_job(job, 'interval', id='3_second_job', seconds=3) sched.start() while(True): print('main 1s') time.sleep(1)
運行程序,我們得到如下的輸出:
main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
job 3s
每個job是怎麼被調度的
通過上面的例子,我們發現,調度器是定時調度job()函數,來實現調度的。
那job()函數會被以進程的方式調度運行,還是以線程來運行呢?
為瞭弄清這個問題,我們寫瞭如下程序:
from apscheduler.schedulers.background import BackgroundScheduler import time,os,threading def job(): print('job thread_id-{0}, process_id-{1}'.format(threading.get_ident(), os.getpid())) time.sleep(50) if __name__=='__main__': job_defaults = { 'max_instances': 20 } sched = BackgroundScheduler(timezone='MST', job_defaults=job_defaults) sched.add_job(job, 'interval', id='3_second_job', seconds=3) sched.start() while(True): print('main 1s') time.sleep(1)
運行程序,我們得到如下的輸出:
main 1s
main 1s
main 1s
job thread_id-10644, process_id-8872
main 1s
main 1s
main 1s
job thread_id-3024, process_id-8872
main 1s
main 1s
main 1s
job thread_id-6728, process_id-8872
main 1s
main 1s
main 1s
job thread_id-11716, process_id-8872
可見,每個job()的進程ID都相同,但線程ID不同。所以,job()最終是以線程的方式被調度執行。
到此這篇關於python中BackgroundScheduler和BlockingScheduler的區別 的文章就介紹到這瞭,更多相關python BackgroundScheduler BlockingScheduler內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python定時庫Apscheduler的簡單使用
- 詳解Python利用APScheduler框架實現定時任務
- python定時任務apscheduler的詳細使用教程
- python中進程間通信及設置狀態量控制另一個進程
- Python實現釘釘/企業微信自動打卡的示例代碼