python中BackgroundScheduler和BlockingScheduler的區別

Posted on 2021-07-28 by WalkonNet

1、基本的定時調度

APScheduler是python的一個定時任務調度框架，能實現類似linux下crontab類型的任務，使用起來比較方便。它提供基於固定時間間隔、日期以及crontab配置類似的任務調度，並可以持久化任務，或將任務以daemon方式運行。

下面是一個最基本的使用示例：

from apscheduler.schedulers.blocking import BlockingScheduler

def job():
    print('job 3s')

if __name__=='__main__':
    sched = BlockingScheduler(timezone='MST')
    sched.add_job(job, 'interval', id='3_second_job', seconds=3)
    sched.start()

它能實現每隔3s就調度job()運行一次，所以程序每隔3s就輸出’job 3s’。通過修改add_job()的參數seconds，就可以改變任務調度的間隔時間。

2、BlockingScheduler與BackgroundScheduler區別

APScheduler中有很多種不同類型的調度器，BlockingScheduler與BackgroundScheduler是其中最常用的兩種調度器。那他們之間有什麼區別呢？簡單來說，區別主要在於BlockingScheduler會阻塞主線程的運行，而BackgroundScheduler不會阻塞。所以，我們在不同的情況下，選擇不同的調度器：

BlockingScheduler: 調用start函數後會阻塞當前線程。當調度器是你應用中唯一要運行的東西時（如上例）使用。
BackgroundScheduler: 調用start後主線程不會阻塞。當你不運行任何其他框架時使用，並希望調度器在你應用的後臺執行。
下面用兩個例子來更直觀的說明兩者的區別。

BlockingScheduler例子

from apscheduler.schedulers.blocking import BlockingScheduler
import time

def job():
    print('job 3s')


if __name__=='__main__':

    sched = BlockingScheduler(timezone='MST')
    sched.add_job(job, 'interval', id='3_second_job', seconds=3)
    sched.start()

    while(True): # 不會被執行到
        print('main 1s')
        time.sleep(1)

運行這個程序，我們得到如下的輸出：

job 3s
job 3s
job 3s
job 3s

可見，BlockingScheduler調用start函數後會阻塞當前線程，導致主程序中while循環不會被執行到。

BackgroundScheduler例子

from apscheduler.schedulers.background import BackgroundScheduler
import time

def job():
    print('job 3s')


if __name__=='__main__':

    sched = BackgroundScheduler(timezone='MST')
    sched.add_job(job, 'interval', id='3_second_job', seconds=3)
    sched.start()

    while(True):
        print('main 1s')
        time.sleep(1)

可見，BackgroundScheduler調用start函數後並不會阻塞當前線程，所以可以繼續執行主程序中while循環的邏輯。

main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
job 3s

通過這個輸出，我們也可以發現，調用start函數後，job()並不會立即開始執行。而是等待3s後，才會被調度執行。
如何讓job在start()後就開始運行
如何才能讓調度器調用start函數後，job()就立即開始執行呢？

其實APScheduler並沒有提供很好的方法來解決這個問題，但有一種最簡單的方式，就是在調度器start之前，就運行一次job()，如下

from apscheduler.schedulers.background import BackgroundScheduler
import time

def job():
    print('job 3s')


if __name__=='__main__':
    job() # 執行一次就好瞭喲
    sched = BackgroundScheduler(timezone='MST')
    sched.add_job(job, 'interval', id='3_second_job', seconds=3)
    sched.start()

    while(True):
        print('main 1s')
        time.sleep(1)

這樣就能得到如下的輸出

job 3s
main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s

這樣雖然沒有絕對做到“讓job在start()後就開始運行”，但也能做到“不等待調度，而是剛開始就運行job”。

如果job執行時間過長會怎麼樣
如果執行job()的時間需要5s，但調度器配置為每隔3s就調用一下job()，會發生什麼情況呢？我們寫瞭如下例子：

from apscheduler.schedulers.background import BackgroundScheduler
import time

def job():
    print('job 3s')
    time.sleep(5)

if __name__=='__main__':

    sched = BackgroundScheduler(timezone='MST')
    sched.add_job(job, 'interval', id='3_second_job', seconds=3)
    sched.start()

    while(True):
        print('main 1s')
        time.sleep(1)

運行這個程序，我們得到如下的輸出：

main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
Execution of job “job (trigger: interval[0:00:03], next run at: 2018-05-07 02:44:29 MST)” skipped: maximum number of running instances reached (1)
main 1s
main 1s
main 1s
job 3s
main 1s

可見，3s時間到達後，並不會“重新啟動一個job線程”，而是會跳過該次調度，等到下一個周期（再等待3s），又重新調度job()。

為瞭能讓多個job()同時運行，我們也可以配置調度器的參數max_instances，如下例，我們允許2個job()同時運行：

from apscheduler.schedulers.background import BackgroundScheduler
import time

def job():
    print('job 3s')
    time.sleep(5)

if __name__=='__main__':
    job_defaults = { 'max_instances': 2 }
    sched = BackgroundScheduler(timezone='MST', job_defaults=job_defaults)
    sched.add_job(job, 'interval', id='3_second_job', seconds=3)
    sched.start()

    while(True):
        print('main 1s')
        time.sleep(1)

運行程序，我們得到如下的輸出：

main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
job 3s
main 1s
main 1s
main 1s
job 3s

每個job是怎麼被調度的

通過上面的例子，我們發現，調度器是定時調度job()函數，來實現調度的。

那job()函數會被以進程的方式調度運行，還是以線程來運行呢？

為瞭弄清這個問題，我們寫瞭如下程序：

from apscheduler.schedulers.background import BackgroundScheduler
import time,os,threading

def job():
    print('job thread_id-{0}, process_id-{1}'.format(threading.get_ident(), os.getpid()))
    time.sleep(50)

if __name__=='__main__':
    job_defaults = { 'max_instances': 20 }
    sched = BackgroundScheduler(timezone='MST', job_defaults=job_defaults)
    sched.add_job(job, 'interval', id='3_second_job', seconds=3)
    sched.start()

    while(True):
        print('main 1s')
        time.sleep(1)

運行程序，我們得到如下的輸出：

main 1s
main 1s
main 1s
job thread_id-10644, process_id-8872
main 1s
main 1s
main 1s
job thread_id-3024, process_id-8872
main 1s
main 1s
main 1s
job thread_id-6728, process_id-8872
main 1s
main 1s
main 1s
job thread_id-11716, process_id-8872

可見，每個job()的進程ID都相同，但線程ID不同。所以，job()最終是以線程的方式被調度執行。

到此這篇關於python中BackgroundScheduler和BlockingScheduler的區別的文章就介紹到這瞭,更多相關python BackgroundScheduler BlockingScheduler內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

python中BackgroundScheduler和BlockingScheduler的區別

目錄

1、基本的定時調度

2、BlockingScheduler與BackgroundScheduler區別

推薦閱讀：

發佈留言取消回覆

近期文章

目錄

1、基本的定時調度

2、BlockingScheduler與BackgroundScheduler區別

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆