python 實現多線程的三種方法總結
1._thread.start_new_thread(瞭解)
import threading import time import _thread def job(): print("這是一個需要執行的任務。。。。。") print("當前線程的個數:", threading.active_count() ) print("當前線程的信息:", threading.current_thread()) time.sleep(100) if __name__ == '__main__': # 創建多線程時, 需要制定該線程執行的任務 _thread.start_new_thread(job, ()) _thread.start_new_thread(job, ()) job()
2.threading.Thread
import threading import time def job(): print("這是一個需要執行的任務。。。。。") print("當前線程的個數:", threading.active_count() ) time.sleep(1) print("當前線程的信息:", threading.current_thread()) if __name__ == '__main__': # 創建多線程時, 需要制定該線程執行的任務.name線程名字 target目標函數名 t1 = threading.Thread(target=job,name='job1') t2 = threading.Thread(target=job,name='job2') t1.start() t2.start() print(threading.active_count()) print("程序執行結束.....")
輸出:
這是一個需要執行的任務。。。。。
當前線程的個數: 3
這是一個需要執行的任務。。。。。
3
程序執行結束…..
當前線程的個數: 3
當前線程的信息: <Thread(job1, started 140416648140544)>
當前線程的信息: <Thread(job2, started 140416639747840)>
出現的問題: 主線程執行結束, 但是子線程還在運行。
join()方法可以等待所有的子線程執行結束之後, 再執行主線程。
import threading import time def job(): print("這是一個需要執行的任務。。。。。") print("當前線程的個數:", threading.active_count() ) print("當前線程的信息:", threading.current_thread()) time.sleep(1) if __name__ == '__main__': # 創建多線程時, 需要制定該線程執行的任務.name線程名字 target目標函數名 t1 = threading.Thread(target=job,name='job1') t2 = threading.Thread(target=job,name='job2') t1.start() t2.start() print(threading.active_count()) # 出現的問題: 主線程執行結束, 但是子線程還在運行。 # 等待所有的子線程執行結束之後, 再執行主線程 t1.join() t2.join() print("程序執行結束.....")
之前寫過一個簡單爬蟲的實驗,現在希望獲取十個ip的城市和國傢
-不使用多線程
import time from urllib.request import urlopen # 記錄時間的裝飾器 def timeit(f): def wrapper(*args, **kwargs): start_time = time.time() res = f(*args, **kwargs) end_time = time.time() print("%s函數運行時間:%.2f" % (f.__name__, end_time - start_time)) return res return wrapper def get_addr(ip): url = "http://ip-api.com/json/%s" % (ip) urlObj = urlopen(url) # 服務端返回的頁面信息, 此處為字符串類型 pageContent = urlObj.read().decode('utf-8') # 2. 處理Json數據 import json # 解碼: 將json數據格式解碼為python可以識別的對象; dict_data = json.loads(pageContent) print(""" %s 所在城市: %s 所在國傢: %s """ % (ip, dict_data['city'], dict_data['country'])) @timeit def main(): ips = ['12.13.14.%s' % (i + 1) for i in range(10)] for ip in ips: get_addr(ip) if __name__ == '__main__': main()
時間需要138.91秒。
-使用多線程
import threading import time from urllib.request import urlopen def timeit(f): def wrapper(*args, **kwargs): start_time = time.time() res = f(*args, **kwargs) end_time = time.time() print("%s函數運行時間:%.2f" % (f.__name__, end_time - start_time)) return res return wrapper def get_addr(ip): url = "http://ip-api.com/json/%s" % (ip) urlObj = urlopen(url) # 服務端返回的頁面信息, 此處為字符串類型 pageContent = urlObj.read().decode('utf-8') # 2. 處理Json數據 import json # 解碼: 將json數據格式解碼為python可以識別的對象; dict_data = json.loads(pageContent) print(""" %s 所在城市: %s 所在國傢: %s """ % (ip, dict_data['city'], dict_data['country'])) @timeit def main(): ips = ['12.13.14.%s' % (i + 1) for i in range(10)] threads = [] for ip in ips: # 實例化10個對象,target=目標函數名,args=目標函數參數(元組格式) t = threading.Thread(target=get_addr, args=(ip, )) threads.append(t) t.start() # 等待所有子線程結束再運行主線程 [thread.join() for thread in threads] if __name__ == '__main__': main()
3.重寫run方法
重寫run方法, 實現多線程, 因為start方法執行時, 調用的是run方法;run方法裡面編寫的內容就是你要執行的任務;
import threading import time # 重寫一個類,繼承於threading.Thread class MyThread(threading.Thread): def __init__(self, jobName): super(MyThread, self).__init__() self.jobName = jobName # 重寫run方法, 實現多線程, 因為start方法執行時, 調用的是run方法; # run方法裡面編寫的內容就是你要執行的任務; def run(self): print("這是一個需要執行的任務%s。。。。。" %(self.jobName)) print("當前線程的個數:", threading.active_count() ) time.sleep(1) print("當前線程的信息:", threading.current_thread()) if __name__ == '__main__': t1 = MyThread("name1") t2 = MyThread("name2") t1.start() t2.start() t1.join() t2.join() print("程序執行結束.....")
重寫run方法實現剛才爬蟲多線程案例
import threading import time from urllib.request import urlopen def timeit(f): def wrapper(*args, **kwargs): start_time = time.time() res = f(*args, **kwargs) end_time = time.time() print("%s函數運行時間:%.2f" % (f.__name__, end_time - start_time)) return res return wrapper class MyThread(threading.Thread): def __init__(self, ip): super(MyThread, self).__init__() self.ip = ip def run(self): url = "http://ip-api.com/json/%s" % (self.ip) urlObj = urlopen(url) # 服務端返回的頁面信息, 此處為字符串類型 pageContent = urlObj.read().decode('utf-8') # 2. 處理Json數據 import json # 解碼: 將json數據格式解碼為python可以識別的對象; dict_data = json.loads(pageContent) print(""" %s 所在城市: %s 所在國傢: %s """ % (self.ip, dict_data['city'], dict_data['country'])) @timeit def main(): ips = ['12.13.14.%s' % (i + 1) for i in range(10)] threads = [] for ip in ips: # 實例化自己重寫的類 t = MyThread(ip) threads.append(t) t.start() [thread.join() for thread in threads] if __name__ == '__main__': main()
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- python threading模塊的使用指南
- Python threading和Thread模塊及線程的實現
- python中start和run方法的區別
- Python基礎學習之認識線程
- Python學習筆記之線程