python 實現多線程的三種方法總結

1._thread.start_new_thread(瞭解)

import threading
import time
import _thread
def job():
    print("這是一個需要執行的任務。。。。。")
    print("當前線程的個數:", threading.active_count() )
    print("當前線程的信息:", threading.current_thread())
    time.sleep(100)
if __name__ == '__main__':
    # 創建多線程時, 需要制定該線程執行的任務
    _thread.start_new_thread(job, ())
    _thread.start_new_thread(job, ())
    job()

2.threading.Thread

import threading
import time
def job():
    print("這是一個需要執行的任務。。。。。")
    print("當前線程的個數:", threading.active_count() )
    time.sleep(1)
    print("當前線程的信息:", threading.current_thread())
if __name__ == '__main__':
    # 創建多線程時, 需要制定該線程執行的任務.name線程名字 target目標函數名
    t1 = threading.Thread(target=job,name='job1')
    t2 = threading.Thread(target=job,name='job2')
    t1.start()
    t2.start()
    print(threading.active_count())
 print("程序執行結束.....")

輸出:

這是一個需要執行的任務。。。。。

當前線程的個數: 3

這是一個需要執行的任務。。。。。

3

程序執行結束…..

當前線程的個數: 3

當前線程的信息: <Thread(job1, started 140416648140544)>

當前線程的信息: <Thread(job2, started 140416639747840)>

出現的問題: 主線程執行結束, 但是子線程還在運行。

join()方法可以等待所有的子線程執行結束之後, 再執行主線程。

import threading
import time
def job():
    print("這是一個需要執行的任務。。。。。")
    print("當前線程的個數:", threading.active_count() )
    print("當前線程的信息:", threading.current_thread())
 time.sleep(1)
if __name__ == '__main__':
    # 創建多線程時, 需要制定該線程執行的任務.name線程名字 target目標函數名
    t1 = threading.Thread(target=job,name='job1')
    t2 = threading.Thread(target=job,name='job2')
    t1.start()
    t2.start()
    print(threading.active_count())
    # 出現的問題: 主線程執行結束, 但是子線程還在運行。
    # 等待所有的子線程執行結束之後, 再執行主線程
    t1.join()
    t2.join()
    print("程序執行結束.....")

之前寫過一個簡單爬蟲的實驗,現在希望獲取十個ip的城市和國傢

-不使用多線程

import time
from urllib.request import urlopen
# 記錄時間的裝飾器
def timeit(f):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        res = f(*args, **kwargs)
        end_time = time.time()
        print("%s函數運行時間:%.2f" % (f.__name__, end_time - start_time))
        return res
    return wrapper
def get_addr(ip):
    url = "http://ip-api.com/json/%s" % (ip)
    urlObj = urlopen(url)
    # 服務端返回的頁面信息, 此處為字符串類型
    pageContent = urlObj.read().decode('utf-8')
    # 2. 處理Json數據
    import json
    # 解碼: 將json數據格式解碼為python可以識別的對象;
    dict_data = json.loads(pageContent)
    print("""
                        %s
    所在城市: %s
    所在國傢: %s
    
    """ % (ip, dict_data['city'], dict_data['country']))
@timeit
def main():
    ips = ['12.13.14.%s' % (i + 1) for i in range(10)]
    for ip in ips:
        get_addr(ip)
if __name__ == '__main__':
    main()

時間需要138.91秒。

-使用多線程

import threading
import time
from urllib.request import urlopen
def timeit(f):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        res = f(*args, **kwargs)
        end_time = time.time()
        print("%s函數運行時間:%.2f" % (f.__name__, end_time - start_time))
        return res
    return wrapper
def get_addr(ip):
    url = "http://ip-api.com/json/%s" % (ip)
    urlObj = urlopen(url)
    # 服務端返回的頁面信息, 此處為字符串類型
    pageContent = urlObj.read().decode('utf-8')
    # 2. 處理Json數據
    import json
    # 解碼: 將json數據格式解碼為python可以識別的對象;
    dict_data = json.loads(pageContent)
    print("""
                        %s
    所在城市: %s
    所在國傢: %s
    
    """ % (ip, dict_data['city'], dict_data['country']))
@timeit
def main():
    ips = ['12.13.14.%s' % (i + 1) for i in range(10)]
    threads = []
    for ip in ips:
        # 實例化10個對象,target=目標函數名,args=目標函數參數(元組格式)
        t = threading.Thread(target=get_addr, args=(ip, ))
        threads.append(t)
        t.start()
    
    # 等待所有子線程結束再運行主線程
    [thread.join() for thread in threads]
if __name__ == '__main__':
    main()

3.重寫run方法

重寫run方法, 實現多線程, 因為start方法執行時, 調用的是run方法;run方法裡面編寫的內容就是你要執行的任務;

import threading
import time
# 重寫一個類,繼承於threading.Thread
class MyThread(threading.Thread):
    def __init__(self, jobName):
        super(MyThread, self).__init__()
        self.jobName = jobName
    # 重寫run方法, 實現多線程, 因為start方法執行時, 調用的是run方法;
    # run方法裡面編寫的內容就是你要執行的任務;
    def run(self):
        print("這是一個需要執行的任務%s。。。。。" %(self.jobName))
        print("當前線程的個數:", threading.active_count() )
        time.sleep(1)
        print("當前線程的信息:", threading.current_thread())
if __name__ == '__main__':
    t1 = MyThread("name1")
    t2 = MyThread("name2")
    t1.start()
    t2.start()
    t1.join()
    t2.join()
    print("程序執行結束.....")

重寫run方法實現剛才爬蟲多線程案例

import threading
import time
from urllib.request import urlopen
def timeit(f):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        res = f(*args, **kwargs)
        end_time = time.time()
        print("%s函數運行時間:%.2f" % (f.__name__, end_time - start_time))
        return res
    return wrapper
class MyThread(threading.Thread):
    def __init__(self, ip):
        super(MyThread, self).__init__()
        self.ip = ip
    def run(self):
        url = "http://ip-api.com/json/%s" % (self.ip)
        urlObj = urlopen(url)
        # 服務端返回的頁面信息, 此處為字符串類型
        pageContent = urlObj.read().decode('utf-8')
        # 2. 處理Json數據
        import json
        # 解碼: 將json數據格式解碼為python可以識別的對象;
        dict_data = json.loads(pageContent)
        print("""
                            %s
        所在城市: %s
        所在國傢: %s
        
        """ % (self.ip, dict_data['city'], dict_data['country']))
@timeit
def main():
    ips = ['12.13.14.%s' % (i + 1) for i in range(10)]
    threads = []
    for ip in ips:
        # 實例化自己重寫的類
        t = MyThread(ip)
        threads.append(t)
        t.start()
    [thread.join() for thread in threads]
if __name__ == '__main__':
    main()

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。

推薦閱讀: