利用PyQt5制作一個豆瓣電影信息查看器
制作一個查看器可以查看豆瓣前100名電影的信息,當然這個爬取信息比較簡單。所以重點放在 QThread 多線程的應用上面。
QThread 子線程是 PyQt5 自帶的一個線程使用,因為如果使用 PyQt5 的主線程去做所有的事情。如果處理速度太慢的情況下主線程就會直接出現卡死狀態。
網絡信息提取的相關模塊有下面這些,主要是一個獲取 Html 信息,另一個解析 Html5 的頁面信息。
import requests # 網絡請求庫 from bs4 import BeautifulSoup # H5頁面元素解析庫 from fake_useragent import UserAgent # 身份信息生成庫
UI 界面佈局相關的模塊。
from PyQt5.QtWidgets import * from PyQt5.QtGui import * from PyQt5.QtCore import *
應用操作相關的模塊。
import sys
先把專門用於信息爬取的獨立線程寫好。新建一個線程類繼承自 QThread,其中最重要的是要寫上 init、del、run這幾個函數。這幾個函數對線程類 QThread 裡面的函數重寫的,業務邏輯是通過 run 函數實現的。
''' 獨立線程處理信息爬取 ''' class DouBanWorker(QThread): trigger = pyqtSignal(str) finished = pyqtSignal(bool) def __init__(self, parent=None): super(DouBanWorker, self).__init__(parent) self.parent = parent self.url = 'https://movie.douban.com/top250?start={}&filter=' self.working = True def __del__(self): self.working = False self.wait() def run(self): # 構造useragent身份設備信息 headers = { "User-Agent": str(UserAgent().random), } for page in range(4): url = self.url.format(page * 25) response = requests.get(url, headers=headers) bs = BeautifulSoup(response.text, 'html.parser') movie_list = bs.find_all('div', class_='item') for movie in movie_list: movie_seq = movie.find('em').text movie_name = movie.find('span').text movie_score = movie.find("span", class_='rating_num').text movie_inst = movie.find("span", class_='inq').text movie_link = movie.find('a')['href'] self.trigger.emit('\n') self.trigger.emit('排名:' + movie_seq + '\n') self.trigger.emit('名稱:' + movie_name + '\n') self.trigger.emit('評分:' + movie_score + '\n') self.trigger.emit('描述:' + movie_inst + '\n') movie_link = "<font color='blue'>" + movie_link + "</font>" self.trigger.emit('鏈接:' + movie_link + '\n') self.finished.emit(True)
主界面的 UI 佈局信息比較簡單,主要是一個文本瀏覽器和一個開始的按鈕組成的。
def init_ui(self): ''' 初始化UI界面佈局 :return: ''' self.setWindowTitle('豆瓣電影排名') self.setWindowIcon(QIcon('電影.ico')) self.resize(400, 300) vbox = QVBoxLayout() self.result_brower = QTextBrowser() self.result_brower.setFont(QFont('宋體', 8)) self.result_brower.setReadOnly(True) self.result_brower.setPlaceholderText('信息展示區域') self.result_brower.ensureCursorVisible() vbox.addWidget(self.result_brower) self.thread_ = DouBanWorker(self) self.thread_.trigger.connect(self.update_log) self.thread_.finished.connect(self.finished) self.start_btn = QPushButton() self.start_btn.setText('獲取前100名豆瓣電影詳細信息') self.start_btn.clicked.connect(self.start_btn_click) vbox.addWidget(self.start_btn) self.setLayout(vbox)
文本瀏覽器內容保持追加更新的槽函數,將電影信息獲取的實施進度追加到頁面上可以看到。
def update_log(self, text): ''' 槽函數:向文本瀏覽器中寫入內容 :param text: :return: ''' cursor = self.result_brower.textCursor() cursor.movePosition(QTextCursor.End) self.result_brower.append(text) self.result_brower.setTextCursor(cursor) self.result_brower.ensureCursorVisible()
開始按鈕上關聯的槽函數,用這個函數在收到主線程的開始命令時來啟動子線程的運行,子線程就會自動去爬取豆瓣上面的排名信息。
def start_btn_click(self): ''' 槽函數:啟動子線程爬取豆瓣電影信息 :return: ''' self.start_btn.setEnabled(False) self.thread_.start()
在收到子線程執行完成的信息時,將開始按鈕完成可用的狀態可以點擊再次執行。
def finished(self, finished): ''' 槽函數:處理完成時將開始按鈕變成可點擊狀態 :param finished: :return: ''' if finished is True: self.start_btn.setEnabled(True)
完成後,啟動後臺入口函數,最後看一下入口函數的寫法和往常是一樣的。
if __name__ == '__main__': ''' 主函數入口 ''' app = QApplication(sys.argv) main = DouBanUI() main.show() sys.exit(app.exec_())
到此這篇關於利用PyQt5制作一個豆瓣電影信息查看器的文章就介紹到這瞭,更多相關PyQt5電影信息查看器內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 利用PyQt5生成過年春聯
- 基於PyQt5制作數據處理小工具
- 基於Python socket實現簡易網絡聊天室
- Python+PyQT5實現手繪圖片生成器
- Python編程實現下載器自動爬取采集B站彈幕示例