Python利用PyQt5制作一個獲取網絡實時NBA數據並播報的GUI程序
制作NBA數據爬蟲
捋順思路
我們在這裡選擇的是百度體育帶來的數據,我們在百度當中直接搜索NBA跳轉到網頁,我們可以看到,百度已經為我們提供瞭相關的數據
我們點擊進去後,可以發現這是一個非常簡潔的網址
我們看一下這個地址欄,發現毫無規律https://tiyu.baidu.com/live/detail/576O5Zu955S35a2Q6IGM5Lia56%2Bu55CD6IGU6LWbI2Jhc2tldGJhbGwjMjAyMS0wNi0xMyPniLXlo6t2c%2BWspritq%2BiIuQ%3D%3D/from/baidu_aladdin
好吧,隻能再找找瞭,我們點擊整個標簽發現,這是一個網址,那就容易多瞭。
這裡我們想要獲取的無非就是具體的每一節數據和總分,然後如果用戶還有其他需求的話我們就直接將其推送到百度網址上面來
爬取的思路大概就是這樣,首先先訪問主頁面,然後在訪問旗下今天的比賽,最後將比賽結果返回
編寫代碼
首先我們使用REQUESTS來訪問網址
我們可以看到,百度沒有做任何限制,直接訪問也可以獲得內容
接下來我們使用解析庫進行解析
首先我們先將程序定位到Main標簽
代碼則是這樣的,運行代碼我們會發現,整個代碼縮進瞭不少
獲取主要的頁面,我們使用FIND函數進行進一步操作
我們成功定位到瞭這個主頁面,接下來就是我們開始爬取最近幾次的比賽信息和詳細頁面瞭
更改代碼,我們直接獲取所有的比賽信息
在測試網站的時候,我發現百度竟然使用瞭AJAX技術,就是說你一次性獲得的網站源代碼可能隻有五條,然後要進行再一次加載才能獲取接下來的數據。但是這也對我們程序來說挺好的,我們本來也不需要那麼多數據。
我們在這裡查找瞭每一個的日期,查找對象為 date,接下來我們把其轉換成字符串,因為百度上面這個日期有縮進,所以我們在後面添加 STRIP() 取消字符串前面的空格。按照這樣的方式獲取比賽地址
在這裡,我們使用拼接字符串的方法,完成瞭對最後地址的解析
# 程序名稱 : NBAReporter # 制作時間 : 2021年6月13日 # 運行環境 : Windows 10 import requests from bs4 import BeautifulSoup # 基礎數據定義 baidu_nba_url = "https://tiyu.baidu.com/match/NBA/" request_url = "https:" nba_dict = {} # 訪問網址 nba_res = requests.get(baidu_nba_url) # print(nba_res.text) # 開始使用解析器 nba_soup = BeautifulSoup(nba_res.text, "html.parser") nba_main = nba_soup.main # print(nba_main) nba_div = nba_main.find_all("div", class_ = "wa-match-schedule-list-wrapper") for i in nba_div: # 獲取比賽時間 nba_time = i.find("div", class_ = "date").string.strip() print(nba_time) # 獲取比賽的次數 nba_times = i.find("div", class_ = "list-num c-color").string print(nba_times) # 獲取詳細的比賽地址 nba_href = i.find_all("div", class_ = "wa-match-schedule-list-item c-line-bottom") for url_nba in nba_href: url_nba = url_nba.a url_href = url_nba["href"] real_url = request_url + url_href print(real_url)
接下來我們要開始剩餘部分的解析,我們可以看到我們還有一部分的詳細信息沒有爬取,所以我們開始爬取詳細信息
按照邏輯繼續編寫代碼
然後我們獲取一下這裡面的值
獲取比賽的相關分數後,我們創建兩個列表,一個列表定義我們等一下需要用到NBA的樣式,另一個列表則存儲今天的日期,最後返回
我們已經在這裡吧這個方法封裝瞭,所以我們創建一個新的文件,直接導入即可
NBAReporter.py
# 程序名稱 : NBAReporter # 制作時間 : 2021年6月13日 # 運行環境 : Windows 10 import requests from bs4 import BeautifulSoup def NBAReporter(): # 基礎數據定義 baidu_nba_url = "https://tiyu.baidu.com/match/NBA/" request_url = "https:" nba_list = [] today_list = [] # 訪問網址 nba_res = requests.get(baidu_nba_url) # print(nba_res.text) # 開始使用解析器 nba_soup = BeautifulSoup(nba_res.text, "html.parser") nba_main = nba_soup.main # print(nba_main) nba_div = nba_main.find_all("div", class_ = "wa-match-schedule-list-wrapper") for i in nba_div: # 獲取比賽時間 today = i.find("div", class_ = "date").string.strip() # 獲取比賽的次數 nba_times = i.find("div", class_ = "list-num c-color").string # 獲取詳細的比賽地址 nba_href = i.find_all("div", class_ = "wa-match-schedule-list-item c-line-bottom") for url_nba in nba_href: url_nba = url_nba.a url_href = url_nba["href"] real_url = request_url + url_href # print(real_url) # 獲取詳細數據 vs_time = url_nba.find("div", class_ = "font-14 c-gap-bottom-small").string vs_finals = url_nba.find("div",class_ = "font-12 c-color-gray").string team_row_1 = url_nba.find("div", class_ = "team-row") team_row_2 = url_nba.find("div", class_ = "c-gap-top-small team-row") """team_row_1_png = team_row_1.find("div", class_ = "inline-block")["style"] team_row_2_png = team_row_2.find("div", class_ = "inline-block")["style"] print(team_row_1_png,team_row_2_png)""" team_row_1_name = team_row_1.find("span", class_ = "inline-block team-name team-name-360 team-name-320 c-line-clamp1").string team_row_2_name = team_row_2.find("span", class_ = "inline-block team-name team-name-360 team-name-320").string # print(team_row_1_name,team_row_2_name) team_row_1_score = team_row_1.find("span", class_ = "inline-block team-score-num c-line-clamp1").string team_row_2_score = team_row_2.find("span", class_ = "inline-block team-score-num c-line-clamp1").string # print(team_row_1_score,team_row_2_score) """import re # 導入re庫,不過最好還是在最前面導入,這裡是為瞭演示的需要 team_row_1_png_url = re.search(r'background:url(.*)', team_row_1_png) team_row_1_png_url = team_row_1_png_url.group(1) team_row_2_png_url = re.search(r'background:url(.*)', team_row_2_png) team_row_2_png_url = team_row_2_png_url.group(1)""" nba = [ today, nba_times,"","", vs_time, vs_finals, team_row_1_name, team_row_2_name, "","", team_row_1_score, team_row_2_score ] nba_list.append(nba) today_list.append(today) return nba_list,today_list
這裡我們要編寫的是GUI界面的實現程序
首先先導入我們運行所需要的庫
簡單定義一下我們的代碼,設置標題和其他的一些窗口屬性# self.setWindowOpacity(0.5)
這裡是設置窗口透明程度的一行代碼,但是經過我的測驗之後,發現這樣子真的對於用戶體驗一點也不好,所以在這裡我把它註釋掉瞭
程序主邏輯如上圖所示,我們創建瞭一個單元佈局,然後又創建瞭和比賽一樣的若幹個標簽,最後將函數返回的列表以標簽的形式放在主窗口上面
最後創建事件,運行程序,這樣子整個程序就完成瞭
NBAWindow.py
# 程序名稱 : NBAWindow # 制作時間 : 2021年6月14日 # 運行環境 : Windows 10 import sys from PyQt5.QtCore import * from PyQt5.QtGui import * from PyQt5.QtWidgets import * from NBAReporter import * # 首先創建一個主窗口 class NBAWindow(QTabWidget): def __init__(self): super().__init__() self.make_Ui() """ # 兩分鐘自動刷新 self.timer = QTimer() self.timer.setInterval(500) self.timer.timeout.connect(self.make_Ui) self.timer.start()""" self.setWindowTitle("NBA數據") self.setGeometry(1440,0,480,300) self.setFixedSize(480,300) self.setWindowIcon(QIcon('images/nba.png')) self.setStyleSheet("""background-color:red; """) # self.setWindowOpacity(0.5) self.setWindowFlags(Qt.WindowStaysOnTopHint|Qt.WindowMinimizeButtonHint|Qt.FramelessWindowHint) def make_Ui(self): self.nba,today = NBAReporter() self.tab = 0 for a in self.nba: # 設置網格單元佈局 grid = QGridLayout() self.setLayout(grid) # 開始添加一個標簽 tab = QWidget() # 將這個標簽設置為TAB並按照列表中的數值命名 self.addTab(tab,today[self.tab]) # 獲取循環之後的位置,重寫列表 positions = [(i, j) for i in range(3) for j in range(4)] nba_list = self.nba[self.tab] # 開始創建Tab下面的標簽 for position, nba in zip(positions, nba_list): #print(nba) # 當時空值時,跳過執行 if nba == "": continue # 設置文字樣式 label = QLabel("<font color='black', size=5><b>%s</b></font>"%nba) grid.addWidget(label, *position) # 設置整個窗口為表格佈局 tab.setLayout(grid) # grid.update() # 將數值加一 self.tab += 1 if __name__ == '__main__': app = QApplication(sys.argv) window = NBAWindow() window.show() app.exec_()
NBAReporter.py
# 程序名稱 : NBAReporter # 制作時間 : 2021年6月13日 # 運行環境 : Windows 10 import requests from bs4 import BeautifulSoup def NBAReporter(): # 基礎數據定義 baidu_nba_url = "https://tiyu.baidu.com/match/NBA/" request_url = "https:" nba_list = [] today_list = [] # 訪問網址 nba_res = requests.get(baidu_nba_url) # print(nba_res.text) # 開始使用解析器 nba_soup = BeautifulSoup(nba_res.text, "html.parser") nba_main = nba_soup.main # print(nba_main) nba_div = nba_main.find_all("div", class_ = "wa-match-schedule-list-wrapper") for i in nba_div: # 獲取比賽時間 today = i.find("div", class_ = "date").string.strip() # 獲取比賽的次數 nba_times = i.find("div", class_ = "list-num c-color").string # 獲取詳細的比賽地址 nba_href = i.find_all("div", class_ = "wa-match-schedule-list-item c-line-bottom") for url_nba in nba_href: url_nba = url_nba.a url_href = url_nba["href"] real_url = request_url + url_href # print(real_url) # 獲取詳細數據 vs_time = url_nba.find("div", class_ = "font-14 c-gap-bottom-small").string vs_finals = url_nba.find("div",class_ = "font-12 c-color-gray").string team_row_1 = url_nba.find("div", class_ = "team-row") team_row_2 = url_nba.find("div", class_ = "c-gap-top-small team-row") """team_row_1_png = team_row_1.find("div", class_ = "inline-block")["style"] team_row_2_png = team_row_2.find("div", class_ = "inline-block")["style"] print(team_row_1_png,team_row_2_png)""" team_row_1_name = team_row_1.find("span", class_ = "inline-block team-name team-name-360 team-name-320 c-line-clamp1").string team_row_2_name = team_row_2.find("span", class_ = "inline-block team-name team-name-360 team-name-320").string # print(team_row_1_name,team_row_2_name) team_row_1_score = team_row_1.find("span", class_ = "inline-block team-score-num c-line-clamp1").string team_row_2_score = team_row_2.find("span", class_ = "inline-block team-score-num c-line-clamp1").string # print(team_row_1_score,team_row_2_score) """import re # 導入re庫,不過最好還是在最前面導入,這裡是為瞭演示的需要 team_row_1_png_url = re.search(r'background:url(.*)', team_row_1_png) team_row_1_png_url = team_row_1_png_url.group(1) team_row_2_png_url = re.search(r'background:url(.*)', team_row_2_png) team_row_2_png_url = team_row_2_png_url.group(1)""" nba = [ today, nba_times,"","", vs_time, vs_finals, team_row_1_name, team_row_2_name, "","", team_row_1_score, team_row_2_score ] nba_list.append(nba) today_list.append(today) return nba_list,today_list
效果演示
到此這篇關於Python利用PyQt5制作一個獲取網絡實時NBA數據並播報的GUI程序的文章就介紹到這瞭,更多相關Python PyQt5數據播報程序內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python利用PyQt5制作一個獲取網絡實時數據NBA數據播報GUI功能
- python爬蟲beautifulsoup庫使用操作教程全解(python爬蟲基礎入門)
- python 如何獲取頁面所有a標簽下href的值
- Python使用Beautiful Soup(BS4)庫解析HTML和XML
- python beautifulsoup4 模塊詳情