python接口自動化使用requests庫發送http請求
前言
今天筆者想和大傢來聊聊python接口自動化如何使用requests庫發送http請求,廢話呢筆者就不多說瞭,直接進入正題。
一、requests庫
什麼是Requests ?Requests 是⽤Python語⾔編寫,基於urllib,采⽤Apache2 Licensed開源協議的 HTTP 庫。它⽐ urllib 更加⽅便,可以節約我們⼤量的⼯作,完全滿⾜HTTP測試需求。
安裝:cmd命令行執行pip install requests
二、HTTP 請求方法
HTTP 協議 (Hyper Text Transfer Protocol),一個基於TCP/IP通信協議來傳遞數據,包括html文件、圖像、結果等,即是一個客戶端和服務器端請求和應答的標準。根據HTTP 標準,HTTP 請求可以使用多種請求方法。
- HTTP 0.9:隻有基本的文本GET請求,沒有固定的版本號,不支持請求頭。
- HTTP 1.0:完善的請求/響應模型,並將協議補充完整,定義瞭三種請求方法:GET,POST和HEAD方法。
- HTTP 1.1:在1.0的基礎上進行更新,新增瞭五種請求方法:OPTIONS,PUT,DELETE,TRACE和CONNECT方法。
- HTTP 2.0(未普及):請求/響應首部的定義基本沒有改變,隻是所有首部鍵必須全部小寫,而且請求行要獨立為:method、:scheme、:host、:path這些鍵值
HTTP請求常用的Get和Post兩種方法:
- GET是從服務器上獲取數據,POST是向服務器傳送數據
- GET請求參數都顯示在瀏覽器網址上,HTTP服務器根據該請求所包含URL中的參數來產生響應內容,也就是說GET請求的參數是URL的一部分。比如百度requests模塊
- POST請求參數是在請求體當中,消息長度沒有限制且以隱式的方式進行傳送,通常用來向HTTP服務器提交量比較大的數據(比如請求中包含許多參數或者文件上傳操作等),請求的參數包含在“Content-Type”消息頭裡,指明該消息體的媒體類型和編碼
三、發送GET請求
關鍵代碼:requests.get(url)
參數說明:若需要傳請求參數,可直接在 url 後面添加,也可以在調用get()方法時通過關鍵字params傳入,需要註意的是params需要傳入dict(字典)類型。
下面以請求百度為例,發送get請求:
import requests # 通過url直接加上請求參數,與通過params傳參效果是一樣的 response = requests.get(url='http://www.baidu.com/s?wd=requests模塊') # 通過params傳參 response2 = requests.get(url='http://www.baidu.com/s', params={"wd": "requests模塊"}) print(response.status_code) # 打印狀態碼 # print(response.text) # 獲取響應內容
運行結果:
C:\software\python\python.exe D:/learn/test.py
200
nished with exit code 0
四、發送POST請求
關鍵代碼:requests.post(url, data)
參數說明:可傳dict類型也可傳json類型,dict類型使用關鍵字data傳參,json類型則為使用關鍵字json傳參。若無需傳參可不傳。
register_url = "http://127.0.0.1:666/index/register" # 添加請求頭,需要就傳 header = { "Content-Type": "application/json" } # json類型的參數 json = { "mobile_phone": "15612345678", "pwd": "Test1234", "type": 0 } # 發送post請求 response = requests.post(url=register_url, json=json, headers=header) print(response.json()) # 打印結果:{'code': 200, 'msg': 'success', 'password': '321', 'username': '123'}
上面舉例為json類型的傳參,json和dict類型的數據結構表面上看有點相似,那怎麼判斷什麼時候用json什麼時候用dict呢?隻要查看請求頭,需要哪種就傳哪種,表單類型的參數,即"Content-Type: application/x-www-form-urlencoded"就使用關鍵字data去傳dcit類型的參數,像上面舉例的"Content-Type": "application/json"json類型的參數一定要使用關鍵字json去傳遞。
五、獲取響應數據
常見的屬性:
- response.status_code:獲取響應狀態碼
- response.cookies:獲取
- cookiesresponse.headers:獲取頭部信息
- response.url:獲取
- urlresponse.text:自動識別文本中的編碼格式進行解碼,但有時候不準確,會出現亂碼
- response.content.decode('utf-8'):response.content,獲取字節流的數據,進行decode解碼,默認是utf8
- response.json():json方法可以將json字符串轉換成對應的python類型的數據,接口返回的數據99%都是json類型的
import requests response = requests.get(url='http://www.baidu.com/s?wd=requests模塊') # response = requests.get(url='http://www.baidu.com/s', params={"wd": "requests模塊"}) print("這是status_code:{}\n".format(response.status_code)) print("這是cookies:.{}\n".format(response.cookies)) print("這是headers:.{}\n".format(response.headers)) print("這是url:.{}\n".format(response.url)) # print("這是響應頁面文本信息:.{}\n".format(response.text)) # 因為返回數據太長,不作運行 # print("這是獲取的字節流數據decode解碼:.{}\n".format(response.content.decode()))
運行結果:
C:\software\python\python.exe D:/learn/test.py
這是status_code:200
這是cookies:.<RequestsCookieJar[<Cookie BAIDUID=6EC84DD4DE623D1500B3D0E771D1D3FA:FG=1 for .baidu.com/>, <Cookie BIDUPSID=6EC84DD4DE623D15C087081CA8B7A6D9 for .baidu.com/>, <Cookie H_PS_PSSID=32292_1441_32355_32328_31253_32348_32046_32394_32429_32115_32437 for .baidu.com/>, <Cookie PSINO=6 for .baidu.com/>, <Cookie PSTM=1596554477 for .baidu.com/>, <Cookie delPer=0 for .baidu.com/>, <Cookie BDSVRTM=11 for www.baidu.com/>, <Cookie BD_CK_SAM=1 for www.baidu.com/>]>
這是headers:.{'Bdpagetype': '3', 'Bdqid': '0xf2cd9ccf00070e08', 'Cache-Control': 'private', 'Ckpacknum': '2', 'Ckrndstr': 'f00070e08', 'Connection': 'keep-alive', 'Content-Encoding': 'gzip', 'Content-Type': 'text/html;charset=utf-8', 'Date': 'Tue, 04 Aug 2020 15:21:17 GMT', 'P3p': 'CP=" OTI DSP COR IVA OUR IND COM ", CP=" OTI DSP COR IVA OUR IND COM "', 'Server': 'BWS/1.1', 'Set-Cookie': 'BAIDUID=6EC84DD4DE623D15C087081CA8B7A6D9:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com, BIDUPSID=6EC84DD4DE623D15C087081CA8B7A6D9; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com, PSTM=1596554477; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com, BAIDUID=6EC84DD4DE623D1500B3D0E771D1D3FA:FG=1; max-age=31536000; expires=Wed, 04-Aug-21 15:21:17 GMT; domain=.baidu.com; path=/; version=1; comment=bd, delPer=0; path=/; domain=.baidu.com, BD_CK_SAM=1;path=/, PSINO=6; domain=.baidu.com; path=/, BDSVRTM=11; path=/, H_PS_PSSID=32292_1441_32355_32328_31253_32348_32046_32394_32429_32115_32437; path=/; domain=.baidu.com', 'Traceid': '1596554477018818305017495812540276870664', 'Vary': 'Accept-Encoding', 'X-Ua-Compatible': 'IE=Edge,chrome=1', 'Transfer-Encoding': 'chunked'}
這是url:.http://www.baidu.com/s?wd=requests%E6%A8%A1%E5%9D%97
Process finished with exit code 0
六、高級操作
在上面我們基本瞭解瞭requests庫的基本用法,如GET、POST請求以及response的屬性,接下來我們再看下requests庫的一些高級用法,如下載/上傳文件、Cookies設置、代理設置等。
6.1文件下載
與發送請求區別無二,隻是保存時需要處理一下,如下載圖片,把獲取圖片的二進制數據然後用二進制寫入文件即可。
import requests response = requests.get('https://github.com/favicon.ico') # 獲取二進制數據,然後寫入文件 with open('favicon.ico','wb')as f: f.write(response.content) f.close
6.2文件上傳
關鍵代碼:requests.post(utl, files=files)
import requests file = {'file':open('favicon.ico','rb')} # 將之前抓取的github圖標以二進制格式讀取 response = requests.post('http://httpbin.org/post', files = file) print(response.text)
6.3SSL證書驗證
為什麼會有SSL證書驗證,SSL是什麼?
SSL協議是網絡層和傳輸層的協議。SSL(Secure Sockets Layer 安全套接層)協議,及其繼任者TLS(Transport Layer Security傳輸層安全)協議,是為網絡通信提供安全及數據完整性的一種安全協議。
HTTPS是兼容HTTP的,可以把HTTPS理解為'HTTP over TSL',即HTTPS是HTTP協議和TSL協議的組合。HTTPS在傳輸數據時,同樣會先建立TCP連接,建立起TCP連接後,會建立TSL連接。請求可以為HTTPS請求驗證SSL證書,就像我們使用的瀏覽器一樣,SSL驗證默認是開啟的,如果證書驗證失敗,請求會拋出一個SSLError,如下圖:
碰到請求SSL驗證的,我們是可以直接跳過不驗證的,通過設置verify=False就可關閉錯誤提示,跳過SSL驗證,這裡隻是忽略瞭SSL驗證,並不是沒有瞭SSL驗證,它仍然會存在一個警告信息InsecureRequestWarning。
import requests #通過一下兩行代碼即可把警報消除,即使verify=False,報警還是存在的 from requests.packages import urllib3 urllib3.disable_warnings() response = requests.get('https://www.12306.cn',verify = False) print(response.status_code)
6.4保持會話
在requests中,如果直接使用get()或post()等方法是可以做到模擬網頁的接口請求,但是每次發起請求結束後它就結束瞭,並不會保存相關的驗證信息,如cookies/token;比如第一次使用post()請求登錄瞭某個網站,第二次想獲取成功登錄後的用戶個人信息,再一次發起post()請求時它會要求你需求先登錄,明明第一次請求時已經登錄瞭,為什麼第二次還提示要先登錄呢?實際上兩次請求相當於使用瞭兩個瀏覽器去訪問,是兩個完全不相關的會話,因此第二次請求是拿不到用戶信息的。
requests中的session對象能夠讓我們跨http請求保持某些參數,即讓同一個session對象發送的請求頭攜帶某個指定的參數。當然,最常見的應用是它可以讓cookie保持在後續的一串請求中。
# 創建一個session對象,使它能夠自動記錄上一次請求中的cookie信息 se = requests.session() # 登錄接口 login_url = "http://www.test.com/api/member/login" login_data = { "mobilephone": "15612355678", "pwd": "Test1234" } res = se.post(url=login_url, data=login_data) # 登錄後查詢用戶最近的訂單記錄 order_record_url = "http://www.test.com/api/member/order" record_data = { "beginTime": "2022-07-01", "endTime": "2022-07-10" } res2 = se.post(url=order_record_url, data=record_data) print(res2.json())
6.5requests封裝
凡是需要重復使用的,我們都可以對它進行二次封裝,寫成我們自己的版本,還可以在封裝過程中加入我們想要的內容,使用的時候直接調用即可。
import requests class SendSessionRequest: """使用session鑒權的接口,記錄cookies/token""" def __init__(self): self.session = requests.session() def requests(self, url, method, params=None, data=None, json=None, headers=None): method = method.lower() if method == "post": return self.session.post(url=url, json=json, data=data, headers=headers) elif method == "patch": return self.session.patch(url=url, json=json, data=data, headers=headers) elif method == "get": return self.session.get(url=url, params=params)
總結
到此這篇關於python接口自動化使用requests庫發送http請求的文章就介紹到這瞭,更多相關python 發送http請求內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python爬蟲之requests庫的使用詳解
- Python爬蟲之requests庫基本介紹
- Python爬蟲學習之requests的使用教程
- Python爬蟲Requests庫的使用詳情
- 詳解Python requests模塊