python requests模塊的使用示例
為什麼使用requests:
- 支持使用Cookie保持會話
- 支持文件上傳
- 支持自動確定響應內容的編碼
- 對用戶來說比較人性化
模擬get請求:
獲取token
# 使用微信公眾平臺舉例 get_param_dict={ "grant_type":"**************", "appid":"**************", "secret":"**************", } response = requests.get(url='https://api.weixin.qq.com/cgi-bin/token', # url地址 params=get_param_dict) # 參數 print(response.content.decode('utf-8'))
模擬請求頭部信息
註:因為requests請求頭是以python,requests發起的,所以大部分接口都會需要手動添加頭部信息
# get 模擬請求頭部信息,(當你發現數據不對時,就模擬) # 以百度舉例 get_param_dict ={ "wd":"newdream" } # 添加頭部信息字典(可以使用抓包抓取到頭部信息) header_info_dict = { "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36", "Accpet":"text/plain, */*; q=0.01" } response = requests.get(url = 'https://www.baidu.com/s', params=get_param_dict,headers=header_info_dict) print(response.content.decode('utf-8'))
模擬post請求
import requests,json # requests模擬發送post請求 # 使用微信公眾平臺舉例 url_param_doct = {"access_token": "43_XcK_1rvR8VPgicGGzq7Vp2QrGx30Kwhy9SSShoVTQs11G_jP9aqhy2bwRQFuG2hYzkwVjphJFfPj8WYQR8vgfu5Xej7KaZBiyPDJ9sYoCKte78sqgtBdCf6N5S8QosNXBOFSEJnzLMbxJwCOTWAgAAANQU"} post_param_data = { "tag" : { "name" : "我是新標簽" } } response = requests.post(url='https://api.weixin.qq.com/cgi-bin/tags/create', params=url_param_doct, # json=post_param_data # 可以使用json data=json.dumps(post_param_data) # 也可以使用data,但是data要求是字符串,需要使用json模塊dumps轉化 ) print(response.content.decode('utf-8'))
requests上傳文件
import requests,os # post上傳文件 current_path = os.path.dirname(__file__) # os模塊定位當前路徑 excel_path = os.path.join(current_path,'..','data','j.xlsx') # join拼接 excel_file = {'file':open(excel_path,'rb')} # 做成字典,open打開文件 rb:隻讀二進制 response = requests.post(url='https://2.python-requests.org/', # requests官方實例文檔地址 files=excel_file) # files傳文件 print( response.content.decode('utf-8') )
requests設置代理
import requests # 設置代理:為什麼設置代理? # 爬蟲類項目,有檢測機制 # 防止公司系統有防灌水功能 # 需要翻墻做接口的時候 proxy_server = {'http':'http://127.0.0.1:8888', 'https':'http://127.0.0.1:8888'} # 做一個字典 proxy_user_pass = { 'https':'http://uesrname:[email protected]:8888' # 需要用戶跟密碼使用這個 } response = requests.get(url= 'https://baidu.com', proxies=proxy_server) # proxies設置代理關鍵字 print(response.status_code)
time模塊設置請求超時
如果一個請求很久沒有結果,就會讓整個項目的效率變得非常低,這個時候我們就需要對請求進行強制要求
讓他必須在特定的時間內返回結果,否則就報錯。
# 設置請求超時 import requests import time print(time.time()) # 時間戳 response = requests.get(url='https://www.baidu.com',timeout=3) # timeout=3: 請求如果在規定時間之內(3秒鐘內)沒有得到響應,就會拋出超時錯誤 print(time.time())
retrying模塊設置刷新
使用超時參數能夠加快我們整體的請求速度,但是在正常的網頁瀏覽過成功,如果發生速度很慢的情況,我們會做的選擇是刷新頁面
retrying模塊就可以幫助我們解決。使用retrying模塊提供的retry模塊
通過裝飾器的方式使用,讓被裝飾的函數反復執行retry中可以傳入參數stop_max_attempt_number,讓函數報錯後繼續重新執行
達到最大執行次數的上限,如果每次都報錯,整個函數報錯,如果中間有一個成功,程序繼續往後執行。
import requests from retrying import retry # 如果函數連續調用三次都報錯,才會報錯,如果三次之中有一次成功,就成功 @retry(stop_max_attempt_number=3) def get_response(url): response = requests.get(url, timeout=2) return response retrying_requests = get_response("https://www.baidu.com") print(retrying_requests.content.decode())
cookie設置
好處:能夠訪問登錄後的頁面
壞處:一套cookie往往對應的是一個用戶的信息,請求太頻繁有更大的可能性被對方識別為爬蟲
如何解決 ?使用多個賬號
# 使用requests提供的session模塊 import requests # 構造formdata表單數據,填寫自己的賬號和密碼 post_data = { "username": "xxxxx", "password": "xxxxx" } # session的使用: 在請求之前創建session對象 session = requests.Session() # 後續的請求都由session來發起,因為session中保存瞭用戶的登陸信息 session.post(url="https://www.baidu.com", data=post_data) response = session.get("https://www.baidu.com") # 使用session請求登陸後的界面 print(response.content.decode())
處理證書認證錯誤
import requests # 方式一:不驗證證書,報警告,返回200 requests.packages.urllib3.disable_warnings()# 直接解決爆紅警告 # 方式二不驗證證書,報警告,返回200 ,後面拼接verify=False,加這個控制臺報警的話,就在加上方式一 response = requests.get('https://www.12306.cn',verify=False) print(response.content.decode('utf-8')) # 方式三:安裝pyopenssl 安裝之後就不會報錯# pip3 install -U requests[security] response = requests.get('https://www.12306.cn') print(response.content.decode('utf-8')) # 方式四: 加上證書 公司內部 問開發要xxx.crt文件 ,最穩妥 response = requests.get('https://www.12306.cn',cert=('/path/server.crt', '/path/key'))
requests+jsonpath解析數據
hosts = 'https://api.weixin.qq.com' # 主機地址 # 獲取token get_param_dict = { "grant_type":"**********", "appid":"*************", "secret":"***************" } response = requests.get('%s/cgi-bin/token'%hosts,params=get_param_dict) json_obj = response.json() # json數據解析:從一個json體中取出需要的數據,就叫json數據解析 token_id = jsonpath.jsonpath(json_obj,'$.access_token')[0] # 接口依賴,接口關聯 print(token_id)
以上就是python requests模塊的使用的詳細內容,更多關於python requests模塊的使用的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- None Found