Python中Selenium對Cookie的操作方法
1、Cookie介紹
HTTP協議是無狀態的協議。一旦數據交換完畢,客戶端與服務器端的連接就會關閉,再次交換數據需要建立新的連接,這就意味著服務器無法從連接上跟蹤會話。也就是說即使第一次和服務器連接後並且登錄成功後,第二次請求服務器依然不能知道當前請求是哪個用戶。舉個例子:用戶A購買瞭一件商品放入購物車內,當再次購買商品時,服務器已經無法判斷該購買行為是屬於用戶A的會話,還是用戶B的會話瞭。要跟蹤該會話,必須引入一種機制。
什麼是一次會話:
用戶打開瀏覽器訪問某個網站, 在這個網站上瀏覽任意頁面, 訪問完成後將瀏覽器關閉的過程稱為是一次會話。
Cookie
的出現就是為瞭解決這個問題,第一次登錄後服務器後,如果服務器需要記錄該用戶狀態,就使用Response
向客戶端瀏覽器頒發一個Cookie
,瀏覽器會把Cookie
數據保存在本地。該用戶發送第二次請求的時候,就會自動的把上次請求存儲的Cookie
數據自動的攜帶給服務器,服務器檢查該Cookie
存儲name
、value
等信息,以此來辨認用戶狀態,服務器還可以根據需要修改Cookie
的內容。Cookie
就相當於是服務器給客戶端們頒發一個通行證,每人一個,無論誰訪問都必須攜帶自己通行證。這樣服務器就能從通行證上確認客戶身份,這就是Cookie
的工作原理。Cookie
存儲的數據量有限,不同的瀏覽器有不同的存儲大小,但一般不超過4KB,因此使用Cookie
隻能存儲一些小量的數據。Cookie
的出現彌補HTTP協議無狀態的不足。但是Cookie
是存儲在客戶端的,通過瀏覽器或者抓包工具很容易就能獲取到,所以非常不安全。
2、Session介紹
Session
是另一種記錄客戶狀態的機制,不同的是Cookie
保存在客戶端瀏覽器中,而Session
保存在服務器上。客戶端瀏覽器訪問服務器的時候,服務器把客戶端信息以某種形式記錄在服務器上。存儲在服務器的數據會更加的安全,不容易被竊取。客戶端瀏覽器再次訪問時,隻需要從該Session
中查找該客戶的狀態就可以瞭。- 如果說
Cookie
機制是通過檢查客戶身上的“通行證”來確定客戶身份的話,那麼Session
機制就是通過檢查服務器上的“客戶明細表”來確認客戶身份。Session
相當於程序在服務器上建立的一份客戶檔案,客戶來訪的時候隻需要查詢客戶檔案表就可以瞭。 Session
存儲在服務器也有一定的弊端,就是會占用服務器的資源,但現在服務器已經發展至今,存儲一些Session
信息還是綽綽有餘的。
3、Cookie工作原理圖解
如下圖所示:
提示:如果步驟5攜帶的是過期的cookie或者是錯誤的cookie,那麼將認證失敗,返回至要求身份認證頁面。
記錄Cookie的作用:
- 用戶第一次登陸時,勾選下次直接登陸或者記住密碼,就是采用記錄
Cookie
實現的。 Cookie
內記錄用戶名和密碼(加密)信息,隻要請求時服務器收到Cookie
,識別成功,默認為已登陸。
4、Cookie內容參數說明
參數 | 描述 |
---|---|
name | 必需。規定 Cookie的名稱。 |
value | 必需。規定 Cookie的值。 |
expire | 可選。規定 Cookie的有效期。 |
domain | 可選。規定 Cookie的域名。 |
path | 可選。規定 Cookie的服務器路徑。 |
secure | 可選。規定是否通過安全的 HTTPS 連接來傳輸 Cookie。 |
httpOnly | 可選。防止XSS攻擊(跨站腳本攻擊) |
說明:
path
:Cookie
的有效范圍,這個參數是在domain
參數基礎上的有效范圍,如果path
設置為”/”
,那就是在整個domain
都有效。secure
:Cookie
是否僅通過安全的https,值為0或1。如果值為1,則Cookie
隻能在https
連接上有效,默認值為0,表示Cookie
在http
和https
連接上都有效。(0或1,也可表示Flase或True)httpOnly
:通過js
腳本將無法讀取到Cookie
信息,這樣能有效的防止XSS攻擊(跨站腳本攻擊),這樣就增加瞭Cookie
的安全性,即便是這樣,也不要將重要信息存入Cookie
。
5、Selenium操作Cookie的API
webdriver
可以讀取、添加和刪除Cookie
信息。
webdriver
操作Cookie
的方法有:
操作 | 說明 |
---|---|
get_cookies() | 獲得所有Cookie信息(重點) |
add_cookie(cookie_dict) | 添加Cookie,必須有name 和value 值(重點) |
get_cookie(name值) | 返回指定name名稱的Cookie信息 |
delete_cookie(name) | 刪除特定(部分)的Cookie信息 |
delete_all_cookies() | 刪除所有Cookie信息 |
6、Selenium操作Cookie的示例
""" 1.學習目標: 掌握selenium對cookie操作 2.語法 2.1獲取所有cookie driver.get.cookies() 返同列表格式字典類型 [{},{},{}] 2.2添加cookie driver.add_cookie(參數) 參數:字典格式{"name":"name值","value":"value值"} 3.需求 實現selenium對cookie操作 """ # 1.導入selenium from selenium import webdriver from time import sleep # 2.打開瀏覽器 driver = webdriver.Chrome() # 3.打開註冊A頁面 # 不打開一個頁面,cookie為[]。 url = "http://www.baidu.com/" driver.get(url) # 4.操作cookie # 4.1 獲取cookie cookies = driver.get_cookies() for cookie in cookies: # 值打印cookie中的name和value print("%s -> %s" % (cookie['name'], cookie['value'])) print("=======================") # 4.2 獲取一個cookie的指定屬性值 # 參數是一個cookie中name的屬性值 # 沒有找到返回None print(driver.get_cookie("BAIDUID")) print("=======================") # 4.3 添加cookie cookie = {"name": "key-aaaaaaa", "value": "value-aaaaaaa"} driver.add_cookie(cookie) # 添加後再次獲取 cookies = driver.get_cookies() for cookie in cookies: print("%s -> %s" % (cookie['name'], cookie['value'])) print("=======================") # 4.4 刪除指定cookie # 根據name刪除 driver.delete_cookie("key-aaaaaaa") # 刪除後再次獲取 cookies = driver.get_cookies() for cookie in cookies: print("%s -> %s" % (cookie['name'], cookie['value'])) print("=======================") # 4.5 刪除全部cookie driver.delete_all_cookies() print(driver.get_cookies()) # 5.關閉瀏覽器 sleep(2) driver.quit()
參考:https://www.cnblogs.com/linguoguo/p/5106618.html
到此這篇關於Selenium對Cookie的操作 的文章就介紹到這瞭,更多相關Selenium Cookie操作 內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python Selenium操作Cookie的實例方法
- Python爬蟲基礎之selenium庫的用法總結
- python+selenium 實現掃碼免密登錄示例代碼
- 利用Selenium添加cookie實現自動登錄的示例代碼(fofa)
- 全網最全python庫selenium自動化使用詳細教程