selenium+超級鷹實現模擬登錄12306
最近迷上瞭用selenium去登陸各大網站,別說selenium真挺好用,可以輕松搞定ajax動態加載的網頁,不用很費勁的去抓包查找。咳咳…跑題瞭,回歸正題。
這次用selenium去登錄12306網站,聽說比較困難。我就去試瞭試,發現它的驗證碼實在是那啥…就是這樣的。聽頭疼的。
我來說說主要的代碼編寫吧。
過程:
用我們的開發者工具定位到輸入賬號和密碼的窗口,找到並send_keys
driver.find_element_by_id('username').send_keys('用戶名') time.sleep(0.5) driver.find_element_by_id('password').send_keys('密碼')
然後復雜的過程就來瞭。我們想要得到驗證碼的圖片。但是頭疼的是,圖片是再變化的。我們請求一次,就變化一次,不像其他普通網站一樣不會變化,直接保存圖片就行瞭。但是這是12306誒,哪這麼輕松。想瞭想,我決定把整張頁面截屏保存下來,然後對驗證碼區域裁剪下來,就可以保證一致瞭。
# 將頁面進行截圖並保存 driver.save_screenshot('12306登錄頁面截圖.png') # 確定驗證碼左上角和右下角的坐標 code_img = driver.find_element_by_xpath('//*[@id="loginForm"]/div/ul[2]/li[4]/div/div/div[3]/img') location = code_img.location # 確定驗證碼圖片左上角的坐標 print('location:', location) size = code_img.size # 確定驗證碼圖片的長和寬 print('size:', size) rangle = (int(location['x']), int(location['y']), int(location['x']) + int(size['width']), int(location['y']) + int(size['height'])) print('rangle:', rangle) i = Image.open('12306頁面截圖.png') # 對指定區域裁剪 code_pic = i.crop(rangle) file_name = 'code_pic.png' code_pic.save(file_name) time.sleep(2) print('驗證碼圖片保存成功!!')
我們識別驗證碼用的是超級鷹,具體如何使用可以去查一查。驗證碼有可能需要我們點擊多個,所以通過打碼平臺會得到多個坐標,就比如這種。有兩個日歷,需要點擊兩次,通過超級鷹就會得到兩個坐標。如下圖。我們發現有兩個坐標會有一個“|”,有三個坐標就有兩個“|”,所以我們就把他們split下,讓每個坐標嵌套再一個列表裡。此過程代碼如下:
# 識別驗證坐標 chaojiying = Chaojiying_Client('用戶賬號', '密碼', '開發者賬號') # 用戶中心>>軟件ID 生成一個替換 96001 im = open('code_pic.png', 'rb').read() # 本地圖片文件路徑 來替換 a.jpg 有時WIN系統須要// result = chaojiying.PostPic(im, 9004)['pic_str'] # 1902 驗證碼類型 官方網站>>價格體系 3.4+版 print 後要加() all_list = [] # 存儲被點擊的坐標 if '|' in result: list1 = result.split('|') xy_list = [] count1 = len(list1) for i in list1: x = int(list1[i].split(',')[0]) xy_list.append(x) y = int(list1[i].split(',')[1]) xy_list.append(y) all_list.append(xy_list) else: xy_list = [] x = int(result.split(',')[0]) xy_list.append(x) y = int(result.split(',')[1]) xy_list.append(y) all_list.append(xy_list) print(all_list)
最後嘛,我們得到瞭驗證碼的坐標,當然就去點擊啦。但是,這個坐標是相對於驗證碼的圖片的坐標,我們必須用ActionChains來移動一下動作鏈的位置。把他移動到驗證碼圖片的location。,然後點擊就ok瞭。此步驟的代碼如下:
# 循環遍歷點擊圖片 for i in all_list: x = i[0] y = i[1] action = ActionChains(driver).move_to_element_with_offset(code_img, x, y).click().perform() time.sleep(1) driver.find_element_by_id('loginSub').click()
最後來看看全部代碼吧!!
這個代碼是超級鷹提供的接口。我封裝成一個類瞭。
#!/usr/bin/env python # coding:utf-8 import requests from hashlib import md5 class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username password = password.encode('utf8') self.password = md5(password).hexdigest() self.soft_id = soft_id self.base_params = { 'user': self.username, 'pass2': self.password, 'softid': self.soft_id, } self.headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)', } def PostPic(self, im, codetype): """ im: 圖片字節 codetype: 題目類型 參考 http://www.chaojiying.com/price.html """ params = { 'codetype': codetype, } params.update(self.base_params) files = {'userfile': ('ccc.jpg', im)} r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers) return r.json() def ReportError(self, im_id): """ im_id:報錯題目的圖片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json()
下面是自己寫的,也就六七十行。
from selenium import webdriver from chaojiying_Python.chaojiying import Chaojiying_Client import time from PIL import Image from selenium.webdriver import ActionChains from selenium.webdriver.chrome.options import Options # 實現無可視化界面的操作 # chrome_options = Options() # chrome_options.add_argument('--headless') # chrome_options.add_argument('--disable-gpu') driver = webdriver.Chrome('D:\software\studySoftware\chromedriver_win32\chromedriver.exe') driver.get('https://kyfw.12306.cn/otn/login/init') # driver.maximize_window() time.sleep(1) driver.find_element_by_id('username').send_keys('用戶名') time.sleep(0.5) driver.find_element_by_id('password').send_keys('密碼') # 將頁面進行截圖並保存 driver.save_screenshot('12306登錄頁面截圖.png') # 確定驗證碼左上角和右下角的坐標 code_img = driver.find_element_by_xpath('//*[@id="loginForm"]/div/ul[2]/li[4]/div/div/div[3]/img') location = code_img.location # 確定驗證碼圖片左上角的坐標 print('location:', location) size = code_img.size # 確定驗證碼圖片的長和寬 print('size:', size) rangle = (int(location['x']), int(location['y']), int(location['x']) + int(size['width']), int(location['y']) + int(size['height'])) print('rangle:', rangle) i = Image.open('12306頁面截圖.png') # 對指定區域裁剪 code_pic = i.crop(rangle) file_name = 'code_pic.png' code_pic.save(file_name) time.sleep(2) print('驗證碼圖片保存成功!!') # 識別驗證坐標 chaojiying = Chaojiying_Client('用戶賬號', '密碼', '開發者賬號') # 用戶中心>>軟件ID 生成一個替換 96001 im = open('code_pic.png', 'rb').read() # 本地圖片文件路徑 來替換 a.jpg 有時WIN系統須要// result = chaojiying.PostPic(im, 9004)['pic_str'] # 1902 驗證碼類型 官方網站>>價格體系 3.4+版 print 後要加() all_list = [] # 存儲被點擊的坐標 if '|' in result: list1 = result.split('|') xy_list = [] count1 = len(list1) for i in list1: x = int(list1[i].split(',')[0]) xy_list.append(x) y = int(list1[i].split(',')[1]) xy_list.append(y) all_list.append(xy_list) else: xy_list = [] x = int(result.split(',')[0]) xy_list.append(x) y = int(result.split(',')[1]) xy_list.append(y) all_list.append(xy_list) print(all_list) # 循環遍歷點擊圖片 for i in all_list: x = i[0] y = i[1] action = ActionChains(driver).move_to_element_with_offset(code_img, x, y).click().perform() time.sleep(1) driver.find_element_by_id('loginSub').click()
到此這篇關於selenium+超級鷹實現模擬登錄12306的文章就介紹到這瞭,更多相關selenium 模擬登錄12306內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python通用驗證碼識別OCR庫ddddocr的安裝使用教程
- Python編程使用Selenium模擬淘寶登錄實現過程
- Python selenium 實例之通過 selenium 查詢禪道是否有任務或者BUG
- 詳解Python 使用 selenium 進行自動化測試或者協助日常工作
- 基於python+selenium自動健康打卡的實現代碼