教你怎麼用python批量登錄帶有驗證碼的網站
一、介紹
原理為使用selenium驅動chorme打開一個新的進程並打開數組中的網址,之後程序自動輸入我們事先填入的賬號密碼,通過已實現的驗證碼識別模塊填寫驗證碼進行登錄。登陸完成後自動切換頁面,進行下一個頁面的登錄
二、準備
部署環境:win10
開發環境:python2.7
chrome版本89.0.4389.128
三、實踐
3.1 下載驅動
設置查看chorme版本
下載對應版本的chromedriver
解壓後,將chromedriver.exe分別放進chrome瀏覽器目錄 和 Python根目錄
chrome瀏覽器目錄(如:C:\Program Files (x86)\Google\Chrome\Application)
Python根目錄(如:D:\Python\Python37)
3.2 安裝python依賴
pip install pillow
pip install selenium
3.3 編寫程序
batchlogin.py
#coding=UTF-8 import time import os from selenium import webdriver from selenium.common.exceptions import NoAlertPresentException from pytesser import * from PIL import Image from PIL import ImageEnhance from PIL import ImageFilter import traceback threshold = 140 table = [] for i in range(256): if i < threshold: table.append(0) else: table.append(1) rep={'O':'0', 'I':'1','L':'1', 'Z':'2', 'S':'8' }; ## 灰度化照片後得到驗證碼 def getverify1(name): im = Image.open(name) # 轉化到灰度圖 imgry = im.convert('L') # imgry.save('g'+name) # 二值化,采用閾值分割法,threshold為分割點 out = imgry.point(table,'1') # out.save('b'+name) # 識別 text = image_to_string(out) # 校正 text = text.strip() text = text.upper(); for r in rep: text = text.replace(r,rep[r]) # out.save(text+'.jpg') print text return text # 獲取瀏覽器當前的驗證碼圖片並調用返回驗證碼 def getVCode(driver): # 保存瀏覽器當前頁面 driver.save_screenshot("page.png") # 從頁面中截取驗證碼(XPATH定位) vcode = driver.find_element_by_xpath("//*[@id='randImage']") # 獲取驗證碼上下左右邊界坐標(手動加減像素以更精確) loc = vcode.location size = vcode.size left = loc['x']+5 top = loc['y'] right = (loc['x'] +size['width']-5) button = (loc['y']+size['height']) # 截取頁面中的驗證碼(進行截圖:參數時一個元組(left,top,right,button)並保存 page_pic = Image.open('page.png') v_code_pic = page_pic.crop((left,top,right,button)) v_code_pic.save('yzm.png') return getverify1('yzm.png') # return getverify1(v_code_pic) #自動登錄操作(參數為登路賬號,密碼,webdriver驅動對象) def login(username,password,driver): v_code = getVCode(driver) driver.find_element_by_id('user_name').click() # 點擊用戶名輸入框 driver.find_element_by_id('user_name').clear() # 清空輸入框 driver.find_element_by_id('user_name').send_keys(username) # 自動敲入用戶名 driver.find_element_by_id('user_password').click() # 點擊密碼輸入框 driver.find_element_by_id('user_password').clear() # 清空輸入框 driver.find_element_by_id('user_password').send_keys(password) # 自動敲入密碼 driver.find_element_by_id('v_code').click() # 點擊驗證碼輸入框 driver.find_element_by_id('v_code').clear() # 清空輸入框 driver.find_element_by_id('v_code').send_keys(v_code) # 自動敲入驗證碼 driver.find_element_by_xpath('//*[@id="SubmitButton"]').click()
open.py
#coding=UTF-8 from selenium import webdriver from batchlogin import * driver = webdriver.Chrome() urls=[ 'http://www.test.com:6086/QX_SPD_B2B/', 'http://www.test.com:6086/QX_SPD_B2B/' ] for i in range(0, len(urls)): url = urls[i] windows_open = "window.open('" + url + "')" driver.execute_script(windows_open) time.sleep(1) #獲取當前頁面句柄 windows = driver.window_handles driver.switch_to_window(windows[i+1]) login("USERNAME","PASSWORD",driver) #cookies=driver.get_cookies() #print(cookies) ##解決頁面加載不正確的問題 time.sleep(2) time.sleep(100) driver.close()
3.4 優化
在圖片保存那塊直接讀取網站的圖片並且不保存直接識別
到此這篇關於教你怎麼用python批量登錄帶有驗證碼的網站的文章就介紹到這瞭,更多相關python登錄有驗證碼的網站內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- None Found