python selenium保存圖片最好的兩種方法

selenium爬取頁面時經常遇到要保存圖片的需求,通常的做法是獲取鏈接後用 requests 下載,但這種方法脫離瞭selenium環境,如遇到有校驗的情況還需要繞過校驗。

下面介紹兩種直接通過selenium保存圖片的方法:

1. 通過抓包

selenium-wire 是selenium擴展,它可以對所有請求抓包,同時還可以修改請求頭,請求body,請求返回值等,功能非常強大。

selenium-wire 的使用和selenium一樣,你隻從seleniumwire導入webdriver就行,對於其他包還是從selenium導入

from selenium.webdriver.chrome.options import Options
from seleniumwire.webdriver import Chrome

driver = Chrome(options= Options())

下載圖片有兩種方法:

1-1.通過攔截器

通過攔截器預先把所有圖片保存下來,要用到時在緩存目錄中找

def get_img_path_from_url(url):
    # 自行實現
    return url

def response_interceptor(request, response):
    t=response.headers['Content-Type']
    if request.host=='xxx' and t and 'image' in t:
        with open(get_img_path_from_url(request.url), 'wb') as f:
            f.write(response.body)
            
driver.response_interceptor = response_interceptor

driver.get('...')
src=driver.find_element_by_tag_name('img').get_attribute('src')
img_path=get_img_path_from_url(src)

1-2. 請求後在所有請求中獲取

這種方法有個缺點,瀏覽器會自動緩存圖片,如果之前已經緩存過這張圖片是不會有網絡請求的

# 下載前先清理數據,不然請求太多
del driver.requests
driver.get('...')
src=driver.find_element_by_tag_name('img').get_attribute('src')</code>
<code>
for r in driver.iter_requests():
    if r.url==src:
        with open('img', 'wb') as f:
            f.write(r.response.body)

2. 通過canvas

使用js把圖片放到canvas中,然後獲取base64字符串,再保存

import base64
import os
import re
from io import BytesIO
from PIL import Image

def base64_to_image(base64_str):
    base64_data = re.sub('^data:image/.+;base64,', '', base64_str)
    byte_data = base64.b64decode(base64_data)
    image_data = BytesIO(byte_data)
    img = Image.open(image_data)
    return img


js = "let c = document.createElement('canvas');let ctx = c.getContext('2d');" \
     "let img = document.getElementsByTagName('img')[0]; /*找到圖片*/ " \
     "c.height=img.naturalHeight;c.width=img.naturalWidth;" \
     "ctx.drawImage(img, 0, 0,img.naturalWidth, img.naturalHeight);" \
     "let base64String = c.toDataURL();return base64String;"
     
base64_str = driver.execute_script(js)
img = base64_to_image(base64_str)

img.save('xx.png')

總結

到此這篇關於python selenium保存圖片最好的兩種方法的文章就介紹到這瞭,更多相關python selenium保存圖片內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: