詳解Python Selenium如何獲取鼠標指向的元素
有一個同學在Gne的群裡面咨詢如何通過Selenium獲取當前鼠標指向的元素,在我講瞭方法以後,他過瞭兩天又來問:
那麼,我今天就來寫一篇文章,具體說說應該怎麼操作。
這個方法的核心,是借助JavaScript的事件(event)來獲取鼠標所在的元素。然後再把這個元素傳遞給Selenium。我們先來第一步,不考慮Selenium,隻使用JavaScript,如何獲取當前鼠標指向的元素呢?
我們首先需要知道在JavaScript中的一個事件句柄,叫做window.onmousemove
。默認情況下,它的值是null:
我們可以把它的值修改成一個函數,這個函數接收一個event
參數,這樣當鼠標在網頁上移動的時候,這個函數就會被調用。而event
參數是一個對象,這個對象有兩個屬性.clientX
和.clientY
,分別表示鼠標相當於網頁的橫坐標和縱坐標:
function track_mouse(event){ var x = event.clientX, y = event.clientY console.log('當前鼠標所在位置的坐標:x=' + x + 'y=' + y) }
運行效果如下圖所示:
你執行命令以後,隻要在頁面上移動鼠標,你就會在控制臺看到大量的坐標被打印出來。
接下來,既然你有瞭當前鼠標所在位置的坐標,那麼你隻需要根據坐標查詢到這個元素是什麼就可以瞭。在JavaScript中,有一個函數叫做document.elementFromPoint
,就能實現這個效果:
function track_mouse(event){ var x = event.clientX, y = event.clientY var element = document.elementFromPoint(x, y) if (!element) { return // 當前位置沒有元素 } return element }
那麼,如何把這個參數返回給Selenium呢?其實也非常簡單,我們設置一個全局變量window.hovered_element
,然後把當前鼠標對應的元素賦值給它。然後在Selenium中,使用.execute_script
獲取window.hovered_element
就可以瞭。
我們先來看看完整的JavaScript:
window.hovered_element = null function track_mouse(event){ var x = event.clientX, y = event.clientY var element = document.elementFromPoint(x, y) if (!element) { window.hovered_element = null return // 當前位置沒有元素 } window.hovered_element = element } window.onmousemove = track_mouse
然後我們再來看看Selenium中的Python代碼:
import time from selenium.webdriver import Chrome driver = Chrome('./chromedriver') driver.get('https://www.kingname.info/') js = ''' window.hovered_element = null function track_mouse(event){ var x = event.clientX, y = event.clientY var element = document.elementFromPoint(x, y) if (!element) { window.hovered_element = null return // 當前位置沒有元素 } window.hovered_element = element } window.onmousemove = track_mouse ''' driver.execute_script(js) while True: element = driver.execute_script('return window.hovered_element') if element: print(f'當前鼠標所在的標簽為:{element.tag_name}, 其中的文本內容為:{element.text}') time.sleep(1)
運行效果如下圖所示:
獲取到瞭當前鼠標所在的元素的標簽和標簽裡面的文字。
到這裡,這個同學需要的功能已經完全實現瞭。
但可能有聰明的同學會發現,他這個需求是有問題的。我們能看到至少有三個問題:
- 因為
window.onmousemove
太靈敏瞭,它的采樣時間是毫秒級別的,鼠標稍稍移動一點點就會生成一個事件。但是,一個元素的區域是很大的,在一個元素內部移動鼠標,其實根本沒有必要更新window.hovered_element
。 - 在Selenium裡面,是通過
while True
每1秒查詢一次window.hovered_element
,雖然我們已經降低瞭頻率,但大傢從上面的圖中可以看到,還是會獲取到很多重復的數據。這是由於有一些元素非常大,我們鼠標如果在上面慢慢移動,時間會超過1秒,那麼Selenium就會重復獲取到數據。 - 由於
window.onmousemove
的采樣時間間隔很小,所以我們可以近似把鼠標的移動看做是連續的移動。因此,這段代碼會記錄鼠標軌跡路徑上面的每一個元素。但實際上,我們並不會對網頁上所有的內容都感興趣,我們隻會對特定的內容感興趣。因此,獲取當前鼠標所在位置的元素,其實是一個偽需求,它根本沒有什麼實際上用處,因為噪聲太大瞭,無用的數據太多瞭!
實際上,我覺得真正的需求應該是這樣的:如果鼠標在網頁上面某個元素停留時間超過5秒,那麼獲取這個元素。
但這樣做太費時間瞭。每次都要等5秒,豈不是帶薪摸魚?那需求能不能改成獲取當前鼠標點擊的元素呢?如果你實踐一下,你會發現,當你點擊一個鏈接的時候,網頁自動就跳轉到另一個頁面去瞭,並不能獲取到你需要的數據。
到此這篇關於詳解Python Selenium如何獲取鼠標指向的元素的文章就介紹到這瞭,更多相關Selenium鼠標指向元素內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python自動化測試selenium執行js腳本實現示例
- JavaScript實現鼠標拖拽效果
- Selenium執行JavaScript腳本的方法示例
- js實現簡單的拖拽效果
- JavaScript實現div的鼠標拖拽效果