詳解Python Selenium如何獲取鼠標指向的元素

Posted on 2022-03-07 by WalkonNet

有一個同學在Gne的群裡面咨詢如何通過Selenium獲取當前鼠標指向的元素，在我講瞭方法以後，他過瞭兩天又來問：

那麼，我今天就來寫一篇文章，具體說說應該怎麼操作。

這個方法的核心，是借助JavaScript的事件(event)來獲取鼠標所在的元素。然後再把這個元素傳遞給Selenium。我們先來第一步，不考慮Selenium，隻使用JavaScript，如何獲取當前鼠標指向的元素呢？

我們首先需要知道在JavaScript中的一個事件句柄，叫做window.onmousemove。默認情況下，它的值是null:

我們可以把它的值修改成一個函數，這個函數接收一個event參數，這樣當鼠標在網頁上移動的時候，這個函數就會被調用。而event參數是一個對象，這個對象有兩個屬性.clientX和.clientY，分別表示鼠標相當於網頁的橫坐標和縱坐標：

function track_mouse(event){
 var x = event.clientX, y = event.clientY
 console.log('當前鼠標所在位置的坐標：x=' +  x + 'y=' + y)
}

運行效果如下圖所示：

你執行命令以後，隻要在頁面上移動鼠標，你就會在控制臺看到大量的坐標被打印出來。

接下來，既然你有瞭當前鼠標所在位置的坐標，那麼你隻需要根據坐標查詢到這個元素是什麼就可以瞭。在JavaScript中，有一個函數叫做document.elementFromPoint，就能實現這個效果：

function track_mouse(event){
 var x = event.clientX, y = event.clientY
 var element = document.elementFromPoint(x, y)
  if (!element) {
  return // 當前位置沒有元素
 } 
  return element
}

那麼，如何把這個參數返回給Selenium呢？其實也非常簡單，我們設置一個全局變量window.hovered_element，然後把當前鼠標對應的元素賦值給它。然後在Selenium中，使用.execute_script獲取window.hovered_element就可以瞭。

我們先來看看完整的JavaScript:

window.hovered_element = null
function track_mouse(event){
 var x = event.clientX, y = event.clientY
 var element = document.elementFromPoint(x, y)
  if (!element) {
      window.hovered_element = null
  return // 當前位置沒有元素
 } 
  window.hovered_element = element
}
window.onmousemove = track_mouse

然後我們再來看看Selenium中的Python代碼：

import time
from selenium.webdriver import Chrome

driver = Chrome('./chromedriver')
driver.get('https://www.kingname.info/')

js = '''
window.hovered_element = null
function track_mouse(event){
 var x = event.clientX, y = event.clientY
 var element = document.elementFromPoint(x, y)
  if (!element) {
      window.hovered_element = null
  return // 當前位置沒有元素
 } 
  window.hovered_element = element
}
window.onmousemove = track_mouse
'''

driver.execute_script(js)
while True:
    element = driver.execute_script('return window.hovered_element')
    if element:
        print(f'當前鼠標所在的標簽為：{element.tag_name}, 其中的文本內容為：{element.text}')
    time.sleep(1)

運行效果如下圖所示：

獲取到瞭當前鼠標所在的元素的標簽和標簽裡面的文字。

到這裡，這個同學需要的功能已經完全實現瞭。

但可能有聰明的同學會發現，他這個需求是有問題的。我們能看到至少有三個問題：

因為window.onmousemove太靈敏瞭，它的采樣時間是毫秒級別的，鼠標稍稍移動一點點就會生成一個事件。但是，一個元素的區域是很大的，在一個元素內部移動鼠標，其實根本沒有必要更新window.hovered_element。
在Selenium裡面，是通過while True每1秒查詢一次window.hovered_element，雖然我們已經降低瞭頻率，但大傢從上面的圖中可以看到，還是會獲取到很多重復的數據。這是由於有一些元素非常大，我們鼠標如果在上面慢慢移動，時間會超過1秒，那麼Selenium就會重復獲取到數據。
由於window.onmousemove的采樣時間間隔很小，所以我們可以近似把鼠標的移動看做是連續的移動。因此，這段代碼會記錄鼠標軌跡路徑上面的每一個元素。但實際上，我們並不會對網頁上所有的內容都感興趣，我們隻會對特定的內容感興趣。因此，獲取當前鼠標所在位置的元素，其實是一個偽需求，它根本沒有什麼實際上用處，因為噪聲太大瞭，無用的數據太多瞭！

實際上，我覺得真正的需求應該是這樣的：如果鼠標在網頁上面某個元素停留時間超過5秒，那麼獲取這個元素。

但這樣做太費時間瞭。每次都要等5秒，豈不是帶薪摸魚？那需求能不能改成獲取當前鼠標點擊的元素呢？如果你實踐一下，你會發現，當你點擊一個鏈接的時候，網頁自動就跳轉到另一個頁面去瞭，並不能獲取到你需要的數據。

到此這篇關於詳解Python Selenium如何獲取鼠標指向的元素的文章就介紹到這瞭,更多相關Selenium鼠標指向元素內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

詳解Python Selenium如何獲取鼠標指向的元素

推薦閱讀：

發佈留言取消回覆

近期文章

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆