關於python中.xpath的使用問題

在python中使用xpath定位時,有時候會先用.xpath定位到一個地點,for循環後,繼續使用.xpath,但是會出現問題,比如在下面這個例子中:

 

 根據xpath定位到瞭tr,註意遊覽器自動生成瞭tbody,在python中要把自動生成的tbody層級去掉。

此時我們想獲取tr下面的td,請看代碼

import requests
from lxml import etree
 
url = "https://www.w3school.com.cn/xpath/xpath_axes.asp"
res = requests.get(url).text
html = etree.HTML(res)
a = html.xpath("(//table[@class='dataintable'])[1]/tr")
print(a)
 
for i in a:
    s = i.xpath("//td")
    print(s)
    print(len(s))

for i in a下,我們想找到的是每個tr下面的td,按理來說隻有兩個,但是返回的卻是全部的44個td,問題出在哪裡呢?原來是s = i.xpath(“//td”)這個寫法不對,雖然 i 繼承瞭 a 的xpath路徑,但是如果寫成//td,等於告訴xpath重新搜索全部,必須要加上點才可以。s = i.xpath(“.//td”),一個點代表當前目錄,兩個點代表上級目錄

 這次搜索正常瞭

總結:除非在一開始的搜索式直接寫成 (//table[@class=’dataintable’])[1]/tr//td,這樣直接搜索td,不用帶點,在復用.xpath的時候,必須加上點表明當前目錄,否則搜索不到想要的結果

到此這篇關於關於python中.xpath的復用的文章就介紹到這瞭,更多相關python .xpath復用內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: