教你如何使用Python selenium

一、瞭解selenium

Selenium是一個用於測試網站的自動化測試工具,支持各種瀏覽器包括Chrome、Firefox、Safar等瀏覽器(需要下載驅動),之前是用來做測試網站的,後來發現也可以用來爬取數據(估計開發者都沒想到他開發的selenium被別人廣泛適用於爬蟲領域——笑)。

二、selenium的下載

1.我這裡是使用的Chrom瀏覽器 !註意不要忽視這個地方

2.python中selenium庫的下載(pycharm系列)

由於我用的pycharm的虛擬環境,所以我隻需要在pycharm的終端下載第三方庫就行瞭,簡單,方便,pycharm真是個好用的東西——O(∩_∩)O~

  • 打開pycharm
  • 打開pycharm的終端
  • 輸入pip install selenium -i https://pypi.doubanio.com/simple (這是使用國內鏡像網站下載selenium,下載速度較快)
  • 等待片刻,結束
  • pip list ——查看自己下載的第三方庫,檢查是否成功

3.python中selenium庫的下載(cmd系列)

  • win+R輸入cmd
  • 打開cmd
  • 輸入pip install selenium -i https://pypi.doubanio.com/simple (這是使用國內鏡像網站下載selenium,下載速度較快)
  • 等待片刻,結束
  • pip list ——查看自己下載的第三方庫,檢查是否成功

4.selenium驅動的下載(官網都是英文,看不懂)

  • 打開你的Chrom瀏覽器查看你是什麼版本的(幫助->about chrom),查看版本號
  • 點擊右邊這個藍色的小可愛,沒錯我是小可愛 ,找到與你的chrom瀏覽器版本相匹配的(沒有匹配的,相近的也可以,win都是32位的),下載
  • 沒瞭,沒錯,你沒看錯,真的沒瞭

5.selenium的環境配置,沒錯又是這個煩人的環境配置 真想給他一腳

  • 想必,這個時候已經下載好瞭吧
  • 下載好以後,很簡單,解壓,然後——看3
  • 最好(但是不是必要)創建一個文件夾放你解壓出來的geckodriver,然後復制你這個文件當前的路徑(ctrl + c)
  • 打開環境變量(此電腦->右鍵->屬性->高級系統配置->環境變量),在系統變量找到path,新建,ctrl + v
  • 完事

6.打開你的pycharm,新建一個py文件去寫出以下代碼

from selenium import webdriver
import time
# 導入時間包和selenium包
huohu = webdriver.Chrome()
# 創建一個chome的selenium對象
huohu.get("http://www.elong.com/")
# 打開網站
huohu.quit()
# 退出

寫好後,運行
好,報錯瞭,對,報錯瞭,可能你們不會報錯,反正我報錯瞭

報錯信息是:selenium.common.exceptions.WebDriverException: Message: ‘chromedriver’ executable needs to be in PATH.

意思是,你需要吧chromdriver放到路徑,我照著做瞭,可是呢,還是這個報錯!

這是什麼情況??明明我是按照教程來的啊

著急的我去群裡請求大佬,大佬們直接無視我——::>_<::

然後又去找它——>WalkonNet,左翻翻,右找找,終於找到瞭解決方案:

將chromdriver放在python解釋器的位置,我照著做瞭之後,就成功瞭。。。

好傢夥,上面教程不是說隨便放的嗎?…

哎,人與人之間最基本的信任都沒有瞭

三、selenium的基本使用

from selenium import webdriver
# 導包
driver = webdriver.Chrome()
# 創建一個瀏覽器對象
driver.get("https://m.elong.com/")
# 訪問藝龍網
driver.quit()
# 關閉瀏覽器,也可以不關閉,但是最好關閉,養成一個打開後不忘記關閉的好習慣

然後我們就會發現,瀏覽器界面一閃而過(為什麼?因為頁面渲染完成後,就直接退出瞭),那麼如何才能讓我們能夠觀察到呢?有請我們的time模塊,讓它睡會兒,就能觀察到瞭
這樣改

from selenium import webdriver
import time
# 導包
driver = webdriver.Chrome()
driver.get("https://m.elong.com/")
time.sleep(5)
# 頁面渲染完成後讓它睡5s,這樣就能觀察到瞭
driver.quit()

OK,看到,代碼替我們打開瞭這個網址,並且展示瞭5s後關閉瞭

四、結語

好瞭,相信大傢已經學會如何使用筷子瞭,那麼讓我們去動用我們的筷子去把這個網站抓下來吧——笑,玩個老梗
今天的筆記就到這裡瞭(主要是不想寫瞭,一天當然不可能隻學會點這玩意),拜拜

到此這篇關於教你如何使用Python selenium的文章就介紹到這瞭,更多相關Python selenium內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: