C#使用selenium實現爬蟲
一、介紹:
Selenium 是一個用於Web應用程序測試的工具。Selenium測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。
1、Selenium Webdriver(也就是Selenium2,Selenium3)和Selenium RC(Selenium 1)一樣提供瞭web自動化的各種語言調用接口庫。相比Selenium RC,Selenium WebDriver的編程接口更加直觀易懂,也更加簡練。
但是和Selenium RC不同的是,Selenium Webdriver是通過各種瀏覽器的驅動(web driver)來驅動瀏覽器的,而不是通過註入JavaScript的方式。
我們的代碼運行起來是一個進程,裡面調用Selenium WebDriver的庫和各個瀏覽器的驅動進程 進行交互,傳遞Selenium命令 給它們,並且獲取命令執行的結果,返回給我們的代碼進行處理。
2、Selenium WebDriver目前包括兩個版本Selenium 2和Selenium 3。這兩個版本從開發代碼調用接口上來看,幾乎沒什麼區別。區別在於庫的實現和web driver的實現。
Selenium2是Selenium組織幫各種瀏覽器寫web driver的,而Selenium 3裡面的web driver是由各個瀏覽器廠商(Apple,Google,Microsoft,Mozilla)自己提供的。所以Selenium 3的自動化效率更高,成功率也更高。
3、Selenium WebDriver 支持瀏覽器眾多:
- Google Chrome
- Microsoft Internet Explorer 7,8,9,10,11在 Windows Vista,Windows 7,Windows 8,Windows 8.1.
- Microsoft Edge
- Firefox
- Safari
- Opera
利用它可以驅動瀏覽器執行特定的動作,如點擊、下拉等操作,同時還可以獲取瀏覽器當前呈現的頁面的源代碼 ,做到可見即可爬。
所以Selenium現在被廣泛用於Python爬蟲。查瞭下資料,發現這個工具確實強大,最重要的是,C#也是可以調用的。
官方支持Java,C#,Python,Ruby,PHP,Perl,Javascript等語言
官方文檔(有C#示例):https://www.selenium.dev/documentation/en/
安裝Selenium:
1、我們新建一個C#控制臺程序
2、使用Nuget搜索以下依賴庫
需要引用的核心庫是Selenium.RC,Selenium.Support,Selenium.WebDriver
然後再需要引用瀏覽器驅動庫,這裡我以新版Edge瀏覽器為例,新版Edge使用方式跟Chrome是一樣的,程序包名稱為Selenium.WebDriver.MSEdgeDriver。
備註:也可以在微軟WebDriver官網下載Edge (Chromium)的webdriver,需要和當前瀏覽器版本一致。然後下載放置到項目可執行文件的目錄。
如果使用Chrome:
先查下本機Chrome的版本
然後去Nuget搜索Selenium.WebDriver.ChromeDriver進行下載安裝。
註意:webdriver版本隻需要和當前瀏覽器主版本一致即可。
3、在Main函數中輸入以下代碼
using OpenQA.Selenium; using OpenQA.Selenium.Edge; using System; using System.Windows.Forms; namespace WinForm2 { public partial class Form1 : Form { public Form1() { InitializeComponent(); } private void Form1_Load(object sender, EventArgs e) { var service = EdgeDriverService.CreateDefaultService(@".", "msedgedriver.exe"); using (IWebDriver driver = new OpenQA.Selenium.Edge.EdgeDriver(service)) { driver.Navigate().GoToUrl("http://www.baidu.com"); //driver.Url = "http://www.baidu.com"是一樣的 var source = driver.PageSource; this.textBox1.Text = source; } } } }
如果是Chrome瀏覽器,可以這樣:
IWebDriver driver = new OpenQA.Selenium.Chrome.ChromeDriver(); driver.Navigate().GoToUrl("http://www.baidu.com");
運行,會彈出IE瀏覽器,網頁加載完成後,瀏覽器會自動關閉。控制臺輸入結果如下
這樣我們就可以輕松的獲取動態渲染頁面的源碼。
二、等待
常用的等待分為顯示等待WebDriverWait()、隱式等待ImplicitlyWait()、強制等待sleep()三種,下面我們就分別介紹一下這三種等待的區別
- Sleep(): 強制等待,設置固定休眠時間。
- ImplicitlyWait():隱式等待,也叫智能等待,是 webdirver 提供的一個超時等待。隱的等待一個元素被發現,或一個命令完成。如果超出瞭設置時間的則拋出異常。
- WebDriverWait():顯示等待,同樣也是 webdirver 提供的方法。在設置時間內,默認每隔一段時間檢測一次當前頁面元素是否存在,如果超過設置時間檢測不到則拋出異常。默認檢測頻率為0.5s,默認拋出異常為:NoSuchElementException
1、隱式等待:ImplicitlyWait
用到Timeouts對象。這個對象是用來對設置器進行一些設置的。
- ImplicitlyWait:設置腳步在查找(定位)元素時最大的超時時間。如FindElement()方法在一些超大網頁中進行定位時的超時時間。
- PageLoad:設置頁面操作超時時間(不是頁面加載時間)。是在頁面進行跳轉操作或刷新操作時的等待時間。如Navigation對象的各種操作方法,以及在頁面上進行某種操作後的等待時間。
- AsynchronousJavaScript: 設置腳步異步執行的超時時間。
代碼如下:
driver.Navigate().GoToUrl("http://www.baidu.com"); ITimeouts timeouts = driver.Manage().Timeouts(); //設置查找元素最大超時時間為30秒 timeouts.ImplicitWait = new TimeSpan(0, 0, 30); //設置頁面操作最大超時時間為30秒 timeouts.PageLoad = new TimeSpan(0, 0, 30); //設置腳本異步最大超時時間為30秒 timeouts.AsynchronousJavaScript = new TimeSpan(0, 0, 30);
2、顯示等待:WebDriverWait()
//等待頁面元素加載完成 //默認等待100秒 WebDriverWait wait = new WebDriverWait(driver, TimeSpan.FromSeconds(100)); //等待頁面上ID屬性值為submitButton的元素加載完成 IWebElement myElement = wait.Until((d) => { return d.FindElement(By.Id("submitButton")); });
三、查找(定位對象)
通過FindElement()這個方法來查找的。然後把參數傳遞過去。
driver.FindElement(By.Id ("kw")).SendKeys("搜索關鍵字"); driver.FindElement(By.Id( "su")).Click();
其中By.id("su")就是定位參數,傳遞一個對象過去。有8種定位方式。
註意:其中PartialLinkText是模糊查找。比如百度網頁中的關於 參數寫“關”就可以瞭,不用寫*這種符號。
//通過ID獲取元素 var byID = driver.FindElement(By.Id("cards")); //通過類名獲取元素by class name var byClassName = driver.FindElements(By.ClassName("menu")); // 通過標簽名獲取元素by tag name var byTagName = driver.FindElement(By.TagName("iframe")); // 通過名字獲取元素 var byName = driver.FindElement(By.Name("__VIEWSTATE")); // 通過鏈接文本獲取元素by linked text <a href="https://www.cnblogs.com/springsnow/p/%3C/span%3E%3Cspan%20style=" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" target="_blank">http://www.google.com</a><a href="https://www.cnblogs.com/springsnow/p/%3C/span%3E%3Cspan%20style=" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" target="_blank">">linkedtext</a>> var byLinkText = driver.FindElement(By.LinkText("linkedtext")); // 通過部分鏈接文本獲取元素by partial link text :<a href="https://www.cnblogs.com/springsnow/p/%3C/span%3E%3Cspan%20style=" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" target="_blank">http://www.google.com</a><a href="https://www.cnblogs.com/springsnow/p/%3C/span%3E%3Cspan%20style=" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" target="_blank">">linkedtext</a>> var byPartialLinkText = driver.FindElement(By.PartialLinkText("text")); //通過CSS選擇器獲取元素by css var byCss = driver.FindElement(By.CssSelector("#header .content .logo")); // 通過XPath來獲取元素(by xpath var byXPath = driver.FindElements(By.XPath("//div"));
各方法使用優先原則:
優先使用id,name,classname,link;次之使用CssSelector();最後使用Xpath();
因為Xpath()方法的性能和效率最低下。
四、獲取頁面元素和元素內容
1.Title:標題
Console.WriteLine(driver.Title);//輸出標題名
2.Url:鏈接
Console.WriteLine(driver.Url);//輸出鏈接
3.Text:元素的文本值
Console.WriteLine(web.Text);//輸出元素標記中文本的信息
4.Selected勾選情況、TagName標記名標、Enabled編輯狀態、Displayed顯示狀態
5.GetAttribute()獲取標簽的屬性
var byIDAttributeText = byID.GetAttribute("id");
6.彈出對話框的處理
首先,要先瞭解三種對話框:Alert、Confirmation以及Prompt。測試網頁test.html:
<html> <head> <title>這是標題</title> </head> <body> <input type="button" onclick="alert('這是Alert');" value="Alert" /><br/> <input type="button" onclick="confirm('這是confirm');" value="confirm" /><br/> <input type="button" onclick="prompt('這是Prompt');" value="prompt" /><br/> </body> </html>
下面進行測試:
var service = EdgeDriverService.CreateDefaultService(@".", "msedgedriver.exe"); IWebDriver driver = new OpenQA.Selenium.Edge.EdgeDriver(service); driver.Navigate().GoToUrl("file:///C:/Users/bobin.yang/Source/Repos/WinForm2/bin/Debug/HTMLPage1.html"); IWebElement web = driver.FindElement(By.XPath("//input[1]")); web.Click(); WebDriverWait wait = new WebDriverWait(driver, new TimeSpan(0,0,2)); //Wait for the alert to be displayed wait.Until(ExpectedConditions.AlertIsPresent()); Console.WriteLine(driver.SwitchTo().Alert().Text);//在接收消息前輸出 System.Threading.Thread.Sleep(1000); driver.SwitchTo().Alert().Accept(); IWebElement web2 = driver.FindElement(By.XPath("//input[2]")); web2.Click(); WebDriverWait wait2 = new WebDriverWait(driver, TimeSpan.FromSeconds(10)); wait2.Until(ExpectedConditions.AlertIsPresent()); Console.WriteLine(driver.SwitchTo().Alert().Text);//在接收消息前輸出 System.Threading.Thread.Sleep(1000); driver.SwitchTo().Alert().Accept(); IWebElement web3 = driver.FindElement(By.XPath(@"html/body/input[3]")); web3.Click(); System.Threading.Thread.Sleep(1000); Console.WriteLine(driver.SwitchTo().Alert().Text);//在接收消息前輸出 driver.SwitchTo().Alert().SendKeys("這是輸入的內容"); driver.SwitchTo().Alert().Accept();
五、操作元素對象WebElement
主要是進行Click和SendKeys操作,如圖。其它的自己查看定義就知道瞭。
1、模擬鼠標點擊元素
driver.FindElement(By.Id("copyright")).Click();
- SenKeys就是在定位到輸入框後,把參數text賦值進去
- Click就是進行鼠標點擊操作,比如點擊按鈕等。和IDE上一樣的。單選、復選都是通過這個方法這點擊的。
- Clear方法:是用於清空輸入框的值,和SendKeys正好的作用正好相反。自己測試時,建議先給輸入框賦值,再用Thread.Sleep(3000)來暫停一下,再用Clear方法,不然你還沒看到效果時,程序已經完成瞭。
- Submit:特殊之處在於,當定位的是Form表單中任何一個元素,當操作完之後,直接調用那個Submit方法就能對整個Form表單完成提交。不用再返回重新查找表單元素。
Selenium中在指定的文本框中輸入指定的字符串
//在文本框中輸入指定的字符串sendkeys() Driver.FindElement(By.Id("tranAmtText")).SendKeys(“123456”);
2、下拉列表框Select的操作
driver.Navigate().GoToUrl("http://tieba.baidu.com/f/search/adv"); IList listOption = driver.FindElement(By.Name("sm")).FindElements(By.TagName("option")); string targetStr = "按相關性排序"; foreach (var option in listOption) { if (option.Text == targetStr) // if (option.GetAttribute("value").Equals(targetStr)) option.Click(); }
3、執行JS
var jsReturnValue = (IWebElement)((IJavaScriptExecutor)driver).ExecuteScript("jsfunname");
4、頁面導航
driver.Navigate().Forward(); driver.Navigate().Back();
Selenium中移動光標到指定的元素上
//移動光標到指定的元素上perform Actions action=new Actions(driver); action.MoveToElement(Find(By.XPath("//input[@id='submit' and @value='確定']"))).Perform();
5、拖拽操作(可以實現滑動驗證碼的驗證)
var element = driver.FindElement(By.Name("source")); IWebElement target = driver.FindElement(By.Name("target")); (new Actions(driver)).DragAndDrop(element, target).Perform();
6、模擬鼠標晃動
//模擬光標晃動movebyoffset() Actions action = new Actions(driver); action.MoveByOffset(2, 4);
7、截圖功能
//WebDriver中自帶截圖功能 Screenshot screenShotFile = ((ITakesScreenshot)driver).GetScreenshot(); screenShotFile.SaveAsFile("test", ImageFormat.Jpeg);
8、selenium操作滾輪滑動到底部
driver.execute_script("window.scrollTo(0,document.body.scrollHeight);")
六、獲得窗口標識WindowHandles
要在不同的瀏覽器窗口之間切換,必須獲得不同的窗口(標簽)的標識符。用一個集合來保存這些數據。當需要到新窗口裡進行操作時,需要將測試器前往新的窗口。開始創建的測試器是對窗口來的,所以當我們需要切換窗口時。需要調用 測試器.SwitchTo().window(獲得標識) 這個方法來返回一個新的測試器對象。新的對象是代表的是切換的窗口。代碼如下:
var service = EdgeDriverService.CreateDefaultService(@".", "msedgedriver.exe"); IWebDriver driver = new OpenQA.Selenium.Edge.EdgeDriver(service); driver.Navigate().GoToUrl("http://tieba.baidu.com/f/search/adv"); //找到註冊元素 IWebElement register = driver.FindElement(By.XPath(@".//*[@id='com_userbar']/ul/li[5]/div/a")); register.Click(); //顯示所有標識 IList<string> listHand = driver.WindowHandles;//拿到所有標識 foreach (string item in listHand) { Console.WriteLine(item); } /*這裡一會插入代碼*/ Console.ReadKey(); driver.Quit();
效果如下:
下面切換到新打開的窗口後,輸入一個12345來表示我們成功瞭
在上面的代碼基礎下 添加下面代碼
//切換到註冊窗口再輸入12345 driver.SwitchTo().Window(listHand[1]); driver.FindElement(By.Name("userName")).SendKeys("12345");
結果如圖:
1、關閉多個子Browser窗口
//獲取所有的WindowHandle,關閉所有子窗口 string oldwin = driver.CurrentWindowHandle; ReadOnlyCollection<string> windows = driver.WindowHandles; foreach (var win in windows) { if (win != oldwin) { driver.SwitchTo().Window(win).Close(); } } driver.SwitchTo().Window(oldwin);
2、對iframe中元素的定位
1、切換焦點到id為固定值的iframe上
進入頁面後,光標默認焦點在DefaultContent中,若想要定位到iframe 需要轉換焦點
driver.SwitchTo().DefaultContent(); //切換焦點到mainFrame driver.SwitchTo().Frame("mainFrame");
需要註意的是:切換焦點之後若想切換焦點到其他iframe上 需要先返回到defaultcontent,再切換焦點到指定的iframe上。
2、切換焦點到id值為動態值的iframe上
有時候 頁面上浮出層的id為動態值,此時需要先獲取所有符合記錄的iframe放置在數組中,然後遍歷數組切換焦點到目標iframe上。
如下方法:
protected string bizFrameId = string.Empty; protected string bizId = string.Empty; //獲取動態iframe的id值 protected void SetIframeId() { ReadOnlyCollection els = driver.FindElements(By.TagName("iframe")); foreach (var e in driver.FindElements(By.TagName("iframe"))) { string s1 = e.GetAttribute("id"); if (s1.IndexOf("window") >= 0 && s1.IndexOf("content") >= 0) { bizFrameId = e.GetAttribute("id"); string[] ss = s1.Split(new char[] { '_' }); bizId = ss[1]; } } }
七、Cookies
在C#中,通過Cookies屬性來獲取當前的Cookie集合,然後進行增刪改查操作。
Cookie由5個部分組成:名稱、值、所在域、路徑和過期時間。
下面我們進入百度首頁,然後獲取cookie,並讓它變動一下來看到效果。 代碼如下:
var service = EdgeDriverService.CreateDefaultService(@".", "msedgedriver.exe"); IWebDriver driver = new OpenQA.Selenium.Edge.EdgeDriver(service); driver.Navigate().GoToUrl("http://www.baidu.com"); //獲取Cookie ICookieJar listCookie = driver.Manage().Cookies; // IList listCookie = driver.Manage( ).Cookies.AllCookies;//隻是顯示 可以用Ilist對象 //顯示初始Cookie的內容 Console.WriteLine("--------------------"); Console.WriteLine($"當前Cookie集合的數量:\t{listCookie.AllCookies.Count}"); for (int i = 0; i < listCookie.AllCookies.Count; i++) { Console.WriteLine($"Cookie的名稱:{listCookie.AllCookies[i].Name}"); Console.WriteLine($"Cookie的值:{listCookie.AllCookies[i].Value}"); Console.WriteLine($"Cookie的所在域:{listCookie.AllCookies[i].Domain}"); Console.WriteLine($"Cookie的路徑:{listCookie.AllCookies[i].Path}"); Console.WriteLine($"Cookie的過期時間:{listCookie.AllCookies[i].Expiry}"); Console.WriteLine("-----"); } //添加一個新的Cookie Cookie newCookie = new Cookie("新Cookie", "新值", "", DateTime.Now.AddDays(1)); listCookie.AddCookie(newCookie); Console.WriteLine("--------------------"); Console.WriteLine($"當前Cookie集合的數量:\t{listCookie.AllCookies.Count}"); for (int i = 0; i < listCookie.AllCookies.Count; i++) { Console.WriteLine($"Cookie的名稱:{listCookie.AllCookies[i].Name}"); Console.WriteLine($"Cookie的值:{listCookie.AllCookies[i].Value}"); Console.WriteLine($"Cookie的所在域:{listCookie.AllCookies[i].Domain}"); Console.WriteLine($"Cookie的路徑:{listCookie.AllCookies[i].Path}"); Console.WriteLine($"Cookie的過期時間:{listCookie.AllCookies[i].Expiry}"); Console.WriteLine("-----"); } //刪除這個Cookie並再次顯示總數 listCookie.DeleteCookieNamed(newCookie.Name); Console.WriteLine($"當前Cookie集合的數量:\t{listCookie.AllCookies.Count}"); Console.ReadLine(); driver.Quit();
運行效果如下:
八、Window窗口控制
這個屬性是可以對當前的窗口進行簡單的控制。如獲取坐標和大小,還可以將其最大化。下面我們用過示例代碼來試試效果。
下面的代碼是先打開網頁,打印坐標和大小,再控制它最大化,再次打印坐標和大小。
var service = EdgeDriverService.CreateDefaultService(@".", "msedgedriver.exe"); IWebDriver driver = new OpenQA.Selenium.Edge.EdgeDriver(service); driver.Navigate().GoToUrl("http://www.baidu.com"); //打印現在的坐標和大小 IWindow window = driver.Manage().Window; Console.WriteLine("第一次打印"); Console.WriteLine($"坐標X為{window.Position.X}\tY為{window.Position.Y}"); Console.WriteLine($"大小長為{window.Size.Width}\t寬為{window.Size.Height}"); Console.WriteLine("-------------"); //控制最大化 window.Maximize(); //再次打印數據 Console.WriteLine("第二次打印"); Console.WriteLine($"坐標X為{window.Position.X}\tY為{window.Position.Y}"); Console.WriteLine($"大小長為{window.Size.Width}\t寬為{window.Size.Height}"); Console.WriteLine("-------------"); Console.ReadLine(); driver.Quit();
效果如下:
這裡有兩個奇怪的地方:
1.我的屏幕是1080P的,輸出後的數據中,長隻有1936.如果減去16的話到正好是1920.但是寬應該是1080,如果任務欄的寬度是24的話,到也能說得過去。隻是數據和我們要的有點偏差,這裡需要註意一下。
2.window屬性居然隻有位置、大小和最大化方法。居然沒有最小化或還原(退出最大化狀態)方法。
九、事件
首先是準備好要添加的事件,然後再掛接。這裡可以使用C#的語法糖。在+=後面直接按兩次tab鍵,然後再移動到事件區編輯。
eventDriver.Navigating += EventDriver_Navigating;//導航前 eventDriver.Navigated += EventDriver_Navigated;//導航後 eventDriver.FindingElement += EventDriver_FindingElement;//查找元素前 eventDriver.FindElementCompleted += EventDriver_FindElementCompleted;//查找元素後 eventDriver.ElementClicking += EventDriver_ElementClicking;//元素單擊前 eventDriver.ElementClicked += EventDriver_ElementClicked;//元素單擊後 eventDriver.ElementValueChanging += EventDriver_ElementValueChanging;//元素值改變前 eventDriver.ElementValueChanged += EventDriver_ElementValueChanged;//元素值改變後 eventDriver.ExceptionThrown += EventDriver_ExceptionThrown;//異常發生後事件
掛接事件:
#region 事件區 /// /// 導航前發生的事件 /// /// /// private void EventDriver_Navigating(object sender, WebDriverNavigationEventArgs e) { this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"即將要跳轉到的URL為:{e.Driver.Url}"); } /// /// 導航後發生的事件 /// /// /// private void EventDriver_Navigated(object sender, WebDriverNavigationEventArgs e) { this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"跳轉到的URL為:{e.Driver.Url}"); } /// /// 查找元素前發生 /// /// /// private void EventDriver_FindingElement(object sender, FindElementEventArgs e) { this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"即將查找的元素為:{e.FindMethod.ToString()}"); } /// /// 查找元素後發生 /// /// /// private void EventDriver_FindElementCompleted(object sender, FindElementEventArgs e) { this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"找到元素,條件為:{e.FindMethod.ToString()}"); } /// /// 單擊元素前發生 /// /// /// private void EventDriver_ElementClicking(object sender, WebElementEventArgs e) { this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"要單擊的元素的value屬性為:{e.Element.GetAttribute("value")}"); } /// /// 單擊元素後發生 /// /// /// private void EventDriver_ElementClicked(object sender, WebElementEventArgs e) { System.Threading.Thread.Sleep(3 * 1000);//暫停3秒 this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"單擊元素後,現在的URL為:{e.Driver.Url}"); } /// /// 單擊元素前發生 /// /// /// private void EventDriver_ElementValueChanging(object sender, WebElementEventArgs e) { this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"元素更改前的值為:{e.Element.GetAttribute("value")}"); } /// /// 單擊元素後發生 /// /// /// private void EventDriver_ElementValueChanged(object sender, WebElementEventArgs e) { this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"元素更改後的值為:{e.Element.GetAttribute("value")}"); } /// /// 異常(保存截圖到本地) /// /// /// private void EventDriver_ExceptionThrown(object sender, WebDriverExceptionEventArgs e) { //地址 string strPath = $@"D:\Desktop\{DateTime.Now.ToString("yyyy-MM-dd HH-mm-ss")}.png"; //保存截圖 Screenshot screen = (sender as EventFiringWebDriver).GetScreenshot(); screen.SaveAsFile(strPath, System.Drawing.Imaging.ImageFormat.Png); //輸出保存信息 this.listMeassage.Add("-----------------------------------------"); this.listMeassage.Add($"發生異常,截圖已保存到:{strPath}"); }
十、關閉瀏覽器
有下面兩種:
- Close():關閉WedDriver對象所在的窗口;
第一個是關閉一個窗口,一個wedDriver對象是可以有多個窗口的(之前的窗口切換也是提到過),需要關閉時要保證當前激活的窗口。比如一個wedDriver對象裡有好多個窗口,你要關閉第2個窗口,就要用SwitchTo().Window()方法切換到第2個窗口才能關閉,不能直接關閉第幾個窗口的。 - Quit():關閉所有相關窗口;
第二個關閉和這個webDriver對象所有相關的窗口。當然,一個腳本是可以有多個webDriver對象
下面代碼的代碼展示這瞭兩個方法的用法和用途。
1.打開百度首頁,單擊“註冊”超級鏈接。
2.在彈出的窗口(百度賬戶註冊)中,調用Close()方法,關閉新彈出的頁面
3.再一次點擊“註冊”超級鏈接,調用Quit()方法來結束測試。
var service = EdgeDriverService.CreateDefaultService(@".", "msedgedriver.exe"); IWebDriver driver = new OpenQA.Selenium.Edge.EdgeDriver(service); //導航到百度首頁 driver.Navigate().GoToUrl("http://www.baidu.com"); //進行點擊 Console.WriteLine("-------------------"); Console.WriteLine("進行點擊"); driver.FindElement(By.LinkText("登錄")).Click(); System.Threading.Thread.Sleep(3 * 1000); driver.FindElement(By.LinkText("立即註冊")).Click(); //獲取窗口句柄 IList<string> listHand = driver.WindowHandles; //切換到註冊窗口並關閉 Console.WriteLine("-------------------"); Console.WriteLine("切換到註冊窗口"); driver.SwitchTo().Window(listHand[1]); System.Threading.Thread.Sleep(3 * 1000); Console.WriteLine("-------------------"); Console.WriteLine("關閉註冊窗口"); driver.Close(); System.Threading.Thread.Sleep(3 * 1000); //切換到主窗口並結束測試 Console.WriteLine("-------------------"); Console.WriteLine("切換到主窗口並結束測試"); driver.SwitchTo().Window(listHand[0]); driver.FindElement(By.LinkText("立即註冊")).Click(); System.Threading.Thread.Sleep(3 * 1000); driver.Quit(); Console.ReadLine();
到此這篇關於C#使用selenium實現爬蟲的文章就介紹到這瞭。希望對大傢的學習有所幫助,也希望大傢多多支持WalkonNet。
推薦閱讀:
- python實現selenium網絡爬蟲的方法小結
- 全網最全python庫selenium自動化使用詳細教程
- python自動化測試selenium核心技術等待條件教程
- c# 從內存中釋放Selenium chromedriver.exe
- c# Selenium爬取數據時防止webdriver封爬蟲的方法