99久久无码一区人妻A黑,亚洲VA欧洲VA日韩VA忘忧草,亚洲男人的天堂在线播放

使用Selenium來抓取動態(tài)加載的頁面

作者：網(wǎng)絡(luò)轉(zhuǎn)載發(fā)布時(shí)間：[ 2015/2/25 17:45:41 ] 推薦標(biāo)簽：Selenium 單元測試

　　有些頁面是通過js以及ajax動態(tài)加載的，例如：花瓣網(wǎng)。這時(shí)如果我們直接分析原始頁面的html，是得不到有效的信息的。當(dāng)然，因?yàn)闊o論怎樣動態(tài)加載，基礎(chǔ)信息總歸是包含在初始頁面中得，所以我們可以用爬蟲代碼來模擬js代碼，js讀取頁面元素值，我們也讀取頁面元素值;js發(fā)送ajax，我們拼湊參數(shù)、發(fā)送ajax并解析返回的json。這樣總歸是能做的，但是比較麻煩，有沒有比較省力的方法呢？比較好的方法大概是內(nèi)嵌一個(gè)瀏覽器了。
　　Selenium是一個(gè)模擬瀏覽器，進(jìn)行自動化測試的工具，它提供一組API可以與真實(shí)的瀏覽器內(nèi)核交互。Selenium是跨語言的，有Java、C#、python等版本，并且支持多種瀏覽器，chrome、firefox以及IE都支持。
　　在Java項(xiàng)目中使用Selenium，需要做兩件事：
　　在項(xiàng)目中引入Selenium的Java模塊，以Maven為例：
　　<dependency> <groupId>org.seleniumhq.selenium</groupId> <artifactId>selenium-java</artifactId> <version>2.33.0</version> </dependency>
　　下載對應(yīng)的driver，以chrome為例：http://code.google.com/p/chromedriver/downloads/list
　　下載后，需要將driver的位置寫到Java的環(huán)境變量里，例如我在mac下將其下載到了/Users/yihua/Downloads/chromedriver，則需要在程序里添加以下代碼(當(dāng)然在JVM參數(shù)里寫-Dxxx=xxx也是可以的)：
　　System.getProperties().setProperty("webdriver.chrome.driver"，"/Users/yihua/Downloads/chromedriver");
　　Selenium的API挺簡單的，核心是WebDriver，下面是動態(tài)渲染頁面，并獲取終html的代碼：
@Test
public void testSelenium() {
System.getProperties().setProperty("webdriver.chrome.driver"， "/Users/yihua/Downloads/chromedriver");
WebDriver webDriver = new ChromeDriver();
webDriver.get("http://huaban.com/");
WebElement webElement = webDriver.findElement(By.xpath("/html"));
System.out.println(webElement.getAttribute("outerHTML"));
webDriver.close();
}
　　值得注意的是，每次new ChromeDriver()，Selenium都會建立一個(gè)Chrome進(jìn)程，并使用一個(gè)隨機(jī)端口在Java中與chrome進(jìn)程進(jìn)行通信來交互。由此可見有兩個(gè)問題：
　　因此如果直接關(guān)閉Java程序，Chrome進(jìn)程可能是無法關(guān)閉的。這里需要顯示的調(diào)用webDriver.close()來關(guān)閉進(jìn)程。
　　創(chuàng)建進(jìn)程的開銷還是比較大的，盡量對webDriver進(jìn)行復(fù)用會比較好。可惜根據(jù)官方的文檔，webDriver不是線程安全的，所以我們需要建立一個(gè)webDriver池來保存它們。不清楚Selenium是否有這樣的接口，反正我是自己寫了一個(gè)WebDriverPool來完成這個(gè)任務(wù)。

關(guān)鍵詞閱讀

測試熱點(diǎn)文章

技術(shù)專題

活動專題

【獲獎(jiǎng)名單公布】加入Alltesting眾測免費(fèi)領(lǐng)取新發(fā)行測試書籍
加入Alltesting眾測免費(fèi)領(lǐng)取新發(fā)行書籍《京東質(zhì)量團(tuán)隊(duì)轉(zhuǎn)型實(shí)踐從測試到測試開發(fā)的蛻變》
【Alltesting眾測2典】0元測試體驗(yàn)+100元現(xiàn)金券+免費(fèi)性能測試
先測試后付費(fèi)-Alltesting眾測超級福利
2000元性能測試服務(wù)，安全生產(chǎn)，穩(wěn)定運(yùn)行，為您的系統(tǒng)保駕護(hù)航�。�！
在線性能測試工具（WebPR）培訓(xùn)與技術(shù)交流（第二期）
Alltesting眾測平臺全新功能已開啟�。�
生命周期管理軟件ALM-本地安裝版本正式發(fā)布�。�！