網頁元素抓取
Ⅰ 如何 獲取網頁元素的xpath
1. 利用Selenium IDE
我們可以通過firefox添加插件Selenium IDE並開啟。當點擊紅色的錄制按鈕後,我們對網頁進行操作後,該工具會錄制所有的行為並轉化為selenium命令,當然也就包含有了locator。
方法優點:簡單、方便
方法不足:對於一些復雜點的行為可能會漏掉,因此也就無法捕獲相應的locator;此外locator是自動獲取的,可能不是很直觀,另外無法得到統一樣式的locator。
2. 利用Firebug
同樣firefox的插件中可以添加firebug。在Tools->Web Developer->Firebug中打開Firebug,於是能夠看到頁面的下半部分有顯示Firebug窗口,可以查看html,CSS等。因為了解的粗淺,所以只能說說知道的幾點簡單功能。
如果我們需要查看頁面某個元素的locator,可以滑鼠右擊,選擇Inspect Element with Firebug, 於是就到了元素對應的html源碼位置。這樣我們根據這部分源碼來寫locator。
但是,往往對於一些element如button等,右擊後沒有反應時,我們可以考慮選擇它們旁邊的元素進行,到源碼後再通過查找其兄弟元素源碼或者上一層來找到相應源碼。這里主要根據是當我們滑鼠放在以某tag為根節點的源碼的上時,上面的頁面對應的界面元素會有相應標記。
方法缺點:寫出的locator可能並不是頁面的唯一,這樣selenium運行就難以識別
Ⅱ 求一款網頁中頁面元素的抓取軟體
可用WEBZIP軟體,可離線瀏覽也可以下載整個網站的所有資料
Ⅲ 網頁上審查元素提取一段完整網頁代碼
您好,首來先你要獲取到你要看的自某個元素的對象,然後 元素對象.讀文本屬性 (「outerHTML」, ) 就可以獲取到代碼了。
第一種:
網頁內容 = 到文本(HTTP讀文件("http://www..com"))
調試輸出(網頁內容)
第二種:
使用超文本瀏覽器填表方式取源碼。
Ⅳ 易語言怎樣提取網頁元素
網路搜:「網業元素提取工具」。名字我忘了,不過這種工具很多,網路搜索就有的。
Ⅳ 網頁元素抓取的問題
內面就一個JS包導入一個FLASH
http://www.lambowolf.com/gg/images/portal_flash.js
你下載下來看就明白了。
這個是FLash的地址http://www.lambowolf.com/focus2.swf
這些是切換圖片和鏈接
imgUrl1="gg/images/ba1.jpg";
imgtext1="11"
imgLink1=escape("http://www.lambowolf.com/");
//imgLink1="";
imgUrl2="gg/images/ba2.jpg";
imgtext2="22"
imgLink2=escape("http://www.lambowolf.com/");
//imgLink2="";
imgUrl3="gg/images/ba1.jpg";
imgtext3="33"
imgLink3=escape("http://www.lambowolf.com/");
//imgLink3="";
imgUrl4="gg/images/ba2.jpg";
imgtext4="44"
imgLink4=escape("http://www.lambowolf.com/");
//imgLink4="";
Ⅵ 【高分】怎麼提取網頁游戲中的的元素。
部分的flash游戲可以從網頁的緩存里找到,例如以下是使用IE取緩存的步驟:
1.打開緩存文件夾:
在IE的菜單欄上點擊「工具」 - 「Internet 選項」,在「常規」欄的 「瀏覽歷史記錄」項,點擊「設置」,彈出「Internet臨時文件和歷史記錄設置」,點擊「查看文件」按鈕,打開緩存文件夾。
2.保存緩存數據:
然後打開你要緩存的網站,等網站載入完畢後,在緩存文件夾右鍵刷新,然後右鍵排列圖標 - 按「internet地址」排列,找到你緩沖的那個網站的網址,然後全部復制出來,放在你的電腦任意一個地方。
3.提取動畫資源:
swf文件(flash)的圖片資源你可以下載一個「閃客精靈」來提取,或者用閃客精靈的反編譯功能輸出fla文件後使用adobe flash軟體工具來編輯。
Ⅶ 如何提取網頁中指定元素
我是這樣實現的,用對象枚舉網頁圖片,得到圖片名後,在臨時文件夾中提取圖片!
參考網頁應用類做的,不知有沒有更好的方法。
.版本 2
WebDoc1 = Webdoc.讀對象型屬性 (「body」, ).讀對象型屬性 (「all」, )
臨時對象 = WebDoc1.對象型方法 (「tags」, 「img」)
.計次循環首 (臨時對象.讀數值屬性 (「length」, ), 計次)
臨時容器 = 臨時對象.對象型方法 (「item」, 計次 - 1).讀文本屬性 (「src」, )
a = 到小寫 (取文本右邊 (臨時容器, 4))
.如果真 (a = 「.jpg」 或 a = 「.bmp」)
加入成員 (地址數組, 臨時容器)
.如果真結束
.計次循環尾 ()
返回 (取數組成員數 (地址數組) ≠ 0)
得到文件名後,尋找IE的臨時文件夾
用 SHGetSpecialFolderLocation 和 SHGetPathFromIDList
可得到IE的臨時文件夾路徑