當前位置：首頁 » 編程語言 » htmlxpath

htmlxpath

發布時間: 2021-03-14 02:24:50

⑴ xpath怎麼抓取<div>下的所有標簽的文字

是python嗎？
from lxml import etree
conturl = 'http://www.xxxx.com.cn'
html = httpget(conturl)
假如html是

<div class="top1">
內容1
內容2
內容3
</div>
ehtml = etree.HTML(html)
strings = ehtml.xpath("//div[@class='top1']/p/text()")
這樣應該就可以吧應該就是['內容1','內容2','內容3']

⑵ python中如何將通過xpath提取部分html代碼或者有什麼其他方法

xpath
pyquery
bs4都可以,
這幾個的官網都有教程,自己先看看

⑶ 用js 根據html生成xpath 求高手！！！！！！！！！！！！！！！！

你有弄懂你要做什麼嘛。。。
你這句話讓人看得一頭霧水。。。
根據你的詞語，我能重新整理成：

如何以JS為工具用xpath規范來解析Html。

答案是，你還不如用js直接dom操作

⑷ lxml xpath怎麼子節點

XPath 是一門在 XML 文檔中查找信息的語言，對 XPath 的理解是很多高級 XML 應用的基礎，XPath 在 XML 中通過元素和屬性進行導航。

什麼是lxml

lxml 是一個用來處理 XML 的第三方 Python 庫，它在底層封裝了用 C 語言編寫的 libxml2 和 libxslt，並以簡單強大的 Python API，兼容並加強了著名的 ElementTree API。

XPath術語

在 XPath 語境中，XML 文檔被視作節點樹，節點樹的根節點也被稱作文檔節點。
XPath 將節點樹中的節點（Node）分為七類：元素（Element），屬性（Attribute），文本（Text），命名空間（Namespace），處理指令（Processing-instruction），注釋（Comment）和文檔節點（Document nodes）。

⑸ 如何獲取網頁元素的xpath

1. 利用Selenium IDE
我們可以通過firefox添加插件Selenium IDE並開啟。當點擊紅色的錄制按鈕後，我們對網頁進行操作後，該工具會錄制所有的行為並轉化為selenium命令，當然也就包含有了locator。
方法優點：簡單、方便
方法不足：對於一些復雜點的行為可能會漏掉，因此也就無法捕獲相應的locator；此外locator是自動獲取的，可能不是很直觀，另外無法得到統一樣式的locator。

2. 利用Firebug
同樣firefox的插件中可以添加firebug。在Tools->Web Developer->Firebug中打開Firebug，於是能夠看到頁面的下半部分有顯示Firebug窗口，可以查看HTML，CSS等。因為了解的粗淺，所以只能說說知道的幾點簡單功能。
如果我們需要查看頁面某個元素的locator，可以滑鼠右擊，選擇Inspect Element with Firebug, 於是就到了元素對應的html源碼位置。這樣我們根據這部分源碼來寫locator。
但是，往往對於一些element如button等，右擊後沒有反應時，我們可以考慮選擇它們旁邊的元素進行，到源碼後再通過查找其兄弟元素源碼或者上一層來找到相應源碼。這里主要根據是當我們滑鼠放在以某tag為根節點的源碼的上時，上面的頁面對應的界面元素會有相應標記。
方法缺點：寫出的locator可能並不是頁面的唯一，這樣selenium運行就難以識別

⑹ 使用xpath怎麼提取src中的部分數據

你可以用文件流跌代器去讀取
如 istream_iterator str3這樣也行

⑺ 如何使用xpath獲取html標簽中屬性的屬性值如：

您好！
比如獲取這個img下的URL把：<xsl:value-of select="//a[@class='b']/img/@src"/>
上面的這條語句就能獲取到URL了。
親，沒有問題的話，請點贊！謝謝！

⑻ Selenium中關於XPath中節點後面[1]的詭異問題

//a[contains(@id,'abc')][2]

這個2代表你要找到 A 在家中排行老二. 而不是所有家庭合起來的第二個.

比如說
<a>老大</a><a>老二</a>
<a>老大</a><a>老二</a>

用 //span/a[2]

會把兩個老二都找出來.

如果是這樣的

<a>老大</a>
<a>老大</a>
<a>老大</a>
<a>老大</a>
<a>老大</a>

用這個xpath 就會找不到東西, 因為都是獨生子女.

你要選中第二個老大, xpath 要這樣寫

(//span/a)[2]

這個方式在很多地方有效, 但在Selenium 中好像無效.

⑼ 大神們，怎樣用js獲取html的xpath

用jQuery寫的，當滑鼠點擊一個元素時，顯示元素的xpath路徑

$(document).ready(function () {
var xpath = '', o;
$('*').click(function (e) {
e.stopPropagation();//停止冒泡
o = this;
alert(readXPath(o));
});
});

⑽ php怎麼使用xpath解析html內容

實例如下：
<?php
$xml = simplexml_load_file("test.xml");

$result = $xml->xpath("form");

print_r($result);
?>
獲取form內容

閱讀全文

htmlxpath

與htmlxpath相關的閱讀推薦