⑴ xpath怎麼抓取<div>下的所有<p>標簽的文字

python嗎?
from lxml import etree
conturl = 'http://www.xxxx.com.cn'
html = httpget(conturl)
假如html是

<div class="top1">
<p>內容1</p>
<p>內容2</p>
<p>內容3</p>
</div>
ehtml = etree.HTML(html)
strings = ehtml.xpath("//div[@class='top1']/p/text()")
這樣應該就可以吧應該就是['內容1','內容2','內容3']

⑵ python中如何將通過xpath提取部分html代碼或者有什麼其他方法

xpath
pyquery
bs4都可以,
這幾個的官網都有教程,自己先看看

⑶ 用js 根據html生成xpath 求高手!!!!!!!!!!!!!!!!

你有弄懂你要做什麼嘛。。。
你這句話讓人看得一頭霧水。。。
根據你的詞語,我能重新整理成:

如何以JS為工具用xpath規范來解析Html。

答案是,你還不如用js直接dom操作

⑷ lxml xpath怎麼子節點

XPath 是一門在 XML 文檔中查找信息的語言,對 XPath 的理解是很多高級 XML 應用的基礎,XPath 在 XML 中通過元素和屬性進行導航。

什麼是lxml

lxml 是一個用來處理 XML 的第三方 Python 庫,它在底層封裝了用 C 語言編寫的 libxml2 和 libxslt,並以簡單強大的 Python API,兼容並加強了著名的 ElementTree API。

XPath術語

在 XPath 語境中,XML 文檔被視作節點樹,節點樹的根節點也被稱作文檔節點。
XPath 將節點樹中的節點(Node)分為七類:元素(Element),屬性(Attribute),文本(Text),命名空間(Namespace),處理指令(Processing-instruction),注釋(Comment)和文檔節點(Document nodes)。

⑸ 如何 獲取網頁元素的xpath

1. 利用Selenium IDE
我們可以通過firefox添加插件Selenium IDE並開啟。當點擊紅色的錄制按鈕後,我們對網頁進行操作後,該工具會錄制所有的行為並轉化為selenium命令,當然也就包含有了locator。
方法優點:簡單、方便
方法不足:對於一些復雜點的行為可能會漏掉,因此也就無法捕獲相應的locator;此外locator是自動獲取的,可能不是很直觀,另外無法得到統一樣式的locator。

2. 利用Firebug
同樣firefox的插件中可以添加firebug。在Tools->Web Developer->Firebug中打開Firebug,於是能夠看到頁面的下半部分有顯示Firebug窗口,可以查看HTML,CSS等。因為了解的粗淺,所以只能說說知道的幾點簡單功能。
如果我們需要查看頁面某個元素的locator,可以滑鼠右擊,選擇Inspect Element with Firebug, 於是就到了元素對應的html源碼位置。這樣我們根據這部分源碼來寫locator。
但是,往往對於一些element如button等,右擊後沒有反應時,我們可以考慮選擇它們旁邊的元素進行,到源碼後再通過查找其兄弟元素源碼或者上一層來找到相應源碼。這里主要根據是當我們滑鼠放在以某tag為根節點的源碼的上時,上面的頁面對應的界面元素會有相應標記。
方法缺點:寫出的locator可能並不是頁面的唯一,這樣selenium運行就難以識別

⑹ 使用xpath怎麼提取src中的部分數據

你可以用文件流跌代器去讀取
如 istream_iterator str3這樣也行

⑺ 如何使用xpath獲取html標簽中屬性的屬性值 如:

您好!
比如獲取這個img下的URL把:<xsl:value-of select="//a[@class='b']/img/@src"/>
上面的這條語句就能獲取到URL了。
親,沒有問題的話,請點贊!謝謝!

⑻ Selenium中關於XPath中節點後面[1]的詭異問題

//a[contains(@id,'abc')][2]

這個2代表你要找到 A 在家中排行老二. 而不是所有家庭合起來的第二個.

比如說
<span><a>老大</a><a>老二</a></span>
<span><a>老大</a><a>老二</a></span>

用 //span/a[2]

會把兩個老二都找出來.

如果是這樣的

<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>

用這個xpath 就會找不到東西, 因為都是獨生子女.

你要選中第二個老大, xpath 要這樣寫

(//span/a)[2]

這個方式在很多地方有效, 但在Selenium 中好像無效.

⑼ 大神們,怎樣用js獲取html的xpath

用jQuery寫的,當滑鼠點擊一個元素時,顯示元素的xpath路徑

$(document).ready(function () {
var xpath = '', o;
$('*').click(function (e) {
e.stopPropagation();//停止冒泡
o = this;
alert(readXPath(o));
});
});

php怎麼使用xpath解析html內容

實例如下:
<?php
$xml = simplexml_load_file("test.xml");

$result = $xml->xpath("form");

print_r($result);
?>
獲取form內容