⑴ xpath怎么抓取<div>下的所有<p>标签的文字

python吗?
from lxml import etree
conturl = 'http://www.xxxx.com.cn'
html = httpget(conturl)
假如html是

<div class="top1">
<p>内容1</p>
<p>内容2</p>
<p>内容3</p>
</div>
ehtml = etree.HTML(html)
strings = ehtml.xpath("//div[@class='top1']/p/text()")
这样应该就可以吧应该就是['内容1','内容2','内容3']

⑵ python中如何将通过xpath提取部分html代码或者有什么其他方法

xpath
pyquery
bs4都可以,
这几个的官网都有教程,自己先看看

⑶ 用js 根据html生成xpath 求高手!!!!!!!!!!!!!!!!

你有弄懂你要做什么嘛。。。
你这句话让人看得一头雾水。。。
根据你的词语,我能重新整理成:

如何以JS为工具用xpath规范来解析Html。

答案是,你还不如用js直接dom操作

⑷ lxml xpath怎么子节点

XPath 是一门在 XML 文档中查找信息的语言,对 XPath 的理解是很多高级 XML 应用的基础,XPath 在 XML 中通过元素和属性进行导航。

什么是lxml

lxml 是一个用来处理 XML 的第三方 Python 库,它在底层封装了用 C 语言编写的 libxml2 和 libxslt,并以简单强大的 Python API,兼容并加强了著名的 ElementTree API。

XPath术语

在 XPath 语境中,XML 文档被视作节点树,节点树的根节点也被称作文档节点。
XPath 将节点树中的节点(Node)分为七类:元素(Element),属性(Attribute),文本(Text),命名空间(Namespace),处理指令(Processing-instruction),注释(Comment)和文档节点(Document nodes)。

⑸ 如何 获取网页元素的xpath

1. 利用Selenium IDE
我们可以通过firefox添加插件Selenium IDE并开启。当点击红色的录制按钮后,我们对网页进行操作后,该工具会录制所有的行为并转化为selenium命令,当然也就包含有了locator。
方法优点:简单、方便
方法不足:对于一些复杂点的行为可能会漏掉,因此也就无法捕获相应的locator;此外locator是自动获取的,可能不是很直观,另外无法得到统一样式的locator。

2. 利用Firebug
同样firefox的插件中可以添加firebug。在Tools->Web Developer->Firebug中打开Firebug,于是能够看到页面的下半部分有显示Firebug窗口,可以查看HTML,CSS等。因为了解的粗浅,所以只能说说知道的几点简单功能。
如果我们需要查看页面某个元素的locator,可以鼠标右击,选择Inspect Element with Firebug, 于是就到了元素对应的html源码位置。这样我们根据这部分源码来写locator。
但是,往往对于一些element如button等,右击后没有反应时,我们可以考虑选择它们旁边的元素进行,到源码后再通过查找其兄弟元素源码或者上一层来找到相应源码。这里主要根据是当我们鼠标放在以某tag为根节点的源码的上时,上面的页面对应的界面元素会有相应标记。
方法缺点:写出的locator可能并不是页面的唯一,这样selenium运行就难以识别

⑹ 使用xpath怎么提取src中的部分数据

你可以用文件流跌代器去读取
如 istream_iterator str3这样也行

⑺ 如何使用xpath获取html标签中属性的属性值 如:

您好!
比如获取这个img下的URL把:<xsl:value-of select="//a[@class='b']/img/@src"/>
上面的这条语句就能获取到URL了。
亲,没有问题的话,请点赞!谢谢!

⑻ Selenium中关于XPath中节点后面[1]的诡异问题

//a[contains(@id,'abc')][2]

这个2代表你要找到 A 在家中排行老二. 而不是所有家庭合起来的第二个.

比如说
<span><a>老大</a><a>老二</a></span>
<span><a>老大</a><a>老二</a></span>

用 //span/a[2]

会把两个老二都找出来.

如果是这样的

<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>

用这个xpath 就会找不到东西, 因为都是独生子女.

你要选中第二个老大, xpath 要这样写

(//span/a)[2]

这个方式在很多地方有效, 但在Selenium 中好像无效.

⑼ 大神们,怎样用js获取html的xpath

用jQuery写的,当鼠标点击一个元素时,显示元素的xpath路径

$(document).ready(function () {
var xpath = '', o;
$('*').click(function (e) {
e.stopPropagation();//停止冒泡
o = this;
alert(readXPath(o));
});
});

php怎么使用xpath解析html内容

实例如下:
<?php
$xml = simplexml_load_file("test.xml");

$result = $xml->xpath("form");

print_r($result);
?>
获取form内容