htmlxpath
⑴ xpath怎么抓取<div>下的所有<p>标签的文字
是python吗?
from lxml import etree
conturl = 'http://www.xxxx.com.cn'
html = httpget(conturl)
假如html是
<div class="top1">
<p>内容1</p>
<p>内容2</p>
<p>内容3</p>
</div>
ehtml = etree.HTML(html)
strings = ehtml.xpath("//div[@class='top1']/p/text()")
这样应该就可以吧应该就是['内容1','内容2','内容3']
⑵ python中如何将通过xpath提取部分html代码或者有什么其他方法
xpath
pyquery
bs4都可以,
这几个的官网都有教程,自己先看看
⑶ 用js 根据html生成xpath 求高手!!!!!!!!!!!!!!!!
你有弄懂你要做什么嘛。。。
你这句话让人看得一头雾水。。。
根据你的词语,我能重新整理成:
如何以JS为工具用xpath规范来解析Html。
答案是,你还不如用js直接dom操作
⑷ lxml xpath怎么子节点
XPath 是一门在 XML 文档中查找信息的语言,对 XPath 的理解是很多高级 XML 应用的基础,XPath 在 XML 中通过元素和属性进行导航。
什么是lxml
lxml 是一个用来处理 XML 的第三方 Python 库,它在底层封装了用 C 语言编写的 libxml2 和 libxslt,并以简单强大的 Python API,兼容并加强了著名的 ElementTree API。
XPath术语
在 XPath 语境中,XML 文档被视作节点树,节点树的根节点也被称作文档节点。
XPath 将节点树中的节点(Node)分为七类:元素(Element),属性(Attribute),文本(Text),命名空间(Namespace),处理指令(Processing-instruction),注释(Comment)和文档节点(Document nodes)。
⑸ 如何 获取网页元素的xpath
1. 利用Selenium IDE
我们可以通过firefox添加插件Selenium IDE并开启。当点击红色的录制按钮后,我们对网页进行操作后,该工具会录制所有的行为并转化为selenium命令,当然也就包含有了locator。
方法优点:简单、方便
方法不足:对于一些复杂点的行为可能会漏掉,因此也就无法捕获相应的locator;此外locator是自动获取的,可能不是很直观,另外无法得到统一样式的locator。
2. 利用Firebug
同样firefox的插件中可以添加firebug。在Tools->Web Developer->Firebug中打开Firebug,于是能够看到页面的下半部分有显示Firebug窗口,可以查看HTML,CSS等。因为了解的粗浅,所以只能说说知道的几点简单功能。
如果我们需要查看页面某个元素的locator,可以鼠标右击,选择Inspect Element with Firebug, 于是就到了元素对应的html源码位置。这样我们根据这部分源码来写locator。
但是,往往对于一些element如button等,右击后没有反应时,我们可以考虑选择它们旁边的元素进行,到源码后再通过查找其兄弟元素源码或者上一层来找到相应源码。这里主要根据是当我们鼠标放在以某tag为根节点的源码的上时,上面的页面对应的界面元素会有相应标记。
方法缺点:写出的locator可能并不是页面的唯一,这样selenium运行就难以识别
⑹ 使用xpath怎么提取src中的部分数据
你可以用文件流跌代器去读取
如 istream_iterator str3这样也行
⑺ 如何使用xpath获取html标签中属性的属性值 如:
您好!
比如获取这个img下的URL把:<xsl:value-of select="//a[@class='b']/img/@src"/>
上面的这条语句就能获取到URL了。
亲,没有问题的话,请点赞!谢谢!
⑻ Selenium中关于XPath中节点后面[1]的诡异问题
//a[contains(@id,'abc')][2]
这个2代表你要找到 A 在家中排行老二. 而不是所有家庭合起来的第二个.
比如说
<span><a>老大</a><a>老二</a></span>
<span><a>老大</a><a>老二</a></span>
用 //span/a[2]
会把两个老二都找出来.
如果是这样的
<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>
<span><a>老大</a></span>
用这个xpath 就会找不到东西, 因为都是独生子女.
你要选中第二个老大, xpath 要这样写
(//span/a)[2]
这个方式在很多地方有效, 但在Selenium 中好像无效.
⑼ 大神们,怎样用js获取html的xpath
用jQuery写的,当鼠标点击一个元素时,显示元素的xpath路径
$(document).ready(function () {
var xpath = '', o;
$('*').click(function (e) {
e.stopPropagation();//停止冒泡
o = this;
alert(readXPath(o));
});
});
⑽ php怎么使用xpath解析html内容
实例如下:
<?php
$xml = simplexml_load_file("test.xml");
$result = $xml->xpath("form");
print_r($result);
?>
获取form内容