『壹』 js怎么解析带有html的数据

一般可以用原生js及jQuery获取html元素的值。

1

<div id="test">数值</div>

原生js写法:
alert(document.getElementById('test').innerHTML);//数值

jQuery写法:
alert($('#test').html());//数值

说明:

innerHTML是取元素的内部html代码,此例中即div内部的所有html代码
html()方法作用也是取dom节点的内部html内容,是jQuery中的函数方法

『贰』 在JS的脚本里,怎么把一个html字符串转成的DOM对象.从而能使用返回的DOM对象来访问某一个节点

你的这个javascript脚本通常会在一个HTML页面里面运行。所以如果你的字符串里面没有<html>标签专,直接就是内容<input type='text' value='123' id='test'>,那么属可以通过doucment.createElement创建一个div,然后把这个div的innerHTML设置成你的字符串。再把这个div append到doucmnet下面人任何一个元素里(通常就是body元素),这样就可以document.getElementById来获取了。用完之后如果不需要了,再从dom tree里把这个元素移除掉,或者就把这个div设置为display="None"就好
但是如果这个字符串是完整的HTML,包括<html><head><body>等标签,那么就需要创建一个新的iframe,把这个iframe的innerHTML设置成你的字符串,然后通过iframe的document的getElementById来获取。

『叁』 如何将HTML String 转换为 dom 元素

前一段时间因为需求,所以把这方面的资料自己查询规整了一下,以备后用。
DOMParser
对于开发者来说,我们"期盼"的最好的方式当然是原生的浏览器支持,就像下面这样
1: var parser = new DOMParser();
2: var doc = parser.parseFromString("<input />", "text/html");

Tips:
parseFromString 返回的并不仅仅是一个 input 元素的 node, 而是一个完整的 Document
这里是支持 script 标签的, 但是当解析出的 dom 被添加到页面时,script是不会被执行的
最好保证格式良好,否则可能并不会展现如我们预期的 dom 结构

遗憾的是,DOMParser 对 HTML 的解析仅仅得到了 Firefox 12+, IE 10+ 的支持,其余的浏览器均不支持,所以我们要寻求浏览器兼容性更好的方法
InnerHTML
用 javascript 写一个简易的 parser 其实并不是很难,基本的雏形就像下面这样
1: (function (DOMParser) {
2: "use strict";
3:
4: var
5: DOMParser_proto = DOMParser.prototype,
6: real_parseFromString = DOMParser_proto.parseFromString;
7:
8: // Firefox/Opera/IE throw errors on unsupported types
9: try {
10: // WebKit returns null on unsupported types
11: if ((new DOMParser).parseFromString("", "text/html")) {
12: // text/html parsing is natively supported
13: return;
14: }
15: } catch (ex) {}
16:
17: DOMParser_proto.parseFromString = function (markup, type) {
18: if (/^\s*text\/html\s*(?:;|$)/i.test(type)) {
19: var
20: doc = document.implementation.createHTMLDocument("");
21: if (markup.toLowerCase().indexOf('<!doctype') > -1) {
22: doc.documentElement.innerHTML = markup;
23: } else {
24: doc.body.innerHTML = markup;
25: }
26: return doc;
27: } else {
28: return real_parseFromString.apply(this, arguments);
29: }
30: };
31: }(DOMParser));

真正在使用时,我们可能不希望返回的是一个完整的 Document, 而仅仅是一个 html 片段,那采用下面的代码也许更方便
1: function parseStringToHTML(text) {
2: var i, a = document.createElement("div"),
3: b = document.createDocumentFragment();
4: a.innerHTML = text;
5: while (i = a.firstChild) b.appendChild(i);
6: return b;
7: }

『肆』 浏览器是怎么把html文档解析成DOM结构的

浏览器解析html的过程如下:
HTML解析器的工作是解析HTML标记到解析树
1)HTML语法定义
HTML的词汇与句法定义在w3c组织创建的规范中。当前版本是HTML4,HTML5的工作正在进行中。
2)不是上下文无关语法
在对解析器的介绍中看到,语法可以用类似BNF的格式规范地定义。不幸的是所有常规解析器的讨论都不适用于HTML(我提及它们并不是为了娱乐,它们可以用于解析CSS和JavaScript)。HTML无法用解析器所需的上下文无关的语法来定义。过去HTML格式规范由DTD (Document Type Definition)来定义,但它不是一个上下文无关语法。
HTML与XML相当接近。XML有许多可用的解析器。HTML还有一个XML变种叫XHTML,那么它们主要区别在哪里呢?区别在于HTML应用更加”宽容”,它容许你漏掉一些开始或结束标签等。它整个是一个“软”句法,不像XML那样严格死板。 总的来说这一看似细微的差别造成了两个不同的世界。一方面这使得HTML很流行,因为它包容你的错误,使网页作者的生活变得轻松。另一方面,它使编写语法格式变得困难。所以综合来说,HTML解析并不简单,现成的上下文相关解析器搞不定,XML解析器也不行。
3)HTML DTD
HTML的定义使用DTD文件。这种格式用来定义SGML族语言,它包含对所有允许的元素的定义,包括它们的属性和层级关系。如我们前面所说,HTML DTD构不成上下文无关语法。
DTD有几种不同类型。严格模式完全尊守规范,但其它模式为了向前兼容可能包含对早期浏览器所用标签的支持。当前的严格模式DTD:http://www.w3.org/TR/html4/strict.dtd
4)DOM
解析器输出的树是由DOM元素和属性节点组成的。DOM的全称为:Document Object Model。它是HTML文档的对象化描述,也是HTML元素与外界(如Javascript)的接口。
DOM与标签有着几乎一一对应的关系,如下:
<html>
<body>
<p>hello world</p>
<div><img src="aa.png"/></div>
</body>
</html>

『伍』 php DOMDocument 如何获取html的数据,包括html的标签在内,麻烦高手解答

没人看的懂你的问题,首先要恭喜你你又懂了一些一般人不懂的问题,不多说了,
我看了DOMDocument 用来获取xml的。如果要用PHP来解析html,可以用simple_html_dom,会jquery的话,看这个比较容易,具体用法,可以网络一下 php simple_html_dom。
希望对你有用。你的意思,我理解对了吧?

『陆』 html中DOM解析获取子元素节点如何忽略空白

你可以根据节点类型来判断,文本节点类型和其他节点类型是不一样的,去回W3school查看一下,有一答个nodeType属性。

参考网址:http://www.w3school.com.cn/htmldom/dom_properties.asp

『柒』 Android怎么用dom解析HTML,HTML嵌套了这么多<div>节点,难道要一个一个子节点的找下去

参考一下这个。。。。
http://www.cfanz.cn/?c=article&a=read&id=29005
有类库可回以帮你的。答