当前位置：首页 » 编程语言 » dom解析html

dom解析html

发布时间: 2021-03-21 08:57:14

『壹』 js怎么解析带有html的数据

一般可以用原生js及jQuery获取html元素的值。

1

<div id="test">数值</div>

原生js写法：
alert(document.getElementById('test').innerHTML);//数值

jQuery写法：
alert($('#test').html());//数值

说明：

innerHTML是取元素的内部html代码，此例中即div内部的所有html代码
html()方法作用也是取dom节点的内部html内容，是jQuery中的函数方法

『贰』在JS的脚本里,怎么把一个html字符串转成的DOM对象.从而能使用返回的DOM对象来访问某一个节点

你的这个javascript脚本通常会在一个HTML页面里面运行。所以如果你的字符串里面没有<html>标签专，直接就是内容<input type='text' value='123' id='test'>，那么属可以通过doucment.createElement创建一个div，然后把这个div的innerHTML设置成你的字符串。再把这个div append到doucmnet下面人任何一个元素里（通常就是body元素），这样就可以document.getElementById来获取了。用完之后如果不需要了，再从dom tree里把这个元素移除掉，或者就把这个div设置为display="None"就好
但是如果这个字符串是完整的HTML，包括<html><head><body>等标签，那么就需要创建一个新的iframe，把这个iframe的innerHTML设置成你的字符串，然后通过iframe的document的getElementById来获取。

『叁』如何将HTML String 转换为 dom 元素

前一段时间因为需求，所以把这方面的资料自己查询规整了一下，以备后用。
DOMParser
对于开发者来说，我们"期盼"的最好的方式当然是原生的浏览器支持，就像下面这样
1: var parser = new DOMParser();
2: var doc = parser.parseFromString("<input />", "text/html");

Tips:
parseFromString 返回的并不仅仅是一个 input 元素的 node，而是一个完整的 Document
这里是支持 script 标签的，但是当解析出的 dom 被添加到页面时，script是不会被执行的
最好保证格式良好，否则可能并不会展现如我们预期的 dom 结构

遗憾的是，DOMParser 对 HTML 的解析仅仅得到了 Firefox 12+, IE 10+ 的支持，其余的浏览器均不支持，所以我们要寻求浏览器兼容性更好的方法
InnerHTML
用 javascript 写一个简易的 parser 其实并不是很难，基本的雏形就像下面这样
1: (function (DOMParser) {
2: "use strict";
3:
4: var
5: DOMParser_proto = DOMParser.prototype,
6: real_parseFromString = DOMParser_proto.parseFromString;
7:
8: // Firefox/Opera/IE throw errors on unsupported types
9: try {
10: // WebKit returns null on unsupported types
11: if ((new DOMParser).parseFromString("", "text/html")) {
12: // text/html parsing is natively supported
13: return;
14: }
15: } catch (ex) {}
16:
17: DOMParser_proto.parseFromString = function (markup, type) {
18: if (/^\s*text\/html\s*(?:;|$)/i.test(type)) {
19: var
20: doc = document.implementation.createHTMLDocument("");
21: if (markup.toLowerCase().indexOf('<!doctype') > -1) {
22: doc.documentElement.innerHTML = markup;
23: } else {
24: doc.body.innerHTML = markup;
25: }
26: return doc;
27: } else {
28: return real_parseFromString.apply(this, arguments);
29: }
30: };
31: }(DOMParser));

真正在使用时，我们可能不希望返回的是一个完整的 Document，而仅仅是一个 html 片段，那采用下面的代码也许更方便
1: function parseStringToHTML(text) {
2: var i, a = document.createElement("div"),
3: b = document.createDocumentFragment();
4: a.innerHTML = text;
5: while (i = a.firstChild) b.appendChild(i);
6: return b;
7: }

『肆』浏览器是怎么把html文档解析成DOM结构的

浏览器解析html的过程如下：
HTML解析器的工作是解析HTML标记到解析树
1)HTML语法定义
HTML的词汇与句法定义在w3c组织创建的规范中。当前版本是HTML4，HTML5的工作正在进行中。
2)不是上下文无关语法
在对解析器的介绍中看到，语法可以用类似BNF的格式规范地定义。不幸的是所有常规解析器的讨论都不适用于HTML（我提及它们并不是为了娱乐，它们可以用于解析CSS和JavaScript）。HTML无法用解析器所需的上下文无关的语法来定义。过去HTML格式规范由DTD (Document Type Definition)来定义，但它不是一个上下文无关语法。
HTML与XML相当接近。XML有许多可用的解析器。HTML还有一个XML变种叫XHTML，那么它们主要区别在哪里呢？区别在于HTML应用更加”宽容”，它容许你漏掉一些开始或结束标签等。它整个是一个“软”句法，不像XML那样严格死板。总的来说这一看似细微的差别造成了两个不同的世界。一方面这使得HTML很流行，因为它包容你的错误，使网页作者的生活变得轻松。另一方面，它使编写语法格式变得困难。所以综合来说，HTML解析并不简单，现成的上下文相关解析器搞不定，XML解析器也不行。
3)HTML DTD
HTML的定义使用DTD文件。这种格式用来定义SGML族语言，它包含对所有允许的元素的定义，包括它们的属性和层级关系。如我们前面所说，HTML DTD构不成上下文无关语法。
DTD有几种不同类型。严格模式完全尊守规范，但其它模式为了向前兼容可能包含对早期浏览器所用标签的支持。当前的严格模式DTD：http://www.w3.org/TR/html4/strict.dtd
4)DOM
解析器输出的树是由DOM元素和属性节点组成的。DOM的全称为：Document Object Model。它是HTML文档的对象化描述，也是HTML元素与外界（如Javascript）的接口。
DOM与标签有着几乎一一对应的关系，如下：
<html>
<body>
<p>hello world</p>
<div><img src="aa.png"/></div>
</body>
</html>

『伍』 php DOMDocument 如何获取html的数据,包括html的标签在内,麻烦高手解答

没人看的懂你的问题，首先要恭喜你你又懂了一些一般人不懂的问题，不多说了，
我看了DOMDocument 用来获取xml的。如果要用PHP来解析html，可以用simple_html_dom，会jquery的话，看这个比较容易，具体用法，可以网络一下 php simple_html_dom。
希望对你有用。你的意思，我理解对了吧？

『陆』 html中DOM解析获取子元素节点如何忽略空白

你可以根据节点类型来判断，文本节点类型和其他节点类型是不一样的，去回W3school查看一下，有一答个nodeType属性。

参考网址：http://www.w3school.com.cn/htmldom/dom_properties.asp

『柒』 Android怎么用dom解析HTML，HTML嵌套了这么多<div>节点，难道要一个一个子节点的找下去

参考一下这个。。。。
http://www.cfanz.cn/?c=article&a=read&id=29005
有类库可回以帮你的。答

阅读全文

dom解析html

与dom解析html相关的阅读推荐