网页表格提取
㈠ 如何提取和保存网页中的表格
最简单的方法,右键点你要的表格,选导出到Microsoft office excel,就可以了。
㈡ 如何获取网页表格里的数据
this.webBrowser1.Document.GetElementById("username").InnerText
就是获取这个控件的值
///////////////////C:a.htm///////////////////
<!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<htmlxmlns="http://www.w3.org/1999/xhtml">
<head>
<title>UntitledPage</title>
</head>
<body>
<tableid="table1">
<thead>
<tr>
<th>
ID
</th>
<th>
Name
</th>
<th>
Memo
</th>
</tr>
</thead>
<tbody>
<tr>
<td>
100
</td>
<td>
aaa
</td>
<td>
123
</td>
</tr>
<tr>
<td>
101
</td>
<td>
bbb
</td>
<td>
456
</td>
</tr>
<tr>
<td>
102
</td>
<td>
ccc
</td>
<td>
789
</td>
</tr>
<tr>
<td>
104
</td>
<td>
ddd
</td>
<td>
000
</td>
</tr>
</tbody>
</table>
</body>
</html>
/////////////////////form1.cs//////////////////
在form1中拖一个webbrowser,一个listview,和一个button
设置listview的视图为Details
//按钮事件
privatevoidbutton1_Click(objectsender,EventArgse)
{
this.webBrowser1.Url=newUri(@"File:\C:a.htm");
}
//webbrowser事件
privatevoidwebBrowser1_DocumentCompleted(objectsender,)
{
HtmlElementhe=this.webBrowser1.Document.GetElementById("table1");
intcolumns=he.FirstChild.FirstChild.Children.Count;
for(inti=0;i<columns;i++)
{
this.listView1.Columns.Add(he.FirstChild.FirstChild.Children[i].InnerText);
}
introws=he.Children[1].Children.Count;
for(intj=0;j<rows;j++)
{
this.listView1.Items.Add(he.Children[1].Children[j].Children[0].InnerText);
for(intk=1;k<columns;k++)
{
this.listView1.Items[j].SubItems.Add(he.Children[1].Children[j].Children[k].InnerText);
}
}
}
㈢ 网页源文件中提取EXCEL表格的方法
可以用我们安全浏览器的插件来导出excel文件
㈣ 如何提取网页上表格中的数据,望大侠指点
如果你想获取结构化的表格数据,并且不断获取新增数据的话,还得用上工具辅专助,目前博 为小 帮软属件机器人对网页或者软件商各种可见数据都能方便采集下来,采集后输出的也是结构化的表格。表结构可以根据你对应的Excel表格来一一设置,一次设置好后,可以实现长期一键采集数据,每次采集后输出的表格,就是数据更新后的Excel表格了