提取网页文本
⑴ 如何提取网页中的文字
去找这篇文章吧。
《中国金融》2005年第4期
地下金融:引导抑或封杀?(本刊记者 赵 耀)
不敢乱装插件。
⑵ 如何提取网页文字
一下答案是在网上帮你找到的!
破解网页不能复制
★一、通过使用IE浏览器“文件”下拉菜单中的“发送”之“电子邮件页面”的操作,在电子邮件页面中去复制,从而实现下载的目的。
★二、可以通过使用IE浏览器“的编辑器功能,如WORD等软件,在编辑状态下可以实现复制和下载。复制网页地址,打开Microsoft Office Word,点击"文件"——“打开”,在弹出的对话框中填出刚才复制的网页地址或者按下ctrl+v组合键,点“打开”按钮,在打开网页之前,可能会弹出“Word 没有足够的内存,此操作完成后无法撤消。是否继续?”的提示窗口,单击“是”,即弹出新的窗口,询问是否信任文件来源,再单击“是”后,Word会自动链接到对应的服务器并打开网页,这时我们就可以选中其中的文字进行复制粘贴了。另外,此法在WPS2005中也可以使用,操作起来十分方便。这样复制、剪切随君所愿。
★三、可以通过使用IE浏览器“查看”菜单之“源文件”功能,在弹出的窗口中可以找到你需要复制和下载的内容,但没有格式。除此之外,还可以通过其他比较具有特殊功能的浏览器,如火狐等,实现一般IE浏览器所不能实现的功能。如果你用的是“遨游”等可以控制脚本的浏览器,可以禁用脚本。具体操作(以“遨游”为例):点击“选项”——“下载控制”——去掉“允许scripts”前的勾,这回可以复制了吧?如果还不行,干脆把“允许java”和“允许activex”前面的勾也去掉。
★四、更改安全级别的破解方法: 单击IE浏览器的“工具”——“internet选项”——“安全”,将其中的“internet”的安全级别设为最高级别,“确定”后刷新网页即可。安全级别最高的时候,一切控件和脚本均不能运行,再厉害的网页限制手段统统全部作废!或者在“安全”选项卡,接下来点击“自定义级别”按钮,在弹出的窗口中将所有脚本全部选择禁用,确定。然后按F5刷新页面,这时我们就能够对网页的内容进行复制、粘贴等操作。当你收集到自己需要的内容后,再用相同步骤给网页脚本解禁,这样就不会影响到我们浏览其他网页了。
★五、我们来了解一下为什么不能被复制。
当前很多网页制做者都不想让自己网页中的内容直接就让人给复制去,有的是为了版权、有的是为了让人再回来看这段文字,提高他的访问量等等,具体原因我也说不清的啦^_^。他们一般会在网页代码 中加入以下一个或多个代码:
onpaste="return false" 不准粘贴
on="return false;" 不准复制
oncut="return false;" 防止剪切
onselectstart = "return false" 不准选择
例如: ,这是一个典型的不让选择复制的语句。好啦,现在我们知道为什么不能被复制了,那我们就可以针对这些代码下药了。
第一步:打开你想要复制的那个网站。
第二步:将该网页另存到你的电脑上(文件|另存为|XXX.html)。
第三步:用记事本打开你刚保存的网页,找到 这段代码(不一定完全是这样的),你把里面的代码(除body)全部删除,最后就剩 ,保存文件。
第四步:双击打开你刚保存的那个网页,用鼠标选择你想要的那些文字,是不是可以选择并复制下来了呢?
★六、如果上面的方法你不很熟悉,不愿意用,还有另外的好办法:文件——另存为——txt文本文档,然后打开所存的文本文档,你想怎么复制就怎么复制。但是这个方法只对文字信息有效,图片信息将会失去。
但是,有时你按照上述多种途径仍然不能实现复制或者下载的目的时,我便提醒诸位,还有另一绝招,即通过查找相关标题内容的网页快照的办法,目前网络、GOOGLE等搜索引擎都具有网页快照的功能,这当然是复制和下载的最好办法。
-------------------------------------------------------------------------------------------------------------------------------------
屏蔽右键的破解方法
★1、出现版权信息类的情况。
破解方法:在页面目标上按下鼠标右键,弹出限制窗口,这时不要松开右键,将鼠标指针移到窗口的“确定”按钮上,同时按下左键。现在松开鼠标左键,限制窗口被关闭了,再将鼠标移到目标上松开鼠标右键。
★2、出现“添加到收藏夹”的情况。
破解方法:在目标上点鼠标右键,出现添加到收藏夹的窗口,这时不要松开右键,也不要移动鼠标,而是使用键盘的Tab键,移动光标到取消按钮上,按下空格键,这时窗口就消失了,松开右键看看,wonderful!右键恢复雄风了!将鼠标移动到你想要的功能上,点击左键吧。
★3、超链接无法用鼠标右键弹出“在新窗口中打开”菜单的情况。
破解方法:这时用上面的两种方法无法破解,看看这一招:在超链接上点鼠标右键,弹出窗口,这时不要松开右键,按键盘上的空格键,窗口消失了,这时松开右键,可爱的右键菜单又出现了,选择其中的“在新窗口中打开”就可以了。
★4、在浏览器中点击“查看”菜单上的“源文件”命令,这样就可以看到html源代码了。不过如果网页使用了框架,你就只能看到框架页面的代码,此方法就不灵了,怎么办?你按键盘上的“Shift+F10”组合键试试,
★5、看见键盘右Ctrl键左边的那个键了吗?按一下试试,右键菜单直接出现了!
★6、在屏蔽鼠标右键的页面中点右键,出现限制窗口,此时不要松开右键,用左手按键盘上的“ALT+F4”组合键,这时窗口就被关闭了,松开鼠标右键,菜单出现了!
-------------------------------------------------------------------------------------------------------------------------------------
破解网页禁用鼠标右键的方法大全
我们经常会在上网的时候遇到很多禁止了鼠标右键的网页,而那些内容却是我们非常喜欢的,不管是文字或插图都想保存到本地以便以后查看,那我们应该怎样来破解这样的限制呢?下面,根据不同的情况,笔者就一一给大家提出解决办法吧,希望对您有用。
★情况一:在网页中无法复制文字,并且无法通过“图片另存为”的方法下载图片。
解决:在IE浏览器右击“属性”—“安全”然后“自定义级别”把“活动脚本”和“Java”小程序脚本”设置为禁用即可。
★情况二:在页面目标上按下鼠标右键,此时弹出一个限制窗口,提示禁止使用鼠标右键。
解决:在页面目标上按下鼠标右键不放,将鼠标光标移动到窗口的“确定”按钮上,同时按下左键。把鼠标左键松开,限制窗口被关闭了,然后在将鼠标光标移动到目标上松开鼠标右键,右键菜单就便弹出来了。
★情况三:在目标上单击鼠标右键,出现添加到收藏夹窗口。
解决:在目标上单击鼠标右键后不要松开,也不要移动鼠标,此时使用键盘的Tab键移动光标到取消按钮上,然后按下空格键,这时窗口就被关闭了,在松开鼠标右键,熟悉的右键菜单就明显出来了。
★情况四:超链接无法用鼠标右键弹出“在新窗口中打开”菜单的。
这时用上面的两种方法无法破解,看看这一招:在超链接上点鼠标右键,弹出窗口,这时不要松开右键,按键盘上的空格键,窗口消失了,这时松开右键,可爱的右键菜单又出现了,选择其中的“在新窗口中打开”就可以了。
★情况五:当你点击右键时,右键无效果、无反应。
解决:
1) 在有锁右键的页面按一下 [Alt] 键。
2) 再按一下 [F12] 键。
3) 在任何地方按鼠标右键便可以啦 !
★情况六:其它组合键的妙用
1、按键盘上的Shift+F10组合键试试,出现什么了?哇!直接出现右键菜单了!
2、还有一招:看见键盘右Ctrl键左边的那个键了吗?那就是快捷菜单键拉!按一下试试,右键菜单直接出现了!或者在想要使用鼠标右键的地方按下鼠标左键不放,接着按下键盘上的 "快捷菜单键" 按键 , 这样鼠标右键的功能就出现了
3、直接将想要的图片用左键拖着,然后按下WIN+D键,这样一来就可以拖到桌面上保存!(此方法适用于单手操作较灵活的同志)
4、在屏蔽鼠标右键的页面中点右键,出现限制窗口,此时不要松开右键,用左手按键盘上的ALT+F4组合键,这时窗口就被我们关闭了,松开鼠标右键,菜单出现了!这一招一使出来,以上所有情况都可轻易破解掉!
★情况七:Java script源代码修改
有时在浏览网页时,除单击鼠标左键外,其他任何形式的鼠标点击或组合点击,都将出现“版权所有(C),严禁复制!”的提示框。这是因为网页文件中加入了如下代码:
你可以在地址栏键入:java script:alert(document.oncontextmenu='''')回车,确定对话框后,就可以直接使用右键了!
⑶ 易语言怎样提取网页中的文本
-----------------------------------------------------------------
.版本 2
.子程序 取出文本, 文本型
.参数 文本, 文本型
.参数 头, 文本型
.参数 尾, 文本型
.参数 起始搜寻位置, 整数型, 可空
.局部变量 pos1, 整数型
.局部变量 pos2, 整数型
.如果真 (起始搜寻位置 ≤ 0)
起始搜寻位置 = 1
.如果真结束
pos1 = 寻找文本 (文本, 头, 起始搜寻位置, 真) + 取文本长度 (头)
pos2 = 寻找文本 (文本, 尾, pos1, 真)
返回 (取文本中间 (文本, pos1, pos2 - pos1))
-----------------------------------------------------------------
调用方法:(如取出上面的“很遗憾,您未获得红包,请继续加油!”)
文本 = 取出文本 (网页文本, “
⑷ 如何提取网页上不能复制的文字
方法:
第一招
点击浏览器的“工具”—“internet选项”—“安全”—“自定义级别”,然后将脚本全部禁用,安F5刷新一下网页。这时候就会发现之前不能复制的内容,现在都没有问题了!(提示:复制完想要的东西之后,记得吧禁用的脚本解禁,否则会影响正常浏览的)
第二招
这招说其实是最简单,但有时最麻烦的一招。直接右击然后“查看源文件”,在源文件代码中复制需要的文章。不过复制文章的时候会有很多用不着的符号和代码。是有些麻烦
第三招
点击浏览器的“文件”菜单栏,选择“保存网页”然后点开保存的文件,下载下来想要的网页,然后用word文本打开就可以了
第四招
打开想要下载的网页,然后把该网页另存到电脑上面,接着用记
事本打开的方法打开!在记事本中找到(onpaste= “reture flase”不准粘贴on=“reture flase;”不准复制oncut=“reture flase;”不准剪切 onselectarst=“reture flase”不准选择)这句语句或者类似的代码,然后把这句代码去掉,body模块中的除外,然后保存记事本。接着双击打开刚才保存的记事本,这时候出现的文章就是可以复制的文章了。
⑸ 网页文字提取
这东西,就是人家为了防复制的,自然是没什么规律。只能手动一点点修改。
不过,你想得到网页中文字的话,可以点另存为,保存这个网页为TXT文件
再用WORD来编辑,用替换功能--高级。试试通配符吧(也就是正则表达式)效果还是不错的
你如果不会用WORD的通配符,可以搜网络。
另:再给你一个方法,点右键,查看源文件,里面也会有你所需要的文字
⑹ 怎样提取网页文字
2个办法
1.在你想保存的页面时,点击
文件
,然后点击另存为,保存在硬盘上。
2.点击
查看
里面有回一个源文件答。然后就会弹出一个文本文档,这是这个网页的源程序(HTML语言),你找一下,有你要的小说内容的,把不需要的代码去掉就可以了。(这个比较麻烦,但是可以把小说以TXT文档格式保存,看起来就方便了。
⑺ 如何用易语言提取网页中的文本内容
局部变量 返回文本文本型
返回文本=http读文本(A)
文本_取中间文本(返回文本,“
<label id="CardInfo" style="color:#1800ff; font-weight:bold;">”,“</label> ”)
⑻ 如何提取网页中的内容
有用又简单的办法:
工具——Internet选项——安全——自定义级别——设置
找到脚本的设置,
即Java小程序脚本、活动脚本和允许通过脚本进行粘贴
设置三个脚本为禁用。(允许通过脚本进行粘贴脚本设置也可为启用)
确定后,刷新网页。一切OK
特别提醒:用完后一定记得要重新将三个脚本设置还原为 启用,要不网页显示会不正常。
⑼ 如何提取网页里的文本
★一、通过使用IE浏览器“文件”下拉菜单中的“发送”之“电子邮件页面”的操作,在电子邮件页面中去复制,从而实现下载的目的。
★二、可以通过使用IE浏览器“的编辑器功能,如WORD等软件,在编辑状态下可以实现复制和下载。复制网页地址,打开Microsoft Office Word,点击"文件"——“打开”,在弹出的对话框中填出刚才复制的网页地址或者按下ctrl+v组合键,点“打开”按钮,在打开网页之前,可能会弹出“Word 没有足够的内存,此操作完成后无法撤消。是否继续?”的提示窗口,单击“是”,即弹出新的窗口,询问是否信任文件来源,再单击“是”后,Word会自动链接到对应的服务器并打开网页,这时我们就可以选中其中的文字进行复制粘贴了。另外,此法在WPS2005中也可以使用,操作起来十分方便。这样复制、剪切随君所愿。
★三、可以通过使用IE浏览器“查看”菜单之“源文件”功能,在弹出的窗口中可以找到你需要复制和下载的内容,但没有格式。除此之外,还可以通过其他比较具有特殊功能的浏览器,如火狐等,实现一般IE浏览器所不能实现的功能。如果你用的是“遨游”等可以控制脚本的浏览器,可以禁用脚本。具体操作(以“遨游”为例):点击“选项”——“下载控制”——去掉“允许scripts”前的勾,这回可以复制了吧?如果还不行,干脆把“允许java”和“允许activex”前面的勾也去掉。
★四、更改安全级别的破解方法: 单击IE浏览器的“工具”——“internet选项”——“安全”,将其中的“internet”的安全级别设为最高级别,“确定”后刷新网页即可。安全级别最高的时候,一切控件和脚本均不能运行,再厉害的网页限制手段统统全部作废!或者在“安全”选项卡,接下来点击“自定义级别”按钮,在弹出的窗口中将所有脚本全部选择禁用,确定。然后按F5刷新页面,这时我们就能够对网页的内容进行复制、粘贴等操作。当你收集到自己需要的内容后,再用相同步骤给网页脚本解禁,这样就不会影响到我们浏览其他网页了。