提取網頁文本
⑴ 如何提取網頁中的文字
去找這篇文章吧。
《中國金融》2005年第4期
地下金融:引導抑或封殺?(本刊記者 趙 耀)
不敢亂裝插件。
⑵ 如何提取網頁文字
一下答案是在網上幫你找到的!
破解網頁不能復制
★一、通過使用IE瀏覽器「文件」下拉菜單中的「發送」之「電子郵件頁面」的操作,在電子郵件頁面中去復制,從而實現下載的目的。
★二、可以通過使用IE瀏覽器「的編輯器功能,如WORD等軟體,在編輯狀態下可以實現復制和下載。復制網頁地址,打開Microsoft Office Word,點擊"文件"——「打開」,在彈出的對話框中填出剛才復制的網頁地址或者按下ctrl+v組合鍵,點「打開」按鈕,在打開網頁之前,可能會彈出「Word 沒有足夠的內存,此操作完成後無法撤消。是否繼續?」的提示窗口,單擊「是」,即彈出新的窗口,詢問是否信任文件來源,再單擊「是」後,Word會自動鏈接到對應的伺服器並打開網頁,這時我們就可以選中其中的文字進行復制粘貼了。另外,此法在WPS2005中也可以使用,操作起來十分方便。這樣復制、剪切隨君所願。
★三、可以通過使用IE瀏覽器「查看」菜單之「源文件」功能,在彈出的窗口中可以找到你需要復制和下載的內容,但沒有格式。除此之外,還可以通過其他比較具有特殊功能的瀏覽器,如火狐等,實現一般IE瀏覽器所不能實現的功能。如果你用的是「遨遊」等可以控制腳本的瀏覽器,可以禁用腳本。具體操作(以「遨遊」為例):點擊「選項」——「下載控制」——去掉「允許scripts」前的勾,這回可以復制了吧?如果還不行,乾脆把「允許java」和「允許activex」前面的勾也去掉。
★四、更改安全級別的破解方法: 單擊IE瀏覽器的「工具」——「internet選項」——「安全」,將其中的「internet」的安全級別設為最高級別,「確定」後刷新網頁即可。安全級別最高的時候,一切控制項和腳本均不能運行,再厲害的網頁限制手段統統全部作廢!或者在「安全」選項卡,接下來點擊「自定義級別」按鈕,在彈出的窗口中將所有腳本全部選擇禁用,確定。然後按F5刷新頁面,這時我們就能夠對網頁的內容進行復制、粘貼等操作。當你收集到自己需要的內容後,再用相同步驟給網頁腳本解禁,這樣就不會影響到我們瀏覽其他網頁了。
★五、我們來了解一下為什麼不能被復制。
當前很多網頁製做者都不想讓自己網頁中的內容直接就讓人給復制去,有的是為了版權、有的是為了讓人再回來看這段文字,提高他的訪問量等等,具體原因我也說不清的啦^_^。他們一般會在網頁代碼 中加入以下一個或多個代碼:
onpaste="return false" 不準粘貼
on="return false;" 不準復制
oncut="return false;" 防止剪切
onselectstart = "return false" 不準選擇
例如: ,這是一個典型的不讓選擇復制的語句。好啦,現在我們知道為什麼不能被復制了,那我們就可以針對這些代碼下葯了。
第一步:打開你想要復制的那個網站。
第二步:將該網頁另存到你的電腦上(文件|另存為|XXX.html)。
第三步:用記事本打開你剛保存的網頁,找到 這段代碼(不一定完全是這樣的),你把裡面的代碼(除body)全部刪除,最後就剩 ,保存文件。
第四步:雙擊打開你剛保存的那個網頁,用滑鼠選擇你想要的那些文字,是不是可以選擇並復制下來了呢?
★六、如果上面的方法你不很熟悉,不願意用,還有另外的好辦法:文件——另存為——txt文本文檔,然後打開所存的文本文檔,你想怎麼復制就怎麼復制。但是這個方法只對文字信息有效,圖片信息將會失去。
但是,有時你按照上述多種途徑仍然不能實現復制或者下載的目的時,我便提醒諸位,還有另一絕招,即通過查找相關標題內容的網頁快照的辦法,目前網路、GOOGLE等搜索引擎都具有網頁快照的功能,這當然是復制和下載的最好辦法。
-------------------------------------------------------------------------------------------------------------------------------------
屏蔽右鍵的破解方法
★1、出現版權信息類的情況。
破解方法:在頁面目標上按下滑鼠右鍵,彈出限制窗口,這時不要松開右鍵,將滑鼠指針移到窗口的「確定」按鈕上,同時按下左鍵。現在松開滑鼠左鍵,限制窗口被關閉了,再將滑鼠移到目標上松開滑鼠右鍵。
★2、出現「添加到收藏夾」的情況。
破解方法:在目標上點滑鼠右鍵,出現添加到收藏夾的窗口,這時不要松開右鍵,也不要移動滑鼠,而是使用鍵盤的Tab鍵,移動游標到取消按鈕上,按下空格鍵,這時窗口就消失了,松開右鍵看看,wonderful!右鍵恢復雄風了!將滑鼠移動到你想要的功能上,點擊左鍵吧。
★3、超鏈接無法用滑鼠右鍵彈出「在新窗口中打開」菜單的情況。
破解方法:這時用上面的兩種方法無法破解,看看這一招:在超鏈接上點滑鼠右鍵,彈出窗口,這時不要松開右鍵,按鍵盤上的空格鍵,窗口消失了,這時松開右鍵,可愛的右鍵菜單又出現了,選擇其中的「在新窗口中打開」就可以了。
★4、在瀏覽器中點擊「查看」菜單上的「源文件」命令,這樣就可以看到html源代碼了。不過如果網頁使用了框架,你就只能看到框架頁面的代碼,此方法就不靈了,怎麼辦?你按鍵盤上的「Shift+F10」組合鍵試試,
★5、看見鍵盤右Ctrl鍵左邊的那個鍵了嗎?按一下試試,右鍵菜單直接出現了!
★6、在屏蔽滑鼠右鍵的頁面中點右鍵,出現限制窗口,此時不要松開右鍵,用左手按鍵盤上的「ALT+F4」組合鍵,這時窗口就被關閉了,松開滑鼠右鍵,菜單出現了!
-------------------------------------------------------------------------------------------------------------------------------------
破解網頁禁用滑鼠右鍵的方法大全
我們經常會在上網的時候遇到很多禁止了滑鼠右鍵的網頁,而那些內容卻是我們非常喜歡的,不管是文字或插圖都想保存到本地以便以後查看,那我們應該怎樣來破解這樣的限制呢?下面,根據不同的情況,筆者就一一給大家提出解決辦法吧,希望對您有用。
★情況一:在網頁中無法復制文字,並且無法通過「圖片另存為」的方法下載圖片。
解決:在IE瀏覽器右擊「屬性」—「安全」然後「自定義級別」把「活動腳本」和「Java」小程序腳本」設置為禁用即可。
★情況二:在頁面目標上按下滑鼠右鍵,此時彈出一個限制窗口,提示禁止使用滑鼠右鍵。
解決:在頁面目標上按下滑鼠右鍵不放,將滑鼠游標移動到窗口的「確定」按鈕上,同時按下左鍵。把滑鼠左鍵松開,限制窗口被關閉了,然後在將滑鼠游標移動到目標上松開滑鼠右鍵,右鍵菜單就便彈出來了。
★情況三:在目標上單擊滑鼠右鍵,出現添加到收藏夾窗口。
解決:在目標上單擊滑鼠右鍵後不要松開,也不要移動滑鼠,此時使用鍵盤的Tab鍵移動游標到取消按鈕上,然後按下空格鍵,這時窗口就被關閉了,在松開滑鼠右鍵,熟悉的右鍵菜單就明顯出來了。
★情況四:超鏈接無法用滑鼠右鍵彈出「在新窗口中打開」菜單的。
這時用上面的兩種方法無法破解,看看這一招:在超鏈接上點滑鼠右鍵,彈出窗口,這時不要松開右鍵,按鍵盤上的空格鍵,窗口消失了,這時松開右鍵,可愛的右鍵菜單又出現了,選擇其中的「在新窗口中打開」就可以了。
★情況五:當你點擊右鍵時,右鍵無效果、無反應。
解決:
1) 在有鎖右鍵的頁面按一下 [Alt] 鍵。
2) 再按一下 [F12] 鍵。
3) 在任何地方按滑鼠右鍵便可以啦 !
★情況六:其它組合鍵的妙用
1、按鍵盤上的Shift+F10組合鍵試試,出現什麼了?哇!直接出現右鍵菜單了!
2、還有一招:看見鍵盤右Ctrl鍵左邊的那個鍵了嗎?那就是快捷菜單鍵拉!按一下試試,右鍵菜單直接出現了!或者在想要使用滑鼠右鍵的地方按下滑鼠左鍵不放,接著按下鍵盤上的 "快捷菜單鍵" 按鍵 , 這樣滑鼠右鍵的功能就出現了
3、直接將想要的圖片用左鍵拖著,然後按下WIN+D鍵,這樣一來就可以拖到桌面上保存!(此方法適用於單手操作較靈活的同志)
4、在屏蔽滑鼠右鍵的頁面中點右鍵,出現限制窗口,此時不要松開右鍵,用左手按鍵盤上的ALT+F4組合鍵,這時窗口就被我們關閉了,松開滑鼠右鍵,菜單出現了!這一招一使出來,以上所有情況都可輕易破解掉!
★情況七:Java script源代碼修改
有時在瀏覽網頁時,除單擊滑鼠左鍵外,其他任何形式的滑鼠點擊或組合點擊,都將出現「版權所有(C),嚴禁復制!」的提示框。這是因為網頁文件中加入了如下代碼:
你可以在地址欄鍵入:java script:alert(document.oncontextmenu='''')回車,確定對話框後,就可以直接使用右鍵了!
⑶ 易語言怎樣提取網頁中的文本
-----------------------------------------------------------------
.版本 2
.子程序 取出文本, 文本型
.參數 文本, 文本型
.參數 頭, 文本型
.參數 尾, 文本型
.參數 起始搜尋位置, 整數型, 可空
.局部變數 pos1, 整數型
.局部變數 pos2, 整數型
.如果真 (起始搜尋位置 ≤ 0)
起始搜尋位置 = 1
.如果真結束
pos1 = 尋找文本 (文本, 頭, 起始搜尋位置, 真) + 取文本長度 (頭)
pos2 = 尋找文本 (文本, 尾, pos1, 真)
返回 (取文本中間 (文本, pos1, pos2 - pos1))
-----------------------------------------------------------------
調用方法:(如取出上面的「很遺憾,您未獲得紅包,請繼續加油!」)
文本 = 取出文本 (網頁文本, 「
⑷ 如何提取網頁上不能復制的文字
方法:
第一招
點擊瀏覽器的「工具」—「internet選項」—「安全」—「自定義級別」,然後將腳本全部禁用,安F5刷新一下網頁。這時候就會發現之前不能復制的內容,現在都沒有問題了!(提示:復制完想要的東西之後,記得吧禁用的腳本解禁,否則會影響正常瀏覽的)
第二招
這招說其實是最簡單,但有時最麻煩的一招。直接右擊然後「查看源文件」,在源文件代碼中復制需要的文章。不過復制文章的時候會有很多用不著的符號和代碼。是有些麻煩
第三招
點擊瀏覽器的「文件」菜單欄,選擇「保存網頁」然後點開保存的文件,下載下來想要的網頁,然後用word文本打開就可以了
第四招
打開想要下載的網頁,然後把該網頁另存到電腦上面,接著用記
事本打開的方法打開!在記事本中找到(onpaste= 「reture flase」不準粘貼on=「reture flase;」不準復制oncut=「reture flase;」不準剪切 onselectarst=「reture flase」不準選擇)這句語句或者類似的代碼,然後把這句代碼去掉,body模塊中的除外,然後保存記事本。接著雙擊打開剛才保存的記事本,這時候出現的文章就是可以復制的文章了。
⑸ 網頁文字提取
這東西,就是人家為了防復制的,自然是沒什麼規律。只能手動一點點修改。
不過,你想得到網頁中文字的話,可以點另存為,保存這個網頁為TXT文件
再用WORD來編輯,用替換功能--高級。試試通配符吧(也就是正則表達式)效果還是不錯的
你如果不會用WORD的通配符,可以搜網路。
另:再給你一個方法,點右鍵,查看源文件,裡面也會有你所需要的文字
⑹ 怎樣提取網頁文字
2個辦法
1.在你想保存的頁面時,點擊
文件
,然後點擊另存為,保存在硬碟上。
2.點擊
查看
裡面有回一個源文件答。然後就會彈出一個文本文檔,這是這個網頁的源程序(HTML語言),你找一下,有你要的小說內容的,把不需要的代碼去掉就可以了。(這個比較麻煩,但是可以把小說以TXT文檔格式保存,看起來就方便了。
⑺ 如何用易語言提取網頁中的文本內容
局部變數 返迴文本文本型
返迴文本=http讀文本(A)
文本_取中間文本(返迴文本,「
<label id="CardInfo" style="color:#1800ff; font-weight:bold;">」,「</label> 」)
⑻ 如何提取網頁中的內容
有用又簡單的辦法:
工具——Internet選項——安全——自定義級別——設置
找到腳本的設置,
即Java小程序腳本、活動腳本和允許通過腳本進行粘貼
設置三個腳本為禁用。(允許通過腳本進行粘貼腳本設置也可為啟用)
確定後,刷新網頁。一切OK
特別提醒:用完後一定記得要重新將三個腳本設置還原為 啟用,要不網頁顯示會不正常。
⑼ 如何提取網頁里的文本
★一、通過使用IE瀏覽器「文件」下拉菜單中的「發送」之「電子郵件頁面」的操作,在電子郵件頁面中去復制,從而實現下載的目的。
★二、可以通過使用IE瀏覽器「的編輯器功能,如WORD等軟體,在編輯狀態下可以實現復制和下載。復制網頁地址,打開Microsoft Office Word,點擊"文件"——「打開」,在彈出的對話框中填出剛才復制的網頁地址或者按下ctrl+v組合鍵,點「打開」按鈕,在打開網頁之前,可能會彈出「Word 沒有足夠的內存,此操作完成後無法撤消。是否繼續?」的提示窗口,單擊「是」,即彈出新的窗口,詢問是否信任文件來源,再單擊「是」後,Word會自動鏈接到對應的伺服器並打開網頁,這時我們就可以選中其中的文字進行復制粘貼了。另外,此法在WPS2005中也可以使用,操作起來十分方便。這樣復制、剪切隨君所願。
★三、可以通過使用IE瀏覽器「查看」菜單之「源文件」功能,在彈出的窗口中可以找到你需要復制和下載的內容,但沒有格式。除此之外,還可以通過其他比較具有特殊功能的瀏覽器,如火狐等,實現一般IE瀏覽器所不能實現的功能。如果你用的是「遨遊」等可以控制腳本的瀏覽器,可以禁用腳本。具體操作(以「遨遊」為例):點擊「選項」——「下載控制」——去掉「允許scripts」前的勾,這回可以復制了吧?如果還不行,乾脆把「允許java」和「允許activex」前面的勾也去掉。
★四、更改安全級別的破解方法: 單擊IE瀏覽器的「工具」——「internet選項」——「安全」,將其中的「internet」的安全級別設為最高級別,「確定」後刷新網頁即可。安全級別最高的時候,一切控制項和腳本均不能運行,再厲害的網頁限制手段統統全部作廢!或者在「安全」選項卡,接下來點擊「自定義級別」按鈕,在彈出的窗口中將所有腳本全部選擇禁用,確定。然後按F5刷新頁面,這時我們就能夠對網頁的內容進行復制、粘貼等操作。當你收集到自己需要的內容後,再用相同步驟給網頁腳本解禁,這樣就不會影響到我們瀏覽其他網頁了。