當前位置：首頁 » 網頁設計 » 網頁圖片爬

網頁圖片爬

發布時間: 2021-03-22 11:52:17

① 如何通過網頁源代碼來提取網頁中的圖片

可以現在網頁源碼中找到圖片的鏈接，然後將圖片在新窗口打開並進行保存。

1、右版擊想要提取的圖片權，在展開的菜單中點擊「檢查」按鈕打開控制台：

② python爬蟲爬取圖片問題用正則規則匹配到一個網頁的所有圖片的網址規則，請問如何用遍歷把正則

#encoding:UTF-8
importre

#將正則表達式編譯成Pattern對象
pattern=re.compile(r'<img[^>]*src[="']+([^"']*)["'][^>]*>',re.I)

#使用search()查找匹配的子串，不存在能匹配的子串時將返回None
match=pattern.search('helloworld!')

ifmatch:
#使用Match獲得分組信息
printmatch.group(1)

③ 使用python爬取網頁，獲取不到圖片地址

這個大圖片是在點擊之後用 JS 控制載入的。

你可以看看 js/js.js 這個文件，253 行：

functionchangeImg(){
		jQuery("#bitImg").attr('src','p/p'+pictID+'/'+indexNum+'.'+jpgPng);	
	}

其實大圖的規律很好找，下面縮略圖列表的 src 可以用 #variContent > li > img 取到，可以在源碼中的 107 行找到：

view-source:http://pictogram2.com/?p=2315

縮略圖列表地址長這樣：

/p/p0997/tn/1.jpg
/p/p0997/tn/2.jpg
/p/p0997/tn/3.jpg
...

如果要獲取大圖，只要去掉「tn」這一段就可以：

/p/p0997/1.jpg
/p/p0997/2.jpg
/p/p0997/3.jpg
...

然後拼接域名在前面，GET 下來就是大圖，比如第一個大圖鏈接：

第一個大圖地址

不過，你如果僅僅只是想要抓那個站的全部素材，窮舉「p0997」這一段的序號（比如改成「p0098」，這個應該是圖集的 ID），並且遍歷最後一段的圖片序號，擴展名可能是 jpg 也可能是 png，從 1 開始（「1.jpg」，「2.jpg」...）直到返回 404 停止。

思路大概是這么個思路，不過話說回來，你這么爬人家素材真的道德嗎？

④ Python爬蟲爬取圖片這個報錯怎麼處理

你好！你的錯誤原因在於html頁面獲取到的img標簽src屬性中的鏈接，可能是因為src中的url格式是這樣的：

<imgsrc="//hao123.com/xxx/xxx/xxx/"></img>

這樣獲取到的鏈接都沒有帶上協議：http或者https。而導致程序拋出ValueError的錯誤異常。

因為正常的url格式應該類似這樣的：https://www..com/

即協議://用戶名:密碼@子域名.域名.頂級域名:埠號/目錄/文件名.文件後綴?參數=值#標志

參考網頁鏈接

可將代碼中第一個for循環中download_links.append修改為：

forpic_taginsoup.find_all('img'):
pic_link=pic_tag.get('src')
download_links.append('http:'+pic_link)

⑤ 百度蜘蛛總是爬行網站的圖片怎麼辦

網路的所有爬行都盡量不要屏蔽，一定不要阻止蜘蛛抓取圖片，更新文章有規律就好，比如你上午更新，那麼你就盡量一直在這個時間段，最好是原創。至於你說的那個情況，正常工作就好，不用去管它，太正常了，無論你做的好於不好，都太正常了。

⑥ java中怎麼抓取網頁中的圖片

通過httpclient來爬取網站內容，分析當前內容頁中的圖片『規則』
抓取一般都是模擬瀏覽器訪問目標網頁，通過返回的頁面html代碼進行分析自己需要的數據
查找規則，例如你爬取的網頁，看到當前頁面顯示的圖片格式如下<img src="http://www..com/img/20101025_user.png">
通過解析爬取的網頁源代碼（html）進行字元串的操作即可，現在有相應的第三方jar包可以幫你更快的完成這部分工作，例如htmlpaser，獲取到對應的地址，然後進行保存或下載。
你可以搜索，java爬蟲(httpclient)和htmlpaser做更多的了解。

⑦ 怎麼抓取網頁上的圖片

360瀏覽器，只要你按住alt，然後用滑鼠點你要保存的圖片，就可以下載下來了。
你的那個功能，可以用360瀏覽器使用一下，估計是瀏覽器問題

⑧ 知道圖片的路徑，怎麼做爬蟲爬取網站的所有

圖片路徑沒必要讓爬蟲抓，除非你就是個素材型網站，那ALT一定要去設置，讓爬蟲抓取，到站長平台主動推送或者做sitemap地圖給平台就O了

⑨ 如果批量把網頁上的圖片進行抓取到本地

1、用迅雷等下來載鏈接自的方法：只能下載一個頁面，操作慢

2、用離線瀏覽器：因是動態網頁，無法把圖片保存下來

3、用按鍵精靈：其實也可以實現，不過也是有點麻煩

4、最終推薦用臨時文件夾的方式，要一頁頁瀏覽後，再到臨時文件夾中把它們把出來就行。

⑩ 網頁爬蟲爬取來的圖片極小

您好，您爬取目標網頁的圖片是不是深度上屬於上一層的略縮圖，所以比較小，建議你再往下一層爬取源鏈接試試。

閱讀全文

網頁圖片爬

與網頁圖片爬相關的閱讀推薦