㈠ 如何用python設置Firefox的代理,使用代理上網

通過Python修改如下文件:
C:\Users\admin\AppData\Roaming\Mozilla\Firefox\Profiles\k3p4upo8.default\prefs.js
增加
user_pref("network.proxy.http", "");
user_pref("network.proxy.port", 80);
通過Python代碼,很容易回就搞定了。答

㈡ python 怎樣設置代理訪問http請求

有幾種方法。一抄種是設置環境變數襲http_proxy,它會自動訪問這個。 另外一種是你使用urllib2的時候,在參數里加上代理。還有一個是urllib上指定。

比如
import urllib
urllib.urlopen(某網站,proxyes={'http:':"某代理IP地址:代理的埠"})

使用QT時,它的瀏覽器設置代理要在瀏覽器初始化參數里指定。

㈢ python隨便給了個代理IP居然也能正常訪問,這是為啥

不同的狀態碼代表著不同含義。
200並不代表正常訪問並獲取到返回值。只是表明正確處理了請求而已。
你隨便設置的代理ip有可能真的存在這是一方面,另一方面代理只是鏈接與轉發功能。200的狀態碼也並不能表示代理成功讓你訪問到了目標網址並獲取到了正確的返回信息。

常見的狀態碼有很多,404、400、500等等。
以下資料摘自(csdn博客:https://blog.csdn.net/xiaoxiaode_shu/article/details/80700801)
1開頭的http狀態碼
表示臨時響應並需要請求者繼續執行操作的狀態代碼。

100 (繼續) 請求者應當繼續提出請求。 伺服器返回此代碼表示已收到請求的第一部分,正在等待其餘部分。
101 (切換協議) 請求者已要求伺服器切換協議,伺服器已確認並准備切換。

2開頭的http狀態碼
表示請求成功

200 成功處理了請求,一般情況下都是返回此狀態碼;
201 請求成功並且伺服器創建了新的資源。
202 接受請求但沒創建資源;
203 返回另一資源的請求;
204 伺服器成功處理了請求,但沒有返回任何內容;
205 伺服器成功處理了請求,但沒有返回任何內容;
206 處理部分請求;

3xx (重定向)
重定向代碼,也是常見的代碼

300 (多種選擇) 針對請求,伺服器可執行多種操作。 伺服器可根據請求者 (user agent) 選擇一項操作,或提供操作列表供請求者選擇。
301 (永久移動) 請求的網頁已永久移動到新位置。 伺服器返回此響應(對 GET 或 HEAD 請求的響應)時,會自動將請求者轉到新位置。
302 (臨時移動) 伺服器目前從不同位置的網頁響應請求,但請求者應繼續使用原有位置來進行以後的請求。
303 (查看其他位置) 請求者應當對不同的位置使用單獨的 GET 請求來檢索響應時,伺服器返回此代碼。
304 (未修改) 自從上次請求後,請求的網頁未修改過。 伺服器返回此響應時,不會返回網頁內容。
305 (使用代理) 請求者只能使用代理訪問請求的網頁。 如果伺服器返回此響應,還表示請求者應使用代理。
307 (臨時重定向) 伺服器目前從不同位置的網頁響應請求,但請求者應繼續使用原有位置來進行以後的請求。

4開頭的http狀態碼表示請求出錯

400 伺服器不理解請求的語法。
401 請求要求身份驗證。 對於需要登錄的網頁,伺服器可能返回此響應。
403 伺服器拒絕請求。
404 伺服器找不到請求的網頁。
405 禁用請求中指定的方法。
406 無法使用請求的內容特性響應請求的網頁。
407 此狀態代碼與 401類似,但指定請求者應當授權使用代理。
408 伺服器等候請求時發生超時。
409 伺服器在完成請求時發生沖突。 伺服器必須在響應中包含有關沖突的信息。
410 如果請求的資源已永久刪除,伺服器就會返回此響應。
411 伺服器不接受不含有效內容長度標頭欄位的請求。
412 伺服器未滿足請求者在請求中設置的其中一個前提條件。
413 伺服器無法處理請求,因為請求實體過大,超出伺服器的處理能力。
414 請求的 URI(通常為網址)過長,伺服器無法處理。
415 請求的格式不受請求頁面的支持。
416 如果頁面無法提供請求的范圍,則伺服器會返回此狀態代碼。
417 伺服器未滿足」期望」請求標頭欄位的要求。

5開頭狀態碼並不常見,但是我們應該知道

500 (伺服器內部錯誤) 伺服器遇到錯誤,無法完成請求。
501 (尚未實施) 伺服器不具備完成請求的功能。 例如,伺服器無法識別請求方法時可能會返回此代碼。
502 (錯誤網關) 伺服器作為網關或代理,從上游伺服器收到無效響應。
503 (服務不可用) 伺服器目前無法使用(由於超載或停機維護)。 通常,這只是暫時狀態。
504 (網關超時) 伺服器作為網關或代理,但是沒有及時從上游伺服器收到請求。
505 (HTTP 版本不受支持) 伺服器不支持請求中所用的 HTTP 協議版本。

㈣ python爬蟲隨機使用代理,請求沒有成功怎麼辦

如果你下面那個可以使用個,你就都加上代理就是了,應該是有的網站限制了爬蟲的頭部數據。

雖然你可以通過urlopen返回的數據判斷,但是不建議做,增加成本。

㈤ python 爬蟲設置代理

㈥ python爬蟲怎麼輸入代理伺服器的賬號密碼

打開火狐瀏覽器右上角的設置選項,選擇「選項」
爬蟲代理伺服器怎麼用?
選擇左版邊選項欄中最下方的權「高級」選項
爬蟲代理伺服器怎麼用?
「高級」選項下拉菜單「網路」。
連接配置 Firefox 如何連接至國際互聯網,右側的「設置網路」
爬蟲代理伺服器怎麼用?
在菜單中選擇「手動選擇配置代理」
爬蟲代理伺服器怎麼用?
將您的http代理IP地址填寫在IP地址欄內,埠代碼寫在相應的位置。
其他的代理SSL代理、FTP代理、socks主機都類似。
現在我用的是 618IP代理,IP還蠻多的喲。