『壹』 python3爬蟲爬百度貼吧decode("utf-8")出錯

我寫了下代碼。沒有編碼問題,是不是不用decode?

import requests

r1 = requests.get("http://tieba..com/f?ie=utf-8&kw=python&fr=search")

print(r1.text)

『貳』 如何用python統計一個貼吧的發帖人個數以及評論的個數啊

你抓取一個貼吧的網頁,然後用re找到最下面的「共有主題數xxxx個,貼子數xxxx篇」之類的。

『叄』 python可以抓取百度貼吧某人參與的所有貼子嗎

可以啊,看你則么使用正則運算了
另外要設置IP池,別被網路屏蔽了、

『肆』 求助,如何抓取百度貼吧樓層中的回復Python

打開一個帖子,按F12,在控制台里輸入 $('cc div')
可以看看這篇文章:http://webmagic.io/docs/zh/posts/chx-cases/js-render-page.html

『伍』 求助,怎麼利用Python爬取貼吧帖子樓中樓的信息

你好,很高興為你解答問題! 到貼吧用戶服務中心找到被刪除的帖子並可以申請恢復。 如果是吧務刪除的,還可以請吧主後台恢復。 如果是自己刪除的,就不能查看和恢復了。 如果這個答案能夠幫到你,請及時點贊噢,謝謝!

『陸』 pic_ext啥用 python爬取百度貼吧圖片

稀里糊塗,不知所雲

『柒』 【python寫的百度貼吧下載圖片】怎麼下載其他的圖片

看你代碼的意思就是匹配到第一個內容之後,完成下載,結束程序,所以只要加個循環就好了,具體的循環條件自己再看一下就好了

『捌』 進來吧,給自己10分鍾,這篇文章帶你直接學會python

Python的語言特性

Python是一門具有強類型(即變數類型是強制要求的)、動態性、隱式類型(不需要做變數聲明)、大小寫敏感(var和VAR代表了不同的變數)以及面向對象(一切皆為對象)等特點的編程語言。

獲取幫助

你可以很容易的通過Python解釋器獲取幫助。如果你想知道一個對象(object)是如何工作的,那麼你所需要做的就是調用help(<object>)!另外還有一些有用的方法,dir()會顯示該對象的所有方法,還有<object>.__doc__會顯示其文檔:

語法

Python中沒有強制的語句終止字元,且代碼塊是通過縮進來指示的。縮進表示一個代碼塊的開始,逆縮進則表示一個代碼塊的結束。聲明以冒號(:)字元結束,並且開啟一個縮進級別。單行注釋以井號字元(#)開頭,多行注釋則以多行字元串的形式出現。賦值(事實上是將對象綁定到名字)通過等號(「=」)實現,雙等號(「==」)用於相等判斷,」+=」和」-=」用於增加/減少運算(由符號右邊的值確定增加/減少的值)。這適用於許多數據類型,包括字元串。你也可以在一行上使用多個變數。例如:

數據類型

Python具有列表(list)、元組(tuple)和字典(dictionaries)三種基本的數據結構,而集合(sets)則包含在集合庫中(但從Python2.5版本開始正式成為Python內建類型)。列表的特點跟一維數組類似(當然你也可以創建類似多維數組的「列表的列表」),字典則是具有關聯關系的數組(通常也叫做哈希表),而元組則是不可變的一維數組(Python中「數組」可以包含任何類型的元素,這樣你就可以使用混合元素,例如整數、字元串或是嵌套包含列表、字典或元組)。數組中第一個元素索引值(下標)為0,使用負數索引值能夠從後向前訪問數組元素,-1表示最後一個元素。數組元素還能指向函數。來看下面的用法:

字元串

Python中的字元串使用單引號(『)或是雙引號(「)來進行標示,並且你還能夠在通過某一種標示的字元串中使用另外一種標示符(例如 「He said 『hello』.」)。而多行字元串可以通過三個連續的單引號(」』)或是雙引號(「」」)來進行標示。Python可以通過u」This is a unicode string」這樣的語法使用Unicode字元串。如果想通過變數來填充字元串,那麼可以使用取模運算符(%)和一個元組。使用方式是在目標字元串中從左至右使用%s來指代變數的位置,或者使用字典來代替,示例如下:


流程式控制制

Python中可以使用if、for和while來實現流程式控制制。Python中並沒有select,取而代之使用if來實現。使用for來枚舉列表中的元素。如果希望生成一個由數字組成的列表,則可以使用range(<number>)函數。

函數

函數通過「def」關鍵字進行聲明。可選參數以集合的方式出現在函數聲明中並緊跟著必選參數,可選參數可以在函數聲明中被賦予一個默認值。已命名的參數需要賦值。函數可以返回一個元組(使用元組拆包可以有效返回多個值)。Lambda函數是由一個單獨的語句組成的特殊函數,參數通過引用進行傳遞,但對於不可變類型(例如元組,整數,字元串等)則不能夠被改變。這是因為只傳遞了該變數的內存地址,並且只有丟棄了舊的對象後,變數才能綁定一個對象,所以不可變類型是被替換而不是改變(譯者註:雖然Python傳遞的參數形式本質上是引用傳遞,但是會產生值傳遞的效果)。

Python支持有限的多繼承形式。私有變數和方法可以通過添加至少兩個前導下劃線和最多尾隨一個下劃線的形式進行聲明(如「__spam」,這只是慣例,而不是Python的強制要求)。當然,我們也可以給類的實例取任意名稱。

導入

外部庫可以使用 import [libname] 關鍵字來導入。同時,你還可以用 from [libname] import [funcname] 來導入所需要的函數。例如: