當前位置：首頁 » 編程語言 » pythonutfgbk

pythonutfgbk

發布時間: 2021-03-21 18:13:42

① python中#coding:gbk有什麼用

它是一種編碼格式，簡單說明是：文件說明指令來確定不同的環境進行不同的解析，與代碼有關，但與代碼的內容無直接關聯。
其中編碼格式有多種，例如常用的還有：UTF-8
GBK即「國標」、「擴展」漢語拼音的第一個字母，英文名稱：Chinese Internal Code Specification。GBK是漢字編碼標准之一，中華人民共和國全國信息技術標准化技術委員會1995年12月1日制訂，國家技術監督局標准化司、電子工業部科技與質量監督司1995年12月15日聯合以技監標函1995 229號文件的形式，將它確定為技術規范指導性文件。
俗說的話，編碼格式指定不明確的話，一般可能會有亂碼出現。

② 怎麼在Python里使用UTF-8編碼

概述

在python代碼即.py文件的頭部聲明即可

解析

py文件中的編碼

Python 默認腳本文件都是 ANSCII 編碼的，當文件中有非 ANSCII 編碼范圍內的字元的時候就要使用"編碼指示"來修正一個 mole 的定義中，如果.py文件中包含中文字元（嚴格的說是含有非anscii字元），則需要在第一行或第二行指定編碼聲明：

# -*- coding=utf-8 -*-
#coding=utf-8
# 以上兩種選其一即可

其他的編碼如：gbk、gb2312也可以；否則會出現:

SyntaxError: Non-ASCII character 'xe4' in file test.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

python中的編碼與解碼

先說一下python中的字元串類型，在python中有兩種字元串類型，分別是 str 和 unicode，他們都是basestring的派生類；

str類型是一個包含Characters represent (at least) 8-bit bytes的序列；

unicode 的每個 unit 是一個 unicode obj;

在str的文檔中有這樣的一句話：

The string data type is also used to represent arrays of bytes, e.g., to hold data read from a file.

也就是說在讀取一個文件的內容，或者從網路上讀取到內容時，保持的對象為str類型；如果想把一個str轉換成特定編碼類型，需要把str轉為Unicode,然後從unicode轉為特定的編碼類型如：utf-8、gb2312等。

拓展內容

utf-8編碼

UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字元編碼，也是一種前綴碼。它可以用來表示Unicode標准中的任何字元，且其編碼中的第一個位元組仍與ASCII兼容，這使得原來處理ASCII字元的軟體無須或只須做少部分修改，即可繼續使用。因此，它逐漸成為電子郵件、網頁及其他存儲或發送文字的應用中，優先採用的編碼。

UTF-8使用一至六個位元組為每個字元編碼（盡管如此，2003年11月UTF-8被RFC 3629重新規范，只能使用原來Unicode定義的區域，U+0000到U+10FFFF，也就是說最多四個位元組）：

1、128個US-ASCII字元只需一個位元組編碼（Unicode范圍由U+0000至U+007F）。

2、帶有附加符號的拉丁文、希臘文、西里爾字母、亞美尼亞語、希伯來文、阿拉伯文、敘利亞文及它拿字母則需要兩個位元組編碼（Unicode范圍由U+0080至U+07FF）。

3、其他基本多文種平面（BMP）中的字元（這包含了大部分常用字，如大部分的漢字）使用三個位元組編碼（Unicode范圍由U+0800至U+FFFF）。

4、其他極少使用的Unicode輔助平面的字元使用四至六位元組編碼（Unicode范圍由U+10000至U+1FFFFF使用四位元組，Unicode范圍由U+200000至U+3FFFFFF使用五位元組，Unicode范圍由U+4000000至U+7FFFFFFF使用六位元組）。

對上述提及的第四種字元而言，UTF-8使用四至六個位元組來編碼似乎太耗費資源了。但UTF-8對所有常用的字元都可以用三個位元組表示，而且它的另一種選擇，UTF-16編碼，對前述的第四種字元同樣需要四個位元組來編碼，所以要決定UTF-8或UTF-16哪種編碼比較有效率，還要視所使用的字元的分布范圍而定。不過，如果使用一些傳統的壓縮系統，比如DEFLATE，則這些不同編碼系統間的的差異就變得微不足道了。若顧及傳統壓縮演算法在壓縮較短文字上的效果不大，可以考慮使用Unicode標准壓縮格式（SCSU）。

互聯網工程工作小組（IETF）要求所有互聯網協議都必須支持UTF-8編碼。互聯網郵件聯盟（IMC）建議所有電子郵件軟體都支持UTF-8編碼。

③ python 中文 gbk utf8是什麼

是不是這個意思，在第一行出現 -*- coding:utf-8 -*- 或者是 -*- coding:gbk -*- 如果是這樣的話意思是你的編碼裡面出版現的中文或者亞洲的文字，權需要使用你所指定的編碼，這樣才能正確的把文字輸入或輸出。

④ python utf8 gbk 編碼問題

你是不是想在python里把中文變成鏈接中%E5%BE%85這種形式？直接用urllib.urlencode({'word':'中文'})方法
而顯示\xe5\xbe\x85\是因為你沒有使用read()方法，加上後變成：'待解析網頁'.decode('gbk').encode('utf-8').read()，就是你熟悉的中文了。
不過，'待解析網頁'.decode('gbk').encode('utf-8')這句我要吐槽一下，網頁明顯是utf-8編碼，你在文件開頭聲明utf-8編碼就可以了，這一句是多餘的。在這基礎上讀取網頁直接用 '待解析網頁'.read()

⑤ Python處理不同編碼utf8和gbk的問題

有。
使用chardet庫。它會去猜測文本文件的編碼，並返回形如：
編碼類型：utf-8
置信度：0.9
這樣的結果回，也就是答說chardet斷定該文件有90%的可能性是utf-8編碼的。
不過chardet的缺陷就是，它不能完全100%確定文件的編碼類型。
目前我的做法是，如果置信度超過0.95，那麼就認定chardet的判斷結果是正確的。否則，再加上一些人機交互操作進行判斷。

目前，chardet庫官網提供的版本只適用於Python 2，如果您使用的是Python 3.x，我可以另外上傳一個。

⑥ python 判斷一個字元能否用gbk和utf8編碼

使用chardet庫。它會去猜測文本文件的編碼，並返回形如：
編碼類型：utf-8
置信度：0.9
這樣的結果，也就是說chardet斷定該文件有90%的可能性是utf-8編碼的。
不過chardet的缺陷就是，它不能完全100%確定文件的編碼類型。
目前我的做法是，如果置信度超過0.95，那麼就認定chardet的判斷結果是正確的。否則，再加上一些人機交互操作進行判斷。

目前，chardet庫官網提供的版本只適用於Python 2，如果您使用的是Python 3.x，我可以另外上傳一個。

⑦ python2.7 utf-8轉gbk 亂碼

windows的本地默認編復碼制是cp936（gbk編碼），Windows中直接列印utf-8的字元串是亂碼
將你文件申明為UTF-8保存
#coding:utf-8

def respeak(self):
cText =pyperclip.paste()
gt = cText.decode('utf-8').encode('gbk')

self.ui.mainT.setText(QtCore.QString(gt))

⑧ python中gbk、utf-8、ascii、Unicode的關系是什麼

gbk是中文編碼，utf-8和unicode一樣是通用編碼，ascii和前三者不是一類的。
一般都是用utf-8，一般不會出問題。

⑨ Python2.7為什麼Utf-8到GBK會變成亂碼

程序沒縮進，看著費勁！

#coding=utf-8

defrespeak():
cText=u'中文專屬'#pyperclip.paste()
print(cText)
printrepr(cText)

print('
Afterencode:')
gbk_text=cText.encode('gbk')
print(gbk_text)
printrepr(gbk_text)

print('
Afterdecode:')
real_text=gbk_text.decode('gbk')
print(real_text)
printrepr(real_text)

if__name__=='__main__':
respeak()

[willie@localhost pys]$ python2.7 speak.py

中文

u'u4e26587'

After encode:

��

'xd6xd0xcexc4'

After decode:

中文

u'u4e26587'

閱讀全文

pythonutfgbk

概述

解析

拓展內容

與pythonutfgbk相關的閱讀推薦