python3漢字
『壹』 python3 將中文句子中漢字數字轉阿拉伯數字
import re
s ='五百八十二元3角六分'
s = re.sub('一','1',s)
s = re.sub('二','2',s)
s = re.sub('三','3',s)
s = re.sub('四','4',s)
s = re.sub('五','5',s)
s = re.sub('六','6',s)
s = re.sub('七','7',s)
s = re.sub('八','8',s)
s=re.sub('九','9',s)
print(s)
a_list = re.findall('\d\D+',s) #type:list
print(a_list)
for a in range(len(a_list)): #type:int
('縮進')if a_list[a].endswith('百'):
('縮進')('縮進')a_list[a]=int(a_list[a][0]+'00')
('縮進')elif a_list[a].endswith('十'):
('縮進')('縮進')a_list[a] = int(a_list[a][0] + '0')
('縮進')elif a_list[a].endswith('元'):
('縮進')('縮進')a_list[a] = int(a_list[a][0])
('縮進')elif a_list[a].endswith('角'):
('縮進')('縮進')a_list[a] = float('0.'+a_list[a][0])
('縮進')elif a_list[a].endswith('分'):
('縮進')('縮進')a_list[a] = float('0.0'+a_list[a][0])
print(sum(a_list))
print(round(sum(a_list),2))
『貳』 在Python3中如何輸出中文
例子:a="您好"
print(a)
就直接運行還會報錯的原因是本人本人新建的文件編碼默認版是ANSI,需要修改一下文件的編權碼為utf-8,就可以了。
修改文件編碼可以這樣做:用系統自帶的記事本打開,然後按另存為,在保存的時候,會可選擇的編碼。
『叄』 python正則匹配漢字
#python2使用如下即可:
#encoding:UTF-8
importre
importsys
reload(sys)
sys.setdefaultencoding('utf-8')
defextract_number(input):
match=re.search(u"[u4e00-u9fa5]+",input)
returnmatch.group()
if__name__=="__main__":
printextract_number(unicode("dss2第三季度建安大sdssd43fds",'utf8'))#python3使用如下:
#encoding:UTF-8
importre
defextract_number(input):
match=re.search("[u4e00-u9fa5]+",input)
returnmatch.group()
if__name__=="__main__":
print(extract_number("dss2第三季度建安大sdssd43fds"))
『肆』 請教python3如何列印中文
如果是不能寫中文的話:把中文寫在其他地方然後復制粘貼
如果是不能print中文的話:
# -*- coding: utf-8 -*-
print("你好")
不過python3一般不會出錯
『伍』 python3 字元串多少個漢字
在python中一個漢字算一個字元,一個英文字母算一個字元。如:
##coding:utf-8
s='我們的'
k=len(s)
print(k)
輸出結果是3。
===================================
所以,可以採取排除法,凡返回字元的ascII碼在大於127的作為漢字統計。
##coding:utf-8
s='我們的88工作和生活168'
k=len(s)
print(k)
n=0
forcins:
iford(c)>127:
n+=1
print(n)
『陸』 python3.3裡面,怎麼將漢字存成unicode文本
只需要捕獲錯誤,你可以糾正。如果你檢查輸入只為與中止AssertionError,你最好只允許代碼後加適當的異常,所以你可以正確地進行調試。
這條線尤其是非常糟糕的,因為它會停止鴨打字: assert isinstance(text_value, basestring), u'All text_values should be str or unicode.'
『柒』 python3中url有漢字怎麼辦
進行一下urlencode就可以了。
import urllib
params = urllib.urlencode({'name': "張三", 'age': 22, 'tel': '123323211'})
print params
f = urllib.urlopen("http://www..com", params)
print f.read()
params的值就版會變成:權age=22&tel=123323211&name=%D5%C5%C8%FD
『捌』 Python3處理中文字元報錯
python3 如何設置文件編碼 直接open(file,'r', encoding="utf-8"),即可。
『玖』 python3怎麼輸出中文字元
Python的字元串
在最新的Python 3版本中,字元串是以Unicode編碼的,也就是說,Python的字元串支持多語言,例如:
>>> print('包含中文的str')
包含中文的str
對於單個字元的編碼,Python提供了ord()函數獲取字元的整數表示,chr()函數把編碼轉換為對應的字元:
復制代碼
>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'
復制代碼
如果知道字元的整數編碼,還可以用十六進制這么寫str
'\u4e2d\u6587' // 中文
『拾』 python3 中文輸出亂碼問題
python 3和2很大區別就是python本身改為默認用unicode編碼。
字元串不再區分"abc"和u"abc", 字元串"abc"默認就是unicode,不再代表本地編內碼、
由於有這種內容部編碼,像c#和java類似,再沒有必要在語言環境內做類似設置編碼,比如「sys.setdefaultencoding」;
也因此也python 3的代碼和包管理上打破了和2.x的兼容。2.x的擴展包要適應這種情況改寫。
另一個問題是語言環境內只有unicode怎麼輸出gbk之類的本地編碼。
答按慣例都在(序列化)輸出時才轉換成本地編碼。
比如
file.write("GBK的中文".encode("GBK"))
python環境內字元串用str.encode("GBK")方法輸出成位元組串用於和其他環境交流。