>>> '輸出中文'.decode("gbk")
u'\u8f93\u51fa\u4e2d\u6587'
>>> s = '\u8f93\u51fa\u4e2d\u6587'#一般從網上爬下的資料是這樣decode("unicode-escape")
>>> s'\\u8f93\\u51fa\\u4e2d\\u6587'>>> print s\u8f93\u51fa\u4e2d\u6587>>> s.decode("unicode-escape")
#通過decode("unicode-escape")直接在"\u8f93\u51fa..."前面補上u
u'\u8f93\u51fa\u4e2d\u6587'>>> print s.decode("unicode-escape")
#然後print輸出中文字元輸出中文
出處:水木社群-源於清華的高知社群
字元編碼 unicode編碼
1.ascii american standard code for information interchange 美國資訊交換標準 這是計算機上最早使用的通用的編碼方案。那個時候計算機還只是拉丁文本的專利,根本沒有想到現在計算機的發展勢頭,如果想到了,可能一開始就會使用unicode了。當時絕大...
Unicode字元編碼
ascii碼 最早的字元編碼,使用乙個byte的7位來表示128種字元 控制字元,控制符,小寫字母,大寫字母,數字,標點,運算子等 然而對於英語國家來說,基本夠用 但對於使用非英文本元的國家來說,就不夠用了。擴充套件ascii碼 為了滿足需要,各國在相容ascii碼的基礎上對128 155等位元組進...
多字元編碼 和 Unicode編碼
四字符集和字元編碼說明 五 其他 c 基本資料型別中表示字元有兩種 char wchar t char 叫多位元組字元,乙個char佔乙個位元組,之所以叫多位元組字元是因為它表示乙個字時可能是乙個位元組也可能是多個位元組。乙個英文本元 如 s 用乙個char 乙個位元組 表示,乙個中文漢字 如 中 ...