python中各種編譯碼彙總

s1 =
'\\u9500\\u552e'
s2 = u'\\u9500\\u552e'
s3 =
'\u9500\u552e'
s4 = u'\u9500\u552e'
print s1,s2,s3,s4
print s1.decode(
'unicode_escape'
),s2.decode(
'unicode_escape'
),s3.decode(
'unicode_escape'
),s4.decode(
'unicode_escape'
)print
'""'
.format
(s1)
,'""'
.format
(s2)
,'""'
.format
(s3)
print json.loads(
'""'
.format
(s1)
),json.loads(
'""'
.format
(s2)
),json.loads(
'""'
.format
(s3)
)>>
\u9500\u552e \u9500\u552e \u9500\u552e 銷售
銷售 銷售 銷售 (error)
"\u9500\u552e"
"\u9500\u552e"
"\u9500\u552e"
(error)
銷售 銷售 銷售 (error)

s =
'\\xe7\\xbb\\x87\\xe7\\x89\\xa9'
s1 =
'\xe7\xbb\x87\xe7\x89\xa9'
l =[
'織物'
]l1 =
[u'織物'
]l2 =
str(l)
.decode(
'string-escape'
)l3 =
str(l1)
.decode(
'unicode-escape'
)print s,s1,l,l1,l2,l3
print s.decode(
'string-escape'
)>>
\xe7\xbb\x87\xe7\x89\xa9 織物 [
'\xe7\xbb\x87\xe7\x89\xa9'
][u'\u7ec7\u7269'][
'織物'
][u'織物'
]織物

gbk 編碼乙個漢字兩個位元組，utf-8 乙個漢字通常3個位元組。

解碼:從其它編碼變成unicode,用的方法是decode(param)，第乙個引數為被解碼的字串原始編碼格式

編碼:從utf-8轉換為gbk，必須經過unicode中間轉換，被編碼的字串必須為unicode

g =
'\xd6\xd0\xce\xc4'
# gbk 中文
u ='\xe4\xb8\xad\xe6\x96\x87'
# unicode 中文
print
type
(g)print g
print
type
(u)print u
gg = g.decode(
'gbk'
)uu = u.decode(
'utf-8'
)print
type
(gg)
print gg
print
type
(uu)
print uu
>>
<
type
'str'
>
����
<
type
'str'
>
中文<
type
'unicode'
>
中文<
type
'unicode'
>
中文

Python 編譯碼初探

編碼是為了相容字符集之間的通用性，通常可以編碼的地方有 1 系統預設編碼 2 程式執行環境的編碼 3 原始碼檔案自身的編碼 4 程式中的字串編碼對於python也是一樣的通常中文作業系統的編碼都是gbk python執行環境預設的編碼是ascii 原始檔的編碼可以自己確定 coding gbk ...

iOS 各種編譯錯誤彙總

1 error macro names must be identifiers yourproject prefix.pch 原因因為你弄髒了預處理器巨集，在它處於的時候修改了它解決方法 configiration選擇all configirations，清空它然後分別重新定義你的debug,...

python編譯碼的那些事兒

在python程式設計尤其是處理web應用時，遇到編譯碼問題的概率較大，通常這種問題也比較繁瑣，記下自己的理解，以備不時之需。編譯碼存在的意義主要是由於各種不同編碼方式的存在，有gbk啦，也有utf 8啦，還有gb2312等等。python中的decode和encode的引數意義是一樣的，即deco...

python中各種編譯碼彙總

Python 編譯碼 初探

iOS 各種編譯錯誤彙總

python編譯碼的那些事兒

相關推薦

Python 編譯碼初探