s1 =
'\\u9500\\u552e'
s2 = u'\\u9500\\u552e'
s3 =
'\u9500\u552e'
s4 = u'\u9500\u552e'
print s1,s2,s3,s4
print s1.decode(
'unicode_escape'
),s2.decode(
'unicode_escape'
),s3.decode(
'unicode_escape'
),s4.decode(
'unicode_escape'
)print
'""'
.format
(s1)
,'""'
.format
(s2)
,'""'
.format
(s3)
print json.loads(
'""'
.format
(s1)
),json.loads(
'""'
.format
(s2)
),json.loads(
'""'
.format
(s3)
)>>
\u9500\u552e \u9500\u552e \u9500\u552e 銷售
銷售 銷售 銷售 (error)
"\u9500\u552e"
"\u9500\u552e"
"\u9500\u552e"
(error)
銷售 銷售 銷售 (error)
s =
'\\xe7\\xbb\\x87\\xe7\\x89\\xa9'
s1 =
'\xe7\xbb\x87\xe7\x89\xa9'
l =[
'織物'
]l1 =
[u'織物'
]l2 =
str(l)
.decode(
'string-escape'
)l3 =
str(l1)
.decode(
'unicode-escape'
)print s,s1,l,l1,l2,l3
print s.decode(
'string-escape'
)>>
\xe7\xbb\x87\xe7\x89\xa9 織物 [
'\xe7\xbb\x87\xe7\x89\xa9'
][u'\u7ec7\u7269'][
'織物'
][u'織物'
]織物
gbk 編碼乙個漢字兩個位元組,utf-8 乙個漢字通常3個位元組。
解碼:從其它編碼變成unicode,用的方法是decode(param),第乙個引數為被解碼的字串原始編碼格式
編碼:從utf-8轉換為gbk,必須經過unicode中間轉換,被編碼的字串必須為unicode
g =
'\xd6\xd0\xce\xc4'
# gbk 中文
u ='\xe4\xb8\xad\xe6\x96\x87'
# unicode 中文
print
type
(g)print g
print
type
(u)print u
gg = g.decode(
'gbk'
)uu = u.decode(
'utf-8'
)print
type
(gg)
print gg
print
type
(uu)
print uu
>>
<
type
'str'
>
����
<
type
'str'
>
中文<
type
'unicode'
>
中文<
type
'unicode'
>
中文
Python 編譯碼 初探
編碼是為了相容字符集之間的通用性,通常可以編碼的地方有 1 系統預設編碼 2 程式執行環境的編碼 3 原始碼檔案自身的編碼 4 程式中的字串編碼 對於python也是一樣的 通常中文作業系統的編碼都是gbk python執行環境預設的編碼是ascii 原始檔的編碼可以自己確定 coding gbk ...
iOS 各種編譯錯誤彙總
1 error macro names must be identifiers yourproject prefix.pch 原因 因為你弄髒了預處理器巨集,在它處於的時候修改了它 解決方法 configiration選擇all configirations,清空它 然後分別重新定義你的debug,...
python編譯碼的那些事兒
在python程式設計尤其是處理web應用時,遇到編譯碼問題的概率較大,通常這種問題也比較繁瑣,記下自己的理解,以備不時之需。編譯碼存在的意義主要是由於各種不同編碼方式的存在,有gbk啦,也有utf 8啦,還有gb2312等等。python中的decode和encode的引數意義是一樣的,即deco...