decode
和encode
區別
在python中進行編碼轉換都是通過unicode作為中間值實現的。
decode的作用是將其他編碼的字串轉換成unicode編碼,如str1.decode(gb2312),表示將gb2312編碼的字串轉換成unicode編碼。
encode的作用是將unicode編碼轉換成其他編碼的字串,如str2.encode(gb2312),表示將unicode編碼的字串轉換成gb2312編碼。
如何正確列印中文
>>>
import
codecs
>>> with codecs.
open
(
"test.txt"
,
'r'
,
'gbk'
) as handle:
...
for
ln
in
handle:
...
print
(ln)
...
中國
>>> with
open
(
"test.txt"
,
'rb'
) as handle:
... ch_str
=
handle.read()
...
>>> ch_str
b
'\xd6\xd0\xb9\xfa'
>>>
print
(ch_str.decode(
"gbk"
))
中國
中文標點符號unicode碼
名稱 unicode 符號
句號 3002 。
問號 ff1f ?
嘆號 ff01 !
逗號 ff0c ,
頓號 3001 、
分號 ff1b ;
冒號 ff1a :
引號 300c 「
300d 」
引號 300e 『
300f 』
引號 2018 『
2019 』
引號 201c 「
201d 」
括號 ff08 (
ff09 )
括號 3014 〔
3015 〕
括號 3010 【
3011 】
破折號 2014 —
省略號 2026 …
連線號 2013 –
間隔號 ff0e .
書名號 300a 《
300b 》
書名號 3008 〈
3009 〉
js 知識點更新
1 push 方法向陣列末尾新增乙個或多個元素 返回新的長度。array1.push e1,e2,e3 2 join 把陣列中 所有元素放入乙個字串 arry2.join 可將陣列轉化為字串 3 js編碼 解碼 escape string unescape string 4 js 刪除 delete...
Python編碼知識
無論是py2還是py3,都使用unicode作為記憶體編碼,簡稱內碼 儲存在python直譯器記憶體中的文字,輸出到螢幕 編輯器,或者儲存成檔案的時候,都要將內碼轉換成utf8或者gbk等編碼格式 同樣,python直譯器從輸入裝置接收文字,或者從檔案讀取文字的時候,都要將utf8或者gbk等編碼轉...
Python編碼知識
編碼是資訊從一種形式或格式轉換為另一種形式的過程也稱為計算機程式語言的 簡稱編碼。用預先規定的方法將文字 數字或其它物件編成數碼,或將資訊 資料轉換成規定的電脈衝訊號。a.ascii 8位 目前計算機中用得最廣泛的字符集及其編碼,是由美國國家標準局 ansi 制定的ascii碼。適用於所有拉丁文本字...