gb2312是中國規定的漢字編碼,簡體中文的字符集
gbk是gb2312的擴充套件,除了相容gb2312外,環能顯示正體中文,日文的假名
cp936:code page內碼 cmd中的預設編碼形式windows使用**頁來適應各個地方。gbk對應的code page是cp936
unicode是國際組織指定的可以容納世界上所有文字和符號編碼方案。utf-8,utf-16,utf-32是將數字轉換到程式資料的編碼方案。
utf-8是最流行的一種對unicode進行傳播和儲存的編碼形式
在進行python開發程式中,會涉及到三個方面的編碼:
python程式檔案的編碼
python2編輯器預設的編碼是ascii,無法識別中文,所以大寫python2程式的時候會加上#coding=utf-8
Python編碼問題
tag python,encoding,unicode 現有的字元編碼 ascii,gbk,gb2312,utf 8,unicode.unicode可以用來表示所有語言的字元,而且是定長雙位元組 也有四位元組的 編碼,包括英文本母在內。python中定義乙個unicode字串和定義乙個普通字串一樣簡...
python編碼問題
python裡面基本上要考慮三種編碼格式 1 原始檔編碼 在檔案頭部使用coding宣告。告訴python直譯器該 檔案所使用的字符集。usr bin python coding utf8 2 內部編碼 檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u uni...
Python編碼問題
python裡面基本上要考慮三種編碼格式 1 原始檔編碼 在檔案頭部使用coding宣告。告訴python直譯器該 檔案所使用的字符集。usr bin python coding utf8 2 內部編碼 檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u uni...