Python編碼相關

2022-01-31 11:54:06 字數 1057 閱讀 5864

1、#coding=utf-8的作用

作用是這個檔案**的編碼格式,如果沒有宣告**中不能出現中文字元,包括注釋中也不能出現。否則會報錯syntaxerror: non-ascii character。

2、sys.setdefaultencoding('utf-8')的作用

可以使用sys.getdefaultencoding()獲取系統編碼格式。python2和python3的預設編碼格式是不相同的,2是ascii碼,3預設是utf-8。

如果不設定預設的編碼,使用中文的時候,在2中重新去encode的時候就會報錯。因為ascii中沒有中文,而encode的時候python會自動要先進行decode,而decode解碼的方式會使用預設的系統編碼。這樣,中文就會出錯了。因此,可以指定解碼的方式,如s.decode('utf-8').encode('gb2312')。

或者在**開始處加:

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

報錯資訊

unicodedecodeerror:

'ascii

' codec can'

t decode byte 0xe8 in position 0: ordinal not in range(128)

s = '中文字元' 

s.encode('gb2312') 

3、reload(sys)的作用

因為,在sys載入後,setdefaultencoding方法被刪除了,所以我們要通過重新匯入sys來設定系統編碼。如果,不reload會報下面的錯誤。

attributeerror: '

module

' object has no attribute '

setdefaultencoding

'

JavaScript編碼相關

我 u6211 a.我 charcodeat 0 tostring 16 6211 其中charcodeat 方法可返回指定位置的字元的 unicode 編碼。這個返回值是 0 65535之間的整數。b.而ascii字元在0 255之間,故有 a charcodeat 0 tostring 16 4...

字元編碼相關

1,文字編輯器開啟檔案,讀入二進位制序列 2,如果有bom頭,直接根據bom頭使用相應的字元編碼解碼方式,如果沒有,則根據一套演算法得出該檔案最有可能為哪種編碼,再使用相應的解碼方式解碼。或者先使用預設的解碼方式 ansi 進行解碼,遇到問題再呼叫適配演算法進行解碼方式適配。3,文字編輯器解碼完成,...

python 位元組編碼 python編碼

參考文章 python編碼 encode 將unicode字元按照編碼規則 如utf 8 編成位元組序列。a u 測試 a.encode utf 8 xe6 xb5 x8b xe8 xaf x95 python解碼 decode 將位元組序列按照編碼規則 如utf 8 解釋成unicode。a b ...