example 2:
>>> str_ = "russopho\xe9bic, clichd and just pl\xe9ain stupid."
>>> print str_
russopho?bic, clichd and just pl?ain stupid.
>>> str_ = str_.decode("unicode_escape")
>>> print str_
russophoébic, clichd and just pléain stupid.
(這個方法解決了我在插入資料到mongodb時遇到的「bson.errors.invalidstringdata: strings in documents must be valid utf-8」問題)
不一樣,可能是一邊是unicode位元組串,一邊是字串。詳見
小結:以後遇到奇葩問題要想好關鍵字再搜,不然很有可能一無所獲。
python Unicode程式設計
ascii美國標準資訊交換碼 utf 88為utf轉換格式 無符號位元組序列,長度為1 4個位元組 utf 1616位utf轉換格式 無符號位元組序列,通常是16位長,兩個位元組 unicode可以表示超過90000個字元。ascii字串成了stringtype,而unicode字串成了unicod...
python Unicode 編碼問題
今天在用python寫分頁 傳入兩個引數 page num,page size,報錯了 我用的是python2.7 列印變數型別是unicode 所以要把unicode 轉成 int 提供兩種方法,都是先轉成字串,再轉成int page num int filter str.isdigit,page...
python unicode 編碼整理
unicode 只定義字元對應的數字,但沒有規定這些數字如何儲存起來,比如像中文的 我 字儲存時需要兩個位元組來表示,而英文本母a卻只需要乙個位元組,有些其他的字元可能需要3 4個位元組。utf 8 是對 unicode 編碼儲存的一種實現方式,同樣的還有 utf 16,utf 32。utf 8 是...