python編碼型別整理

2021-08-01 12:15:58 字數 627 閱讀 5880

\x 是ascii碼

\u 是unicode(utf8)

gbk?

ascii和unicode轉換中

str(tempword)和unicode(tempword, "utf8")互為逆運算

s.decode('utf-8')可以進行解碼,對應的還有encode命令

有的時候轉碼了也不匹配可以把用於匹配的字元加入list中再列印list看實際編碼的區別,最常出現的情況是有的字串多了個'\n'等,不易察覺。

還有就是下面的命令

importsys

reload(sys)

sys.setdefaultencoding("utf-8")

以及py檔案頭加上
# -*- coding:utf-8 -*-

能解決絕大多數編碼型別引起的問題

爬蟲使用中url解碼unquote;url編碼

quote

編碼問題其實應該算是python2.7軟體自己的問題了。。。python3.x貌似已經修復了。

python 編碼規範整理

pep8 python 編碼規範 一 編排 1 縮排。4個空格的縮排 編輯器都可以完成此功能 不要使用tap,更不能混合使用tap和空格。2 每行最大長度79,換行可以使用反斜槓,最好使用圓括號。換行點要在操作符的後邊敲回車。3 類和top level函式定義之間空兩行 類中的方法定義之間空一行 函...

python 編碼規範整理

好處1 風格的統一可以很好地提高 的可讀性。制定乙個相同的 風格,如直接選用python的pep8官方風格指南,嚴格遵守後可以得到美觀又統一風格的專案 這在多人協作的開發中是很有必要的,每個人編寫 的習慣不一樣,特別是有些喜歡用一些奇怪或新奇的寫法,這樣可讀性很差。尤其是靈活的指令碼語言python...

python 編碼規範整理

pep8 python 編碼規範 一 編排 1 縮排。4個空格的縮排 編輯器都可以完成此功能 不要使用tap,更不能混合使用tap和空格。2 每行最大長度79,換行可以使用反斜槓,最好使用圓括號。換行點要在操作符的後邊敲回車。3 類和top level函式定義之間空兩行 類中的方法定義之間空一行 函...