\x 是ascii碼
\u 是unicode(utf8)
gbk?
ascii和unicode轉換中
str(tempword)和unicode(tempword, "utf8")互為逆運算
s.decode('utf-8')可以進行解碼,對應的還有encode命令
有的時候轉碼了也不匹配可以把用於匹配的字元加入list中再列印list看實際編碼的區別,最常出現的情況是有的字串多了個'\n'等,不易察覺。
還有就是下面的命令
importsysreload(sys)
sys.setdefaultencoding("utf-8")
以及py檔案頭加上
# -*- coding:utf-8 -*-
能解決絕大多數編碼型別引起的問題
爬蟲使用中url解碼unquote;url編碼
quote
編碼問題其實應該算是python2.7軟體自己的問題了。。。python3.x貌似已經修復了。
python 編碼規範整理
pep8 python 編碼規範 一 編排 1 縮排。4個空格的縮排 編輯器都可以完成此功能 不要使用tap,更不能混合使用tap和空格。2 每行最大長度79,換行可以使用反斜槓,最好使用圓括號。換行點要在操作符的後邊敲回車。3 類和top level函式定義之間空兩行 類中的方法定義之間空一行 函...
python 編碼規範整理
好處1 風格的統一可以很好地提高 的可讀性。制定乙個相同的 風格,如直接選用python的pep8官方風格指南,嚴格遵守後可以得到美觀又統一風格的專案 這在多人協作的開發中是很有必要的,每個人編寫 的習慣不一樣,特別是有些喜歡用一些奇怪或新奇的寫法,這樣可讀性很差。尤其是靈活的指令碼語言python...
python 編碼規範整理
pep8 python 編碼規範 一 編排 1 縮排。4個空格的縮排 編輯器都可以完成此功能 不要使用tap,更不能混合使用tap和空格。2 每行最大長度79,換行可以使用反斜槓,最好使用圓括號。換行點要在操作符的後邊敲回車。3 類和top level函式定義之間空兩行 類中的方法定義之間空一行 函...