python編碼型別整理

\x 是ascii碼

\u 是unicode(utf8)

gbk?

ascii和unicode轉換中

str(tempword)和unicode(tempword, "utf8")互為逆運算

s.decode('utf-8')可以進行解碼，對應的還有encode命令

有的時候轉碼了也不匹配可以把用於匹配的字元加入list中再列印list看實際編碼的區別，最常出現的情況是有的字串多了個'\n'等，不易察覺。

還有就是下面的命令

importsys
reload(sys)
sys.setdefaultencoding("utf-8")

以及py檔案頭加上

# -*- coding:utf-8 -*-

能解決絕大多數編碼型別引起的問題

爬蟲使用中url解碼unquote；url編碼

quote

編碼問題其實應該算是python2.7軟體自己的問題了。。。python3.x貌似已經修復了。

pep8 python 編碼規範一編排 1 縮排。4個空格的縮排編輯器都可以完成此功能不要使用tap，更不能混合使用tap和空格。2 每行最大長度79，換行可以使用反斜槓，最好使用圓括號。換行點要在操作符的後邊敲回車。3 類和top level函式定義之間空兩行類中的方法定義之間空一行函...

好處1 風格的統一可以很好地提高的可讀性。制定乙個相同的風格，如直接選用python的pep8官方風格指南，嚴格遵守後可以得到美觀又統一風格的專案這在多人協作的開發中是很有必要的，每個人編寫的習慣不一樣，特別是有些喜歡用一些奇怪或新奇的寫法，這樣可讀性很差。尤其是靈活的指令碼語言python...