python讀檔案編碼格式錯誤,中文亂碼等,強烈推薦看如下文章:點我
**:python在安裝時,預設的編碼是ascii,當程式中出現非ascii編碼時,python的處理常常會報這樣的錯unicodedecodeerror: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),python沒辦法處理非ascii編碼的,此時需要自己設定將python的預設編碼,一般設定為utf8的編碼格式。查詢系統預設編碼可以在直譯器中輸入以下命令:
sys.getdefaultencoding()
設定預設編碼時使用:
sys.setdefaultencoding('utf8')
可能會報attributeerror: 'module' object has no attribute 'setdefaultencoding'的錯誤,執行reload(sys),在執行以上命令就可以順利通過。此時在執行sys.getdefaultencoding()就會發現編碼已經被設定為utf8的了,但是在直譯器裡修改的編碼只能保證當次有效,在重啟直譯器後,會發現,編碼又被重置為預設的ascii了,那麼有沒有辦法一次性修改程式或系統的預設編碼呢。
有2種方法設定python的預設編碼:
乙個解決的方案在程式中加入以下**:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
另乙個方案是在python的lib\site-packages資料夾下新建乙個sitecustomize.py,內容為:
# encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
此時重啟python直譯器,執行sys.getdefaultencoding(),發現編碼已經被設定為utf8的了,多次重啟之後,效果相同,這是因為系統在python啟動的時候,自行呼叫該檔案,設定系統的預設編碼,而不需要每次都手動的加上解決**,屬於一勞永逸的解決方法。
另外有一種解決方案是在程式中所有涉及到編碼的地方,強制編碼為utf8,即新增**encode("utf8"),這種方法並不推薦使用,因為一旦少寫乙個地方,將會導致大量的錯誤報告,我曾經遇到這種情況,錯誤日誌壓縮之後尚有70多k,全都是這乙個問題,讓人有很崩潰的感覺。
1、使用 c++ 傳送http請求,中文引數使用url編碼,後端使用 flask,解析中文引數出現亂碼
請求鏈結,需要獲取引數v的資料,使用 request.args 讀取顯示亂碼
/test?cid=0&v=[%20%20%20"pycharm64%2eexe",%20%20%20"%b2%e2%ca%d4555%2eexe"]&mid=123
解決方法:
import re
from urllib import unquote
params = re.findall('v=\[.*\]', request.query_string)
for a in json_loads(unquote(params[0][2:]).decode('gb2312')):
print a
Python 檔案讀寫,中文編碼
寫入檔案 file open e baidunetdiskdownload 基礎 day11 1.txt w r讀,w寫 覆蓋 wb以二進位制寫,a寫 不覆蓋 file open r e baidunetdiskdownload 基礎 day11 1.txt w mystr yingwen file...
Python檔案中文編碼問題
需要讀取utf 8編碼的中文檔案,先利用sublime text軟體將它改成無dom的編碼,並且在第一行寫 encoding utf 8 然後用以下 with codecs.open note path,r utf 8 as f line f.readline print line 這樣就可以正確地...
python讀取SQL server中文亂碼處理
環境 問題描述 乙個python資料處理指令碼,功能是一些資料儲存操作。使用了pandas sqlalchemy做資料庫連線。e1上,任何情況均執行正常。e2上,出現中文亂碼 相關知識點 varchar在sqlserver中,採用單位元組儲存。nvarchar在sqlserver中,採用雙位元組儲存...