一段程式讀入了utf-8檔案,再print出來,在pycharm中可以正常執行,在cmd中報'gbk' codec can't encode錯誤,是因為cmd預設使用gbk輸出,如果在程式中print了一段utf-8字元則會報此錯誤,解決方法是:
file=open(filepath, encoding='utf-8') #以檔案本身格式讀入(此處為utf-8),此時readline的字串為相應格式
print(file.readline().encode('gbk','ignore').decode('gbk')) #將字串轉為cmd可輸出的格式即gbk,同理,在linux下顯示gbk檔案也要先以gbk格式open檔案,在輸出時轉為utf-8格式
編碼 python筆記
為了避免亂碼問題,應當始終堅持使用 utf 8 編碼對str和bytes進行轉換。usr bin env python3 coding utf 8 第一行注釋是為了告訴 linux os x 系統,這是乙個 python 可執行程式,windows 系統會忽略這個注釋 第二行注釋是為了告訴 pyth...
Python學習筆記 編碼問題
想要徹底搞清楚編碼問題,我們必須要先搞清楚計算機是怎麼儲存資料的,這就涉及到了計算機基礎的幾個概念了,開篇我們就先來捋捋這幾個容易混淆的概念。bit二進位制位,是計算機內部資料儲存的最小單位,11010100是乙個8位二進位制數。乙個 二進位制位只可以表示0和1兩種狀態 2 1 兩個二進位制位可以表...
python爬蟲筆記 編碼問題
importurllib2 importurllib importrequests frombs4 importbeautifulsoup url respones requests.get url text soup beautifulsoup respones,html.parser info ...