unicode
什麼是unicode:unicode 是計算機可以支援這個星球上多種語言的秘密**。unicode使用乙個或多個位元組來表示乙個字元。
unicodedecodeerror: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128) 問題的解決方法及原理:
該問題是在python2中將中文進行編碼時報的錯,意思是ascii編碼的最大長度為128,對中文進行解碼時超出了這個範圍。因為程式要對中文進行編碼時首先要將中文解碼成unicode(系統預設設定是ascii)。
解決方法:
一、在指令碼前面設定檔案的預設編碼方式為utf8
1#-*- coding: utf-8 -*-2#
!/usr/bin/env python
3import
sys4 reload(sys) #
重新匯入
5 sys.setdefaultencoding('
utf8
') #
設定預設編碼方式為utf8
二、在對中文進行編碼前向解碼為utf8 格式
1#報錯的**
2 str = "
中文字串
"3 str_out = str.encode('
utf8
')
1#正常的**
2 str = "
中文字串
"3 str = str.decode('
utf8')
4 str_out = str.encode('
utf8
')
三、在定義中文字串之前先指定字串的格式,比如:
1#定義時指定字串編碼格式
2 str = u"
中文字串
"3 str_out = str.encode('
utf8
')
Python 的編碼問題
我在爬取網頁解析的過程中出現了網頁內容解析不了的問題,雖然用記事本開啟是顯示正常的漢字和符號,但用winhex開啟就會出現亂碼的問題 把它放到cmd中也顯示亂碼 這個一般就是編碼問題,這種 編碼應該很可能是 utf 8 能在winhex中正常顯示漢字的應該是gb2312或者gbk編碼,所以用正規表示...
python的編碼問題
今天學習了python,作為乙個新手,對python的編碼問題仔細研究了一番,自己的理解如下 1 python 的檔案是以ascii編碼儲存,所以當python 檔案中有中文時 包括注釋 檔案開頭都要加 coding utf 8 或 coding gbk。2 python內部使用的都是unicode...
Python的編碼問題
python的編碼問題一般在有中文的情況下會出現。這裡的python檔案在windows環境下執行的。當python檔案不含中文時,無論.py檔案是anic ascii格式還是utf 8格式,在cmd中執行時都能得到正常的結果,但是.py檔案裡含中文時,直接編譯就會出現問題了。這裡主要有兩種情況 1...