python語言實際上有三種字串,通常意義的字串(str),unicode字串(unicode)和抽象類basestring,其中basestring不可例項化。
在windows系統下的cpython直譯器輸入**:
>>> st1 = '中文'
>>> st1
'\xd6\xd0\xce\xc4'
>>> type(st1)
'str'>
>>> st2 = st1.decode('gbk')
>>> st2
u'\u4e2d\u6587'
>>> type(st2)
'unicode'>
>>> st3 = st2.encode('utf-8')
>>> st3
'\xe4\xb8\xad\xe6\x96\x87'
>>> type(st3)
'str'>
>>> st4 = st2.encode('gbk')
>>> st4
'\xd6\xd0\xce\xc4'
>>> type(st4)
'str'>
如果在**中加入一句:
>>> st5 = st1.decode('utf-8')
則會報錯
從上面的**和輸出我們可以得到如下結論:
1、windows命令列輸入的預設中文編碼格式是gbk,輸入的中文字串型別為str
2、使用decode函式可以將乙個str型別的中文字串轉成unicode型別
3、使用encode函式可以將乙個unicode型別的中文字串轉成str型別
所以我們一般在進行python指令碼編寫的時候,需要在指令碼的開頭加上如下**:
#-*- coding:utf-8 -*-
也可以匯入模組sys,設定預設編碼格式:
import sys
sys.setdefaultencoding('utf-8')
ps: python版本為python2.7 筆記 ubuntu下新增windows的字型
方法如下 第一步 將windows下喜歡的字型檔案copy到乙個資料夾中,例如將xp裡windows fonts中的字型檔案 本人比較貪心,把整個資料夾copy了過來 在linux中命名為xpfonts 第二步 將copy到的字型資料夾copy到系統字型資料夾中並且修改許可權 sudo cp xpf...
Windows下Python的安裝
python語言對於windows並不算很友好,因為如果初學者,windows環境下安裝,簡直是折磨人,會遇到各種蛋疼的情況。本文記錄下安裝我在64位win7下的安裝步驟,希望能夠令讀者成功安裝python和pip以及計算機視覺處理所需要的pil,matlotlib,numpy,scipy的安裝。現...
windows下python自動補齊
windows下使用python2.7,控制台下無法無法自動補齊 參照1.安裝pyreadline pip install pyreadline 2.啟用tab鍵自動補齊 try import readline except importerror import pyreadline as read...