本人安裝的是python 2.7版本,由於編寫程式的過程中會碰到中文字串,但由於python預設採用ascii編碼方式,所以對中文不支援。要解決此問題,必須設定當前編碼方式為unicode方式。
預設ascii編碼方式對中文字元產生的異常為:unicodedecodeerror: 'ascii' codec can't decode byte 0xe9 in position 0: ordinal not in range(128)
解決方案:
首先在檔案頭加入如下設定:
#! /usr/bin/env python
-*- coding: utf-8 -*-
對需要 str->unicode 的**,可以在前邊寫上
import sys
reload(sys)
sys.setdefaultencoding('utf8')
把 str 編碼由 ascii 改為 utf8 (或 gb18030)
python 解決中文字串的問題
在用python處理資料庫中文字符集時遇到資料庫的個別字段只有一半。結合網上朋友給的思路,使用以下方法進行處理,如果是完整的中文字元似乎是兩個位元組,並且第乙個位元組大於128。引數test 輸入字串是gb18030 def cutstr test vlist i 0while true if i ...
Python中文字串擷取問題
先來看個例子程式設計客棧 程式設計客棧 coding utf8 s u 中文擷取 s.decode utf8 0 3 encode utf8 www.cppcns.com 結果u 中文擷取 延伸閱讀 utf 8中的漢字占用多少位元組?佔2個位元組的 佔3個位元組的 基本等同於gbk,含21000多個...
解決PHP擷取中文字串問題
php擷取字串如果是英文那很好辦,直接用substr就行了,一般不會出現亂碼.中文就有點麻煩了.下面給出兩種解決辦法 一 直接使用multi byte函式庫的mb substr 函式就行了,例項 如下 php echo mb substr str start length encoding echo...