列印python檔案編碼
import sysprint(sys.getdefaultencoding())
中文的乙個字元unicode占用2個位元組。對在於ascii字元占用1個位元組
utf-8中:中文字元佔3個位元組,英文本元占用1個位元組
編碼和轉碼:unicode不能再解碼了(它是基層的~~)
unicode----encode---->gbk gbk----decode---->unicode
unicode----encode---->utf-8 utf-8----decode---->unicode
#!/usr/bin/env python# -*- coding:utf-8 -*-
# author:coke
s='你好'
#s是unicode
s_to_gbk=s.encode('gbk') #編碼採用gbk
s_to_utf8=s.encode() #預設的編碼是utf-8
#decode中解碼型別寫原型別,告訴它我是誰
#encode中編碼型別寫新型別,告訴它轉成誰
gbk_to_utf8=s_to_gbk.decode("gbk").encode("utf-8")
utf8_to_gbk=s_to_utf8.decode("utf-8").encode("gbk")
print(s_to_gbk)
print(utf8_to_gbk)
print(s_to_utf8)
print(gbk_to_utf8)
python字元編碼
ascii 碼是乙個位元組,通常只能顯示英文本母和數字。unicode碼為了顯示多種語言產生,但是要占用兩個位元組,顯示文字要占用大量空間 utf 8 為了節約空間而生,英文本元只用乙個位元組儲存,中文字元需要三個位元組 character ascii unicode utf 8 a01000000...
Python字元編碼
在用python程式設計中,字串有兩種表示方法 string 和 u string 為什麼字串要是用這兩種表達方式。不是僅僅用前一種呢?使用type 函式檢視,它們各自是str物件和unicode物件。這兩個物件有什麼差別嗎?還有經經常使用到的encode 和decode 又是幹什麼的呢?都說pyt...
Python字元編碼
計算機只能處理數字,如果要處理文字,必須先把文字轉化成數字。計算機最早是美國人發明的,所以只有127個字元被編碼到計算機裡面,即大小寫英文本母 數字及一些符號,這個編碼表被稱為ascll表。其中 a 的編碼是65,a 的編碼是97。大本事處理中文乙個位元組是不夠的,至少需要兩個位元組,為了不與asc...