字元: 就是各種文字和符號的總稱,包括國家文字、標點符號、圖形符號、數字等
字符集: 就是多個字元的集合,比如熟知的ascii字符集,很類似字典,乙個鍵對應乙個值
a = "中國"
print(a)
b = a.encode() #預設不寫就是使用了utf-8的編碼方式
print(b) #列印出 b'\xe4\xb8\xad\xe5\x9b\xbd' ,可以看到「中國」兩個字每個字占用3個位元組,對應了utf-8字符集
**注意:如上\xe4表示乙個十六進製制字元,對應於4個二進位制的字元,這裡就有24個二進位制字元,除以8位後,就是3個位元組**
c = b.decode() #解碼預設不寫也是使用了utf-8字符集
print(c) #列印出「中國」
d = a.encode("gbk") #這裡使用了gbk的編碼方式
print(d) #列印出 b'\xd6\xd0\xb9\xfa' 可以看出乙個中文占用了2個位元組
e = d.decode("gbk") #這裡的解碼就要對應使用gbk
print(e) #列印出「中國」
最後就是編碼和解碼要使用相同的字符集,否則就會產生亂碼 C 中處理字符集與常見字符集介紹
c 提供不同的字元型別用以應付前述字符集 char可被用於所有8bit以下的字符集,例如us ascii iso latin 1和iso latin 9。此外它可被用於utf 8的8bit值。char16 t 始自c 11 可被用於ucs 2,也可用於utf 16的code unit。char32 ...
你不知道的 字符集和編碼(編碼字符集與字符集編碼)
我的上篇文章,有朋友提出字符集和編碼的區別,我在此立文和大家討論下 常說的字符集和編碼區別,其實就是編碼字符集和字符集編碼的區別,其實,單單如果只是說字符集,沒有任何編碼的概念的話,那麼字符集其實僅僅是乙個簡單的字元的集合,或者說是乙個抽象的字元的集合,包括文字,符號等等,不參與任何儲存形式,只是存...
Python3中urllib使用介紹
urllin2庫 在pytho2.x中使用import urllib 對應的,在python3.x中會使用import urllib.request,urllib.error,urllib.parse。在pytho2.x中使用import urlparse 對應的,在python3.x中會使用imp...