今天在看python的轉義字元的時候,在字串中寫\u***x
的時候出現錯誤:syntaxerror:unicodeerror
,於是搜了一下unicode。
1、utf-32
將字元的unicode編號直接轉換成二進位制儲存。使用4個位元組,即32位。
2、utf-16
utf-16使用變長位元組表示,使用2個或4個位元組。
① 對於編號在u+0000到u+ffff的字元(常用字符集),直接用兩個位元組表示。
② 編號在 u+10000到u+10ffff之間的字元,需要用四個位元組表示。
3、utf-8
utf-8使用變長位元組表示,使用的位元組個數從1到4個不等。
chunked 編碼 是什麼
分塊傳輸編碼 chunked transfer encoding 是超文字傳輸協議http中的一種資料傳輸機制,允許http由網頁伺服器傳送給客戶端應用的資料可以分成多個部分。分塊傳輸編碼只在http協議1.1中提供。原理 http 1.1引入分塊傳輸編碼提供了以下幾點好處 http分塊傳輸編碼允許...
字元編碼 unicode編碼
1.ascii american standard code for information interchange 美國資訊交換標準 這是計算機上最早使用的通用的編碼方案。那個時候計算機還只是拉丁文本的專利,根本沒有想到現在計算機的發展勢頭,如果想到了,可能一開始就會使用unicode了。當時絕大...
什麼是Unicode是什麼是UTF 8
首先說明一下現在常用的一些編碼方案 在中國,大陸最常用的就是gbk18030編碼,除此之外還有gbk,gb2312,這幾個編碼的關係是這樣的。最早制定的漢字編碼是gb2312,包括6763個漢字和682個其它符號 95年重新修訂了編碼,命名gbk1.0,共收錄了21886個符號。之後又推出了gbk1...