字元編碼詳解

2022-08-28 09:09:12 字數 803 閱讀 2211

1.acsii表,00000000,8位儲存,一共有256個種表示方法,使用英語的國家使用一張acsii表即可

a,美國人使用只需要128種表示方法即可表示所有字元

b,拉丁國家使用了256種表示方法

2.gb2312,中國人使用,需要兩個位元組,剛開始只能表示幾千個漢字

gbk,能表示所有漢字,2萬多種

3.unicode  兩個位元組能表示6萬多種種狀態,俗稱萬國碼,能夠表示所有國家的明文

4.utf-8  中文預設使用三個位元組,英文乙個位元組,結合unicode,ascii碼衍生出來的一種編碼

5.python直譯器:

python直譯器是乙個對其它編碼進行編碼,解碼,並且執行檔案的乙個工具

對**進行逐行解釋逐行執行

檔案用什麼編碼必須用同一編碼進行解碼,才不會報錯

開啟檔案(二進位制)

1先直譯器對檔案進行解碼

py3預設使用的是utf—8進行解碼

py2預設使用的是ascll碼進行解碼(可以在**第一行加coding:utf-8

2在由直譯器把一行行的**翻譯到記憶體

py3把一行行中的」字串」預設解釋成unicode存在記憶體中

py2是把一行行中的「字串」解釋unicode存在記憶體中

3在終端輸出

py3由於記憶體中是unicode,終端無論是什麼都沒問題

py2由於記憶體中是unicode,在遇到print時,py2會預設幫我們轉換成byte型

字元編碼詳解

你是否認為 ascii碼 乙個字元就是8位元 你是否認為乙個位元組就是乙個字元,乙個字元就是8位元?你是否還認為你是否還認為utf 8就是用8位元表示乙個字元?如果真的是這樣認為認真讀完這篇文章吧!首先大家需要明確的是在計算機裡所有的資料都是位元組的形式儲存,處理的。我們需要這些位元組來表示計算機裡...

字元編碼詳解

字元編碼詳解 2.1.2.1.ascii字符集中的功能 控制字元 2.1.2.1.1.什麼是function code功能碼或 function character功能字元 ascii字符集,大家都知道吧,最基本的包含了128個字元。其中前32個,0 31,即0x00 0x1f,都是不可見字元。這些...

python 字元編碼轉換詳解

unicode所有的中文或者英文都是占用兩個位元組 16位 ascii 只能存英文 8位 utf 8 可變長的字元編碼,所有英文按ascll佔乙個位元組,常用中文字元用utf 8編碼占用3個位元組 coding gbk import sys with語句 為了避免開啟檔案後忘記關閉,可以通過管理上下...