各種不同位元組碼的介紹

2021-09-29 18:57:18 字數 1250 閱讀 9672

編碼:就是用二進位制數來表示計算機中的控制符

、大小寫字母、數字、中文漢字等

1、ascii 碼

ascii 就是用乙個位元組去表示計算機中的控制符、大小寫字母、數字以及符號和其他的圖案。

乙個位元組是8位,也就是有 256 個數 ,所以可以用來表示 256 個東西。

0 - 32 來表示各種控制,叫做控制碼(如:10代表換行,7表示聲音)。

32 - 126 則代表大小寫字母、符號等

還有 128 個數,則是用於擴充套件一些圖案等。

2、iso-8859-1 編碼

在歐洲的國家和其他國家也有自己的語言。(如:阿拉伯數字、希臘語)

這裡也需要能夠在計算機用某個二進位制數來表示。

這時候,他們利用了 ascii 碼剩下的 128 個數。

也就是它也是乙個位元組,只是在ascii 碼上面進行了擴充套件。

3、gbk 編碼

ascii 可以用來表示字母和符號,但是中文是無法表示的。

所以國人就規定一套自己的規定:

當乙個自己表示的數字小於 127 的時候,任然用 ascii 來表示。

當某個位元組大於 127 且緊接著的後面的乙個位元組也必須大於 127,這時候就會用這兩個位元組來表示乙個漢字。

第一位元組就稱為高自己,第二個則稱為低位元組。

以上就是gb2312 的編碼規則。

但是漢字會有很多,這個時候就進行了重新規定:

只要某乙個位元組大於 127 ,則就會與後面的位元組來一起代表漢字,所以低位元組就不需要大約 127 ,則樣就可以表示更多的漢字。

以上是標準的gbk 的編碼規則。

3、unicode 編碼

規定了所有的字元(文字、符號、字母等)都用 2/4 個位元組的二進位制來表示。

也就是都用兩個位元組來表示。這樣可以用呢但位元組表示的字元,就會浪費資源。

utf-16 是 unicode 的具體實現,兩個位元組。

utf-32 也是 unicode 的具體實現,四個位元組。

4、utf-8

utf-8 也是 unicode 編碼的實現。

utf-8 可變長度的編碼方式,可以用 1 - 4 個自己來表示字元。

單位元組:自己的第一位為 0 ,後面 7 位表示字元,和 ascii 一樣表示

n位元組:第乙個位元組的前 n 位都為 1 ,n+1 位未 0,其他位元組的話開始都是 10 開始。

Python位元組碼介紹

如果你曾經編寫過 python,或者只是使用過 python,你或許經常會看到 python 源 檔案 它們的名字以 py 結尾。你可能還看到過其它型別的檔案,比如以 pyc 結尾的檔案,或許你可能聽說過它們就是 python 的 位元組碼bytecode 檔案。在 python 3 上這些可能不容...

Java 不同型別屬性在位元組碼檔案class中

1.object attribute publicclass objectattribute constant pool 會出現constant fieldref info條目,其中 包含了屬性的類目和名稱型別 such as 16 constant fieldref info class name...

各種協議的介紹

icmp協議 網際網路控制報文協議。它是tcp ip協議族的乙個子協議,用於在ip主機 路由器之間傳遞控制訊息。tftp協議 是tcp ip協議族中的乙個用來在客戶機與伺服器之間進行簡單檔案傳輸的協議,提供不複雜 開銷不大的檔案傳輸服務。http協議 超文字傳輸協議,是乙個屬於應用層的物件導向的協議...