字元位元組區別,各種編碼格式作用

2021-09-25 14:21:11 字數 823 閱讀 5018

字元:由數字,字母,標點符號,各種符號。。。組成的都叫做字元。

位元組:位元組是計算機中儲存容量的基本單位,1位元組是在計算機中是8位。也就是從 00000000到11111111。在計算機裡面,無論你什麼樣的檔案,到最後都會被轉為0,1的組成序列來表示,那麼問題來了,我們肯定要制定規則呀,比如00011001代表哪個字元,這些都是我們人為後面規定的,所以我們就引入了編碼格式:anci、utf-8、gbk、utf-16、utf-32…等等很多很多編碼格式就應運而生。

3.編碼格式:anci、utf-8、gbk、utf-16、utf-32…。記住一句話,這些編碼格式作用就是:乙個字元在計算機中到底佔幾個位元組。不同的編碼格式對這個的規定是不一樣的。

1、anci編碼碼中:標點符號、數字、大小寫字母都佔乙個位元組,漢字佔2個位元組。

乙個二進位制數字序列,在計算機中作為乙個數字單元,一般為8位二進位制數,換算為十進位制。最小值0,最大值255。

2、utf-8編碼中:乙個英文本元等於乙個位元組,乙個中文(含繁體)等於三個位元組。

3、unicode編碼中:乙個英文本元等於兩個位元組,乙個中文(含繁體)等於兩個位元組。

符號:英文標點佔乙個位元組;中文標點佔兩個位元組。

舉例:英文句號「.」佔1個位元組的大小;中文句號「。」佔2個位元組的大小。

4、utf-16編碼中:乙個英文本母字元或乙個漢字字元儲存都需要2個位元組(unicode擴充套件區的一些漢字儲存需要4個位元組)。

5、utf-32編碼中:世界上任何字元的儲存都需要4個位元組。

6、gbk編碼中:英文本元1個位元組,中文字元2個位元組.

以前我基本上看到字元位元組就躲著它們,後來實在躲不了,今天和它們做個了斷,如果我說的不對,請賜教。

位 位元組 編碼格式

位 bit 計算機中最小的資料單位。每一位的狀態只能是0或1。位元組 byte 儲存空間的基本計量單位,8個二進位制位構成乙個位元組 編碼格式 ascii 127個字元被編碼到計算機裡,也就是大小寫英文本母 數字和一些符號 unicode 把所有語言都統一到一套編碼裡,解決亂碼問題 gbk 有一位元...

字元,位元組和編碼

想搞清楚這幾個問題,樓主需要分清楚三個概念 字元 位元組和編碼。比如2d 4e和d6 d0和e4 b8 ad和ff fe 2d 4e是位元組,但是都對應同乙個字元 中 編碼 把字元變成位元組的過程。比如 d6 d0把字元 中 使用gb2312進行編碼的位元組結果。e4 b8 ad把字元 中 使用ut...

字元 位元組的概念和區別 編碼概念

位元組 byte 位元組是通過網路傳輸資訊 或在硬碟或記憶體中儲存資訊 的基本單位。位元組是計算機資訊技術用於計量儲存容量和傳輸容量的一種計量單位,1個位元組等於8位二進位制,它是乙個8位的二進位制數,是乙個很具體的儲存空間。字元人們使用的記號,抽象意義上的乙個符號。比如鍵盤上敲出的數字 字母 各種...