zìfú
字元是可使用多種不同字元方案或**頁來表示的抽象實體。例如,
unicode utf-16
編碼將字元表示為
16 位整數序列,而
unicode utf-8
編碼則將相同的字元表示為
8 位位元組序列。公共語言執行庫使用
unicode utf-16
(unicode
轉換格式,
16 位編碼形式)表示字元。
針對公共語言執行庫的應用程式使用編碼將字元表式形式從本機字元方案對映至其他方案。應用程式使用解碼將字元從非本機方案對映至本機方案。
zìjié
位元組(byte):
位元組是通過網路傳輸資訊(或在硬碟或記憶體中儲存資訊)的單位。
乙個英文本母
(不分大小寫
)佔乙個位元組的空間,乙個中文漢字佔兩個位元組的空間.
符號:英文標點佔乙個位元組,中文標點佔兩個位元組.
乙個二進位制數字序列
,在計算機中作為乙個數字單元
,一般為
8位二進位制數,如乙個
ascii
碼就是乙個位元組,此類單位的換算為:
理解編碼的關鍵,是要把字元的概念和位元組的概念理解準確。這兩個概念容易混淆,我們在此做一下區分:
概念描述
舉例字元
人們使用的記號,抽象意義上的乙個符號。
'1', '
中', 'a', '$', '
¥', ……
位元組計算機中儲存資料的單元,乙個
8位的二進位制數,是乙個很具體的儲存空間。
0x01, 0x45, 0xfa, ……
ansi
字串在記憶體中,如果「字元
」是以ansi
編碼形式存在的,乙個字元可能使用乙個位元組或多個位元組來表示,那麼我們稱這種字串為
ansi
字串或者多位元組字串。"中文
123"(佔7
位元組)unicode
字串在記憶體中,如果「字元
」是以在
unicode
中的序號存在的,那麼我們稱這種字串為
unicode
字串或者寬位元組字串。
l"中文
123"
(佔10
位元組)
由於不同ansi 編碼所規定的標準是不相同的,因此,對於乙個給定的多位元組字串,我們必須知道它採用的是哪一種編碼規則,才能夠知道它包含了哪些「字元」。而對於unicode 字串來說,不管在什麼環境下,它所代表的「字元」內容總是不變的.
字元與位元組
摘 自 位元組 byte 位元組是通過網路傳輸資訊 或在硬碟或記憶體中儲存資訊 的單位。位元組是計算機資訊技術用於計量儲存容量和傳輸容量的一種計量單位,1個位元組等於8位二進位制,它是乙個8位的二進位制數,是乙個很具體的儲存空間。1byte 8bit 字元 人們使用的記號,抽象意義上的乙個符號。1 ...
字元與位元組
ascii碼 乙個英文本母 不分大小寫 佔乙個位元組的空間,乙個中文 漢字佔兩個位元組的空間。乙個 二進位制數字序列,在 計算機中作為乙個數字單元,一般為8位二進位制數,換算為 十進位制。最小值 128,最大值127。如乙個ascii碼就是乙個位元組。utf 8編碼 乙個英文 字元等於乙個位元組,乙...
字元與位元組
1 計算機儲存資訊的最小單位,稱之為位 bit 音譯為位元,二進位制的乙個 0 或乙個 1 叫一位。2 計算機儲存容量基本單位是位元組 byte 音譯為拜特,8個二進位制位組成1個位元組。一般而言 乙個標準英文本母佔乙個位元組位置,乙個標準漢字佔二個位元組位置。3 計算機儲存容量大小以位元組數來度量...