gb2312編碼:2023年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。
big5編碼:台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,2023年實施。
gbk編碼:2023年12月發布的漢字編碼國家標準,是對gb2312編碼的擴充,對漢字採用雙位元組編碼。gbk字符集共收錄21003個漢字,包含國家標準gb13000-1中的全部中日韓漢字,和big5編碼中的所有漢字。
gb18030編碼:2023年3月17日發布的漢字編碼國家標準,是對gbk編碼的擴充,覆蓋中文、日文、朝鮮語和中國少數民族文字,其中收錄27484個漢字。gb18030字符集採用單位元組、雙位元組和四位元組三種方式對字元編碼。相容gbk和gb2312字符集。
unicode編碼:國際標準字符集,它將世界各種語言的每個字元定義乙個唯一的編碼,以滿足跨語言、跨平台的文字資訊轉換。
一般使用2w基本漢字就夠了
字符集字數unicode 編碼
基本漢字
20902字
4e00-9fa5
基本漢字補充
38字9fa6-9fcb
擴充套件a6582字
3400-4db5
擴充套件b42711字
20000-2a6d6
擴充套件c4149字
2a700-2b734
擴充套件d222字
2b740-2b81d
康熙部首
214字
2f00-2fd5
部首擴充套件
115字
2e80-2ef3
相容漢字
477字
f900-fad9
相容擴充套件
542字
2f800-2fa1d
pua(gbk)部件
81字e815-e86f
部件擴充套件
452字
e400-e5e8
pua增補
207字
e600-e6cf
漢字筆畫
36字31c0-31e3
漢字結構
12字2ff0-2ffb
漢語注音
22字3105-3120
注音擴充套件
22字31a0-31ba〇1字
3007
漢字unicode編碼範圍
gb2312編碼 1981年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。big5編碼 台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,1984年實施。gbk編碼 1995年12月發布的漢字編碼國家...
Unicode 漢字編碼表
1 unicode編碼表 unicode只有乙個字符集,中 日 韓的三種文字占用了unicode中0x3000到0x9fff的部分 unicode目前普遍採用的是ucs 2,它用兩個位元組來編碼乙個字元,比如漢字 經 的編碼是0x7ecf,注意字元編碼一般用十六進製制來 表示,為了與十進位制區分,十...
中文在unicode中的編碼範圍
以前寫過一篇貼子是寫中文在unicode中的編碼範圍unicode中文範圍 但寫的不是很詳細,今天再次研究了下unicode,並給出詳細的unicode取值範圍。本次研究的unicode物件是unicode 5.2.0版本。現在最新的是6.0版 對於這次研究的unicode把編碼分為以下幾個平面 英...