GB2312和utf 8的區別

2021-09-28 20:24:49 字數 535 閱讀 6480

gb2312編碼大約包含6000多漢字(不包括特殊字元),編碼範圍為第一位b0-f7,第二位編碼範圍為a1-fe(第一位為cf時,第二位為a1-d3),計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼。

gbk編碼是對gb2312編碼的擴充,容納的漢字更多,但僅僅是擴充,沒有質的變化。保留了所有gb2312編碼,在此基礎上進行編碼範圍的擴充.容納(包含特殊字元)共22014個字元編碼.

gb18030編碼是在gbk編碼基礎上的擴充,因為漢字更多,僅僅使用兩位編碼已經不能容納要求的漢字,所以採用了2/4位混和的辦法,可以支援更多的漢字編碼。並且保留了原有的gbk 2位元組編碼相容gb2312和gbk編碼的檔案。大概容納55657個編碼(包含特殊字元)unicode編碼(也就是utf編碼):俗稱萬國碼,致力於使用統一的編碼準則表達各國的文字。

為表達更多的文字,utf-8採用2/3混編的方式。目前容納的漢字範圍小於gbk編碼。並且以3位元組的方式處理中文,帶來了相容性的問題,原有的gbk,gb2312,gb18030編碼檔案都不能正常的處理,還有很長的路要走。

gb2312和UTF 8的區別

gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字更多,...

GB2312 和 UTF 8的區別

本文 gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字...

GB2312和utf 8的區別

gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼。gbk編碼是對gb2312編碼的擴充,容納的漢字更多,...