GBK GB2312和UTF 8編碼區分

2021-07-01 18:31:20 字數 415 閱讀 2255

gbk包含全部中文字元, gbk的文字編碼是雙位元組來表示的,即不論中、英文本元均使用雙位元組來表示,只不過為區分中文,將其最高位都定成1。

至於utf-8編碼則是用以

解決國際上字元的一種多位元組編碼,它對英文使用8位(即乙個位元組),中文使用24位(三個位元組)來編碼。對於英文本元較多的

論壇則用utf-8節省

空間。gbk包含全部中文字元,

utf-8則包含全世界所有國家需要用到的字元。

gbk是在國家標準gb2312基礎上擴容後相容gb2312的標準

utf-8編碼的文字可以在各國各種支援utf8字符集的瀏覽器上顯示。

比如,如果是utf8編碼,則在外國人的英文ie上也能顯示中文,而無需他們

對於英文比較多的論壇,使用gbk則每個字元占用2個位元組,而使用utf-8英文卻只佔乙個位元組。

關於GBK GB2312 UTF8之間的區別

utf 8 unicode transformation format 8bit,允許含bom,但通常不含bom。是用以解決國際上字元的一種多字 節編碼,它對英文使用8位 即乙個位元組 中文使用24為 三個位元組 來編碼。utf 8包含全世界所有國家需要用到的字 符,是國際編碼,通用性強。utf 8...

gb2312和UTF 8的區別

gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字更多,...

GB2312 和 UTF 8的區別

本文 gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字...