utf-8:unicode transformation format-8bit,允許含bom,但通常不含bom。是用以解決國際上字元的一種多字
節編碼,它對英文使用8位(即乙個位元組),中文使用24為(三個位元組)來編碼。utf-8包含全世界所有國家需要用到的字
符,是國際編碼,通用性強。utf-8編碼的文字可以在各國支援utf8字符集的瀏覽器上顯示。如,如果是utf8編碼,則在
gbk是國家標準gb2312基礎上擴容後相容gb2312的標準。gbk的文字編碼是用雙位元組來表示的,即不論中、英文本元
均使用雙位元組來表示,為了區分中文,將其最高位都設定成1。gbk包含全部中文字元,是國家編碼,通用性比utf8差,
不過utf8占用的資料庫比gbk大。
gbk、gb2312等與utf8之間都必須通過unicode編碼才能相互轉換:
gbk、gb2312--unicode--utf8
utf8--unicode--gbk、gb2312
對於乙個**、論壇來說,如果英文本元較多,則建議使用utf-8節省空間。不過現在很多論壇的外掛程式一般只支援gbk。
gb2312是gbk的子集,gbk是gb18030的子集
gbk是包括中日韓字元的大字符集合
為了避免所有亂碼問題,應該採用utf-8,將來要支援國際化也非常方便
utf-8可以看作是大字符集,它包含了大部分文字的編碼。
使用utf-8的乙個好處是其他地區的使用者(如香港台灣)無需安裝簡體中文支援就能正常**你的文字而不會出現亂碼。
gb2312是簡體中文的碼
gbk支援簡體中文及正體中文
big5支援正體中文
utf-8支援幾乎所有字元
中文內容多的站點可以考慮用gbk或gb2312,英文內容多的站點還是utf-8好
GBK GB2312和UTF 8編碼區分
gbk包含全部中文字元,gbk的文字編碼是雙位元組來表示的,即不論中 英文本元均使用雙位元組來表示,只不過為區分中文,將其最高位都定成1。至於utf 8編碼則是用以 解決國際上字元的一種多位元組編碼,它對英文使用8位 即乙個位元組 中文使用24位 三個位元組 來編碼。對於英文本元較多的 論壇則用ut...
gb2312和UTF 8的區別
gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字更多,...
GB2312 和 UTF 8的區別
本文 gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字...