到底是用UTF 8還是GB2312

2021-04-17 14:11:55 字數 1083 閱讀 2207

有關漢字字元標準的說明

gb2312編碼大約包含6000多漢字(不包括特殊字元),編碼範圍為第一位b0-f7,第二位編碼範圍為a1-fe(第一位為cf時,第二位為a1-d3),計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼gbk編碼是對gb2312編碼的擴充,容納的漢字更多,但僅僅是擴充,沒有質的變化。保留了所有gb2312編碼,在此基礎上進行編碼範圍的擴充.容納(包含特殊字元)共22014個字元編碼.

gb18030編碼是在gbk編碼基礎上的擴充,因為漢字更多,僅僅使用兩位編碼已經不能

容納要求的漢字,所以採用了24位混和的辦法,可以支援更多的漢字編碼。並且保留了原有的gbk 2位元組編碼相容gb2312和gbk編碼的檔案。大概容納55657個編碼(包含特殊字元)unicode編碼(也就是utf編碼):俗稱萬國碼,致力於使用統一的編碼準則表達各國的文字。

為表達更多的文字,utf-8採用2/3混編的方式。目前容納的漢字範圍小於gbk編碼。並且以3位元組的方式處理中文,帶來了相容性的問題,原有的gbk,gb2312,gb18030編碼檔案都不能正常的處理,還有很長的路要走。

到底是用utf-8還是gb2312

傾向於 gb2312

我現在用的是英文 2000,可除了介面的「開始」變成「start」這樣的微小變化外其他東西用起來沒有感到任何差別,剛裝完 2000 的時候隨便去乙個國內**他就會問你是否要裝簡體中文,點了是,安一下,連 ie 都不用重新開啟就可以直接看中文了,英文系統看中文是如此簡單,換成繁體系統看簡體應該沒有任何差別的,不可能會出現看不了或者亂碼的情況。

utf-8 的同屏顯示多語種確實是個很有意思的新玩意,不過畢竟是後來的,只要用就得成天考慮相容問題,況且很少需要 utf-8 的特性:我用簡體中文寫東西,看的人一般系統裡只有簡體中文或者安個簡體中文就可以看了,永遠不會出現乙個倭文或者韓文,那麼 utf-8 還有用的必要了嗎?

xml 和 *** 這些非常好的東西,推行了很多年也無法成為「預設配置」,恩,對,gb2312 之於 utf-8,正如同 vcd 之於 ***:*** 好是好,可目前幾乎所有的軟體還都是用 650mb 的光碟發行,一台家用電腦可以讀不了 ***,但絕對不可以讀不了普通的光碟,否則連裝個系統啟動起來都很困難。

c語言中關於utf 8編碼轉換為gb2312的問題

在網上查到如下 問題是 輸出發現gb2312 utf8是沒問題的,但是utf8轉為gb2312時發現只轉換了英文部分,漢字部分並沒有轉換,期待高手釋疑!include include include include define outlen 255 main 轉換 從一種編碼轉為另一種編碼 int...

NSString到底是用copy還是用strong

本質上來講,copy和strong都沒有錯,但是對於追求效能的乙個碼農來講他會再適當的地方用適當的修飾符 那麼,什麼時候用copy,什麼時候用strong呢?首先,為什麼要用copy?因為copy安全 copy修飾的nsstring,在初始化時,如果 是nsmutablestring的話,會對 進行...

用PHP實現將GB編碼轉換為UTF8

gb2utf8.php 檔案如下 複製 如下 class gb2utf8 function set gb2312.txt this g程式設計客棧t codetable array while list key,value each tmp function convert str this gb ...