中文字符集介紹:
gb2313包括6763個漢字
gbk收錄了20902個漢字
gb18030收錄了27484個漢字
200.31.138.173
總結:gb2312=ascii+常用漢字+符號
gbk=gb2312+不常用字(含big5繁體漢字)+圖形符號
gb18030=gbk+ext-a+圖形符號
unicode=gb18030+ext-b+……(如未發布的ext-c及其它國家文字)
注意:unicode的漢字編碼與前三者不一樣,utf-8是unicode的實現方式之一。
aix系統中:
aix的中文漢字型檔中,zh_cn 中有6763個漢字,而zh_cn中有20902個漢字。如果使用者要用到一些比較偏僻的漢字,建議使用者安裝中文環境時選擇zh_cn。
gbk的意思是 guo (national) biao (standard) kuo (extension).
gb18030 將國家標準定義進行了擴充套件,包含 20902 個漢字, 它定義了所有 dbcs 字元以及中國大陸及台灣地區使用的符號
注:aix中各字符集的區別在於zh_cn的大小寫。
常用命令:
檢視已經安裝的字符集
locale -a
注:"c"是系統預設的locale,"posix"是"c"的別名。所以當我們新安裝完乙個系統時,預設的locale就是c或posix
檢視當前系統使用的字符集
env | grep lang 或者 locale
修改整個系統的字符集
vi /etc/environment --> lang=zh_cn
修改單個使用者的字符集
設定中文字符集
目錄 二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符...
中文字符集
gb2312 1980年 16位字符集,收錄有6763個簡體漢字,682個符號,共7445個字元。優點 適用於簡體中文環境,屬於中國國家標準,通行於大陸,新加坡等地也使用此編碼 缺點 不相容正體中文,其漢字集合過少。gbk 1995年 16位字符集,收錄有21003個漢字,883個符號,共21886...
給aix 系統增加中文字符集
最近客戶反映,在run oracle 的時候,有中文顯示不出來,討論了一下,可能沒有安裝中文字元。我去support locale a 發現沒有utf8 安裝步驟 step1 smit lang step2 language mangement step3 add additional langua...