centos7 中文字符集

2021-10-06 05:39:35 字數 1279 閱讀 1631

二、linux(centos7)字符集設定

三、編碼轉換

ascii

unicode(utf-8、utf-16、utf-32)

unicode 將全球所有的字元統一編碼,解決了字符集不相容和字元轉換的問題。全世界通用。

gb2312

gb2312-80字符集,國家標準字符集(gb國標)。收入漢字6763個普遍使用的簡體字字符集。

gbk

gbk字符集,國家標準擴充套件字符集(gb國標;k,即擴充套件),相容gb2312-80標準。

gb18030

gb18030字符集,包含gbk字符集,共計27533個漢字。

常用的中文編碼

gbk、gb18030、unicode

gbk和gb18030占用空間小,unicode通用性強,占用空間大。

不考慮全球通用,實際應用還是選擇gbk和gb18030。

檢視系統字符集

locale
檢視系統安裝的字符集

locale -a
是否安裝中文字符集

locale -a|grep zh_cn
gbk、gb18030、unicode都可以若沒有,安裝中文字符集

yum -y install chinese-support
修改系統的字符集為gbk

echo lang=

"zh_cn.gbk"

>

/etc/locale.conf

使修改生效

source /etc/locale.conf
出現亂碼的原因是字符集不匹配,修改客戶端和伺服器端字符集保持一致即可。

gbk、gb18030與unicode需要進行編碼轉換,防止亂碼。

iconv(linux命令)

作用:編碼轉換

舉例:將test.c由gbk編碼轉換成utf-8編碼,指定輸出為test.c

CentOS7設定中文字符集

二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符集相對...

CentOS7設定中文字符集

二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符集相對...

CentOS7設定中文字符集

二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符集相對...