二、linux(centos7)字符集設定
三、編碼轉換
ascii
unicode(utf-8、utf-16、utf-32)
unicode 將全球所有的字元統一編碼,解決了字符集不相容和字元轉換的問題。全世界通用。
gb2312
gb2312-80字符集,國家標準字符集(gb國標)。收入漢字6763個普遍使用的簡體字字符集。
gbk
gbk字符集,國家標準擴充套件字符集(gb國標;k,即擴充套件),相容gb2312-80標準。
gb18030
gb18030字符集,包含gbk字符集,共計27533個漢字。
常用的中文編碼
gbk、gb18030、unicode
gbk和gb18030占用空間小,unicode通用性強,占用空間大。
不考慮全球通用,實際應用還是選擇gbk和gb18030。
檢視系統字符集
locale
檢視系統安裝的字符集
locale -a
是否安裝中文字符集
locale -a|grep zh_cn
gbk、gb18030、unicode都可以若沒有,安裝中文字符集
yum -y install chinese-support
修改系統的字符集為gbk
echo lang=
"zh_cn.gbk"
>
/etc/locale.conf
使修改生效
source /etc/locale.conf
出現亂碼的原因是字符集不匹配,修改客戶端和伺服器端字符集保持一致即可。
gbk、gb18030與unicode需要進行編碼轉換,防止亂碼。
iconv(linux命令)
作用:編碼轉換
舉例:將test.c由gbk編碼轉換成utf-8編碼,指定輸出為test.c
CentOS7設定中文字符集
二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符集相對...
CentOS7設定中文字符集
二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符集相對...
CentOS7設定中文字符集
二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符集相對...