字元和字元碼之間的對映關係可稱為字符集;
unicode出現之前,字元編碼等同於字元編碼流,如ascii既表示字符集,又表示字元編碼;
unicode出現之後,字元碼和字元編碼流之間多了乙個中間層,用來表示兩者之間的對映關係,如utf-8就是這樣一種對映關係,來實現對字元碼的可變長儲存和傳輸;
常說的unicode編碼指的使用unicode字符集的編碼方案集合,包括utf-8,utf-16,所以應講明具體的編碼方式;
unicode字符集的最大的好處就是可以在同乙個文件中實現各國語言的表示;
ascii編碼是一種單位元組編碼方案,gb2313和gbk都是在ascii編碼的基礎上衍生出來的,屬於多位元組編碼方案;
推薦一篇關於編碼的文章:
開啟檔案出現亂碼時,可以嘗試修改字元的編碼:
m-x revert-buffer-with-coding-system
然後輸入對應編碼,如:utf-8 或者 chinese-gbk。
在儲存的時候還可以指定檔案的儲存編碼:
m-x set-buffer-file-coding-system
emacs 字元編碼
在vim中,我們可以通過set fencs utf 8,gbk告訴它按照先utf 8後gbk的順序自動識別開啟檔案的字元編碼。emacs也有一組字元編碼相關指令,整理如下 指令全名 set buffer file coding system 指令作用 改變當前buffer的編碼 呼叫方法 以目標編碼...
Linux mysql改變字符集編碼
找到配置檔案 etc mysql my.cnf 在 client 下面加上 default character set utf8 在 mysqld 下面加上 default character set utf8 重啟伺服器 service mysql restart 在mysql中鍵入命令 show...
設定emacs的編碼
學習emacs,因為蘋果上的編碼使用unicode,所以配置emacs的編碼為gb2312。查資料了解了一些中文編碼的知識。emacs的配置檔案 set keyboard coding system cn gb 2312 set selection coding system cn gb 2312 ...