1、asii:美國標準資訊交換碼,用乙個位元組的7位可以表示;
2、iso8859-1:拉丁碼表,歐洲碼表,用乙個位元組的8位可以表示;
3、gbk2312:中國的中文編碼表,最多兩個位元組編碼所有字元;
5、unicode:國際標準碼,融合了目前人類使用的所有字元,為每個字元分配唯一的字元碼,所有的文字都用兩個位元組來表示;
6、utf-8:變長的編碼方式,可用1-4個位元組來表示乙個字元。現在最多的又有6個位元組;
7、utf-16:中文和字母都是佔2個位元組。
8、utf-32:中文和字母都是佔4個位元組。編碼
乙個漢字對應位元組數
乙個字母對應位元組數
ascii
無漢字1
utf-831
utf-1622
gbk2
1utf-3244
idea中gbk編碼的文件轉化為utf-8編碼的文件教程,解決中文亂碼問題
另外:
1、unicode的落地實現是utf-8和utf-16
2、utf-8的優點是:傳輸效率高
;utf-16的優點是:記憶體中儲存效率高
字符集及編碼
字符集 charset 編碼不同,資料的儲存空間大小也不同,選擇不當還會出現亂碼等,特別是資料互動的地方,傳送與接收應該保持編碼一致。ascii碼是最早最基礎的編碼,採用7位 bit 表示乙個字元,一共可表示2的7次方 128種字元,後來有了latin1 iso 8859 1 對ascii進行了擴充...
字符集和字符集編碼詳解
gb2312 gbk ascii asni unicode utf 8等等,這些字眼非常常見,同時帶來許多的問題。本文只是從理解的角度,說明以上內容的不同含義從而達到區分其用法的目的是夠了的。至於實現方式,可以查閱各自的詳細標準官方文件。先解釋乙個概念,什麼是字符集,嗯,不解釋了,我弄乙個吧 從今以...
對字符集和字元編碼的解析
3 ansi utf 8 utf 16le utf 16be區別 我記得有一次使用emwin的foncnv時,讀入pattern檔案,出現了好多字元無法識別,當時我就納悶了,我用的字型是是這種語言的編碼的,怎麼會無法識別,於是使用windows記事本開啟,檢查了下檔案屬性,發現該檔案是按照utf 8...