unicode:iso(國際標準化組織)為了解決不同語言之間進行文字轉換和處理,為每種語言設定統一的唯一的二進位制標準。(簡稱ucs)。unicode只是規定如何編碼,並沒有規定如何傳輸和儲存編碼。
utf-8及utf系列:相容全世界各種語言字元。utf-8英文只佔乙個位元組,漢字佔3個位元組。
gb2312是對ascii碼的中文擴充套件,使用2個位元組編碼。
gbk是在gb2312基礎上的擴容,相容gb2312,新增了繁體字表示。
utf-8和gbk優缺點:
utf-8具有良好的國際語言相容性。英文本元只佔1個位元組,但是漢字占用了3個位元組並且占用資料庫儲存空間過多。gbk漢字只占用了2個位元組,如果不考慮國際化,使用gbk編碼執行效率會更高。
常見字元編碼
在程式中如果沒有處理好,就有可能出現亂碼問題。下面我們一起為大家介紹在開發中常見的編碼有哪些。在計算機世界裡,任何的文字都是以指定的編碼方式存在的。常見的編碼 iso8856 1 gbk gb2312 unicode utf。iso8856 1 屬於單位元組編碼,最多只能表示0 255的字元範圍,主...
常見字符集和編碼方式
ascii unicode gbk gbk2312 utf 8這些字符集和編碼方式的名詞總是讓我們糾結,那麼他們有什麼區別呢?一般來講,除了utf 8是字符集unicode的編碼方式,其餘的例如ascii gbk等都屬於字符集,它們為每乙個字符集的字元都賦予了乙個值,這個值可以是乙個位元組大小 也可...
常見字元流
字元流的由來 字元流讀取文字位元組資料以後,不直接操作而是先查指定的編碼表,獲取對應的文字,再對該文字進行操作,簡單說字元流就是位元組流 編碼表。所以對於文字的操作優先使用字元流。public class copyfiletest catch exception e finally catch io...