常見字元編碼

2022-10-06 15:06:19 字數 726 閱讀 6634

在程式中如果沒有處理好,就有可能出現亂碼問題。下面我們一起為大家介紹在開發中常見的編碼有哪些。

在計算機世界裡,任何的文字都是以指定的編碼方式存在的。

常見的編碼:iso8856-1、gbk/gb2312、unicode、utf。

iso8856-1:

屬於單位元組編碼,最多只能表示0-255的字元範圍,主要在英文上應用

gbk/gb2312:

中文的國際編碼,專門用來表示漢子,是雙位元組編碼

unicode:

j**a中用的就是此編碼方式,也是最標準的一種編碼,使用16進製表示的編碼,但此編碼不相容iso8856-1

utf:

由於unicode不相容iso8856-1,而且容易占用更多空間,而且對於英文也需要兩個字元編碼表示,這樣使得unicode不便於傳輸和儲存,所以產生了utf編碼,此編碼相容了iso8856-1,也可以用來表示所有語言祝福,不過uft是不定長編碼,每個字元的長度從1-6個位元組不等,一般在中文網頁中使用此編碼,因為這樣可以節省空間。

造成亂碼的根本原因:

1、程式中使用的編碼與本機編碼不一致

2、網路中,客戶端與服務端編碼不統一

常見字元編碼有關知識

unicode iso 國際標準化組織 為了解決不同語言之間進行文字轉換和處理,為每種語言設定統一的唯一的二進位制標準。簡稱ucs unicode只是規定如何編碼,並沒有規定如何傳輸和儲存編碼。utf 8及utf系列 相容全世界各種語言字元。utf 8英文只佔乙個位元組,漢字佔3個位元組。gb231...

常見字符集和編碼方式

ascii unicode gbk gbk2312 utf 8這些字符集和編碼方式的名詞總是讓我們糾結,那麼他們有什麼區別呢?一般來講,除了utf 8是字符集unicode的編碼方式,其餘的例如ascii gbk等都屬於字符集,它們為每乙個字符集的字元都賦予了乙個值,這個值可以是乙個位元組大小 也可...

常見字元流

字元流的由來 字元流讀取文字位元組資料以後,不直接操作而是先查指定的編碼表,獲取對應的文字,再對該文字進行操作,簡單說字元流就是位元組流 編碼表。所以對於文字的操作優先使用字元流。public class copyfiletest catch exception e finally catch io...