本機預設使用字符集,可以使用chcp
命令檢視:
活動**頁936表示字符集為gb2312。
前面已經詳細講述了位元組編碼和字元解碼,下面看具體例子:
測試����
測試測試
??utf-8
string str2 = new string(str.getbytes(「utf-8」)); 預設使用檔案的編碼進行解碼。
string str3 = new string(str.getbytes(「gbk」));使用gbk將其轉換為位元組,再使用預設編碼方式進行解碼。
string str4 = new string(str.getbytes(「utf-8」),「utf-8」);
都可以正確解析!
string str5 = new string(str.getbytes(「gbk」),「gbk」);
可正確解析。
string str6 = new string(str.getbytes(「iso-8859-1」),「iso-8859-1」);
不可正確解析,因為iso-8859-1不支援中文。
java 中String編碼和byte 解碼 總結
1 inputstreamreader 是位元組流通向字元流的橋梁 它使用指定的 charset 讀取位元組並將其解碼為字元 inputstreamreader inputstream in,string charsetname 2 outputstreamwriter 是字元流通向位元組流的橋梁 ...
編碼和解碼
str是以位元組表示的文字,unicode是以字元表示的文字。您可以將文字從位元組解碼為unicode,並使用某種編碼將unicode編碼為位元組。即 str str unicode str encode 編碼,程式設計不可識別的unicode decode 解碼,恢復成字串和中文等def test...
編碼和解碼
1 編碼 encode 編碼方式 拿到明文編碼後對應的位元組 ascii 碼 不支援中文,支援英文 數字 字母 符號 gbk 國標 支援中文 支援英文 數字 字母 符號 英文用16位 中文用16位 unicode 萬國碼 支中文 英文 數字 字母 英文32位 中文32位 utf 8 長度可變的萬國碼...