中國的unicode碼是4e2d56fd
gb2312碼是d6d0b9fa
以後遇到這種問題用中國兩個字試一下
public class testcharactorencoding
system.out.println(s);
string(s.getbytes("iso8859-1"),"gb2312"));//如果得到的s是ios8859-1的字串,可以先編碼再以gb2312解碼,就能得到中文字元
//如果unicode的字串按iso8859-1編碼成位元組陣列,不能反向解碼成字串,因為「中」的unicode佔兩個位元組,按iso8859-1編碼只能生成乙個位元組,丟掉了一些資訊。
break;
default:
b[pos++] = (byte)ch;
}} }
}
常見字元編碼有關知識
unicode iso 國際標準化組織 為了解決不同語言之間進行文字轉換和處理,為每種語言設定統一的唯一的二進位制標準。簡稱ucs unicode只是規定如何編碼,並沒有規定如何傳輸和儲存編碼。utf 8及utf系列 相容全世界各種語言字元。utf 8英文只佔乙個位元組,漢字佔3個位元組。gb231...
有關XML的編碼問題
由於xml文件中可以包含外語字母,如挪威語 或法語 因此要讓你的xml分解器理解這些字母,就應該把xml文件儲存成unicode 統一的字元編碼標準 1 windows 95 98 記事本 windows 95 98 記事本不能將檔案儲存成unicode 格式。你可以用notepad 編輯和儲存包含...
記錄幾個有關LINUX IPTABLES的文章
基於 linux 平台的 libpcap 源 分析 過濾演算法 bpf 搜尋 algorithms for routing lookups and nf hipac演算法 linux netfilter實現機制和擴充套件技術 iptables規則集優化的設計與實現 netfilter包過濾演算法的分...