郵件的標題為:測試家意專家
取到的頭資訊為:subject:=?gb2312?b?pz+80tlip7zs?=
通過getsubject方法取到的字串繁體亂碼:類似於??家意?家
頭資訊的含義為:subject:=?chartset?encoding?word?=,即上文中的標題是gb2312編碼,base64加密
繁體亂碼的原因是:gb2312不支援繁體,但標題中就是有繁體。
string str=
"測試家意專家"
;string test=base64encoder.
encode
(str.
getbytes
("gb2312"))
;//"pz+80tlip7zs"
//測試:先解密,再用gbk編碼
string result1=
newstring
(base64decoder.
decodebuffer
(test)
,"gbk");
// result1 : ??家意?家
ascii碼63 就是 「?」,也就是說繁體字在被gb2312解碼時,因為無法識別,全部設為?,無法被還原。
所以雖然頭資訊中寫的gb2312,實際可能用的是gbk
//1.測試2
把mail包中的 getsubject()及相關的方法cv複製下來,然後加個判斷如果編碼是gb2312就換成gbk。 gb2312學習筆記
1,gb 2312中對所收漢字進行了 分割槽 處理,每區含有94個漢字 符號。01 09區為特殊符號。16 55區為一級漢字,按拼音排序。56 87區為二級漢字,按部首 筆畫排序。10 15區及88 94區則未有編碼。舉例來說,啊 字是gb2312之中的第乙個漢字,它的區位碼就是1601。2,在使用...
GB2312編碼範圍
gb2312編碼範圍 a1a1 fefe,其中漢字編碼範圍 b0a1 f7fe。gb2312編碼是第乙個漢字編碼國家標準,由中國國家標準總局1980年發布,1981年5月1日開始使用。gb2312編碼共收錄漢字6763個,其中一級漢字3755個,二級漢字3008個。同時,gb2312編碼收錄了包括拉...
列舉GB2312中的漢字
build gcc g gb.c o gb.exe characters in gb2312 are divided into codepoints,with each codepoint comprising 94 glyphs characters.the codepoints can be d...