* unicode的編碼形式與對應的字串相互轉換
* @author 白幹濤
*/publicclassunicodeutils ";//所有的引號和反斜槓前面都要加乙個反斜槓
system.out.println(unicodetostring(unicodemessages) + "\n")
;// }
private
static
void test1()
private
static
void test2()
system.out.println("\n"
+ unicode);//同樣,這裡也不會解碼。【\u0061\u0041\u0031\u003a\u4e2d\u56fd】 }
/*** 將【字元】轉換成unicode碼形式【unicode用兩個位元組來編碼乙個字元,2^16=16^4,所以可以用四個16進製制數表示】
*/public
static string tounicodestring(char
c)
return sb.tostring();
} /**
* 將【字串】轉換成unicode碼形式
*/public
static string tounicodestring(string string)
return sb.tostring();
} /**
* 將unicode編碼解析成字串形式
*/public
static string unicodetostring(string ustring) }
return sb.tostring();
} }
/*** 字串編碼格式轉換
* @author 白幹濤
*/publicclasscodeutils
/*** gbk轉utf8
* @param gbk gbk編碼格式的字串
* @return utf8編碼格式的字串
*/public
static string gbk2utf8(string gbk)
/*** utf8轉gbk
* @param utf utf8編碼格式的字串
* @return gbk編碼格式的字串
*/public
static string utf2gbk(string utf)
/***gbk轉unicode
* @param str gbk編碼格式的字串
* @return string unicode編碼格式的字串
*/public
static string gbk2unicode(string str)
+ integer.tohexstring((int)
chr1));
}return result.tostring();
}/**
*unicode轉gbk
* @param datastr unicode編碼格式的字串
* @return string gbk編碼格式的字串
*/public
static string unicode2gbk(string datastr)
string charstr = "";
charstr = datastr.substring(index + 2, index + 6);
char letter = (char) integer.parseint(
charstr, 16);
index += 6;
}return buffer.tostring();
}/**
* utf8轉unicode
* @param instr utf8編碼格式的字串
* @return unicode編碼格式的字串
*/public
static string utf2unicode(string instr)
else
if(ub == unicodeblock.halfwidth_and_fullwidth_forms)
else
}return sb.tostring();
}/**
*unicode轉utf8
* @param thestring unicode編碼格式的字串
* @return string utf8編碼格式的字串
*/public
static string unicode2utf8(string thestring)}}
else}}
return outbuffer.tostring();}}
null
碼表 Unicode GBK UTF8 示例
unicode的編碼形式與對應的字串相互轉換 author 白幹濤 publicclassunicodeutils 所有的引號和反斜槓前面都要加乙個反斜槓 system.out.println unicodetostring unicodemessages n private static void...
ASCII 碼表對照
ascii碼表 ascii碼大致可以分作三部分組成。第一部分是 ascii非列印控制字元 第二部分是 ascii列印字元 第三部分是 擴充套件ascii列印字元 ascii碼表 ascii值 控制字元 ascii值 控制字元 ascii值 控制字元 ascii值 控制字元 0nul 32 space...
常用ASCII碼表
十進位制 縮寫可以顯示的表示法 名稱 意義 0nul 空字元 null 1soh 標題開始 2stx 本文開始 3etx 本文結束 4eot 傳輸結束 5enq 請求 6ack 確認回應 7bel 響鈴 8bs 退格 9ht 水平定位符號 10lf 換行鍵 11vt 垂直定位符號 12ff 換頁鍵 ...