$str = '回';
$bin = pack("c3", ord($str), ord($str), ord($str));
$hex = strtoupper(bin2hex($bin));
//切換文字編碼可檢視gbk編碼
echo
"utf-8編碼: " . $hex . "\n";
$byte1 = ord($str);
$byte2 = ord($str);
$byte3 = ord($str);
$c1 = (($byte1 & 0x0f) << 4) | (($byte2 & 0x3f) >> 2);
$c2 = (($byte2 & 0x03) << 6) | ($byte3 & 0x3f);
$dec = (($c1 & 0x00ff) << 8) | $c2;
echo
"unicode編碼: " . $dec . "\n";
iso 8859-1又稱 latin-1 或西歐語言。是國際標準化組織內iso/iec 8859的第乙個8位字符集。它以ascii為基礎,在空置的0xa0-0xff的範圍內,加入96個字母及符號,藉以供使用附加符號的拉丁字母語言使用。
因為iso-8859-1編碼範圍使用了單位元組內的所有空間,在支援iso-8859-1的系統中傳輸和儲存其他任何編碼的位元組流都不會被拋棄。
for($i=0xb0;$i
<=0xf7;$i++)
for($j=0xa1;$j
<=0xfe;$j++)
echo mb_convert_encoding( pack('cc',$i,$j), "utf-8", "gb2312" );
$a = ' ["' ;
for ($i = 0x4e00; $i
<= 0x9fa5; $i ++)
$a .= '"] ' ;
$b = json_decode($a);
print_r($b[0]);
漢字編碼問題
漢字編碼問題 由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5月...
漢字編碼問題
漢字編碼問題 由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5月...
漢字編碼問題
由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5 月1日實施,通...