PHP 漢字編碼

2021-08-14 13:12:38 字數 1046 閱讀 2192

$str = '回';

$bin = pack("c3", ord($str), ord($str), ord($str));

$hex = strtoupper(bin2hex($bin));

//切換文字編碼可檢視gbk編碼

echo

"utf-8編碼: " . $hex . "\n";

$byte1 = ord($str);

$byte2 = ord($str);

$byte3 = ord($str);

$c1 = (($byte1 & 0x0f) << 4) | (($byte2 & 0x3f) >> 2);

$c2 = (($byte2 & 0x03) << 6) | ($byte3 & 0x3f);

$dec = (($c1 & 0x00ff) << 8) | $c2;

echo

"unicode編碼: " . $dec . "\n";

iso 8859-1又稱 latin-1 或西歐語言。是國際標準化組織內iso/iec 8859的第乙個8位字符集。它以ascii為基礎,在空置的0xa0-0xff的範圍內,加入96個字母及符號,藉以供使用附加符號的拉丁字母語言使用。

因為iso-8859-1編碼範圍使用了單位元組內的所有空間,在支援iso-8859-1的系統中傳輸和儲存其他任何編碼的位元組流都不會被拋棄。

for($i=0xb0;$i

<=0xf7;$i++)

for($j=0xa1;$j

<=0xfe;$j++)

echo mb_convert_encoding( pack('cc',$i,$j), "utf-8", "gb2312" );

$a = ' ["' ;

for ($i = 0x4e00; $i

<= 0x9fa5; $i ++)

$a .= '"] ' ;

$b = json_decode($a);

print_r($b[0]);

漢字編碼問題

漢字編碼問題 由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5月...

漢字編碼問題

漢字編碼問題 由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5月...

漢字編碼問題

由於常常要和漢字處理打交道,因此,我常常受到漢字編碼問題的困擾。在不斷的打擊與堅持中,也積累了一點漢字編碼方面的經驗,想和大家一起分享。一 漢字編碼的種類 漢字編碼中現在主要用到的有三類,包括gbk,gb2312和big5。1 gb2312又稱國標碼,由國家標準總局發布,1981年5 月1日實施,通...