/*** 把乙個漢字轉為unicode的通用函式,不依賴任何庫,和別的自定義函式,但有條件
* 條件:本檔案以及函式的輸入引數應該用utf-8編碼,不然要加函式轉換
* 其實亦可輕易編寫反向轉換的函式,甚至不侷限於漢字,奇怪為什麼php沒有現成函式
* @author xieye
* * @param $word 必須是乙個漢字,或代表漢字的乙個陣列(用str_split切割過)
* @return 乙個十進位制unicode碼,如4f60,代表漢字 「你」
*/function getunicodefromoneutf8($word) (.).(.).(.)$/','$1$2$3', $bin_str);
//此時, $bin_str應類似0100111101100000,如果是漢字"你"
return bindec($bin_str); //返回類似20320, 漢字"你"
//return dechex(bindec($bin_str)); //如想返回十六進製制4f60,用這句
}
JS 漢字與Unicode碼的相互轉化
js檔案中,有些變數的值可能會含有漢字,畫面引入js以後,有可能會因為字符集的原因,把裡面的漢字都變成亂碼。後來發現網上的一些js裡會把變數中的漢字都表示成 u 開頭的16進製制編碼,這樣應該可以解決上面的問題。最近有時間在網上查詢了一下實現方式,一種比較大眾化的 function tounicod...
漢字unicode編碼範圍
gb2312編碼 1981年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。big5編碼 台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,1984年實施。gbk編碼 1995年12月發布的漢字編碼國家...
漢字unicode編碼範圍
gb2312編碼 1981年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。big5編碼 台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,1984年實施。gbk編碼 1995年12月發布的漢字編碼國家...