PHP獲取漢字unicode碼的通用函式

2021-08-29 15:06:39 字數 549 閱讀 9311

/**

* 把乙個漢字轉為unicode的通用函式,不依賴任何庫,和別的自定義函式,但有條件

* 條件:本檔案以及函式的輸入引數應該用utf-8編碼,不然要加函式轉換

* 其實亦可輕易編寫反向轉換的函式,甚至不侷限於漢字,奇怪為什麼php沒有現成函式

* @author xieye

* * @param $word 必須是乙個漢字,或代表漢字的乙個陣列(用str_split切割過)

* @return 乙個十進位制unicode碼,如4f60,代表漢字 「你」

*/function getunicodefromoneutf8($word) (.).(.).(.)$/','$1$2$3', $bin_str);

//此時, $bin_str應類似0100111101100000,如果是漢字"你"

return bindec($bin_str); //返回類似20320, 漢字"你"

//return dechex(bindec($bin_str)); //如想返回十六進製制4f60,用這句

}

JS 漢字與Unicode碼的相互轉化

js檔案中,有些變數的值可能會含有漢字,畫面引入js以後,有可能會因為字符集的原因,把裡面的漢字都變成亂碼。後來發現網上的一些js裡會把變數中的漢字都表示成 u 開頭的16進製制編碼,這樣應該可以解決上面的問題。最近有時間在網上查詢了一下實現方式,一種比較大眾化的 function tounicod...

漢字unicode編碼範圍

gb2312編碼 1981年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。big5編碼 台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,1984年實施。gbk編碼 1995年12月發布的漢字編碼國家...

漢字unicode編碼範圍

gb2312編碼 1981年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。big5編碼 台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,1984年實施。gbk編碼 1995年12月發布的漢字編碼國家...