php隨機生成漢字實現方法

2022-09-16 00:42:08 字數 1318 閱讀 3451

gb 2312-80 是中國國家標準簡體中文字符集,全稱《資訊交換用漢字編碼字符集·基本集》,由中國國家標準總局發布,2023年5月1日實施。gb2312 編碼通行於中國大陸;新加坡等地也採用此編碼。中國大陸幾乎所有的中文系統和國際化的軟體都支援 gb 2312。

gb2312 標準共收錄 6763 個漢字,其中一級漢字 3755 個,二級漢字 3008 個;同時收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內的 682 個字元。gb2312 的出現,基本滿足了漢字的計算機處理需要,它所收錄的漢字已經覆蓋中國大陸 99.75% 的使用頻率。對於人名、古漢語等方面出現的罕用字,gb2312 不能處理,這導致了後來 gbk 及 gb18030 漢字字符集的出現。

gb2312 中對所收漢字進行了「分割槽」處理,每區含有 94 個漢字/符號。這種表示方式也稱為區位碼。

10 - 15 區及 88 - 94 區則未有編碼。舉例來說,「啊」字是 gb2312 之中的第乙個漢字,它的區位碼就是 1601。

每個漢字及符號以兩個位元組來表示。第乙個位元組稱為「高位位元組」,第二個位元組稱為「低位位元組」。「高位位元組」使用了 0xa1 - 0xf7(把 01 - 87 區的區號加上 0xa0),「低位位元組」使用了 0xa1 - 0xfe(把 01 - 94 位的位號加上 0xa0)。 由於一級漢字從 16 區起始,漢字區的「高位位元組」的範圍是 0xb0 - 0xf7,「低位位元組」的範圍是 0xa1 - 0xfe,占用的碼位是 72 * 94 = 6768。其中有 5 個空位是 d7fa - d7fe。例如「啊」字在大多數程式中,會以兩個位元組,0xb0(第乙個位元組)0xa1(第二個位元組)儲存。(與區位碼對比:0xb0 = 0xa0 + 16, 0xa1 = 0xa0 + 1)。

國家標準 gb 18030-2005《資訊科技 中文編碼字符集》,是中華人民共和國現時最新的內碼字集,與 gb 2312-1980 完全相容,與 gbk 基本相容,支援 gb 13000 及 unicode 的全部統一漢字,共收錄漢字 70244 個。現行版本為國家質量監督檢驗總局和中國國家標準化管理委員會於2023年11月8日發布,2023年5月1日實施,為在中國境內所有軟體產品支援的強制標準。12

3456

78910

11functiongetchar($num)// $num為生成漢字的數量

return$b;

}

隨機生成漢字!

var aa string bb array 1.95 of byte cc array 1.95 of byte i,j integer begin i a0 for j 1 to 95 do begin bb j i cc j i inc i end randomize for i 1 to 3...

生成隨機漢字

using system using system.text 此函式在漢字編碼範圍內隨機建立含兩個元素的十六進製制位元組陣列,每個位元組陣列代表乙個漢字,並將 四個位元組陣列儲存在object陣列中。引數 strlength,代表需要產生的漢字個數 public static object crea...

Java 生成隨機漢字名稱

方法一 class randomhan 這種會有繁體字。class randomhan han的使用可以自己設定很多預選漢字,然後通過中文轉unicode 轉碼 或者直接設定 乙個string 漢字陣列,然後隨機取字。public string getchinese long seed throws...