在專案中需要實現使用者輸入拼音就能查詢到漢字的功能,在網上搜尋了一下漢字和對應的拼音的庫,發現很少,找到的幾個收錄的漢字也就幾千個常用字。所以自己收集整理了乙個。希望對大家有幫助。
每行記錄是乙個漢字,同音字有幾個音就有幾行。
每行格式說明:漢字,拼音,聲母,韻母,unicode編碼(16進製制),頻率
關於最後一列的頻率有3個值,0代表一般字,1代表常用字,2代表最常用的百家姓。
這個值主要是針對多音字,因為有的讀音不常見,所以用這個值來決定漢字具體選用的讀音。
當然,這最後一列是我後期根據專案的需要自己定義的頻率值,因為我們這個專案是錄入拼音查詢姓名的,所以把百家姓的頻率值設定的最高,那樣在對使用者姓名進行拼音編碼時吻合的概率就高一些。
關於聲母和韻母有些字不一定正確,例如「安」,這個字的拼音是「an」,它沒有聲母,但是我也把它的聲母定義為「a「,因為輸入拼音的時候通常使用者輸入的就是聲母,例如「王安石」錄入的是「was",這個也是根據實際的專案需求這樣做的。
總之,這個對照庫的「漢字」「拼音」「unicode編碼」3列是肯定正確的,「聲母」「韻母」和「頻率」是根據實際需要定義的。
不也可以根據自己專案的需要來重新處理或定義它們。
這個庫是直接從sql server2000中匯出的txt檔案,在使用時也可以重新導回到sql
漢字拼音對照表
首先 利用系統自帶軟體生成漢字和拼音的對照表 然後 切割文字內容 匹配正規表示式在 這個類裡增加下面2個方法public void testfilerw p matcher m stringbuffer sbtemp new stringbuffer for int i 0 i charactpy....
漢字拼音資料庫
前些天,一位同事需要在網頁上根據拼音縮寫代表的漢字進行對資料庫的查詢。今天閒著沒事,就專門從網上找了一些拼音方面的資源,提取 簡化放到了資料庫裡。並根據這個拼音資料庫,做了乙個簡單的網頁。n久沒寫web了,今天寫的時候,感到手很生,不過還好,還沒全忘記,寫web的感覺還在。先看看我的成果吧 輸入拼音...
漢字轉拼音
region 漢字轉拼音 漢字轉拼音類 用法 crazycoderpinyin.covent 漢字 長度 using system.text.regularexpressions build date 20030610 public class crazycoderpinyin 定義陣列 priva...