由於專案上用到了pinyin4j這個開源庫,我就很好奇它的實現原理,就看了一下它的**。原來它就是相當於建立了乙個hashset,把unicode的編碼和漢語拼音對應了,如下:
3007 (ling2)
4e00 (yi1)
4e01 (ding1,zheng1)
4e02 (kao3)
4e03 (qi1)
4e04 (shang4,shang3)
4e05 (xia4)
4e06 (none0)
4e07 (wan4,mo4)
4e08 (zhang4)
4e09 (san1)
4e0a (shang4,shang3)
4e0b (xia4)
4e0c (ji1)
4e0d (bu4,bu2,fou3)
4e0e (yu3,yu4,yu2)
4e0f (mian3)
4e10 (gai4)
4e11 (chou3)
4e12 (chou3)
4e13 (zhuan1)
4e14 (qie3,ju1)
拼音工具 pinyin4j
com.belerweb pinyin4j 2.5.0 方法 描述tohanyupinyinstringarray char ch,hanyupinyinoutputformat outputformat 漢語字元轉漢語拼音,outputformat為輸出格式,選填 totongyongpinyin...
pinyin4j 漢語轉拼音
pinyin4j提供了漢語轉拼音的乙個開源庫,支援多種拼音系統 漢語拼音 通用拼音 威氏拼音 注音二式 雅禮 國語羅馬字。但當前版本貌似不支援根據上下文來識別多音字的功能。寫個小例子試了一下,多音字簡單的取第乙個讀音 package edu.jlu.fuliang import net.source...
Java漢字轉拼音pinyin4j
package com.joyce.pinyin4j import net.sourceforge.pinyin4j.pinyinhelper import net.sourceforge.pinyin4j.format.hanyupinyincasetype import net.sourcefo...