package info.gnuhpc;
/** * @author gnuhpc email: [email protected] blog:
* @date 2010-1-22
* @bugs 不支援多音字處理
*/public class pinyinconv ;
// 二十六個字母區間對應二十七個端點
// gb2312碼漢字區間十進位制表示
private static int table = new int[27];
// 對應首字母區間表
private static char initialtable = ;
// 初始化
static
table[26] = end;// 區間表結尾
}// ------------------------public方法區------------------------
/*** 根據乙個包含漢字的字串返回乙個漢字拼音首字母的字串 最重要的乙個方法,思路如下:乙個個字元讀入、判斷、輸出
*/public static string cn2py(string sourcestr)
} catch (exception e)
return result;
}// ------------------------private方法區------------------------
/*** 輸入字元,得到他的聲母,英文本母返回對應的大寫字母,其他非簡體漢字返回 '0'
* */
private static char char2initial(char ch)
if (gb==end)
return initialtable[i]; // 在碼表區間中,返回首字母
}/**
* 取出漢字的編碼 cn 漢字
*/private static int gbvalue(char ch) catch (exception e)
}public static void main(string args) throws exception
}
提取漢字拼音的首字母
這個能取大部分漢字的首字母,但還不全,有些unicode的漢字是取不到的,要想取到所有漢字的首字母,最好是能做乙個unicode漢字和拼音的對照表,通過對照表查.gb2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個 同時,gb2312收錄了包括拉丁字母 希臘字母 日文平假...
提取漢字拼音的首字母
這個能取大部分漢字的首字母,但還不全,有些unicode的漢字是取不到的,要想取到所有漢字的首字母,最好是能做乙個unicode漢字和拼音的對照表,通過對照表查.gb2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個 同時,gb2312收錄了包括拉丁字母 希臘字母 日文平假...
漢字提取拼音首字母修正
using system using system.collections.generic using system.linq using system.text namespace getcnspell return mystr 把提取的字母變成小寫 需要轉換的字串 轉換結果 public str...