1.準備以下檔案
pangu.dll :分詞功能檔案dll
dict.dct :詞庫
2.搞乙個這樣的局面
初啟化詞庫
public form1()
寫入分詞**
/// /// 分詞
///
///
///
private void btn_participle_click(object sender, eventargs e)
txt_result.text = strs;
}
3.修改詞庫位置pangu.xml
<?xml version="1.0" encoding="utf-8"?>
注意這裡修改為自己的檔案路徑(/***/***/dict)
true
false
false
true
true
true
false
false
false
true
false
false
false
false
false
false
false
false
1532
1153
2111
100customruleexample.dll
customruleexample.pickupversion
0
盤古分詞 多元分詞演算法
中文分詞按照分詞粒度來分,分成 一元分詞,二元分詞,多元分詞和精確分詞等型別。一元分詞就是最簡單的分詞,將所有的中文字元按照單字形式輸出。二元分詞按雙字形式輸出。多元分詞則是將一句話中可能的單詞組合按照一定規則輸出,允許輸出的詞有重疊。精確分詞則是將一句話中最準確的單詞組合輸出,不允許輸出的詞有重疊...
盤古分詞 功能簡介
posted on 2009 08 13 16 50 eaglet 閱讀 8474 編輯收藏 盤古分詞 功能簡介 兩年前我開發了乙個ktdictseg 中文分詞元件,這個元件推出2年來受到很多朋友的喜愛。不過由於我當初開發ktdictseg時比較倉促,底子沒有打好,而且當時對分詞的理解也比較膚 淺,...
盤古分詞小測
編譯了以後,跟蹤了一下 應該是高手寫的,非常的清晰。只是因為沒有文件,時間有限,不能深入研究它的演算法。基本的演算法是這樣的 比如句子 盤古分詞 簡介 盤古分詞 是由eaglet 開發的一款基於字典的中英文分詞元件 先根據 非中文符號,對句子進行切分,如下 盤古分詞 簡介 盤古分詞 是由 eagle...