ansj中文分詞應用時,需要自定義詞庫,比如城中村,分詞成城、中、村,需自定義詞庫,有時,也需要過濾單詞。具體**如下,可以結合執行結果看**效果。
1、過濾詞庫
package csc.ansj;
import org.ansj.domain.result;
import org.ansj.recognition.impl.filterrecognition;
import org.ansj.splitword.analysis.toanalysis;
public class ansjwordfilter }/*
* 您好/l,歡迎/v,使用/v,ansj/en,seg/en,深圳/ns,有/v,沒/d,有/v,村/n,這裡/r,有/v,寬頻/nz,嗎/y,ansj/en,中文/nz,分詞/n,在/p,這裡/r,如果/c,你/r,遇到/v,什麼/r,問題/n,都/d,可以/v,聯絡/v,我/r,我/r,一定/d,盡/v,我/r,所/u,能/v,幫助/v,大家/r,ansj/en,seg/en,更/d,快/a,更/d,準/a,更/d,自由/a
*/
2、自定義詞庫,可以設定歧義詞等
package csc.ansj;
import org.ansj.domain.result;
import org.ansj.domain.term;
import org.ansj.library.userdefinelibrary;
import org.ansj.splitword.analysis.toanalysis;
import org.nlpcn.commons.lang.tire.domain.forest;
import org.nlpcn.commons.lang.tire.domain.value;
import org.nlpcn.commons.lang.tire.library.library;
public class ansjworddefine }/*
增加自定義詞庫:不三不四/i,,/w,您好/l,!/w,歡迎/v,使用/v,ansj/en,_,seg/en,,,深圳/ns,有/v,沒/d,有/v,城中村/userdefine,這裡/r,有/v,寬頻/nz,嗎/y,?,(,ansj中文分詞/userdefine,),在/p,這裡/r,如果/c,你/r,遇到/v,什麼/r,問題/n,都/d,可以/v,聯絡/v,我/r,./m,我/r,一定/d,盡/v,我/r,所/u,能/v,./m,幫助/v,大家/r,./m,ansj/en,_,seg/en,更/d,快/a,,,更/d,準/a,,,更/d,自由/a,!
刪除自定義詞庫:不三不四/i,,/w,您好/l,!/w,歡迎/v,使用/v,ansj/en,_,seg/en,,,深圳/ns,有/v,沒/d,有/v,城中/ns,村/n,這裡/r,有/v,寬頻/nz,嗎/y,?,(,ansj/en,中文/nz,分詞/n,),在/p,這裡/r,如果/c,你/r,遇到/v,什麼/r,問題/n,都/d,可以/v,聯絡/v,我/r,./m,我/r,一定/d,盡/v,我/r,所/u,能/v,./m,幫助/v,大家/r,./m,ansj/en,_,seg/en,更/d,快/a,,,更/d,準/a,,,更/d,自由/a,!
我/r,經濟/n,南/f,下/f,車/n,到/v,廣州/ns,./m,中國/ns,經濟/n,南/f,下/f,勢頭/n,迅猛/a,!
我/r,經/p,濟南/n,下車/v,到/v,廣州/ns,./m,中國/ns,經濟/n,南/f,下/f,勢頭/n,迅猛/a,!
*/
自定義中文分詞
基於統計的分詞 序列模型分詞 常用的分詞方法有 基於規則的分詞是通過維護字典的方法,在切分語句時將語句中的字元與詞典進行逐一匹配去劃分詞語,是一種比較機械的分詞方式 my dict 江大橋 研究 生命科學 南京市 研究生 大橋 科學 課題 南京市長 生命 長江大橋 南京 市長 max length ...
開發自定義控制項
學習自定義控制項的開發不僅可以使你開發出更靈活的系統更重要的是它可以使你加深對已有伺服器控制項的理解,得以更靈活的應用。先說一下伺服器控制項的概念吧 所謂伺服器控制項,就是在伺服器上執行,並可以對映到所有瀏覽器支援的標準 html 標記的控制項,在你的web窗體中,凡是包含 runat server...
開發自定義View
view元件就類似於乙個矩形空白區域,剛開始它裡面什麼都沒有,對於android應用的其他ui元件來說,他們都繼承了view元件,然後在view元件的空白區域上繪製外觀.基於這個原理,開發者可以開發出專案定製的元件,當android系統提供的ui不能滿足開發需求時,可以自定義類去繼承view類或者v...