不知道這個方法是否可行,我簡單做了個測試。貌似還行。把具體的**貼出來分享給大家。
通過paodinganalyzer、ik_analyzer兩個分詞器來實現。具體分出來的無用的字:比如:的、人……,那麼我們可以寫乙個配置檔案。先羅列出一些無用的詞。那麼我們在建立索引的時候。就自動的把這些字給過濾掉。我是這麼實現的。
public static treesetgetexclusivestringlist2(string fieldname, string string);
treesettreesetstring = new treeset();
for (int i = 0; i < analyzer.length; i++)
}} catch (parseexception e)
}for (iteratoriterator = treesetstring.iterator(); iterator.hasnext();)
return treesetstring;
}乙個main方法測試:
public static void main(stringargs) sortbylastmodifyhits(indexsearcher,query,searcherutil.getfilter(contentquery),searcherutil.sort);
sortbylastmodifyhits hits;
synchronized (indexsearcher)
listlist = hits.searcher();
system.out.println("記錄數:" + list.size());
}
Lucene 搜尋方法(多短語搜尋)
短語搜尋解決了短語搜尋的問題,在很多情況下,使用者輸入某個關鍵字時,該關鍵字可以喝多種單字組成短語,例如,使用者輸入乙個 聲 字。它可以和 聲音 宣告 等字組成短語。lucene提供了multiphrasequery來進行多短語搜尋。public static void main string ar...
Lucene 搜尋方法(短語搜尋)
public static void main string args try indexsearcher search new indexsearcher d demo phrasequery query new phrasequery term term1 new term bookname 鋼...
Lucene 搜尋詞分詞
搜尋詞分詞也即對使用者輸入的搜尋詞進行分詞處理,如 民族 信仰 如果不對它進行分詞,可能搜尋不到東西,但單獨搜尋 民族 或 信仰 抑或 民族信仰 都可以搜到東西,故要對其進行分詞。兩種方法 1 空格分詞,字串處理 單個詞項搜尋的 修改後的,空格隔開的多個詞項的搜尋 2 利用ik等中文分詞元件 使用和...