比如將資料的資料生成索引檔案,查詢出來的資料以list返回,則
1、定義分詞器,lucene自帶的分詞器為標準分詞器,standardanalyzer,
但我們這裡要講的是中文分詞器--ik_canalyzer ikanalyzer = new ik_canalyzer();
/* 建立索引初始化,執行這些語句將建立或清空c:\\index\\目錄下所有索引 */
file file = new file(path);
if (file.isdirectory())
//中文分詞器
ik_canalyzer ikanalyzer = new ik_canalyzer();
indexwriter writer1 = new indexwriter(path, ikanalyzer, true);
writer1.close();
indexwriter writer2 = new indexwriter(path, ikanalyzer, false);
//這裡的false表示在新建索引檔案時要刪除舊的索引檔案,true表在舊的索引檔案中追加新的索引記錄
for (int i = 0; i < list.size(); i++)
說明:/*
* 建立乙個域articletitle,並往這個域裡面新增內容 "field.store.yes"表示域裡面的內容將被儲存到索引
* "field.index.tokenized"表示域裡面的內容將被索引,以便用來搜尋 lucene給文件的字段設定三個布林變數:
* 索引(indexed), 儲存(stored), 切詞(tokenized) ,
*/
lucene學習筆記2
簡介 doug cutting 於2000年開始的專案 2001年9月後加入apache,lucene是doug cutting的middle name 目前lucene已經是apache的top level的專案,已經不在jakarta下面,同時也有了python,perl,c net,ruby ...
lucene學習筆記2 檢索
對已經建立好的索引庫進行檢索 功能詳細描述 param keyword 搜尋條件 param indexpath 索引路徑 throws ioexception throws parseexception see 類 類 方法 類 成員 public void search string keywo...
Lucene 學習筆記
調整索引索引效能 在乙個典型的索引應用中,程式效能的瓶頸存在於將索引檔案寫入磁碟的過程中。如果你曾經分析過索引過索引應用程式,應該會發現執行程式大部分時間都消耗在操作索引檔案的程式段上,因此我們必要使lucene索引新物件和修改索引檔案時變得更智慧型。當新的document物件新增到lucene的索...