field.store.yes或者no(儲存域選項)
yes:將會儲存域值,原始字串的值會儲存在索引中,以此可以進行相應的恢復操作,對於主鍵,標題可以是這種方式儲存
no:不會儲存域值,通常與index.anaylized合起來使用,索引一些如文章正文等不需要恢復的文件
,此時內容無法完全還原(doc.get)
field.index(索引選項)
index.analyzed:進行分詞和索引,適用於標題、內容等
index.not_analyzed:進行索引,但是不進行分詞,如果身份證號,姓名,id等,適用於精確搜尋
index.analyzed_not_norms:進行分詞但是不儲存norms資訊,這個norms中包括了建立索引的時間和權值等資訊
index.not_analyzed_not_norms:即不進行分詞也不儲存norms資訊
index.no:不進行索引
最佳實踐:
索引選項
儲存選項
not_analyzed_not_norms yes 識別符號(主鍵、檔名),**號碼,身份證號,姓名,日期
anaylzed yes 文件標題和摘要
anaylzed no 文件正文
no yes 文件型別,資料庫主鍵(不進行索引)
not_analyzed no 隱藏關鍵字
索引檔案的初步認識:
_0.fdt
_0.fdx
---儲存域的值---
_0.fnm
---儲存域的名稱---
_0.frq
---分詞出現的頻率---
_0.nrm
---儲存評分資訊---
_0.prx
---位偏移量---
_0.tii
_0.tis
---索引資訊---
文件和域的概念很重要
文件相當於表中的每一條記錄,域相當於表中每乙個字段
3 學習Lucene3 5之索引建立 域選項
field string name,string value,field.store store,field.index index 方法解析 引數一 key 引數二 value 引數三 是否儲存到硬碟 儲存域選項 1.field.store.yes 表示把這個域中的內容完全儲存到檔案中,方便進行文...
Lucene 建立索引
public class indexer public static string indexdir d luceneindex public static void main string args system.out.println 被索引的文件個數 writer.numdocs catch ...
Lucene之建立索引
lucene用來建搜尋引擎要解決四個問題 抓取資料 解析資料 建立索引和執行搜尋。首先為每一篇文章新增標題 內容 寫作時間等資訊,從而寫好每一篇文章,然後將每一篇文章新增到書裡面去。這樣問及就寫好了。建立索引的過程如下 建立索引器indexwriter,這相當於一本書的框架。建立文件物件docmen...