1,
建立索引器
indexwriter 2,
建立文件物件
document 3,
建立資訊字段物件
field 4,
將field
新增到document
裡面5,
將document
新增到indexwriter 6,
關閉indexwriter
field field=new field(field
名稱,field內容,
儲存方式
,索引方式)
引數的含義:
field
名稱:就是
field
起的名字,類似資料表的欄位名稱
field
內容:field
的內容,類似資料表的字段內容
儲存方式:
不儲存field.store.no
索引太大的情況
,不利於效率,如正文
完全儲存
field.store.yes
索引不太大的情況,如標題
壓縮儲存
field.store.compress
索引內容較多的情況,如正文
索引方式:
索引方式
理解應用
field.index.no
不索引只需要跟著搜尋結果顯示出來卻不需要按照其內容進行搜尋
field.index.tokenized
索引並分詞
適合模糊搜尋,如標題,全文
field.index.no_norms
索引但不分析
field.index.un_tokenized
索引但不分詞
適合精確搜尋
document doc=new document()
建立乙個不含有任何
field
的空的document.
新增
field
doc.add(field);
indexwriter writer=new indexwriter(
存放索引的路徑,分析器的例項);
indexwriter writer=new indexwriter(「myindex」,new cjkanalyzer());
新增
document
writer.adddocument(doc);
關閉索引器
writer.close();
簡單索引:
******indexer
package example.example;
import org.apache.lucene.document.document;
import org.apache.lucene.document.field;
import org.apache.lucene.index.indexwriter;
import org.apache.lucene.analysis.standard.standardanalyzer;
public class ******indexer
}
Lucene之建立索引
lucene用來建搜尋引擎要解決四個問題 抓取資料 解析資料 建立索引和執行搜尋。首先為每一篇文章新增標題 內容 寫作時間等資訊,從而寫好每一篇文章,然後將每一篇文章新增到書裡面去。這樣問及就寫好了。建立索引的過程如下 建立索引器indexwriter,這相當於一本書的框架。建立文件物件docmen...
Lucene之索引建立入門級例項
是否對域的內容進行分詞處理,前提是我們要對域的內容進行查詢 將field分析後的詞或整個field值進行索引,只有索引方可搜尋到 比如 商品名稱 商品簡介分析後進行索引,訂單號 身份證號不用分析但也要索引,這些將來都要作為查詢條件。將field值儲存在文件中,儲存在文件中的field才可以從docu...
Lucene 建立索引
public class indexer public static string indexdir d luceneindex public static void main string args system.out.println 被索引的文件個數 writer.numdocs catch ...