今天開始研究lucene,有關lucene的簡單介紹我就不做介紹了,直接google一下就了解了,我根據的是《lucene in action》這本書來學習的。學習還在進行,把學習過程中的一些經驗和體會寫出來供和我一樣的新手參考。
1:這本書對應的lucene版本。
我一開始用最新的lucene-2.4.1,結果根據書中的例子出現了很多不一致的情況,後來換成了lucene-1.4.3就可以用了。
2:建立索引的 indexer 類中,向document中設定的filename和contents,乙個是目錄,乙個是內容或者是檔案,在searcher類中檢索索引的時候 query query = queryparser.parse(q , "[b][color=red]contentsssss[/color][/b]", new standardanalyzer()); 紅色部分一定要和 indexer 類中所設定的保持一致。
附件中是第2點中的兩個類檔案。
lucene學習筆記 1
indexing主要使用的類 indexwriter 較核心的類,index檔案由它建立 directory 乙個抽象的標示index檔案位址的類,有兩個實現 fsdirectory和ramdirectory,前者是基於檔案系統,後者使用記憶體 analyzer 檔案的分析器 聽起來彆扭,還是叫an...
lucene學習筆記 1
doug cutting 於2000年開始的專案 2001年9月後加入apache,lucene是doug cutting的middle name 目前lucene已經是apache的top level的專案,已經不在jakarta下面,同時也有了python,perl,c net,ruby 進行中...
Lucene學習筆記 1
lucene學習筆記 可以搜尋文字檔案,理論上可以搜尋任何型別的資料。只要先把資料轉化為文字,就可以對資料進行索引和搜尋。使用了反向索引的機制,維護乙個詞 短語的表,對於每個詞和短語都有乙個鍊錶描述有哪些文件包含這個詞和短語。這樣使用者輸入查詢條件的時候,搜尋引擎先對輸入的條件分詞,分成詞和短語,然...