Lucene基礎篇總結

2021-05-24 05:39:26 字數 1135 閱讀 6731

到此為止,以前所發表的關於

lucene

的文章就把

lucene

的基礎篇包括玩完了。

從《搜尋引擎》開始,我們對搜尋引擎和

lucene

有了初步的認識和一定了解,「這些內容,對於幫助我們從乙個資訊檢索系統的門外漢變成乙個局內人有著重大的意義」(

摘自《開發自己的搜尋引擎》——邱哲

符滔滔編著——人民郵電出版社

)。後來,在《建立簡單的資訊檢索系統》中,通過對乙個文件的處理,像我們演示了如何使用

lucene

從文件檢索關鍵字。(預處理、建立索引、構建查詢物件、在索引中查詢)。除此之外,還用了

string

的字元匹配和

lucene

的查詢做了比較,發現

lucene

的查詢效率的高超。

再來,我們在《索引》《索引建立全過程》《剖析索引的建立》等等文章中,讓大家清清楚楚的看到建立索引的全過程,並且了解了

indexwriter

、documentwriter

、indexreader

這幾個最為關鍵的元件。

這些知識的學習都為我們接下來更深刻的走入

lucene

打下了基礎。此外

lucene

還具有許多細節,需要注意的是細節對於乙個開發者來說,並非一定要關注,但開發者一定要了解

lucene

的索引機理和各種效能引數的配置。

接下來,通過《

lucene

查詢》和《奇妙的

queryparser

》的學習,我們學會了熟練掌握

lucene

的各種query

物件。我們能夠進行人性化的搜尋。

最後由闡述了與

lucene

的相關話題,

pdfbox

和xpdf

等技術。想必和

lucene

結合起來使用會更加強大。

lucene

還有很多東西要講,並不能一口吃成胖子,不過我們堅持這樣做下去,一定能和

lucene

來一次親密的接觸的。

祝大家新年快樂,萬事如意!!!過年啦

…………………..!!!

初學lucene 菜鳥篇

首先了解一下什麼是全文檢索 舉個例子 比如我們在乙個磁碟上有很多檔案,而有一天我想通過關鍵字搜尋出包含的檔案。如 我們輸入lucene,所有內容含有lucene的檔案都會被檢查出來,這就是全文檢索 鄙人的個人定義 其實,通過上述的例子,我們很容易會想到,關鍵字與這些檔案需要建立乙個相關對映。在luc...

Lucene簡介 理論篇

lucene 是乙個軟體程式的庫或者說是乙個工具套件,而不是乙個完全的具有搜尋特性的應用程式。它關注於自己的文字檢索和搜尋功能,提供api來完成商業中所涉及到的搜尋功能。在搜尋功能中,lucene的功能如圖深色框所示。外圍的功能組要主要由一些比較流行的框架來實現,比如solr elasticsear...

lucene 高階搜尋篇

一,概念 1 lucene相關排序流程 2 lucene相關類 query類 乙個抽象類,lucene檢索結果最終評分的總控制中心。其它評分有關的類和物件都是由 query類來管理和生產。weight類介面 定義 query權重計算的乙個實現介面,可以被重用。weight類可以用來生成 scorer...