Lucene實戰閱讀筆記1

2021-06-11 18:18:46 字數 679 閱讀 5518

solr lucene子專案,支援從關聯式資料庫和xml文件中提取原始資料,以及能夠通過整合tika來處理複雜文件。

nutch lucene子專案,它包含大規模的爬蟲工具,能夠抓取和分辨web站點資料。

heritrix 開源的internet文件搜尋程式。

drods lucene子專案,目前正處於籌備狀態。

aperture 它支援從web站點、檔案系統和右鍵中抓取,並解析和索引其中的文字資料。

谷歌企業連線管理工具 提供大量針對非web形式的內容連線方案。

dbsight,hibernate search,lusql,compass,oracle/lucene整合專案,可以無縫連線內容獲取步驟和文件建立步驟就能輕易地對資料表進行索引和搜尋操作。

lucene並沒有提供有關搜尋範圍的模組,但solr和nutch都提供了對索引拆分和複製的支援,katta開源專案也提供這個功能。elastic search提供了另一種解決方案。

solr提供了完整搜尋程式的大部分組建,作為伺服器程式執行並提供乙個管理介面(包含兩種搜尋模式),提供索引資料庫內容的能力,提供類似於分組導航的終端功能,這些功能都是基於lucene構建的。

另外,一些web程式框架頁提供了基於lucene的搜尋外掛程式。例如,有乙個適用於grails開源專案的搜尋外掛程式,該外掛程式基於compass搜尋引擎框架,而後者是採用lucene作為後台的。

《kotlin實戰》閱讀筆記(1)

可變和不可變類似於c 中 const 對於指標的限定,而且是頂層const 或者說指正常量。然後變數是可以進行自動型別推斷的,類似於auto,前提是進行了初始化 同時對於val 來說,如果編譯器可以保證val只進行唯一一次初始化,則可以根據條件初始化成不同的值。val message string ...

lucene學習筆記 1

indexing主要使用的類 indexwriter 較核心的類,index檔案由它建立 directory 乙個抽象的標示index檔案位址的類,有兩個實現 fsdirectory和ramdirectory,前者是基於檔案系統,後者使用記憶體 analyzer 檔案的分析器 聽起來彆扭,還是叫an...

Lucene 學習筆記 1

今天開始研究lucene,有關lucene的簡單介紹我就不做介紹了,直接google一下就了解了,我根據的是 lucene in action 這本書來學習的。學習還在進行,把學習過程中的一些經驗和體會寫出來供和我一樣的新手參考。1 這本書對應的lucene版本。我一開始用最新的lucene 2.4...