Springboot Lucene全文搜尋引擎

2021-09-16 13:24:04 字數 1308 閱讀 2455

引入核心依賴

lucene核心及其依賴

org.apache.lucene

lucene-core

7.6.0

org.apache.lucene

lucene-queryparser

7.6.0

org.apache.lucene

lucene-analyzers-common

7.6.0

中文分詞器

org.apache.lucene

lucene-analyzers-smartcn

7.6.0

檔案io操作

commons-io

commons-io

2.6

原始文件

原始文件是指要索引和搜尋的內容。原始內容包括網際網路上的網頁、資料庫中的資料、磁碟上的檔案等。

用來測試的原始文件

field分析

建立索引

對所有文件分析得出的語彙單元進行索引,索引的目的是為了搜尋,最終要實現只搜尋被索引的語彙單元從而找到document(文件)。

索引庫建立查詢

使用者輸入查詢關鍵字執行搜尋之前需要先構建乙個查詢物件,查詢物件中可以指定查詢要搜尋的field文件域、查詢關鍵字等,查詢物件會生成具體的查詢語法,

例如:語法 「filename:lucene」表示要搜尋field域的內容為「lucene」的文件

**示例(建立索引)

//建立索引

@test

public void lucenecreateindex() throws exception

//關閉indexwriter

indexwriter.close();

}

**示例(查詢索引)

@test

public void searchindex() throws ioexception

indexreader.close();

}

個人部落格:

sql server 全文搜尋(全文索引)

參考 按照鏈結方式建立全文索引 使用 全文查詢使用全文謂詞 contains 和 freetext 以及全文函式 containstable 和 freetexttable 它們支援複雜的 transact sql 語法,這種語法支援各種形式的查詢詞。若要編寫全文查詢,必須了解何時以及如何使用這些謂...

全文索引搜尋whoosh

whoosh是python中解決索引查詢的模組,在討論索引查詢的文章已經對有關索引查詢進行了闡述,此處詳細說明whoosh模組的應用。這裡有詳細內容 鏈結被被閹割!whoosh在應用上劃分三個步驟 建立索引和模式物件 寫入索引檔案搜尋 下面依次闡述各步驟 使用whoosh的第一步就是要建立索引物件。...

全文搜尋與倒排索引

全文搜尋是指計算機搜尋程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文中出現的次數和位置,當使用者查詢時,搜尋程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者。這個過程類似於通過字典中的搜尋字表查字的過程,lucene是目前全球使用最廣的全文搜尋引擎開源庫。倒排索引源於...