lucene的實戰入門

2021-08-31 23:22:48 字數 2341 閱讀 6871

最近在寫個人部落格專案.有個需求.就是要求在前端頁面上有乙個搜尋框,使用者可以根據這個搜尋框對所有部落格進行全文檢索,包括標題和正文,然後根據搜尋匹配度進行排序展示出來,並且要有高亮顯示,類似如下效果:

全文檢索的這個功能可以採用lucene這個框架實現.

lucene的具體原理到底是什麼呢? 其實就是根據 索引 去查詢.

舉個例子:我們查字典,都先要在字典前面的各類索引目錄去查,然後在索引中找到具體想要的後,然後再去正文中去找.這樣一來要大大節省時間.

如果你感覺不出,找個對比就知道了,我們寫sql中的模糊搜尋的like語句.這條語句在搜尋過程中,其實是一條一條查的,就是每條記錄都要去檢視,資料量小的話還好,資料量一大,就費勁了.

而lucene呢,他是先建立索引檔案,然後根據 搜尋詞 去索引檔案查詢,然後直接定位到搜尋結果.雖然建立索引檔案是費時間的,但是索引檔案是具有可復用性的,以後的搜尋是大大節約時間的.

廢話不多說,直接看**;

導包.

生成索引檔案

/**

* 初始化生成所有已存在的部落格索引檔案

* @param bloglist 所有部落格例項的集合

* 獲取indexwriter例項

* 生成或修改索引檔案

* @param writer

* @param b

* @throws ioexception

*/public void addorupdatedoc(indexwriter writer,blog b,int temp) throws ioexception else if(temp == 0)

}

這樣一來,就可以生成索引檔案了.

在我自己的專案中,我是每次進入首頁時 開始生成索引檔案,其實這樣是不對的.由於我目前的數量比較小,所以可以這樣做.一旦資料量巨大的話,每次進入首頁的速度就會變慢,這樣不好.像我這樣生成所有實體的索引檔案,應該是定期更新生成.平時呢,應該是當對部落格進行 增 刪 改 等操作時也應對其索引檔案進行 增 刪 改.  增加和刪除都在上面,刪除操作如下:

public void deleteindex(blog blog,httpservletrequest request)throws exception
當索引檔案都弄好後,我們就可以對其進行搜尋了.

}搜尋的這個方法,肯定是在controller中呼叫,在controller中獲取到前台傳過來的搜尋詞,然後呼叫搜尋方法並傳入搜尋詞,返回乙個實體集合,剩下的就是業務邏輯了.基本思路就是這樣. 搜尋方法中每一步是做什麼的,可以看注

Lucene的入門例子

1.lucene的基本步驟 配 與jar包版本 2.示例的 3.完成示例後再該延伸到哪些知識 jar包版本 一 從資料庫中查資料 爬資料 1 public arraylistgetdate string sql throws sqlexception 把資料庫裡的資料取出來 return item ...

Lucene的小入門

lucene的搜尋原理 在進行搜尋之前,我們只要新增資料,就會對資料進行分詞,並把分詞後的資料和資料對應的id儲存到索引庫中,我們進行查詢的時候,不會根據某個欄位的值直接去查資料庫 因為可能資料量很龐大,或者資料庫在進行模糊匹配的時候資料庫索引會失效,很消耗效能 而是先去索引庫中查詢獲取到id,然後...

lucene入門學習

我們生活中的資料總體分為兩種 結構化資料和非結構化資料 全文檢索 將非結構化資料中的一部分資訊提取出來,重新組織,使其變得有一定結構,然後對此有一定結構的資料進行搜尋,從而達到搜尋相對較快的目的。這部分從非結構化資料中提出的然後重新組織的資訊,我們稱之為索引。這種先建立索引,再對索引進行搜尋的過程就...