全文檢索概念以及案例

2022-08-24 17:24:15 字數 920 閱讀 5623

,如何實現全文檢索

一.什麼是全文檢索?

就是在檢索資料,資料的分類:

在計算機當中,比如說存在磁碟的文字文件,html頁面,word文件等等......

1.結構化資料

格式固定,長度固定,資料型別固定等等,我們稱之為結構化資料,比如說資料庫中的資料

2.非結構化資料

word文件,html檔案,pdf文件,文字文件等等,格式不固定,長度不固定,資料型別不固定,成為非結構化資料

3.半結構化資料

lucene-core

7.4.0

org.apache.lucene

lucene-analyzers-common

7.4.0

commons-io

commons-io

2.42.1 建立索引

public static void main(string args) throws ioexception

//步驟八:關閉資源

indexwriter.close();

}2.2 利用luke工具檢視索引庫內容

2.2.1 指定索引庫位置

2.2.2 檢視當前索引庫內容

2.3 檢視索引

public static void main(string args) throws ioexception

//7.關閉資源

indexreader.close();

}

public classreadindex 

//7.關閉資源

indexreader.close();

}}

public classcreateindex 

//步驟八:關閉資源

indexwriter.close();

}}

全文檢索概念

全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...

什麼叫全文檢索 全文檢索概念

全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...

什麼叫全文檢索 全文檢索概念

全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...