,如何實現全文檢索
一.什麼是全文檢索?
就是在檢索資料,資料的分類:
在計算機當中,比如說存在磁碟的文字文件,html頁面,word文件等等......
1.結構化資料
格式固定,長度固定,資料型別固定等等,我們稱之為結構化資料,比如說資料庫中的資料
2.非結構化資料
word文件,html檔案,pdf文件,文字文件等等,格式不固定,長度不固定,資料型別不固定,成為非結構化資料
3.半結構化資料
lucene-core
7.4.0
org.apache.lucene
lucene-analyzers-common
7.4.0
commons-io
commons-io
2.42.1 建立索引
public static void main(string args) throws ioexception
//步驟八:關閉資源
indexwriter.close();
}2.2 利用luke工具檢視索引庫內容
2.2.1 指定索引庫位置
2.2.2 檢視當前索引庫內容
2.3 檢視索引
public static void main(string args) throws ioexception
//7.關閉資源
indexreader.close();
}
public classreadindex//7.關閉資源
indexreader.close();
}}
public classcreateindex//步驟八:關閉資源
indexwriter.close();
}}
全文檢索概念
全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...
什麼叫全文檢索 全文檢索概念
全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...
什麼叫全文檢索 全文檢索概念
全文檢索是指計算機索引程式通過掃瞄文章中的每乙個詞,對每乙個詞建立乙個索引,指明該詞在文章中出現的次數和位置,當使用者查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文檢索的方法主要分為按字檢索和按詞檢索兩種。按字檢...