lucene 第一步 建立文件物件

2021-08-10 15:58:24 字數 527 閱讀 9204

獲取原始內容的目的是為了索引,在索引前需要將原始內容建立成文件(document),文件中包括乙個乙個的域(

field

),域中儲存內容。

這裡我們可以將磁碟上的乙個檔案當成乙個document,

document

中包括一些

field

(file_name

檔名稱、

file_path

檔案路徑、

file_size

檔案大小、

file_content

檔案內容)

注意:每個document可以有多個

field

,不同的

document

可以有不同的

field

,同乙個

document

可以有相同的

field

(網域名稱和域值都相同)

每個文件都有乙個唯一的編號,就是文件id。

踏出第一步

我是乙個比較內向的人,或許應該說有一點自卑的傾向。因為生活中的一些事情,總是不斷的打擊我的自信心,讓我產生一種感覺 我缺乏能力,是乙個無用的人。我想有過這種經歷的,肯定不只我乙個人。人的信心有時候是很脆弱的,兩三次的失敗就可能讓其消失殆盡,然後你就覺得,反正我也做不出什麼事情來,乾脆就這樣混著吧,於...

邁出第一步

我,乙個程式小白,不是為了熱愛而走上程式設計之路。就這樣稀里糊塗的度過了兩年,期間,自己有為找不出那乙個個errors煩躁,也有為成功編譯後而獲得正確結果的那種喜悅。如今是真的想去改變現狀,想去提公升自己,想不負剩餘的兩年時光,不負你,不負我!對於今後的學習之路的想法,首先基礎的語言學習,其次資料結...

爬蟲第一步

注意正規表示式的書寫注意正規表示式的書寫 import re import requests url headers html requests.get url,headers,timeout 10 text print html redata re.compile r for i in re.fi...