lucene 3(相關度排序)

2021-08-03 10:00:58 字數 583 閱讀 5972

相關度排序這個東西顧名思義,在上文中我們講到了乙個打分的問題,就是說的在查詢關鍵字匹配的時候,相識度越高的就會打分越高,就會越靠前。

打分的兩個步驟:1.根據詞計算詞的權重。 2.根據詞的權重打分。

詞的權重:意思就是詞的重要性,而且詞就是我們上文講到的term,

而影響詞的權重的有兩個東西:

tf:詞在該文件中出現的頻率

df:詞在多個文件中出現的頻率

到了現在大家都應該知道了,tf越高,df越低,打分就會越高。

但是以上都是自然打分的原則!!! 還有人為影響的程式設計。

設定boost值影響打分

boost 加權值 預設為 1f

在建立時設定過於簡單,這裡就不說了。

這是在搜尋時修改

map

boosts = new hashmap();

boosts.put("name", 200f);

multifieldqueryparser parser = new multifieldqueryparser(fields,

analyzer, boosts);

Lucene 中相關度排序

lucene 中的相似度排序主要是在org.apache.lucene.search 包下的 similarity類中定義的,其排序演算法如下 score q,d tf t in d idf t 2 getboost t in q getboost t.field in d lengthnorm t...

sqlite3 相關操作

size small 檔案儲存策略 一般有三中方法 1,屬性列表,2,物件歸檔,3,iphone的嵌入式資料庫庫 sqlite3 1,屬性列表 儲存檔案 獲取文件目錄,nsdocumentdirectory表示我們查詢documents目錄的路徑,nsuserdomainmask表示我們的搜尋範圍只...

ns3相關記錄

2.ofswitch13 for ns3 二.執行 1.列印所有模組下的log日誌。1 在終端輸入 export ns log level all 2 在終端輸入執行語句 waf run scratch wzx mptcp logsdn all.out 注意 前面不能加 sudo 命令 3 waf ...