相關度排序這個東西顧名思義,在上文中我們講到了乙個打分的問題,就是說的在查詢關鍵字匹配的時候,相識度越高的就會打分越高,就會越靠前。
打分的兩個步驟:1.根據詞計算詞的權重。 2.根據詞的權重打分。
詞的權重:意思就是詞的重要性,而且詞就是我們上文講到的term,
而影響詞的權重的有兩個東西:
tf:詞在該文件中出現的頻率
df:詞在多個文件中出現的頻率
到了現在大家都應該知道了,tf越高,df越低,打分就會越高。
但是以上都是自然打分的原則!!! 還有人為影響的程式設計。
設定boost值影響打分
boost 加權值 預設為 1f
在建立時設定過於簡單,這裡就不說了。
這是在搜尋時修改
map
boosts = new hashmap();
boosts.put("name", 200f);
multifieldqueryparser parser = new multifieldqueryparser(fields,
analyzer, boosts);
Lucene 中相關度排序
lucene 中的相似度排序主要是在org.apache.lucene.search 包下的 similarity類中定義的,其排序演算法如下 score q,d tf t in d idf t 2 getboost t in q getboost t.field in d lengthnorm t...
sqlite3 相關操作
size small 檔案儲存策略 一般有三中方法 1,屬性列表,2,物件歸檔,3,iphone的嵌入式資料庫庫 sqlite3 1,屬性列表 儲存檔案 獲取文件目錄,nsdocumentdirectory表示我們查詢documents目錄的路徑,nsuserdomainmask表示我們的搜尋範圍只...
ns3相關記錄
2.ofswitch13 for ns3 二.執行 1.列印所有模組下的log日誌。1 在終端輸入 export ns log level all 2 在終端輸入執行語句 waf run scratch wzx mptcp logsdn all.out 注意 前面不能加 sudo 命令 3 waf ...