是為了將當前查詢的結果進行排序,比較不同查詢結果的相關度評分沒有太大意義。
score(q,d) = # score(q,d) 是文件 d 與查詢 q 的相關度評分。
· querynorm(q) # 查詢歸一化因子,用來使查詢結果之間能夠相互比較,但意義不大,因為_score的目的並不是對不同查詢進行比較,而是用來對查詢結果進行排序
· coord(q,d) # 協調因子,對於多詞查詢,文件裡出現的匹配詞越多,該值越大。 bool查詢也遵循這個規則。lucene中同義詞查詢會自動禁用這個值(優秀!)。
· ∑ (
· tf(t in d)
· idf(t)²
· t.getboost()
· norm(t,d)
) (t in q)
原文
設定boost引數在乙個查詢上、某些索引上
使用查詢結構修改相關度
使用boosting查詢,對包含不想要的詞的查詢結果進行降級
function_score查詢:這個查詢可以使兩個效果融合:可以仍然根據全文相關度進行排序,但也會同時考慮最新發布文件、流行文件、或接近使用者希望**的產品。
3.1 field_value_factor:需要有乙個專門的字段,儲存數值,以這個數值進行除錯
3.2 functions:可以用來對不同搜尋詞加權
3.3
ElasticSearch相關概念
節點 node 物理概念,乙個執行的elasticearch例項,一般是一台機器上的乙個程序。分片 shard 為了支援更大量的資料,索引一般會按某個維度分成多個部分,每個部分就是乙個分片,分片被節點 node 管理。乙個節點 node 一般會管理多個分片,這些分片可能是屬於同乙份索引,也有可能屬於...
elasticsearch相關筆記
elasticsearch kibana nginx將原索引的資料reindex到新索引 post reindex dest 刪除原索引 delete vehicle info將新索引資料再次reindex回舊索引 post reindex dest 刪除新索引 然後在後台 bulk資料時,加上新的...
elasticsearch 優化相關
es寫入過程關鍵步驟 資料寫入index buffer緩衝和translog日誌檔案。index buffer indices.memory.index buffer size 大小預設是heap的10 最小值為48m。每隔一秒鐘 index.refresh interval index buffe...