solr自定義評分器

2021-09-01 13:37:34 字數 663 閱讀 8555

solr服務搭建完成(索引已建立,可以進行搜尋)

現象: 搜尋" 美女"後,「美女美女美女美女」文件會出現第一位。

但實際系統中可能並不需要 這種結果 

這個時候的解決辦法:根據自己業務需要進行重寫評分器

1.   自定義評分器

package cn.xxt.solr.util;

import org.apache.lucene.search.defaultsimilarity;

/** * vtigu評分器

* @author zhaoguoli

* @version v1.0 2012-11-04

*/@suppresswarnings("serial")

public class vtigusolrsimilarity extends defaultsimilarity

public float tf(int freq)

}

2.  新增至solr 配置檔案 schema.xml

3.  cn.xxt.solr.util.vtigusolrsimilarity需要放置在 solr.war包中

路徑為 web-inf/classes/cn/xxt/solr/util/目錄下。

4.  重新啟動 solr服務即可。

solr 相關度評分,自定義評分

ps 臨時寫的,大體的實現和簡單版,以後會不斷完善 部落格和 solr是基於lucene的全文檢索 搜尋引擎,和一般查資料庫相比,solr的乙個特色就是它的相關度評分。這裡介紹一下它的自定義 相關度評分。在實際的業務中,可能不需要這麼複雜的相關度,是需要簡單粗暴的 按照我指定的規則計算相關度,並按照...

自定義評分器Similarity,提高搜尋體驗

首先說一下lucene對文件的評分規則 score q,d coord q,d querynorm q tf t in d idf t 2 t.getboost norm t,d 這裡先考慮三個因素coord q,d 與tf t in d 當查詢串中,命中的詞越多,coord計算的值則越大,某個詞在...

自定義評分器Similarity,提高搜尋體驗

首先說一下lucene對文件的評分規則 score q,d coord q,d querynorm q tf t in d idf t 2 t.getboost norm t,d 這裡先考慮三個因素coord q,d 與tf t in d 當查詢串中,命中的詞越多,coord計算的值則越大,某個詞在...