solr服務搭建完成(索引已建立,可以進行搜尋)
現象: 搜尋" 美女"後,「美女美女美女美女」文件會出現第一位。
但實際系統中可能並不需要 這種結果
這個時候的解決辦法:根據自己業務需要進行重寫評分器
1. 自定義評分器
package cn.xxt.solr.util;
import org.apache.lucene.search.defaultsimilarity;
/** * vtigu評分器
* @author zhaoguoli
* @version v1.0 2012-11-04
*/@suppresswarnings("serial")
public class vtigusolrsimilarity extends defaultsimilarity
public float tf(int freq)
}
2. 新增至solr 配置檔案 schema.xml
3. cn.xxt.solr.util.vtigusolrsimilarity需要放置在 solr.war包中
路徑為 web-inf/classes/cn/xxt/solr/util/目錄下。
4. 重新啟動 solr服務即可。
solr 相關度評分,自定義評分
ps 臨時寫的,大體的實現和簡單版,以後會不斷完善 部落格和 solr是基於lucene的全文檢索 搜尋引擎,和一般查資料庫相比,solr的乙個特色就是它的相關度評分。這裡介紹一下它的自定義 相關度評分。在實際的業務中,可能不需要這麼複雜的相關度,是需要簡單粗暴的 按照我指定的規則計算相關度,並按照...
自定義評分器Similarity,提高搜尋體驗
首先說一下lucene對文件的評分規則 score q,d coord q,d querynorm q tf t in d idf t 2 t.getboost norm t,d 這裡先考慮三個因素coord q,d 與tf t in d 當查詢串中,命中的詞越多,coord計算的值則越大,某個詞在...
自定義評分器Similarity,提高搜尋體驗
首先說一下lucene對文件的評分規則 score q,d coord q,d querynorm q tf t in d idf t 2 t.getboost norm t,d 這裡先考慮三個因素coord q,d 與tf t in d 當查詢串中,命中的詞越多,coord計算的值則越大,某個詞在...