1.1.1.1 中文分析器的配置
第一步:使用ik-analyzer。把分析器的資料夾上傳到伺服器。
第二步:需要把分析器的jar包新增到solr工程中。
[root@bogon ik analyzer 2012ff_hf1]#
第三步:需要把ikanalyzer需要的擴充套件詞典及停用詞詞典、配置檔案複製到solr工程的classpath。(建立乙個classes目錄)
[root@bogon ik analyzer 2012ff_hf1]#
注意:擴充套件詞典及停用詞詞典的字符集必須是utf-8。不能使用windows記事本編輯。
第四步:配置fieldtype。需要在usr/local/solr/tomcat/solrhome/collection1/conf/schema.xml中配置。
技巧:使用vi、vim跳轉到文件開頭gg。跳轉到文件末尾:g (最好在末尾新增)
注:文中text_ik可以自己隨意寫,但class=「solr.textfield」 不能改
1.1.1.1 業務字段配置
業務字段判斷標準:
1、在搜尋時是否需要在此字段上進行搜尋。例如:商品名稱、商品的賣點、商品的描述
2、後續的業務是否需要用到此欄位。例如:商品id。
例如:需要用到的字段:
1、商品id
2、商品title
3、賣點
4、**
5、商品
6、商品分類名稱
7、商品描述
solr中的業務字段:
1、id——》商品id
其他的對應字段建立solr的字段。
在schema.xml檔案末尾中新增
重新啟動tomcat
Solr快速入門第五講 配置中文分析器
在上一講中,我向大家詳細地介紹了solr中的managed schema配置檔案,其實,主要是介紹了該配置檔案中的五個標籤。你只有了解了這五個標籤的含義,才能曉得如何配置中文分析器,這裡咱就使用ik analyzer中文分析器。好了,問題來了,如何配置ik analyzer中文分析器呢?你可按照下面...
配置分析器
第三個重要的索引設定是analysis部分,用來配置已存在的分析器或針對你的索引建立新的自定義分析器。在 分析與分析器 我們介紹了一些內建的 分析器,用於將全文本串轉換為適合搜尋的倒排索引。standard分析器是用於全文本段的預設分析器,對於大部分西方語系來說是乙個不錯的選擇。它包括了以下幾點 預...
Solr分詞器 過濾器 分析器。
對乙個document進行索引時,其中的每個field中的資料都會經歷分析 分析就是組合分詞和過濾 最終將一句話分成單個的單詞,去掉句子當中的空白符號,大寫轉換小寫,複數轉單數,去掉多餘的詞,進行同義詞代換等等。如 this is a blog this,is,a會被去除,最後剩下blog。當然 這...