Solr配置中文分析器以及業務字段

2021-08-14 06:26:56 字數 881 閱讀 6685

1.1.1.1        中文分析器的配置

第一步:使用ik-analyzer。把分析器的資料夾上傳到伺服器。

第二步:需要把分析器的jar包新增到solr工程中。

[root@bogon ik analyzer 2012ff_hf1]#

第三步:需要把ikanalyzer需要的擴充套件詞典及停用詞詞典、配置檔案複製到solr工程的classpath。(建立乙個classes目錄)

[root@bogon ik analyzer 2012ff_hf1]#

注意:擴充套件詞典及停用詞詞典的字符集必須是utf-8。不能使用windows記事本編輯。

第四步:配置fieldtype。需要在usr/local/solr/tomcat/solrhome/collection1/conf/schema.xml中配置。

技巧:使用vi、vim跳轉到文件開頭gg。跳轉到文件末尾:g    (最好在末尾新增)

注:文中text_ik可以自己隨意寫,但class=「solr.textfield」 不能改

1.1.1.1        業務字段配置

業務字段判斷標準:

1、在搜尋時是否需要在此字段上進行搜尋。例如:商品名稱、商品的賣點、商品的描述

2、後續的業務是否需要用到此欄位。例如:商品id。

例如:需要用到的字段:

1、商品id

2、商品title

3、賣點

4、**

5、商品

6、商品分類名稱

7、商品描述

solr中的業務字段:

1、id——》商品id

其他的對應字段建立solr的字段。

在schema.xml檔案末尾中新增

重新啟動tomcat

Solr快速入門第五講 配置中文分析器

在上一講中,我向大家詳細地介紹了solr中的managed schema配置檔案,其實,主要是介紹了該配置檔案中的五個標籤。你只有了解了這五個標籤的含義,才能曉得如何配置中文分析器,這裡咱就使用ik analyzer中文分析器。好了,問題來了,如何配置ik analyzer中文分析器呢?你可按照下面...

配置分析器

第三個重要的索引設定是analysis部分,用來配置已存在的分析器或針對你的索引建立新的自定義分析器。在 分析與分析器 我們介紹了一些內建的 分析器,用於將全文本串轉換為適合搜尋的倒排索引。standard分析器是用於全文本段的預設分析器,對於大部分西方語系來說是乙個不錯的選擇。它包括了以下幾點 預...

Solr分詞器 過濾器 分析器。

對乙個document進行索引時,其中的每個field中的資料都會經歷分析 分析就是組合分詞和過濾 最終將一句話分成單個的單詞,去掉句子當中的空白符號,大寫轉換小寫,複數轉單數,去掉多餘的詞,進行同義詞代換等等。如 this is a blog this,is,a會被去除,最後剩下blog。當然 這...