Solr配置中文分析器以及業務字段

1.1.1.1 中文分析器的配置

第一步：使用ik-analyzer。把分析器的資料夾上傳到伺服器。

第二步：需要把分析器的jar包新增到solr工程中。

[root@bogon ik analyzer 2012ff_hf1]#

第三步：需要把ikanalyzer需要的擴充套件詞典及停用詞詞典、配置檔案複製到solr工程的classpath。(建立乙個classes目錄)

[root@bogon ik analyzer 2012ff_hf1]#

注意：擴充套件詞典及停用詞詞典的字符集必須是utf-8。不能使用windows記事本編輯。

第四步：配置fieldtype。需要在usr/local/solr/tomcat/solrhome/collection1/conf/schema.xml中配置。

技巧：使用vi、vim跳轉到文件開頭gg。跳轉到文件末尾：g (最好在末尾新增)

注：文中text_ik可以自己隨意寫，但class=「solr.textfield」不能改

1.1.1.1 業務字段配置

業務字段判斷標準：

1、在搜尋時是否需要在此字段上進行搜尋。例如：商品名稱、商品的賣點、商品的描述

2、後續的業務是否需要用到此欄位。例如：商品id。

例如：需要用到的字段：

1、商品id

2、商品title

3、賣點

4、**

5、商品

6、商品分類名稱

7、商品描述

solr中的業務字段：

1、id——》商品id

其他的對應字段建立solr的字段。

在schema.xml檔案末尾中新增

重新啟動tomcat

Solr快速入門第五講配置中文分析器

在上一講中，我向大家詳細地介紹了solr中的managed schema配置檔案，其實，主要是介紹了該配置檔案中的五個標籤。你只有了解了這五個標籤的含義，才能曉得如何配置中文分析器，這裡咱就使用ik analyzer中文分析器。好了，問題來了，如何配置ik analyzer中文分析器呢？你可按照下面...

配置分析器

第三個重要的索引設定是analysis部分，用來配置已存在的分析器或針對你的索引建立新的自定義分析器。在分析與分析器我們介紹了一些內建的分析器，用於將全文本串轉換為適合搜尋的倒排索引。standard分析器是用於全文本段的預設分析器，對於大部分西方語系來說是乙個不錯的選擇。它包括了以下幾點預...

Solr分詞器過濾器分析器。

對乙個document進行索引時，其中的每個field中的資料都會經歷分析分析就是組合分詞和過濾最終將一句話分成單個的單詞，去掉句子當中的空白符號，大寫轉換小寫，複數轉單數，去掉多餘的詞，進行同義詞代換等等。如 this is a blog this，is，a會被去除，最後剩下blog。當然這...

Solr配置中文分析器以及業務字段

Solr快速入門第五講 配置中文分析器

配置分析器

Solr分詞器 過濾器 分析器。

相關推薦

Solr快速入門第五講配置中文分析器

Solr分詞器過濾器分析器。