solr4 10 3配置中文分詞器

二、上傳

上傳中文分詞器jar包 ikanalyzer2012ff_u1.jar

三、把ikanalyzer2012ff_u1.jar新增到solr/web-inf/lib目錄下

[root@itcast-01 lib]# mv/root/ikanalyzer2012ff_u1.jar ./

四、複製ikanalyzer的配置檔案和自定義詞典和停用詞詞典到tomcat服務

五、在schema.xml配置中文分詞器

根據業務需要選擇相應的字段對應solr的字段，本專案涉及的資料庫表如下：

根據表配置業務域--fieldname

[root@itcast-01 web-inf]# cd/usr/local/solr/solrhome/collection1/conf/

[root@itcast-01 conf]# vim schema.xml

另外，解釋一下ik的配置，其中ikanalyzer.cfg.xml為配置檔案，主要用來配置擴充套件詞庫，禁止詞詞庫等

<?xml version="1.0" encoding="utf-8"?>
ik analyzer 擴充套件配置comment>
key="ext_dict">ext.dic;entry>
key="ext_stopwords">stopword.dic;entry>
properties>

stopword.dic和ext.dic分別為禁止詞詞庫和擴充套件詞庫，注意，詞庫的的編碼方式為utf-8 無bom的編碼方式，新增新詞的時候，需要注意。

solr配置中文分詞器

可能需要連線上篇 solr與tomcat整合將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案，增加下面注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...

solr配置中文分詞器

一 smartcn 自 1 將自帶的jar包拷貝到tomcat下檔案 solr 5.1.0 contrib analysis extras lucene libs lucene analyzers smartcn 5.1.0.jar 2 修改schema.xml，新增 3 測試二 mmseg4j...

solr配置中文分詞器

在 opt solr 7.7.1 server solr article core conf資料夾下的 managed schema檔案中配置ik中文分詞器測試分詞效果配置停用詞擴充套件詞同義詞停止詞的功能是過濾，把啊加入到停止詞的字典裡，比如搜尋你好啊 solr會過濾掉啊以 ...

solr4 10 3配置中文分詞器

solr配置中文分詞器

solr配置中文分詞器

solr配置中文分詞器

相關推薦