solr4 0加入中文分詞IKanalry

1：solr4.0加入中文分詞：

在ik的自帶文件中有：

這裡特別的羅嗦幾句，在solr4.0發布以後，官方取消了basetokenize***ctory介面，而直接使用lucene analyzer標準介面。因此ik分詞器2012 ff版本也取消了org.wltea.analyzer.solr.iktokenize***ctory類。

2：首先在tomcat不是的solr目錄下lib中加入：

ikanalyzer2012ff_u1.jar包

3：然後再solr目錄c:\solr\collection1\conf下的schema.xml檔案中加入：

就可以了，在solr介面中analys選錯 type下的 text就可以分詞了

比如：2：解釋下，我在ik的jar包中的dir字典加入了停用詞：

中潭露。

Solr4 0效能調優之快取配置

size medium solr配置檔案 solrconfig.xml 有三種快取分別是 filtercache，queryresultcache，documentcache但solr是在什麼時候，什麼情況下會用到這些快取呢，通過看solr的原始碼，下面對solr三種快取做說明 list 1 fil...

solr 配置中文分詞

要在中文的專案中使用 solr 少不了要整合中文分詞元件。本篇以 ik2012 分詞為例，講解如何在 solr 3.5 中及整合中文分詞，使用 ik 的原因 ik 比其他中文分詞維護的勤快，和 solr 整合也相對容易。fieldtypename text zh class solr.textfie...

安裝solr中文分詞系統

solr是乙個國外的開源專案，要想solr能處理中文，必須安裝中文分詞系統，步驟如下 3.拷貝mmseg4j的jar包到solr目錄裡 4.增加詞庫 mkdir p opt solr tomcat solr dic unzip data.zip cp data dic opt solr tomcat...

solr4 0加入中文分詞IKanalry

Solr4 0效能調優之快取配置

solr 配置中文分詞

安裝solr中文分詞系統

相關推薦