1:solr4.0加入中文分詞:
在ik的自帶文件中有:
這裡特別的羅嗦幾句,在solr4.0發布以後,官方取消了basetokenize***ctory介面,而直接使用lucene analyzer標準介面。因此ik分詞器2012 ff版本也取消了org.wltea.analyzer.solr.iktokenize***ctory類。
2:首先在tomcat不是的solr目錄下lib中加入:
ikanalyzer2012ff_u1.jar包
3:然後再solr目錄c:\solr\collection1\conf下的schema.xml檔案中加入:
就可以了,在solr介面中analys選錯 type下的 text就可以分詞了
比如:2:解釋下,我在ik的jar包中的dir字典加入了 停用詞:
中潭露。
Solr4 0效能調優之快取配置
size medium solr配置檔案 solrconfig.xml 有三種快取分別是 filtercache,queryresultcache,documentcache但solr是在什麼時候,什麼情況下會用到這些快取呢,通過看solr的原始碼,下面對solr三種快取做說明 list 1 fil...
solr 配置中文分詞
要在中文的專案中使用 solr 少不了要整合中文分詞元件。本篇以 ik2012 分詞為例,講解如何在 solr 3.5 中及整合中文分詞,使用 ik 的原因 ik 比其他中文分詞維護的勤快,和 solr 整合也相對容易。fieldtypename text zh class solr.textfie...
安裝solr中文分詞系統
solr是乙個國外的開源專案,要想solr能處理中文,必須安裝中文分詞系統,步驟如下 3.拷貝mmseg4j的jar包到solr目錄裡 4.增加詞庫 mkdir p opt solr tomcat solr dic unzip data.zip cp data dic opt solr tomcat...