一、smartcn**自
1、將自帶的jar包拷貝到tomcat下
檔案:solr-5.1.0/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-5.1.0.jar
2、修改schema.xml,新增
3、測試
二、mmseg4j
2、修改schema.xml,新增以下內容後重啟tomcat
3、測試
三、索引字段加入中文分詞
這裡新建了張表articles
create table `articles` (
`id` int(10) unsigned not null auto_increment,
`title` varchar(200) not null,
`author` varchar(50) not null,
`last_update_time` timestamp not null default current_timestamp on update current_timestamp,
primary key (`id`)
) engine=innodb default charset=utf8;
網上找點資料塞進去
insert into `articles` values ('1', '3.6億曼城又被這臥底坑死!無底黑洞讓1億白花', '梓泉', '2016-01-07 09:43:17');
insert into `articles` values ('2', '瓜帥版曼城豪陣**!組最奢華中軸 梅西領4天王', '小九', '2016-01-07 09:43:41');
insert into `articles` values ('3', '聯賽杯-棄將助小魔獸絕殺 曼城丟爭議球1-2負 ', '斯科', '2016-01-07 09:43:50');
insert into `articles` values ('4', '瓜迪奧拉去曼城已定!英媒:他與前巴薩2巨頭重逢 ', '蘭尼斯特', '2016-01-07 09:44:06');
insert into `articles` values ('5', '曼城主帥諷皇馬:同情貝帥 皇馬幹出這種事不奇怪 ', '馬爾科', '2016-01-07 09:44:18');
solr後台新建core_articles。
修改data-config.xml
'$'">
修改schema.xml,新增filedtype
再新增相關索引字段
重啟tomcat後全量匯入。
在query裡搜尋的結果
對title欄位進行關鍵字搜尋(如:巴薩)結果
solr配置中文分詞器
可能需要連線上篇 solr與tomcat整合 將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案,增加下面 注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...
solr配置中文分詞器
在 opt solr 7.7.1 server solr article core conf資料夾下的 managed schema檔案中配置ik中文分詞器 測試分詞效果 配置停用詞 擴充套件詞 同義詞 停止詞 的功能是過濾,把 啊 加入到停止詞的字典裡,比如搜尋 你好啊 solr會過濾掉 啊 以 ...
solr配置中文解析 分詞 器
前提 1 在solr中預設是沒有中文分析器的,需要手工配置。需要配置乙個fieldtype,在fieldtype中指定中文分析器。2 solr中的字段必須是先定義後使用。一 使用ik analyzer 把分析器的資料夾上傳到伺服器 root winy ik analyzer 2012ff hf1 p...