solr4 10 2及中文分詞器的使用

2021-06-27 14:49:48 字數 312 閱讀 5037

轉眼間lucene已發布到版本4了,想起07年使用lucene時,還是1點幾的版本,那時公司買了本lucene in action中文版,我把它當寶一樣,立馬捧在手頭,翻閱兩遍。從那後,很少在用lucene,但時常也在關注,原理還是一致,只是增了很多特性與改進。

現在開發的產品需要使用搜尋功能,lucene是首選,於是再度研究了一翻,沒有多大難度。同時也不在直接使用lucene庫,而是使用solr,大大簡化了建立索引與查詢索引的難度。solr這種分布式索引方式對效能的控制更加有把握,因為它支援多核、複製功能,我們還可以寫**實現讀寫分離等效能擴充套件功能。

推薦使用mmseg4j

solr配置中文分詞器

可能需要連線上篇 solr與tomcat整合 將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案,增加下面 注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...

solr配置中文分詞器

一 smartcn 自 1 將自帶的jar包拷貝到tomcat下 檔案 solr 5.1.0 contrib analysis extras lucene libs lucene analyzers smartcn 5.1.0.jar 2 修改schema.xml,新增 3 測試 二 mmseg4j...

solr 引入中文分詞器

ik analyzer 擴充套件配置 ext.dic my ext stopword.dic ext.dic 存放同義詞 厲害了我的國 相同,相似,相近 電腦,膝上型電腦 計算機 my ext stopword.dic 存放停用詞 的地了 你我他它 不嗯需要引入的jar 配置solrconfig.x...