3.在tomcat目錄下新建solr_home目錄,複製e:\apache\apache-solr-1.4.1\example\solr下的bin、conf目錄到
solr_home,並新建
data資料夾,複製sogou-dic-utf8下的words.dic到data資料夾下。
4. e:\tomcat\conf\catalina\localhost 新增solr.xml
6. e:\tomcat\solr_home\conf\schema.xml,在
下增加:
最終,開啟http://localhost:8080/solr/admin/analysis.jsp,輸入文字並將其分詞。
mmseg4j 中文分詞 1 5 版發布
經過幾天的開發與除錯,新版的 mmseg4j 可以發布了。定為1.5版,是因為變動比較大。mmseg4j 1.5變更 list 把chars.dic檔案放到jar裡,我們不需要關心它,當然你在詞庫目錄放這個檔案可能覆蓋它。最長匹配遍歷調整 基本不受長詞的影響 優化了程式,除去沒有必要的陣列複製等,效...
solr整合mmseg4j實現中文分詞檢索
1 使用mmseg4j 1.9版本 mmseg4j core 1.9.0.jar 包括詞庫檔案 mmseg4j analysis 1.9.0.jar 是一些 analysis mmseg4j solr 1.9.0.jar 是一些 solr 使用的功能。2 將mmseg的jar放入solr web i...
solr4 5配置中文分詞器mmseg4j
solr4.x雖然提供了分詞器,但不太適合對中文的分詞,給大家推薦乙個中文分詞器mmseg4j 通過以下幾步就可以把mmseg4j分詞器整合到solr中 1 解壓mmseg4j 1.9.1.zip,把dist下面的所有jar檔案拷貝到你應用伺服器下的solr web inf lib中 如果你的應用伺...