SOLR配置預設的一元分詞與安裝主流的中文分詞擴充套件

2021-09-01 13:11:15 字數 966 閱讀 6095

引言:solr用的好不好,分詞是關鍵,分詞分的好不好,詞庫是關鍵。沒有完美的分詞和詞庫,只有更適合你**的分詞和詞庫。

目前網路上主流的solr分詞模組:

4、standardanalyzer、chineseanalyzer、cjkanalyzer、ik_canalyzer、mik_canalyzer、mmanalyzer(je分詞)等,參考文件:

solr安裝ikanalyzer 2012

本例使用版本為:ikanalyzer2012_u5.zip

unzip解壓到目錄ikanalyzer2012

cd ikanalyzer2012

solr 配置 ikanalyzer 2012

開啟/opt/solr/example/solr/conf/,其中有兩個關鍵檔案schema.xml,該檔案是配置當前搜尋專案的索引結構,另乙個是sorlconfig.xml,該檔案用於配置solr的一些引用介面和呼叫方案的,具體內容後續詳談。

開啟schema.xml

在中新增**:

01 02

03 04

05 06

07 08

09 10

11 12

13 14

該**片段宣告了一種搜尋型別叫:text_ika,

在中新增片段:

1 我們宣告了thread_title欄位使用text_ika分詞,並宣告該字段是可以被索引的indexed="true",並且需要儲存索引內容stored="true",結果為單一結果,非多個字段組合結果multivalued="false"

重新啟動tomcat,在瀏覽器中開啟admin位址http://localhost:8080/solr/admin/analysis.jsp?highlight=on

如下輸入:

檢視分詞結果:

這就是呼叫ikanalyzer2012擴充套件,分詞的結果了,是不是很神奇。

出處:

實驗 一元多項式的相加與相乘

資料結構上機實驗。實驗要求 根據所給的一元多項式相加的程式,寫出一元多項式相乘的程式並除錯通過。注意 1 最後得到的一元多項式採用兩種輸出格式,即數字格式和一般格式。2 一般格式的多項式輸出,按指數非遞增順序。3 係數為0的項不予以輸出 只有0項的多項式只輸出0 include include in...

一元多項式的乘法與加法運算

設計函式分別求兩個一元多項式的乘積與和。輸入分2行,每行分別先給出多項式非零項的個數,再以指數遞降方式輸入乙個多項式非零項係數和指數 絕對值均為不超過1000的整數 數字間以空格分隔。輸出分2行,分別以指數遞降方式輸出乘積多項式以及和多項式非零項的係數和指數。數字間以空格分隔,但結尾不能有多餘空格。...

一元多項式的乘法與加法運算

設計函式分別求兩個一元多項式的乘積與和。輸入分2行,每行分別先給出多項式非零項的個數,再以指數遞降方式輸入乙個多項式非零項係數和指數 絕對值均為不超過1000的整數 數字間以空格分隔。輸出分2行,分別以指數遞降方式輸出乘積多項式以及和多項式非零項的係數和指數。數字間以空格分隔,但結尾不能有多餘空格。...