solr索引建立流程:
分詞元件tokenizer
分詞元件(tokenizer)會做以下幾件事情(這個過程稱為:tokenize),處理得到的結果是詞彙單元(token)。
1、將文件分成乙個乙個單獨的單詞。
2、去除標點符號。
3、去除停詞(stop word)。
語言處理元件
語言處理元件(linguistic processor)主要是對得到的詞元(token)做一些語言相關的處理。對於英語,語言處理元件(linguistic processor)一般做以下幾點:
1、變為小寫(lowercase)
2、將單詞縮減為詞根形式
3、將單詞轉換為詞根形式
索引元件(indexer)
1、利用得到的詞(term)建立乙個字典
2、對欄位進行排序
3、合併相同的詞和詞出現的文件
solr建立查詢索引
1 建立solrserver物件 try catch exception e 2 新增索引 collectiondocs newarraylist for int i 0 i list.size i try catch exception e 3 使用bean物件新增索引 建立乙個對應於solr索引...
solrj操作solr索引庫 流程
宣告 博主自己記錄以免忘記,所以無邏輯無參考價值。小女子就是醬紫任性 首先dao層 訪問索引庫的類。定義一些通用的資料訪問方法。業務邏輯就是查詢索引庫。引數 solrquery物件 業務邏輯 1 根據query物件進行查詢。2 返回查詢結果。list 查詢結果的總記錄數。需要把返回結果封裝到pojo...
SOLR對多個(關聯)表建立索引
首先在資料庫建立一張表,本來有乙個tuser表了,我又建立了乙個role表,就兩三個字段,沒什麼特殊的,然後在裡面隨便新增幾條資料即可,看一下資料庫 資料庫建立完成之後就是修改data config.xml檔案了,因為資料庫跟solr之間的關聯主要就是建立在這個檔案上面的,所以接下來就是修改該檔案了...