本篇主要說乙個lucene使用多個條件同時匹配的情況,如圖所示
這個檢索表示四個條件同時滿足的結果,其中分類關鍵categoryname這個唯一字段,年級與科目比較複雜,它們兩個同時關聯propertyname欄位,字段內容用|
分割,關鍵字它關鍵所有字段,在web專案中,首先需要對年級與科目進行處理,讓它們形成乙個|分割的形式
grouppropertyname方法如下:
而在lucene底層需要對這三種檢索形式進行設定
這樣,我們就可以找到條件的結果集了。
Lucene常見的分詞
剛上班第乙個任務就是將db查詢改為lucene查詢,之前也沒有接觸過lucene,也是慢慢自學lucene,lucene大概的意思就是將原先的資料庫重新生成重組成新的資料庫,它生成的lucene資料庫會有多個資料夾。用lucene查詢會大大提高查詢的速度。下面介紹的是lucene中常見的幾種分詞。p...
Lucene 中文分詞的理解
中文與西方文字不同,西方文字如英文的單詞間有空格作為分隔,計算機很容易把乙個個詞分開。而中文句子裡的之間沒有分隔,要把中文句子拆分成詞就需要使用中文分詞技術。由於全文索引採用的是倒排索引技術,所以分詞的效果直接決定了搜尋的效果。目前的中文分詞技術主要有 n元切分 最長匹配 最大壓縮 統計語言模型等方...
lucene 分詞原理2
建立索引和查詢的過程中,都是以基本的語素項為單位的。基本的語素項就是通過分詞得到。這個過程決定了索引單元金額最終的匹配過程。分詞在文字索引的建立過程和使用者提交檢索過程中都存在。利用相同的分詞器,把短語或者句子切分成相同的結果,才能保證檢索過程順利進行。1 英文分詞的原理 基本的處理流程是 輸入文字...