首先,索引一些文件的全文,在搜尋「電腦科學」時,首先,根據檢索詞可以找到命中的所有文件,有沒有辦法獲取到對某個命中的文件中所有的檢索關鍵字的上下文資訊?
就像在word中進行搜尋時,會在目錄中高亮顯示在那些節有檢索詞,並返回共有多少個匹配項。
就是需要先定位到文件,然後還要定位到文件中的位置資訊。
用lucene的話怎麼實現這種功能?
舉個例子:
我想索引一本書的全文,有乙個field為書名,另外乙個field content對應的值應該是乙個頁碼和當前頁碼中的內容的乙個陣列。
但是lucene好像沒有辦法儲存陣列型別的field。這個該怎麼解決?有什麼好的替代方法嗎?
如果針對每頁均作為乙個field去儲存的話,不能實現上面的需求,因為在搜尋時沒有辦法指定查詢的field。
現在將content作為全文field的name,但這個field的值需要有頁碼和內容2個內容,而且在檢索時除了能返回那些文件中有這個檢索詞,還需要能返回檢索詞出現在那些頁碼中。
Table Storage對分頁的支援
大家可能知道wcf data services最新版提供了server paging的功能,意即在服務期端對資料進行分頁,從而限制傳回客戶端的資料量。那麼windows azure table storage是否提供分頁功能呢?windows azure table storage本身就限制了客戶端...
Lucene的檢索優化(二) Hits的改進
剛剛開始學lucene,看的是lucene in action。順著看下去,很自然的就是使用hits來訪問search的結果。但是使用起來,發現search的速度是很快,不過如果結果很多的話 比如1w個 通過hits訪問所有的結果速度非常慢,就是簡單地從每個結果中讀乙個field,在我的機器上用了接...
Lucene3 6的分頁查詢
分頁查詢只需要傳入每頁顯示多少條記錄,當前是第幾頁就可以了。當然是對搜尋返回的結果進行分頁,並不是對搜尋結果的總數量進行分頁,因為我們搜尋的時候都是返回前n條記錄。例如indexsearcher.search query,100 只返回前100條記錄 對搜尋返回的前n條結果進行分頁顯示 param ...