初學搜尋引擎,簡要記錄下 lucene7.1.0 搜尋流程。
1、現有待處理檔案目錄d:\test\resource ;
2、通過 lucene 建立索引檔案目錄 d:\test\index ;
3、在索引目錄中搜尋關鍵字。
實現乙個簡單的demo 步驟如下:
compile group: 'org.apache.lucene', name: 'lucene-core', version: '7.1.0'2) 建立索引目錄compile group: 'org.apache.lucene', name: 'lucene-analyzers-common', version: '7.1.0'
@compilestatic@typechecked
class indexprocessor
}writer.commit()
writer.close()
} catch (ioexception e)
}//載入文件 生成字串
string loadfiletostring(file f)
br.close()
return sb.tostring()
} catch (ioexception e)
}static void main(string args)
}
執行main 函式 ,生成 索引目錄 d:\\test\\index 。
@compilestatic@typechecked
class search
searcher.indexreader.close()
}long endtime=system.currenttimemillis
() println "總耗時:"+(endtime-starttime)+" ms"
} catch (exception e)
}public static void main(string args)
}
執行main ,返回如下:
##使用索引方式搜尋##
關鍵字:報告,在 d:/test/index中,一共檢索到檔案 2 個
關鍵字:報告,在 c1.txt檔案中0.672359
關鍵字:報告,在 c2.txt檔案中0.66506714
總耗時:184 ms
ok,乙個簡單的demo 就完成了。
HTML 簡要概述
說實在的,這門語言的確不需要太多或太詳細的篇幅來大書特書。掌握個大概,知道些特點及特性也就差不多了。人腦不是電腦,不需要死記硬背許多的屬性和值,有一本幫助手冊在手,勝過千言萬語。什麼是 html?html 是用來描述網頁的一種語言。html 指的是超文字標記語言 hypertextmarkuplan...
kafka簡要概述
生產者種類多,資料格式不同,資料來源眾多,消費者種類多 使用生產者和消費者模式進行解耦 消費者無法依據自身處理情況輪詢拉取資料 提供資料持久化,適配多個消費者 訊息系統無法橫向擴充套件 系統隨流量進行很想擴充套件,使用訊息批次加壓縮的模式提高訊息傳輸效率通過主題對訊息進行分類 配置項 partiti...
html標籤簡要概述
3 同時也存在單獨出現的標籤,稱之為單標籤,如 雙標籤關係可以分為兩類 包含關係和並列關係 1 包含關係 2 並列關係 每個網頁都會有乙個基本的結構標籤 骨架標籤 頁面內容也是在這些標籤上書寫的。我也有乙個大佬夢 標籤名 定義說明 html html html標籤 頁面中最大的標籤,稱之為根標籤 h...