軟體準備:
1.tomcat
2.solr-5.2.1.tgz
3.hadoop-2.7.2
執行環境
centos7
看以前文件hadoop安裝好
在hadoop-2.7.2/etc/hadoop下的hdfs-site.xml增加了以下內容
dfs.webhdfs.enabled
true
dfs.permissions.enabled
false
webhdfs觀念是基於http操作,比如get、put、post和delete,引入rest介面
rest http的格式為:
安裝solr(看以前文件)
修改solrhome資料夾中tika/conf 下的solrconfig.xml
替換原有directoryfactory配置為如下
hdfs:
true
1true
16384
true
true
true
16192
注:solr.hdfs.home 為你所安裝的hadoop的hdfs的訪問路勁
替換原有locktype為如下:
$替換datadir
$
搜尋引擎solr系列 solr分詞配置
分詞我理解的是,輸入的一句話,按照它自己定義的規則分為常用詞語。首先,solr有自己基本的型別,string int date long等等。對於string型別,比如在你的core conf manage schema檔案中,配置乙個字段型別為string型別,如果查詢符合 我是中國人 的資料,它...
solr系列二 solr匯入資料庫資料
2.找到d solr home catalog conf schema.xml來配置solr和資料庫的對應字段。uniquekey是文件的唯一標識,必須標識對應的字段,否則solr建立索引報錯。此處的field的name屬性最好和資料庫的字段保持一致,這樣我們可以減少一些對映配置。具體配置如下 ca...
solrj操作solr索引庫 流程
宣告 博主自己記錄以免忘記,所以無邏輯無參考價值。小女子就是醬紫任性 首先dao層 訪問索引庫的類。定義一些通用的資料訪問方法。業務邏輯就是查詢索引庫。引數 solrquery物件 業務邏輯 1 根據query物件進行查詢。2 返回查詢結果。list 查詢結果的總記錄數。需要把返回結果封裝到pojo...