solr系列 索引庫儲存在hdfs中

2021-08-02 05:49:46 字數 689 閱讀 2161

軟體準備:

1.tomcat

2.solr-5.2.1.tgz

3.hadoop-2.7.2

執行環境

centos7

看以前文件hadoop安裝好

在hadoop-2.7.2/etc/hadoop下的hdfs-site.xml增加了以下內容

dfs.webhdfs.enabled

true

dfs.permissions.enabled

false

webhdfs觀念是基於http操作,比如get、put、post和delete,引入rest介面

rest http的格式為: 

安裝solr(看以前文件)

修改solrhome資料夾中tika/conf 下的solrconfig.xml

替換原有directoryfactory配置為如下

hdfs:

true

1true

16384

true

true

true

16192

注:solr.hdfs.home 為你所安裝的hadoop的hdfs的訪問路勁

替換原有locktype為如下:

$替換datadir

$

搜尋引擎solr系列 solr分詞配置

分詞我理解的是,輸入的一句話,按照它自己定義的規則分為常用詞語。首先,solr有自己基本的型別,string int date long等等。對於string型別,比如在你的core conf manage schema檔案中,配置乙個字段型別為string型別,如果查詢符合 我是中國人 的資料,它...

solr系列二 solr匯入資料庫資料

2.找到d solr home catalog conf schema.xml來配置solr和資料庫的對應字段。uniquekey是文件的唯一標識,必須標識對應的字段,否則solr建立索引報錯。此處的field的name屬性最好和資料庫的字段保持一致,這樣我們可以減少一些對映配置。具體配置如下 ca...

solrj操作solr索引庫 流程

宣告 博主自己記錄以免忘記,所以無邏輯無參考價值。小女子就是醬紫任性 首先dao層 訪問索引庫的類。定義一些通用的資料訪問方法。業務邏輯就是查詢索引庫。引數 solrquery物件 業務邏輯 1 根據query物件進行查詢。2 返回查詢結果。list 查詢結果的總記錄數。需要把返回結果封裝到pojo...