原文:
本文的前提條件是,你已經完成了第一節,將solr搭建起來了。
solr版本solr 3.1
solr有幾個配置檔案是最重要的。solr.xml,solrconfig.xml,schema.xml,db-data-config.xml
如果你不使用solr自帶的更新索引的功能,想用solrj程式設計來實現索引更新,那麼我可以告訴你db-data-config.xml檔案沒什麼用,乙個乙個來介紹下這幾個配置檔案吧。
看了網上很多大神的blog,然後自己開發經驗之後發現這些配置檔案都是蠻好理解的。
1. solr.xml配置例子:
<?xml version="1.0" encoding="utf-8" standalone="yes"?>
< solr sharedlib="lib" persistent="true">
< /solr>
告訴搜尋引擎,db這個資料夾下的配置檔案是可用的配置。
2.solrconfig.xml 配置例子
這個配置檔案的東西就多了。先配置最簡單的乙個也是必須配置的乙個。以後祥談。$
3.db-data-config.xml,即相當於索引對應的資料庫是什麼,資料庫表是什麼。
這個是依你的實際情況來看的。
< /dataconfig>
4.schema.xml 配置檔案
主要是告訴搜尋引擎建索引的時候哪些字段需要分詞,哪些欄位是什麼型別。使用什麼分詞器,等等
後面專門再寫一下solrconfig和schema.xml的詳細配置。這裡先只談一下他們各自的作用。
solr3.1版本,solr3.x版本大部分應該一致。
乙個乙個的配置項來談談schema.xml 配置:
以下是針對schema.xml 配置檔案的剖析:
1. 這個標籤和它的意義一樣,是用來表示資料有哪些型別,這些型別當然是solr內部定義的型別和自定義型別。
2.
和他上面解釋一樣,string型別是不分詞的,要建索引,要儲存
3.數值型別,有如下幾個型別是預設數值型別,如果想用於排序請用 tint/tfloat/tlong/tdouble型別
4.時間型別:如果想用於快速排序查詢,用tdate(看到這裡我的排序沒用tdate,得改啊。。)
note: for faster range queries, consider the tdate type
5.專門用於分詞的字段。在裡面包含了定義使用什麼分詞器,可以手工定製。
其他幾個類別都是不常用的,也是通過分詞器來定義不同的類別。和第五個類似。
6.索引欄位名稱定義。
< !-- -->
id:是索引欄位的唯一標識。
multivalued="true"屬性,一般用於多個字段組成乙個欄位的情況。
一般用於查詢的字段定義為multivalued。
7. 表示動態字段,暫時沒用到。
利用solr構建企業搜尋平台 (六)
solr查詢引數說明 在做solr查詢的時候,solr提供了很多引數來擴充套件它自身的強大功能!以下是使用頻率最高的一些引數!具體請看 1.常用 q 查詢字串,必須的。查詢語句 類似sql 相關詳細的操作還需lucene 的query 語法 fl 指定返回那些字段內容,用逗號或空格分隔多個。star...
利用solr構建企業搜尋平台 (十)
四.將solr home目錄下面的solrconfig.xml和schema.xml拷貝到db資料夾下面的conf中。五.修改db conf db data config.xml xml 其中的意思我做簡單解釋,具體大家可以去看看官方wiki。document 乙個文件也就是lucene的docum...
如何搭建企業資料平台
隨著資訊時代正逐步向資料時代轉變,資料演變得越來越重要,它可以反映出公司的經營情況,為公司的經營和決策提供準確的參考依據。而資料平台是連線資料和企業的中介軟體,可以將這些資料通過一定的規格,清晰地展示給企業領導。企業資料平台搭建的整體架構可以由以下幾個部分組成 更深層次的還能收集到使用者的行為資料,...