基於PHP的搜尋引擎Sphinx安裝步驟

2021-08-31 06:05:41 字數 1876 閱讀 9068

系統要求:

1.windows xp或以上,或者是linux系統

2.mysql 5.0以上

安裝步驟

2、解壓到d盤,目錄為 d:\spihinx

3、在根目錄(d:\spihnx)建立sphinx.conf檔案,內容如下:

# minimal sphinx configuration sample (clean, ******, functional)

#source test1

index test1

#index testrt

#indexer

searchd

4、修改配置,引數說明如下:

source部分配置項說明

#type 資料庫型別,目前支援mysql與pgsql

#strip_html 是否去掉html標籤

#sql_host 資料庫主機位址

#sql_user 資料庫使用者名稱

#sql_pass 資料庫密碼

#sql_db 資料庫名稱

#sql_port 資料庫採用的埠

#sql_query_pre 執行sql前要設定的字符集,用utf8必須set names utf8

#sql_query 全文檢索要顯示的內容,在這裡盡可能不使用where或group by,將where與groupby的內容交給sphinx,由sphinx進行條件過濾與groupby效率會更高

#注意:select 出來的字段必須至少包括乙個唯一主鍵(articlesid)以及要全文檢索的字段,你計畫原本在where中要用到的字段也要select出來

#這裡不用使用orderby

#sql_attr_開頭的表示一些屬性字段,你原計畫要用在where,orderby,groupby中的字段要在這裡定義

#根據我們原先的sql:

#select * from eht_articles where title like ? and catalogid=? and edituserid=? and addtime between ? and ? order by hits desc

#我們需要對catalogid,edituserid,addtime,hits進行屬性定義(這四個欄位也要在select的字段列表中),定義時不同的字段型別有不同的屬性名稱,具體可以見sphinx.conf.in中的說明

index部分配置項說明

#source 資料來源名

#path 索引記錄存放目錄,如d:/sphinx/data/cgfinal,實際存放時會存放在d:/sphinx/data目錄,然後建立多個cgfinal名稱,不同副檔名的索引檔案。

#其他的配置如min_word_len,charset_type,charset_table,ngrams_chars,ngram_len這些則是支援中文檢索需要設定的內容。

5、將安裝包中的「example.sql」檔案匯入到test庫中

6、註冊系統服務寫道

d:\sphinx\bin> d:\sphinx\bin\searchd --install --config d:\sphinx\sphinx.conf --servicename sphinxsearch

7、啟動服務

8、我在啟動服務的時候出錯,在網上找了一下,解決方法如下:寫道

# 先停掉sphinxsearch服務,或直接殺程序,要保證log/searchd.pid檔案的一致性

indexer.exe --all # 重建所有索引,可以看到***.sph檔案又回來了

searchd.exe # 啟動searchd服務

indexer.exe --all --rotate # 試試用rotate命令重建索引

PHP搜尋引擎

簡單php搜尋引擎源 需要開啟php的curl擴充套件。功能 對某一 進行檢索,獲取 基本資訊,同時提取 的所有連線。class engine 啟動引擎 public function start 獲取meta內容 public function getmeta content 獲取body內容 p...

基於Flask的搜尋引擎

由於需要課設,所以臨時做了乙個搜尋引擎的小demo,很簡陋的乙個程式。原理呼叫其他搜尋引擎的api 完成索引,網頁爬去,跳轉。flask 爬蟲 即可 索引模組 from flask import flask from flask import render template from flask i...

搜尋引擎 索引

正排索引 文件編號,單詞編號,單詞的數量,單詞出現的位置。倒排索引 1,單詞詞典,儲存單詞以及統計資訊,單詞在記錄表中的便宜,可常駐記憶體,用雜湊表儲存。2,記錄表,單詞對應的文件集合,記錄單詞出現的數目 位置。文件採用差分變長編碼。其中文件可按編號公升序排列 可利用差分編碼 也可按出現次數排列,可...