前一段在研究sphinx,檢索功能很強大,用的ubuntu,coreseek中文檢索
用root賬戶登入
1、ubuntu9.10需安裝軟體:
apt-get install gcc g++ automake libtool mysql-client libmysqlclient15-dev libxml2-dev libexpat1-dev
2、
download
tar xzvf coreseek-3.2.13.tar.gz
3、安裝mmseg中文分詞:
cd mmseg-3.2.13
./bootstrap
##ubuntu環境下,需要使用aclocal_flags="-i /usr/share/aclocal" ./bootstrap
./configure --prefix=/usr/local/mmseg3
make
make install
檢測安裝:
/usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc src/t1.txt
中文/x 分/x 詞/x 測試/x
中國人/x 上海市/x
word splite took: 1 ms.
4、安裝coreseek(mysql資料來源):
cd csft-3.2.13
sh buildconf.sh
apt-get install mysql-client libmysqlclient15-dev libxml2-dev libexpat1-dev
./configure --prefix=/usr/local/coreseek --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql
make
make install
5、測試安裝:
/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx-min.conf.dist
6、建立全索引:
/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --all
搜尋:
/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/csft.con
f
開啟searchd埠監控:
/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf
關閉埠:
/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf --stop
重建索引
/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --all --rotate
建立指定配置檔案中指定索引
/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf index1 --rotate
7、配置中文分詞
生成詞典:
cp ~/mmseg3/data/ /usr/local/mmseg/ -r
/usr/local/mmseg3/bin/mmseg -u unigram.txt
cp unigram.txt.uni uni.lib
修改索引配置:
charset_dictpath=/usr/local/mmseg3/etc/
charset_type=zh_cn.utf-8
重建索引加入cron任務,
建立增量索引,
配置檔案等等
再續..
全文檢索引擎 Sphinx
sphinx是乙個基於sql的全文檢索引擎,可以結合mysql,postgresql做全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得應用程式更容易實現專業化的全文檢索。sphinx特別為一些指令碼語言設計搜尋api介面,如php,python,perl,ruby等,同時為mysql也設計了乙...
全文檢索引擎 Sphinx
sphinx是乙個基於sql的全文檢索引擎,可以結合mysql,postgresql做全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得應用程式更容易實現專業化的全文檢索。sphinx特別為一些指令碼語言設計搜尋api介面,如php,python,perl,ruby等,同時為mysql也設計了乙...
sphinx中文索引實現中文檢索
介紹 2 sphinx使用的好處 快速檢索使用者需要的模糊資訊 替代like使用 本身還有中文 分詞 的實現,英文分詞通過 空格 區分,中文分詞通過技術實現 例如 匹配 使用習慣 sphinx是專業做資料檢索的乙個技術使用者去sphinx做模糊查詢,查詢 北京 相關的資訊,sphinx把 北京西二旗...