搜尋引擎從**上分為全網搜尋引擎,由爬蟲爬取網際網路上的資料作為底層搜尋資料支撐; 站內搜尋引擎,由系統內部生成的資料作為底層搜尋資料支撐。
spider爬蟲系統
search&index建立索引與查詢索引系統
一方面生成索引資料build_index
另一方面生成查詢索引資料search_index
rank打分排序系統
web 網頁庫
index索引資料庫
系統組成:有spider與search&index兩個系統完成
輸入:網際網路上的網頁
輸出:正排倒排索引資料
流程:架構圖中的1,2,3,4
spider把網際網路網頁抓過來
spider把網際網路網頁儲存在網頁庫中
build_index從網頁中讀取資料,完成分詞
build_index生成倒排索引index
系統組成:有search&index與rank兩個系統完成
輸入:使用者的檢索詞
輸出:排好序的第一頁檢索結果
流程圖:如架構圖中的a,b,c,d
search_index 獲得使用者的搜尋詞,完成分詞
search_index 查詢倒排索引,獲得"字元匹配"網頁,完成初篩
rank對初篩的結果進行打分排序
rank對排序後的第一頁結果返回
站內搜尋引擎與全網搜尋引擎相比差異只有寫入的地方
本文**:
搜尋引擎分類
出自搜尋引擎直通車 搜尋引擎按其工作方式主要可分為三種,分別是全文搜尋引擎 full text search engine 目錄索引類搜尋引擎 search index directory 和元搜尋引擎 meta search engine 元搜尋引擎 meta search engine 元搜尋引...
搜尋引擎分類
搜尋引擎按其工作方式主要可分為三種,分別是全文搜尋引擎 full text search engine 目錄索引類搜尋引擎 search index directory 和元搜尋引擎 meta search engine 全文搜尋引擎 從搜尋結果 的角度,全文搜尋引擎又可細分為兩種,一種是擁有自己的...
搜 索 引 擎 分 類
搜尋引擎按其工作方式主要可分為三種,分別是全文搜尋引擎 full text search engine 目錄索引類搜尋引擎 search index directory 和元搜尋引擎 meta search engine 從搜尋結果 的角度,全文搜尋引擎又可細分為兩種,一種是擁有自己的檢索程式 in...