搜尋引擎分類和架構

2021-09-25 09:00:09 字數 865 閱讀 1049

搜尋引擎從**上分為全網搜尋引擎,由爬蟲爬取網際網路上的資料作為底層搜尋資料支撐; 站內搜尋引擎,由系統內部生成的資料作為底層搜尋資料支撐。

spider爬蟲系統

search&index建立索引與查詢索引系統

一方面生成索引資料build_index

另一方面生成查詢索引資料search_index

rank打分排序系統

web 網頁庫

index索引資料庫

系統組成:有spider與search&index兩個系統完成

輸入:網際網路上的網頁

輸出:正排倒排索引資料

流程:架構圖中的1,2,3,4

spider把網際網路網頁抓過來

spider把網際網路網頁儲存在網頁庫中

build_index從網頁中讀取資料,完成分詞

build_index生成倒排索引index

系統組成:有search&index與rank兩個系統完成

輸入:使用者的檢索詞

輸出:排好序的第一頁檢索結果

流程圖:如架構圖中的a,b,c,d

search_index 獲得使用者的搜尋詞,完成分詞

search_index 查詢倒排索引,獲得"字元匹配"網頁,完成初篩

rank對初篩的結果進行打分排序

rank對排序後的第一頁結果返回

站內搜尋引擎與全網搜尋引擎相比差異只有寫入的地方

本文**:

搜尋引擎分類

出自搜尋引擎直通車 搜尋引擎按其工作方式主要可分為三種,分別是全文搜尋引擎 full text search engine 目錄索引類搜尋引擎 search index directory 和元搜尋引擎 meta search engine 元搜尋引擎 meta search engine 元搜尋引...

搜尋引擎分類

搜尋引擎按其工作方式主要可分為三種,分別是全文搜尋引擎 full text search engine 目錄索引類搜尋引擎 search index directory 和元搜尋引擎 meta search engine 全文搜尋引擎 從搜尋結果 的角度,全文搜尋引擎又可細分為兩種,一種是擁有自己的...

搜 索 引 擎 分 類

搜尋引擎按其工作方式主要可分為三種,分別是全文搜尋引擎 full text search engine 目錄索引類搜尋引擎 search index directory 和元搜尋引擎 meta search engine 從搜尋結果 的角度,全文搜尋引擎又可細分為兩種,一種是擁有自己的檢索程式 in...