搜尋引擎原理

2021-04-01 17:51:37 字數 550 閱讀 2501

乙個搜尋引擎由搜尋器、索引器、檢索器和使用者介面等四個部分組成。

1.搜尋器 搜尋器的功能是在網際網路中漫遊,發現和蒐集資訊。它常常是乙個電腦程式,日夜不停地執行。它要盡可能多、盡可能快地蒐集各種型別的新資訊,同時因為網際網路上的資訊更新很快,所以還要定期更新已經蒐集過的舊資訊,以避免死連線和無效連線。

2.索引器。索引器的功能是理解搜尋器所搜尋的資訊,從中抽取出索引項,用於表示文件以及生成文件庫的索引表。索引器可以使用集中式索引演算法或分布式索引演算法。當資料量很大時,必須實現即時索引,否則不能夠跟上資訊量急劇增加的速度。索引演算法對索引器的效能(如大規模峰值查詢時的響應速度)有很大的影響。乙個搜尋引擎的有效性在很大程度上取決於索引的質量。

3.檢索器 檢索器的功能是根據使用者的查詢在索引庫中快速檢出文件,進行文件與查詢的相關度評價,對將要輸出的結果進行排序,並實現某種使用者相關性反饋機制。

4.使用者介面 使用者介面的作用是輸入使用者查詢、顯示查詢結果、提供使用者相關性反饋機制。主要的目的是方便使用者使用搜尋引擎,高效率、多方式地從搜尋引擎中得到有效、及時的資訊。使用者介面的設計和實現使用人機互動的理論和方法,以充分適應人類的思維習慣。

搜尋引擎工作原理

搜尋引擎優化的主要任務之一就是提高 的搜尋引擎友好性,因此,搜尋引擎優化的每乙個環節都會與搜尋引擎工作流程存在必然的聯絡,研究搜尋引擎優化實際上就是對搜尋引擎工作過程進行逆向推理。因此,學習搜尋引擎優化應該從了解搜尋引擎的工作原理開始。搜尋引擎的主要工作包括 頁面收錄 頁面分析 頁面排序 及 關鍵字...

搜尋引擎工作原理

搜尋引擎工作原理 爬行和抓取 預處理 排名 爬行和抓取 1,是通過蛛蛛程式來實現的,蛛蛛主要是通過鏈結來抓取所有頁面的.所以要想讓蛛蛛盡量的抓取頁面,必須要吸引蛛蛛 優化 2,為了避免重複爬行和抓取 搜尋引擎建立了乙個位址庫用來儲存已經抓取的頁面 位址庫中的url 大多數是蛛蛛獲取到的,當然也有一些...

搜尋引擎技術原理

一 web搜尋引擎技術綜述 二 google技術 四 結束語 搜尋引擎 search engine 是指根據一定的策略 運用特定的電腦程式蒐集網際網路上的資訊,在對資訊進行組織和處理後,為使用者提供檢索服務的系統。一 web搜尋引擎技術綜述 一 引子 隨著網路技術的應用與發展,互連網已經成為資訊的重...