把今天的看的點知識,挑重要的記下來。
1)搜尋引擎是什麼?
「搜尋引擎」,說到底是乙個計算機應用軟體系統,或者說是乙個網路應用軟體系統。
網路搜尋引擎:它根據使用者提交的類自然語言查詢詞或者短語,返回一系列很可能與該查詢相關的網頁資訊,供使用者進一步判斷和選取。(全引自《搜尋引擎—原理、技術與系統》,呵呵
2)網路搜尋引擎的主要組成
主要分為三個子系統:網頁蒐集,預處理和查詢服務。
3)網路搜尋返回的主要結果
最終提供給使用者的是:三個元素(標題,**鏈結url,摘要)結果集列表。
「在乙個可以接受的時間內返回乙個和該使用者查詢匹配的網頁資訊列表」,強調:可以接受的時間,匹配,列表(需要rank).
4)三個子系統的基本策略
(1)網頁蒐集:提前抓取(crawl)-策略:定期蒐集或增量蒐集或折中。
(3)查詢服務:查詢方式和匹配,結果排序,文件摘要。
搜尋引擎技術原理
一 web搜尋引擎技術綜述 二 google技術 四 結束語 搜尋引擎 search engine 是指根據一定的策略 運用特定的電腦程式蒐集網際網路上的資訊,在對資訊進行組織和處理後,為使用者提供檢索服務的系統。一 web搜尋引擎技術綜述 一 引子 隨著網路技術的應用與發展,互連網已經成為資訊的重...
搜尋引擎原理
乙個搜尋引擎由搜尋器 索引器 檢索器和使用者介面等四個部分組成。1.搜尋器 搜尋器的功能是在網際網路中漫遊,發現和蒐集資訊。它常常是乙個電腦程式,日夜不停地執行。它要盡可能多 盡可能快地蒐集各種型別的新資訊,同時因為網際網路上的資訊更新很快,所以還要定期更新已經蒐集過的舊資訊,以避免死連線和無效連線...
搜尋引擎《原理 技術與系統》讀書筆記(5)
hub網頁 hub 網頁 pic 內容類別 是從語義上對網頁的內容進行分類 正文是原始網頁中真正描述主題的部分,因此,在某些具體應用中用正文代替原始網頁更為合理。相關鏈結是指在本網頁中指向與正文內容相關的網頁的鏈結,而非廣告等噪音鏈結。將正文和相關超鏈重新組合就得到了淨化後的網頁。網頁的表示 構造標...