從**的iis日誌可以分析蜘蛛爬行和使用者訪問情況,經常檢視log記錄是個好習慣,這也是每位站長必備的基本功。以下是乙份國內常見的搜尋引擎蜘蛛列表,打算開站的朋友先混個眼熟,作為站長的你日後會經常跟它打交道。
名稱:googlebot
身份:谷歌
腳印:2009-10-13 07:25:05 get /default.asp 203.208.60.173 mozilla/5.0+(compatible;+googlebot/2.1;++ - www.joseo.cn 200 0 0 17706 296 718
名稱:yahoo!+slurp
身份:雅虎
腳印:2009-10-13 20:21:53 get /default.asp - 67.195.111.42 mozilla/5.0+(compatible;+yahoo!+slurp;+ - www.joseo.cn 200 0 0 297 189 218
名稱:msnbot
身份:微軟msn
腳印:2009-10-13 02:00:44 get /default.asp - 65.55.25.143 msnbot/1.1+(+ - www.joseo.cn 200 0 0 14823 193 703
名稱:sogou+web+spider
身份:搜狗
腳印:2009-10-13 06:00:47 get /default.asp 220.181.94.222 sogou+web+spider/4.0(+ - www.joseo.cn 200 0 0 910 361 468
名稱:youdaobot
身份:網易有道
腳印:2009-10-13 07:14:21 get /default.asp - 202.108.7.213 mozilla/5.0+(compatible;+youdaobot/1.0;+ 200 0 0
常見搜尋引擎蜘蛛大全
谷歌 google.com googlebot http www.google.com bot.html 中文版請開啟以下頁面 雅虎 yahoo.com yahoo http misc.yahoo.com.cn help.html 開啟後跳轉到以下頁面 有道 yodao.com yodaobot 搜...
搜尋引擎蜘蛛爬蟲原理
1 聚焦爬蟲工作原理及關鍵技術概述 相對於通用網路爬蟲,聚焦爬蟲還需要解決三個主要問題 1 對抓取目標的描述或定義 2 對網頁或資料的分析與過濾 3 對url的搜尋策略。抓取目標的描述和定義是決定網頁分析演算法與url搜尋策略如何制訂的基礎。而網頁分析演算法和候選url排序演算法是決定搜尋引擎所提供...
搜尋引擎蜘蛛工作原理
能在搜尋引擎被搜到,歸功於搜尋引擎蜘蛛抓取的功勞,權重高,更新快的 搜尋引擎蜘蛛會經常爬行,抓取 最新資料,經過搜尋引擎資料整理後,在搜尋引擎上就能搜尋到 的網頁,為了更好的seo優化 了解搜尋引擎蜘蛛爬行規則也是相當重要的,怎麼才能知道搜尋引擎蜘蛛在爬行 時間 爬行網頁 爬行反映呢,就要檢視 ii...