搜尋引擎通過一種程式robot(又稱spider),自動訪問網際網路上的網頁並獲取網頁資訊。
您可以在您的**中建立乙個純文字檔案robots.txt,在這個檔案中宣告該**中不想被robot訪問的部分,這樣,該**的部分或全部內容就可以不被搜尋引擎收錄了,或者指定搜尋引擎只收錄指定的內容。
robots.txt(統一小寫)是一種存放於**根目錄下的ascii編碼的文字檔案,它通 常告訴網路搜尋引擎的漫遊器(又稱網路蜘蛛),此**中的哪些內容是不能被搜尋引擎的漫遊器獲取的,哪些是可以被(漫遊器)獲取的。 因為一些系統中的url是大小寫敏感的,所以robots.txt的檔名應統一為小寫。robots.txt應放置於**的根目錄下。如果想單獨定義搜 索引擎的漫遊器訪問子目錄時的行為,那麼可以將自定的設定合併到根目錄下的robots.txt,或者使用robots元資料。
搜尋引擎常見語法
1 引號的用法 例 推廣策劃 網路營銷方案 2 加減號的用法 加號是搜尋同時包含兩個關鍵字的內容。相當於空格和and。減號是讓某一關鍵字不要出現在搜尋結果裡面。比如搜尋 推一把 相關的文章,但是直接搜尋會出現一些有關 江禮坤 這個名字的網頁,這樣可以用減號 江禮坤 完整的構造為 推一把 江禮坤 就可...
什麼是搜尋引擎蜘蛛機械人?是如何工作的
在網際網路發展初期,相對較少,資訊查詢比較容易。然而伴隨網際網路 性的發展,普通網路使用者想找到所需的資料簡直如同大海撈針,這時為滿足大眾資訊檢索需求的專業搜尋 便應運而生了。現代意義上的搜尋引擎的祖先,是1990年由蒙特婁大學學生alan emtage發明的archie。雖然當時world wid...
常見搜尋引擎蜘蛛大全
谷歌 google.com googlebot http www.google.com bot.html 中文版請開啟以下頁面 雅虎 yahoo.com yahoo http misc.yahoo.com.cn help.html 開啟後跳轉到以下頁面 有道 yodao.com yodaobot 搜...