1.blue spider網路蜘蛛軟體
2.軟體簡稱:
3.版本號:v1.0
4.分類號:67500-9100
5.首次發表地點:西安
6.硬體環境:pc機(記憶體1g以上)
7.軟體環境:windows xp以上版本
8.程式語言:visual c++ 6.0
9.源程式量:8216行
10.主要功能和技術特點(不超過300字)
主要功能:
1.設定採集目標,採集網路資訊;
2.儲存採集資訊;
3.採集資訊的瀏覽;
4設定採集規則;
5.設定url過濾規則。
技術特點:
1. 多執行緒並行的功能。保證了系統的執行效率。
2.網頁抓取的深度優先、廣度優先、啟發式搜尋和基於自動分類搜尋的多種策略選擇,提高了採集效率;
3. 不同語言編碼的識別與轉換,提高了系統的相容性。
網路蜘蛛爬蟲原理
相對於通用網路爬蟲,聚焦爬蟲還需要解決三個主要問題 1 對抓取目標的描述或定義 2 對網頁或資料的分析與過濾 3 對url的搜尋策略。抓取目標的描述和定義是決定網頁分析演算法與url搜尋策略如何制訂的基礎。而網頁分析演算法和候選url排序演算法是決定搜尋引擎所提供的服務形式和爬蟲網頁抓取行為的關鍵所...
網路蜘蛛Spider簡介
與網路蜘蛛 網路蜘蛛需要抓取網頁,不同於一般的訪問,如果控制不好,則會引起 伺服器負擔過重。今年4月,http www.taobao.com 2004年5月15日的搜尋引擎訪問日誌 網路蜘蛛進入乙個 一般會訪問乙個特殊的文字檔案robots.txt,這個檔案一般放在 伺服器的根目錄下,內容提取 更新...
網路程式設計 網路蜘蛛的秘密
headlines l t h3 stocks prices fall ne w movies today bush and nb sp gore to debate tonight fall tv lineup 在這個頁面內,我們只關心位於 put headlines here 和 end hea...