所謂的網路日誌就是搜尋引擎爬蟲爬取**頁面的一種記錄,通過檢視網路日誌我們可以分析蜘蛛爬行有無異常,從而得知**是否產生對搜尋引擎的不友好度。此外還可以檢視網友的訪問記錄。網路日誌對**的安全也起著監管左右,如果某個ip訪問量過大,就有可能是想侵入後台系統或者其他危害**安全的行為。
zac今天想要告訴大家的。
就從嘉興seo的部落格說起。我們先在日誌裡複製一段出來:
第一段表示的自然是時間.
w3svc103表示全球資訊網不用去管它。
get:指伺服器所作的動作,get的意思是獲取
/zac/.54html:我部落格中的檔案
80:東八區
如何寫robots的博文裡說到過。
其他蜘蛛的型別表現形式為:
mozilla/5.0 (compatible; yahoo! slurp china; 雅虎中國蜘蛛
mozilla/5.0 (compatible; yahoo! slurp/3.0; 英文雅虎蜘蛛
mozilla/5.0 (compatible; googlebot/2.1; + google蜘蛛
msnbot/1.1 (+ 微軟 bing蜘蛛
sogou+web+robot+(+搜狗蜘蛛
sosospider+(+ 搜搜蜘蛛
mozilla/5.0 (compatible; yodaobot/1.0; ) 有道蜘蛛
200:成功抓取了檔案
301:永遠轉向
302:暫時轉向
304:未抓取
400:非法請求
401:無法訪問
403:禁止訪問
500:伺服器內部錯誤
503:伺服器沒有應答
1236 0 292:這裡指的是檔案的大小,單位是位元組。
mozilla/5.0+(windows;+u;+windows+nt+5.1;+en-us):使用者電腦配置。蜘蛛爬行其實是模擬使用者訪問的方式來爬行的。這裡表示的意思是:
mozilla/5.0+:與ntescape相容的mozilla瀏覽器
windows;+u:在美國的windows系統
windows+nt+5.1作業系統,這裡是windows xp,因為xp的核心是nt5.1
en-us:語言是美國英語
khtml,+like+gecko:一種**,我也不太懂,這裡不做介紹
chrome:谷歌瀏覽器
safari:safari瀏覽器
這裡搜尋引擎會以各種瀏覽器的身份去訪問**的檔案,這裡一共用到了蘋果瀏覽器,谷歌瀏覽器和safari瀏覽器。
當然蜘蛛還會以其他瀏覽器的身份訪問,比如說火狐,ie,360,等等。
PowerShell 抓取網路日誌
豆子今天想看看powershell是否有像winsock之類的方式抓包,不過很遺憾,他有乙個netevenpacketcapture的模組,但是他不像wireshark那樣可以直接抓取tcp ip包,他獲取的是windows的網路日誌。優點是我可以直接用get winevent來分析內容了,缺點是我...
flume 網路日誌收集
channels 記憶體 sink 本地 a1.sources s1 a1.channels c1 a1.sinks k1 tcp協議 a1.sources.s1.type syslogtcp a1.sources.s1.port 5140 a1.sources.s1.host wangfutai ...
PowerShell 抓取網路日誌
豆子今天想看看powershell是否有像winsock之類的方式抓包,不過很遺憾,他有乙個netevenpacketcapture的模組,但是他不像wireshark那樣可以直接抓取tcp ip包,他獲取的是windows的網路日誌。優點是我可以直接用get winevent來分析內容了,缺點是我...