如何讀取網路日誌的方法

2021-06-02 09:48:57 字數 1446 閱讀 3647

所謂的網路日誌就是搜尋引擎爬蟲爬取**頁面的一種記錄,通過檢視網路日誌我們可以分析蜘蛛爬行有無異常,從而得知**是否產生對搜尋引擎的不友好度。此外還可以檢視網友的訪問記錄。網路日誌對**的安全也起著監管左右,如果某個ip訪問量過大,就有可能是想侵入後台系統或者其他危害**安全的行為。

zac今天想要告訴大家的。

就從嘉興seo的部落格說起。我們先在日誌裡複製一段出來:

第一段表示的自然是時間.

w3svc103表示全球資訊網不用去管它。

get:指伺服器所作的動作,get的意思是獲取

/zac/.54html:我部落格中的檔案

80:東八區

如何寫robots的博文裡說到過。

其他蜘蛛的型別表現形式為:

mozilla/5.0 (compatible; yahoo! slurp china; 雅虎中國蜘蛛

mozilla/5.0 (compatible; yahoo! slurp/3.0; 英文雅虎蜘蛛

mozilla/5.0 (compatible; googlebot/2.1; + google蜘蛛

msnbot/1.1 (+ 微軟 bing蜘蛛

sogou+web+robot+(+搜狗蜘蛛

sosospider+(+ 搜搜蜘蛛

mozilla/5.0 (compatible; yodaobot/1.0; ) 有道蜘蛛

200:成功抓取了檔案

301:永遠轉向

302:暫時轉向

304:未抓取

400:非法請求

401:無法訪問

403:禁止訪問

500:伺服器內部錯誤

503:伺服器沒有應答

1236 0 292:這裡指的是檔案的大小,單位是位元組。

mozilla/5.0+(windows;+u;+windows+nt+5.1;+en-us):使用者電腦配置。蜘蛛爬行其實是模擬使用者訪問的方式來爬行的。這裡表示的意思是:

mozilla/5.0+:與ntescape相容的mozilla瀏覽器

windows;+u:在美國的windows系統

windows+nt+5.1作業系統,這裡是windows xp,因為xp的核心是nt5.1

en-us:語言是美國英語

khtml,+like+gecko:一種**,我也不太懂,這裡不做介紹

chrome:谷歌瀏覽器

safari:safari瀏覽器

這裡搜尋引擎會以各種瀏覽器的身份去訪問**的檔案,這裡一共用到了蘋果瀏覽器,谷歌瀏覽器和safari瀏覽器。

當然蜘蛛還會以其他瀏覽器的身份訪問,比如說火狐,ie,360,等等。

PowerShell 抓取網路日誌

豆子今天想看看powershell是否有像winsock之類的方式抓包,不過很遺憾,他有乙個netevenpacketcapture的模組,但是他不像wireshark那樣可以直接抓取tcp ip包,他獲取的是windows的網路日誌。優點是我可以直接用get winevent來分析內容了,缺點是我...

flume 網路日誌收集

channels 記憶體 sink 本地 a1.sources s1 a1.channels c1 a1.sinks k1 tcp協議 a1.sources.s1.type syslogtcp a1.sources.s1.port 5140 a1.sources.s1.host wangfutai ...

PowerShell 抓取網路日誌

豆子今天想看看powershell是否有像winsock之類的方式抓包,不過很遺憾,他有乙個netevenpacketcapture的模組,但是他不像wireshark那樣可以直接抓取tcp ip包,他獲取的是windows的網路日誌。優點是我可以直接用get winevent來分析內容了,缺點是我...