解讀apache日誌
當你一步步地看到這裡的時候,相信你的www站點已經建好,並且已經在
internet上展現出來了。這時你可能就會關心誰造訪過你的站點,或者想知道
你的apache伺服器 現在的執行狀態與效能如何。下面我們一起通過解讀apache
的日誌來實現這個偉大的願望。
一、盯著apache伺服器
apache允許通過www監視伺服器的配置資訊與執行狀態。
1.**配置資訊
如果你的apache象預設配置一樣加入了mod_info模組的話,你就可以通過訪問
http://localhost/server-info檢視伺服器資訊。
2.使用狀態頁
如果你的apache象預設配置一樣加入了mod_status模組的話,你就可以
通過訪問http://localhost/apache -status檢視伺服器的執行狀態資訊,其中
包括:¨ 伺服器系統 的當前時間;
¨ 伺服器最近一次重啟時間;
¨ 伺服器啟動後的執行時間;
¨ 到目前為止服務的訪問總數;
¨ 到目前為止傳輸的位元組總數;
¨ 服務請求的子程序數;
¨ 空閒子程序數;
¨ 每個程序狀態、子程序服務的請求數以及該子程序傳輸的位元組總數;
¨ 每秒平均請求數、每秒傳輸的位元組數、每次請求平均傳輸位元組數;
¨ 目前每個子程序cpu占用及apache的總的cpu佔用率;
¨ 當前主機及處理的請求。
二、什麼是日誌檔案
日誌檔案是apache工作的記錄,apache包括了mod_log_config模組,它用來記
錄日誌。在預設情況下,它用通用日誌格式clf規範來寫。clf日誌檔案內對每
個請求均有乙個單獨行,形如:host ident anthuser date request status
bytes
其含義如下:
¨ host��客戶端主機的全稱網域名稱 或ip位址;
¨ ident��存放客戶端報告的識別資訊;
¨ authuser��如果是基於使用者 名認證的話,值為使用者名稱;
¨ date��請求的日期與時間;
¨ request��客戶端的請求行;
¨ status��返回到客戶端的三們數字的http狀態碼;
¨ bytes��除去http頭標外,返回給客戶端的位元組數。
三、分析日誌檔案
有了日誌檔案後,我們可以利用unix的一些工具和一此專門的日誌分析工具對
日誌檔案進行分析。
例項一:列出訪問過本**的主機名或ip:
對於這個需求,我們可以通過乙個unix的乙個指令碼語句來完成:
用上面的方法雖然可以得到訪問過本**的主機名或ip,但是由於有些是多次
訪問的,我們希望在上面得到的結果的基礎上做一些優化,使得列出的表中,
每個主機只出現一次。我們可以使用:
3. 當然,我們可以根據需要選擇第三方提供日誌分析工具甚至自己開發 一些日
3. 志分析工具來滿足我們的需求。常見的第三方日誌分析工具有:web trends、
四、一些提示
日誌一方面是我們分析**的第一手資料,一方面卻是吞噬大量磁碟空間 的罪
魁禍首。所以別忘了定期轉儲或刪除一些老的日誌檔案。
apache與**伺服器
**伺服器是位於客戶和客戶要訪問的伺服器之間的系統。當客戶機使用
url請求訪問遠端資源時,**伺服器接受該請求並取得該資源以滿足客戶機的
請求。在通常情況下,**伺服器是客戶機的伺服器,同時也是遠端伺服器的
客戶。**伺服器可以在自己的緩衝區中儲存被請求的內容,當這些資訊再次被
請求的時候,**伺服器就無需再從遠端伺服器上取了,這樣**伺服器就減
輕了網路的瓶頸問題 。
Apache日誌解讀
apache的日誌,記錄了apache所有的活動記錄,如果apache的安裝方式為預設安裝,則伺服器一執行就會有兩個日誌檔案生成,這兩個日誌檔案為access log 和 error log,預設放在logs資料夾下。下面是access log日誌中乙個典型的記錄,這些內容有7項構成。第四項 請求的...
apache切割日誌
系統環境 ubuntu11.04 apache2 使用apache自帶的rotatelog進行日誌切割,可將日誌的檔名以年月日時分秒儲存,如2011 10 21 14 20 00,設定如下 首先在apache2的目錄下有個sites enabled資料夾,裡面有個000 default檔案,在該資料...
Apache日誌分析
1 獲得訪問前10位的ip位址 cataccess.log awk sort uniq c sort nr head 10 cat access.log awk end 2 訪問次數最多的檔案或頁面,取前20及統計所有訪問ip cat access.log awk sort uniq c sort ...