相信網際網路的從業人員,或多或少都會接觸access_log進行一些資訊的提取和分析,那麼如何高效的達成目標,今天我就將業務線的實踐分享給大家。
基於日誌格式的規範,不論是單機分析,還是離線集群分析,效率都得到了大幅的提公升,我們只需要做資料接入,通過各個產品線提供的外掛程式即可滿足絕大部分需求
注意事項
要明確定義單位,從而讓分析系統能夠自適應
含義要清晰和標準,便於各類角色都能夠統一理解
分隔符要避免使用url中可能出現的字元
日誌示例
調整前:
10.10.10.10 – – [18/mar/2016:09:47:16 +0800] 「get /test.php http/1.1」 844 200
調整後:
[remote_ip:10.10.10.10] [remote_user:-] [querytime:18/mar/2016:09:47:16 +0800][request_url:get /test.php http/1.1] [request_status:200] [request_byte_b:844]
問題:在日誌中找出訪問次數最多的幾個分鐘
結論:優化格式,可以用最簡單的命令,100%保證日誌分析結果的可靠性和通用性,且越複雜的場景,其帶來的收益越顯著。
nginx日誌格式
最近我們要呼叫idl的乙個人臉識別介面,但是人家那個介面是部署在南京機房,並且只能內部呼叫。從最小化成本的考慮,對於海外使用者,我們在香港搭建了乙個nginx走專線中轉進行提速。在國內則是在北京機房。中轉的配置很簡單,就是乙個簡單的proxypass 使用者是對 傳送 http post 請求就能夠...
nginx日誌格式
日誌簡介 nginx日誌主要有兩種 訪問日誌和錯誤日誌。訪問日誌主要記錄客戶端訪問nginx的每乙個請求,格式可以自定義 錯誤日誌主要記錄客戶端訪問nginx出錯時的日誌,格式不支援自定義。兩種日誌都可以選擇性關閉。通過訪問日誌,你可以得到使用者地域 跳轉 使用終端 某個url訪問量等相關資訊 通過...
nginx日誌格式
為了更好滿足分析場景,推薦採用如下log format配置。各欄位含義如下 字段 含義remote addr 客戶端位址 remote user 客戶端使用者名稱 time local 伺服器時間 request 請求內容,包括方法名 位址和http協議 使用者請求時使用的http位址 status...