通訊公司工作,經常處理各種協議介面,在統計協議介面字段內容時,需要統計字段填寫的內容是否正確,和佔比是多少。要是單次統計,估計會把人累死,寫個指令碼統計,輕鬆便捷。
舉例:介面內容
這是一條話單,這樣的話單有很多條
24|eb8f7837000039|||8613522222222|||2016092817|2016092817|7|1|10.82.58.2|4010|10.82.99.10|3868|2001
統計結果舉例:
擷取第10和11欄位
--------- [ 10 ] ---------
total 80816
35.66% 28817 1
6.09% 4924 2
18.37% 14843 3
39.87% 32221 4
--------- [ 11 ] ---------
total 80816
96.21% 77756 1
0.15% 125 2
3.63% 2935 3
#!/bin/bash
awk -f, 'begin
#這裡-f, 需要注意,假如這裡不用指令碼,直接awk統計的話,需要使用awk兩次,首次awk統計出結果,然後再用這個awk對同一數值歸類。這時,-f, 是可以不寫的,但是在寫的時候,這裡的「,」 是不能少的,不然報錯。
end
printf("total %d\n", total);
}'
AWK 指令碼例子
能夠到乙個類似與 data sandbox scanresult 0 1 41435 42458 2 result.xml 的路徑,在該檔案目錄下還有乙個以md5命名的檔案。需求是 根據xml 路徑得到md5 全部xml 檔案路徑儲存在 randomsample55000 20150105 vre....
awk實戰小例子
1 去除重複行,並計數 文字內容 jdasalsfkklasjf,20euweiu37123812 djsakkldkaljdladsfsfsfsfsf 20euweiu37123812 20euweiu37123812 20euweiu37123812 fssfsfsfsfsfsfs ererwe...
描述統計2 數值方法
2.1 位置的度量 平均數 中位數 眾數 百分位數 四分位數 mean,median,mode,iqr inter quartile range 2.2 變異程度的度量 極差 四分位數間距 方差 標準差 標準差係數 2.3 分布形態 相對位置 異常值檢測 偏度 z 分數 切比雪夫定理 經驗法則 切比...