量異常分值計算模型
基線x(1)30日全日誌,計算其每小時訪問次數,將所有項累加後取項平均值,得出降噪後的每小時平均次數作為基線m;
(2)30日每日日誌,重複一過程計算每日每小時次數作為參考值;
(3)利用(1)(2)過程產出資料計算標準差,計算出進30日訪問行為波動情況c;
(4)m+ -2c作為原始參考基線;
(5)為避免產生不合理取值,取m的150%與50%作為參考區間佐證(4)產生基線;
(6)將(4)(5)計算出的值域取上域及下域較大值確定基線範圍;
2. 報警
(1)報警所用基線是針對個人資料,採用過程1(1)計算個人基線;
(2)超出基線值域,則取值域中最近的值作為基線;
3. 小時、單日量異常分值計算
(1)取當前樣本次數s 計算(s-x)/x 得出超出基線情況p
(2)針對制定閾值對(1)產生的結果p進行分值計算;
(3)採用分段函式
a) 第一階段(40%)採用斜率開始較大,後期平緩的對數函式,可快速將分值區分;
b) 第二階段(40%)擬合線性函式計算分值
c) 第三階段(20%)擬合指數函式計算分值
(4)將warnscore展示為當前單維異常值
多維打分規則
利用lnx函式,將離散率較大的報警頻率對映至較小的離散區間
將對映後的數值正比例切分分值上限(100分),並根據比例得出每種報警的極限分值;
取單人的報警id及分值top5報警,加權(1/2 n次方),求和,得出單種類報警異常分值
將c得出的分值對映至b得出的極限分值
迴圈d,累加後求出最終異常分值
反比例係數分值
a) 取ln(en/ni)為反比例係數,重新計算上一步的b過程
b) 將二者得出的分值以決策樹方式取較大分值一組記錄;
多維分值計算例項
查詢紅名單報警共20次 警員a觸發3次 top分值為 100,100,100 小時查詢量異常共3000次 警員a觸發 10次 top分值為 100,100,100,80,60 高頻查詢異常共1000次 警員a觸發 1次 top分值為80 夜間查詢共10次 警員a觸發0次 若直接劃分100分總分 則 ...
模型參數量和計算量獲取的小工具
我們要比較乙個模型的效能,往往不僅僅是模型的表現效果,往往要兼顧模型的參數量和計算量。這裡主要列出了pytorch和tensorflow的統計引數和計算量的方法,參數量只和模型有關,和模型的輸入無關,而計算量和模型的參數量有關也和模型的輸入有關對於tensorflow可由下列 獲取計算量和參數量 i...
分組卷積 計算量
import torch import torch.nn as nn 分組卷積 n,c in,h,w,c out 10,4,16,16,4 x torch.randn n,c in,h,w conv nn.conv2d c in,c out,3,1,padding 0,bias false conv...