多維分值計算例項

2021-09-24 05:01:56 字數 1217 閱讀 3160

查詢紅名單報警共20次  警員a觸發3次  top分值為 100,100,100

小時查詢量異常共3000次   警員a觸發 10次  top分值為 100,100,100,80,60

高頻查詢異常共1000次     警員a觸發 1次  top分值為80

夜間查詢共10次    警員a觸發0次

若直接劃分100分總分 則 比值為 20:3000:1000:200 差距很大 紅名單異常會被稀釋

所以執行第一步

a)利用lnx函式,將離散率較大的報警頻率對映至較小的離散區間

為計算方便計算lnx時取整

則ln20 =3  ln3000=8   ln1000=7  ln200=2  總和為20

執行第二部

b)將對映後的數值正比例切分分值上限(100分),並根據比例得出每種報警的極限分值;

所以得出 紅名單報警分值上限是(3/20)x100 = 15分  佔總分值15%

以此類推  15% ,40%,35%,10%

得出分值佔比後執行第三步

c)取單人的報警id及分值top5報警,加權(1/2 n次方),求和,得出單種類報警異常分值

紅名單得分(100*1/2+100*1/4+100*1/8) = 87.5分

小時量異常得分 (100*1/2+100*1/4+100*1/8+80*1/16+60*1/16)=96.25分 ps:因為取5次所以第五次是1/16 不是1/32  

高頻得分 (80*1/2) = 40分

夜間得分 0分

d)將c得出的分值對映至b得出的極限分值

乘以分值佔比  87.5*15% =13.125分

乘以得分佔比 96.25*40% = 38.5分

乘以得分佔比 40*35% =14分 e)

迴圈d,累加後求出最終異常分值

最後分值 13.125+38.5+14 =65.625分

因為有些報警並不是報的次多就比較重要,報少的反而重視,例如紅名單報警,所以新增反比例係數

反比例係數計算方式 將第一步a的比例系統做反比調整計算方式如下:

報警次數總和為20+3000+1000+10 = 4030次

紅名單係數為ln(4030/20)約為ln(200)

小時量異常係數ln(4030/3000) 約為 ln(1.3)

以此方式重複上述過程,報警次數少的比例將遠遠增大,逆向分值大就代表具有個性的報警較多。將正向分值與逆向分值 取較大值 則為 最終的報警分值

量異常分值計算模型

量異常分值計算模型 基線x 1 30日全日誌,計算其每小時訪問次數,將所有項累加後取項平均值,得出降噪後的每小時平均次數作為基線m 2 30日每日日誌,重複一過程計算每日每小時次數作為參考值 3 利用 1 2 過程產出資料計算標準差,計算出進30日訪問行為波動情況c 4 m 2c作為原始參考基線 5...

jquery多維物件計算個數 多維尺度分析理論概述

在工作中常常會遇到這樣的情況,有 n 個由多個指標反映的客體,但是反映客體的指標個數是多少不清楚,甚至指標本身是什麼也是模糊的,更談不上直接測量或觀察它,僅僅所能知道的是這 n 個客體之間的某種距離 相異性 或者是某種相似性。我們希望僅由這種距離或者相似性給出的資訊出發,在較低維的歐氏空間把這 n ...

多維曼哈頓距離的計算

這篇寫的不錯 給出五維空間n個點的座標,求其中兩點的最大曼哈頓距離。我們可以定義曼哈頓距離的正式意義為l1 距離或城市區塊距離,也就是在歐幾里得空間的固定直角座標系上兩點所形成的線段對軸產生的投影的距離總和。例如在平面上,座標 x1,y1 的點 p1 與座標 x2,y2 的點 p2的曼哈頓距離為 x...