維度 == 標籤,泛指描述惡意行為的一類合集,不必糾結文中用詞,看官就當做一回事, 就是你理解的那回事就行。
總原則:
每天基於前一天的分值,增量更新
得分越高,使用者越黑
縱向分
下文,將所有具備惡意傾向的描述,統稱為「標籤」,比如**ip登入是乙個維度,也可以說是乙個標籤,工程師喜歡說維度,運營喜歡說標籤.看官隨你自己
橫向分
上述是 4個 基礎分值,計算邏輯,所有標籤通用,可以歸為一類:縱向比較
,始終是乙個標籤下的結果或情況在比較。下面介紹一些,橫向比較
, 哪個標籤更好使?
假設ip 1.2.3.6 是雲商ip,那麼就說 1.2.3.6是這個黑標籤下乙個值
如果這個ip 1.2.3.6一共登入了10000個使用者,其中8000個已經被標黑了,是不是說明這個ip識別的很準啊
實現
畫完餅了,該講如何實現了?**是沒有滴,看懂了,肯定是闊以開工編碼滴
資料層面(二)
為了計算每個標籤的效果分,需要統計每個標籤值,每天的命中使用者的打標結果。如果無人工打標,可以直接粗暴一點點,被任意標籤連續命中7天就算黑使用者。
標籤項標籤值
日期準確
誤判**ip
1.2.3.6
昨天323(人)
1(人)
**ip
1.2.3.6
前天39(人)
0(人)
**ip
1.2.3.6
....
....
....
雲商ip
6.3.2.1
昨天23(人)
0(人)
雲商ip
6.3.2.1
前天31(人)
0(人)
雲商ip
6.3.2.1
....
....
....
其他標籤
其他值....
....
....
明白了摸?有了怎麼一張效果統計表,你是不是想怎麼算都行?選出你爽的標籤值或者標籤項都可以!!!
效果好的標籤值,比如1.2.3.6,可以增加其效果分,讓命中它的人得分高
效果好的標籤項,比如雲商ip,可以反過來提高這個標籤的基準分,這個很重要哦,形成反哺了哦
再進一步,不停的反哺,你最終將得到乙份十分貼近業務的基準分配置,這就是知識沉澱
。你可以拿它換2個肉夾饃了
業務(場景)層面
上文說了,可以得到乙份貼合業務的基準分配置。那麼不同的業務,是不是有所差異,是不是應該有不同一套基準分配置? 這個實現就不說了,找你家碼農搞,讓做個可配的。做不了,就盤他
擴充套件
實訓日記8 情緒評分系統實現
之前的部落格我們設計出了根據情緒對不同型別的文章進行評分的演算法,現在我們使用python對其進行實現。使用這個標準向量可以計算余弦相似度。根據上述演算法思想,實現 如下 import numpy as np 標準情緒向量 st emotion def rate type,emotion 計算評分 ...
秒殺系統的設計與實現
redis 高併發鎖機制 如何限制乙個ip使用搶購軟體?秒殺的超賣問題?將存庫從mysql前移到redis中,所有的寫操作放到記憶體中,由於redis中不存在鎖故不會出現互相等待,並且由於redis的寫效能和讀效能都遠高於mysql,這就解決了高併發下的效能問題。然後通過佇列等非同步手段,將變化的資...
作業系統設計與實現
額,沒有看完,但是 目前看得還是沒有壓力就是 好奇心和問題都太多,丟下一段 對於如下一條命令 cp file1 file2 其功能是為檔案file1作乙個拷貝file2,在shell建立乙個子程序後,子程序執行程式cp,同時向該程式傳遞執行的引數 源檔名和目標檔名。cp程式的主函式格式如下 main...