常見的場景:
活動,比如拉新使用者,一些黑產薅羊毛。
在使用具體的反欺詐策略前,需要分析每個使用者邀請新使用者數量的分布情況,確定哪些使用者可能存在欺詐行為,重點分析這些使用者。
邀請新使用者數量在100個以上的使用者佔極少數(共31個),重點分析此類使用者。
一、 使用者裝置、網路識別策略
使用者使用的裝置和網路識別策略是最簡單、最基本的反作弊策略。以裝置為中心,分析ip、imei、mac號、手機號等是否有重複。
然而,這種方式的識別率比較差,因為作弊者已能夠模擬真實裝置的ip、imei、mac等標識。所以需要結合其他反欺詐策略防止使用者褥羊毛。
案例分析:
ip、imei、mac號以及手機號均沒有異常。抽樣打**,有真人接聽。此策略在本案例中無效。
二、 使用者屬性規則策略
使用者訪問時所在城市、性別、年齡等,當然有時候只能獲得使用者的部分屬性資料,如城市,這個通過網路請求gps就可以獲得。
如果乙個使用者在短時間內邀請了分布在多個城市的多個使用者註冊,這個使用者就可能存在欺詐行為。因為使用者邀請是基於熟人圈子,乙個人的熟人圈子分布有一定範圍,主要集中在他經常活躍或曾長時間活躍的少數幾個城市。
案例分析:
此案例中,僅能獲取使用者的城市屬性資料,分析疑似欺詐使用者邀請的新使用者的城市分布,發現疑似欺詐使用者邀請的新使用者多數分布在多個不同城市(20個以上),進一步確定是極有可能是欺詐使用者。
三、 使用者行為規則策略
使用者行為規則策略是通過一些關鍵行為指標來分析使用者是否存在欺詐。主要涉及以下四個指標:邀請的新使用者的註冊時間間隔及分布、開停機的啟動次數、平均使用時長、留存率。
行為規則策略中的四個指標,留存率是滯後指標,但時間是很寶貴的,如果不能夠在短時間內判斷出使用者是否存在欺詐,就會造成大規模損失。所以被邀請的新使用者在第一天的表現非常重要。
比如:
疑似欺詐使用者邀請的新使用者當天的平均使用時長非常短,僅50秒;
註冊時間多數是在晚上10點~凌晨2:00;
31個疑似欺詐使用者平均一分鐘內邀請3個使用者註冊(邀請新使用者數最高的疑似欺詐使用者每分鐘平均邀請了20個新使用者註冊)。
參考:拉新反作弊策略及應用案例
金融反欺詐模型
整個專案做下來,感受最深的其實是如何從眾多的特徵中選出最實用的特徵變數。資料讀取,skiprows的含義表示跳過第一行,從第二行開始讀取 data pd.read csv g data loanstats 2016q2 loanstats 2016q2.csv skiprows 1,low memo...
反欺詐建模方案
在反欺詐場景中,知識圖譜聚合各類資料來源,逐步繪製出借款人的profile,從而針對性的識別欺詐風險。以乙個借款人舉例,借款人可以有身份證號,手機號,學歷等個人資訊,屬於個人的屬性資訊 而借款人可以有擔保人或是親屬好友,借款人與擔保人之間的關係 也就是邊edge 是被擔保與擔保的關係,借款人與其親屬...
信用卡反欺詐
信用卡反欺詐 一 背景 反欺詐是一項識別服務,是對交易詐騙 網路詐騙 詐騙 盜卡盜號等行為的一項風險識別。其核心是通過大資料的收集 分析和處理,建立反欺詐信用評分和反欺詐模型,解決不同場景中的風險問題。二 資料集分析 資料樣本為2013年9月歐洲持卡人在兩天內進行的284,808筆信用卡交易,其中4...