ai應用在金融領域,如何能夠在商業上有所突破
如今,隨著社會不斷發展,技術不斷進步,國內外各大金融機構已經在大資料
、人工智慧、區塊鏈等新技術上有很多嘗試,智慧型客服、智慧型投顧等新金融形式也早已不新鮮。那麼,這些前沿新科技遇到嚴肅謹慎的金融業,究竟是「黑科技」般的存在,還是技術宅們的另一場狂歡呢?
以下是氪信聯合創始人楊玢玢在《當金融遇上黑科技》線下主題沙龍活動的精彩分享:
在氪信創立之初,我們主要思考這樣乙個問題:ai應用在金融領域裡,如何能夠在商業上有所突破?李開復老師也針對這個問題說過他的觀點:想要有所突破,需要幾個必要因素,乙個是要有資料,畢竟ai歸根究底還是資料的技術;另外要有處理資料的能力,其次還要有商業變現的場景。技術單獨存在不能產生價值,一定要放在乙個對技術有需求的場景裡面。
我們認為,把ai技術應用於金融領域是乙個突破點,而且金融本身是資料化非常完善的場景。同時,金融領域還具備以下幾個要素:
第一,市場本身快速發展。在國內目前徵信體系不是很完善的情況下,很多有金融需求的人得不到相應的金融服務。氪信通過對資料的蒐集和加工,為符合要求的使用者提供金融服務。
第二,資料端非常成熟。如今,大家花在手機上的時間特別多,網際網路行為就是乙個非常好的資料。關鍵在於如何把它和金融、信用相結合,怎麼去擬合他們之間的關係。而這種信任評估是氪信比較擅長的。
從我們決定把ai的技術應用於金融風控,至今已有一年半的時間,在這段實踐過程中,我們看到在技術層面、業務層面和戰略層面都存在很多痛點,概括來說,就是業務本身對技術提出了需求。比如2023年蓬勃發展的小額現金貸業務,本身就是乙個欺詐頻發的行業,且沒有強資料做支撐,因此,很多從業十幾年的金融風控專家在面對新業務形態時,顯得有些束手無策。
沒有強資料不代表沒有資料,事實上,企業還是能夠拿到一些所謂的「弱資料」,比如手機上的資料,裝置類的資料,或者一些消費類的資料。拿到資料之後去想怎麼把這些資料用好,最後再決定要不要給這個人授信。至於授信多少,就需要用到ai技術了。
接下來分享一下氪信的做法和取得的成果。簡單來講風控分為兩個部分:乙個是反欺詐,乙個是授信。
在實踐過程中,我們發現區別於傳統徵信,網際網路徵信存在幾個核心的點:
第一,在反欺詐的階段,傳統徵信很難捕捉到一些不是很明顯的、由於社交關係和其它關係對自己產生的潛在風險,例如一些團貸、群體欺詐的問題。但是這些問題通過挖掘網路資料價值就可以得到很好的解決。
第二,了解ai的人都清楚,我們在做資料加工的時候,主要還是做特徵和建模。在加工的過程中,除了運用專家的方法之外,深度學習也被驗證效果突出。建模階段相比較傳統的淺層模型,比如說邏輯回歸等等模式,我們採用的是複雜的整合模型方式,因為不同維度的資料具有不同的特點,需要使用不同的建模方法,整合學習框架可以支援不同型別模型演算法作為子模型,高效、準確的處理稀疏、超高維、非線性資料建模。
接下來我會分別講一下我們公司的做法:
第一是底層,我們需要把能夠拿到的資料定義為網路需要的關係,底層做乙個資料的整合;第二層我們會到一些複雜的網路構建基礎,裡面有一些資訊挖掘和演算法;再往上我們會有一些模型,從網路裡面拿到隱含的特徵,去進行模型的構建;最終來識別比如說一些虛假的申請,或者是一些特殊地域的團貸等。
在網路的演算法裡面,我們的主要核心是複雜網路構建和團挖掘技術兩塊。首先在原始的點和邊構建好以後,我們如何通過合理演算法解決實際的問題,通過團的距離計算,達到比較良好的分團的結果。
另外乙個是特徵,這個也是非常關鍵的。我們如何從網路裡面提取對乙個人的欺詐識別比較有用的訊號特徵。在這方面,傳統的做法是會有一些個人的風險特徵,或者關聯人,大概多少壞人,這些是我們人能想到的特徵。
除了個人區域性的風險特徵以外,還有全域性的。我們用到了一些優化後的演算法,每乙個人在整個網路中,都會出現一些高的風險點,對和他有社交關係的人也會存在輻射效應。對於個人來說,可能在一度二度三度關係上,會和乙個或是幾個壞人有一些聯絡,現在社交比較發達,如果出現大片這樣子的人,可以通過輻射演算法捕捉到這樣的訊號。
另外在網路這塊,很重要的一點就是整個系統的迴轉和流程優化。因為網路欺詐有乙個特性,對於實時性甄別以及實時修改性上限要求特別高,同時我們學習的目標,不是乙個純事實,很多都是學習專家認定為欺詐的經驗,這樣的結果對本身的優化是很有價值的,從整個產品來看,形成了資料加工、資料計算和反饋的閉環。
我們也有專家的介面,網路捕捉風險之後,我們的專家都可以看到。
下面分享一下我們氪信在特徵加工上的實踐。可能了解ai的人特別清楚,我們最後做模型結果的時候,如果是優秀的話,這個優秀的絕大部分來自於我們非常辛苦的加工過程。
我們會看到個人的加工方法,很多時候會有一些不侷限性,比如說文字的特徵,通過一些方法或者通過不同時間維度的方法,可以描繪出幾百個維度的特徵,但是不可能達到完備的狀態,我們確實需要借助技術本身的能力達到提公升。
氪信在小額信用貸的場景裡面,嘗試用深度學習像迴圈神經網路處理時序的資料一樣處理文字,效果還是非常不錯的,我們整個的特徵過程是包含了專家的部分以及深度學習自動生成的特徵共同傳遞給模型,並且進行了最終的**和識別。
這邊舉乙個具體的例子,剛才我提到時序的特徵。比如我在不同的時間視窗,是不是要窮盡所有的特徵?有可能我們花費了大量的時間,只可以覆蓋80%的部分,但是我們用迴圈神經網路利用長短時記憶的特徵,可以捕捉資料在不同視窗趨勢類、統計類等不同的特徵,從而衍生出來上萬種特徵,最後我們把這些交給模型,讓它來識別哪些是有效的。
建模部分。我們曾做過很多相關的實踐,像淺層的偏現金的模式,有它的優勢,比較穩定,人也好理解。也嘗試過中間階段端到端的深度學習的方法,通過反神經網路的方法捕捉之間的關聯。
最後通過實踐結果,我們認為整合模型在金融風控場景裡,是乙個判斷好壞既穩定又有效的手段。整合模型的思想是用不同的子分類器,處理不同的資料。我會選擇最好的分類器處理面臨的資料,在上面去做乙個整合,優勢就出來了,就是好而不同,說的直白一點就是三個臭皮匠頂個諸葛亮。從模型效能來看,整合方法無論是擬合能力、模型的**能力,以及換乙個場景它的穩定能力都是非常好的。同時,整合模型在各個場景裡也可以實現遷移。現在在氪信的產品體系裡面,也融合了這個方法。
在信用貸場景裡面,我們和傳統模型相比效能提公升了1倍,穩定在ks值0.3以上,壞賬率直接下降46%。這使得我們很興奮,是技術給業務直接帶來了效果。
的公升級。
資料核心是我們沉澱的這條金融圖譜的知識體系,從原始的需要用什麼資料,到加工挖掘資料,再到上層怎麼連線管理它,形成精準完備的畫像。
另外在系統的整個過程和ai的運營中,從裝置接入到資料的加工處理,到得出結果等等,整個都是自動化的過程。現在現金貸的量非常大,解放人力已經成為重要需求,因此我們確確實實需要這樣一套資料智慧型一體化的產品。
11 web端主要應用在哪些領域?
任何應用都可以web端。html5是web的未來,不僅到廣泛的應在電腦端,而且在移動端也一定會得用。據統計2015年全球將有10億手機瀏覽器支援html5,同時htmlweb開發者數量將達到200萬。毫無疑問,html5將成為未來5 10年內,移動網際網路領域的主宰者。據idc的調查報告統計,截至2...
明亮的色彩如何應用在UI設計中?
單調在使用亮系色彩時,單一調色盤法則是目前最流行的方式之一。單一調色盤包括單一色調和色彩混合方式。這樣的調色盤能形成視覺刺激 驚豔的排版和單一的色彩進行配對能創造令人過目不忘的效果。小技巧 使用黑白這樣的單一顏色,是在小螢幕上創造視覺驚喜的好方法。雙色調雙色調是影象的半色調的複製,它帶來影象的中間調...
MATLAB專家揭秘AI在金融領域的應用
在目前大資料的網路時代下,matlab以及人工智慧在金融行業有廣泛的應用,它可以幫助金融行業從業者增強和優化流程 做出更準確的 並從經驗中自主學習,從而進一步優化流程。在金融業領域的諸應用中凸顯前沿化的優勢。經管大學堂本次邀請到的傅慈祥,畢業於德國慕尼黑大學 lmu 主修金融及貨幣經濟學,他在德勤等...