文章講的是周灝:金融大資料量化信用,
檔案 物理與金融的跨界融合
周灝,北京大學物理學士、萊斯大學物理博士。供職摩根史坦利期間曾構建摩根史坦利與創業融資相關的千億美元級量化系統。他曾作為第一資本總部資深統計師建立第一資本首個基於交易行為的億級使用者市場策略,還曾作為巴克萊銀行全球精英中心副總裁,領導團隊高效搭建風險模型策略模板、規範及流程。2023年在中關村創辦金融大資料公司量化派。
事件 是否有信用讓資料來說話
在「信用錢包」註冊登入進入主頁後,使用者可以把**消費賬號、話費詳單查詢賬號、教育資訊查詢賬號等資訊輸入,並隨即進入貸款申請頁面。填入申請貸款額度、用途、時間等需求資訊,系統就會在幾分鐘內自動生成乙份使用者風險分析報告。是否為黑白名單使用者、是否屬於高風險人群……根據報告提供的這些資訊,原本在銀行、網貸平台、融資租賃公司眼中「信用不足」的人,也有可能獲得貸款。
「人們的信用可以通過很多方式評估,我們的作用就是通過大資料分析和機器學習等技術,幫使用者把這些零碎的資訊資料收集和分析,讓過去沒法『量化』的信用受到重視,為使用者增信。評價『信用』的標準其實可以很豐富,除了車房抵押、銀行流水,消費記錄、手機號碼使用記錄都應該成為乙個人是否應該獲得貸款的評價因素。」「信用錢包」研發企業、量化派創始人周灝說。
量化派業務的一頭是銀行、網際網路金融公司等機構,另外一頭是個人或企業使用者。「我們給自己的定位是一家金融大資料公司,也可以說是一家平台公司。我們是通過基於機器學習和網際網路化的風險定價,整合網際網路及傳統資料來源,運用歐美成熟的量化方法及金融經驗,幫助個人及小微企業證明經濟財務等狀況,從而去幫助使用者快速獲得低成本貸款,實現低息快速融資的大眾普惠金融。」周灝說。
截止到2023年8月2日,「信用錢包」的總使用者數為210萬。在「信用錢包」被越來越多人所熟知之時,乙個新的計畫已經在周灝腦海中成型——信用場景消費。「在國外,許多商業機構都會有屬於自己的金融服務,而在國內這塊市場相對較為空白。資料顯示,國外在引入信用場景消費後,商業機構的銷售額平均增加40%。信用場景消費,將是我們未來的主要發展方向之一。」
對話 10萬特徵繪就「信用畫像」
北京商報:中國的信用消費處於乙個什麼樣的階段?
周灝:相比於美國等國家而言,中國的信用消費還處於乙個起步階段。信用消費的成型,不僅僅是看發行了多少張信用卡、貸款額達到多少。從我國的現狀來看,信用卡正越來越被普及和認可,信用消費、超前消費的概念越來越深入人心,但部分消費者使用信用卡時消費心理不成熟,刷卡無節制,也導致了信用卡的壞賬在逐年增加。而這也正是市場不成熟的一種表現。信用消費水平應該是由信用消費和信用管理兩個方面共同組成,這才是衡量乙個市場是否成熟的標準。
在美國,大多數人從小就會被告知信用卡是什麼,該如何去用,你如果不按時還款會怎麼樣……而在我們國家,可能大多數只是關注信用卡的便利性,並不知道如果不按時還款會對自己以後產生什麼樣的影響,這是一種消費觀念的缺失。我們的「信用錢包」不僅可以幫助使用者用信用取得貸款,更會告知你如果按時還款會增加多少信用、不按時還款又會帶來哪些影響……我們希望通過這種潛移默化的提醒,培養一種良好的信用習慣。同時也建議,學校裡適當地增加一些關於信用消費和信用管理的課程,培養更多人的消費習慣和管理意識。
北京商報:銀行等機構的專業人員都無法判別的資訊,大資料憑什麼就能從中看出風險高低?
周灝:首先,資料分析人員需要用計算機建立乙個資料模型。為了便於理解,人們可以把這個資料模型當做乙個「黑盒子」。「黑盒子」會通過一項名叫「機器學習」的技術進行自我完善和調整。假設申請人填寫的工作地、常住地為北京,他的手機通訊資料卻顯示他常年在邊遠地區活躍,那麼這就有很大可能被判斷為高風險。當一名貸款申請人把自己的資訊查詢渠道授權給「信用錢包」,所有與他相關的資訊會迅速進入這個「黑盒子」接受檢驗。除了使用者主動授權的資訊,「信用錢包」還與徵信機構等第三方機構合作共享資訊。當模型積累了數萬億的資料之後,這個「黑盒子」逐漸成熟,便可以用來檢驗、篩選貸款人了。目前,分析一名使用者的信用情況,我們最多已經有10萬個特徵資訊可供參考了。
北京商報:除了貸款,還可以在哪些地方享受到「信用錢包」帶來的便利?
周灝:最近我們成為58同城的戰略合作方,大家展開了很多深層次的合作。58同城會把需要租房、找工作、養寵物等具有資金需求的客戶推送給我們,我們通過大資料分析這些使用者的信用情況,篩選出信用等級高的使用者,給他們提供消費分期、現金貸款等業務。另外我們和拍拍貸、北銀消費、齊商銀行等機構都已經展開了合作,拍拍貸是國內最早做線上信用貸款的公司,我們之間也會使用新的風控手段,讓整個過程更快速、高效,我們都希望能夠將普惠金融落到實處,讓大資料可以幫助更多的人。
大資料量演算法
給40億個不重複的unsigned int的整數,沒排過序的,然後再給乙個數,如何快速判斷這個數是否在那40億個數當中 位圖思想解法 include stdio.h include stdlib.h include memory.h define max num 4294967295 int mai...
大資料量處理
看看這個,異曲同工,永遠不超時 該程式是針對非常龐大的資料庫開發的,沒有用迴圈 用途 對過萬條資料的資料庫字段內容批量替換 資料庫連線 dim beeyee dbname,connstr,conn,intsn1 dim content,num,intsn,intidno,strcodea,strco...
航測大資料量處理 大資料量處理及優化措施
1 首先考慮垂直拆分庫,不同的表拆分到不同的庫中,例如使用者庫 產品庫 支付庫 2 然後考慮水平拆分庫,將乙個表的資料放到多張表中,例如按照使用者 時間 訂單號 3 插入資料的時候不建立索引 4 待資料已經插入完成後,建立索引 5 正確的指定索引字段 6 使用批量插入資料庫的方式代替單條資料的插入 ...