日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
金融科技 正文
發(fā)私信給AI金融評(píng)論
發(fā)送

0

數(shù)據(jù)越多模型越復(fù)雜越好?這家P2P公司認(rèn)為關(guān)鍵在于“意識(shí)”

本文作者: AI金融評(píng)論 2018-06-05 19:48
導(dǎo)語(yǔ):P2P大數(shù)據(jù)的問(wèn)題是,嘴里喊著風(fēng)控靠大數(shù)據(jù)模型,身體卻很誠(chéng)實(shí)地要靠高息貸款盈利。

雷鋒網(wǎng)AI金融評(píng)論報(bào)道,6月1日,GIAC 全球互聯(lián)網(wǎng)架構(gòu)大會(huì)在深圳召開(kāi)。該會(huì)議是長(zhǎng)期關(guān)注互聯(lián)網(wǎng)技術(shù)與架構(gòu)的高可用架構(gòu)技術(shù)社區(qū)推出的、面向架構(gòu)師、技術(shù)負(fù)責(zé)人及高端技術(shù)從業(yè)人員的年度技術(shù)架構(gòu)大會(huì),組委會(huì)從互聯(lián)網(wǎng)架構(gòu)最熱門(mén)系統(tǒng)架構(gòu)設(shè)計(jì)、工程效率、機(jī)器學(xué)習(xí)、未來(lái)的編程語(yǔ)言、分布式架構(gòu)等領(lǐng)域甄選前沿的有典型代表的技術(shù)創(chuàng)新及研發(fā)實(shí)踐的架構(gòu)案例,分享他們?cè)诒灸甓茸钪档玫目偨Y(jié)、盤(pán)點(diǎn)的實(shí)踐啟示,打造一個(gè)分享及討論平臺(tái),改變未來(lái)一年的互聯(lián)網(wǎng)構(gòu)建方式。

大會(huì)更多的討論的是機(jī)構(gòu)方面的技術(shù)創(chuàng)新內(nèi)容,而在6月1日上午舉辦的Fintech分場(chǎng)上,小贏(yíng)科技理財(cái)研發(fā)中心負(fù)責(zé)人林實(shí)立結(jié)合小贏(yíng)科技的互聯(lián)網(wǎng)金融數(shù)據(jù)與應(yīng)用的演講則是為數(shù)不多的業(yè)務(wù)與數(shù)據(jù)運(yùn)用相結(jié)合的分享。據(jù)介紹,小贏(yíng)科技成立于14年,是一家快速發(fā)展的金融科技公司,累積交易千億,注冊(cè)用戶(hù)過(guò)千萬(wàn),林實(shí)立主要負(fù)責(zé)P2P交易系統(tǒng)的設(shè)計(jì)研發(fā)工作。

數(shù)據(jù)越多模型越復(fù)雜越好?這家P2P公司認(rèn)為關(guān)鍵在于“意識(shí)”

據(jù)雷鋒網(wǎng)了解,小贏(yíng)科技所采用的數(shù)據(jù)架構(gòu)是基于經(jīng)典的Lambda架構(gòu)進(jìn)行選型的,Lambda架構(gòu)是Nathan Marz提出的一個(gè)實(shí)時(shí)大數(shù)據(jù)處理框架,其核心思路是將大數(shù)據(jù)系統(tǒng)架構(gòu)拆分為Batch Layer、Speed Layer和Serving Layer三部分,其中批處理層(Batch Layer)針對(duì)全量數(shù)據(jù)進(jìn)行處理,加速層(Speed Layer)針對(duì)實(shí)時(shí)的增量數(shù)據(jù)進(jìn)行處理,從而達(dá)到可以靈活應(yīng)對(duì)任意規(guī)模的數(shù)據(jù)處理需求。但據(jù)林實(shí)立介紹,目前小贏(yíng)科技的數(shù)據(jù)處理“主要還是在離線(xiàn)處理部分,增量處理還是在待建,并沒(méi)有用到很大數(shù)據(jù)的處理。”

那么,在P2P交易系統(tǒng)中數(shù)據(jù)是如何被使用的?林實(shí)立舉了兩個(gè)例子:

第一個(gè)例子是邀請(qǐng)網(wǎng)絡(luò)分析,是基于用戶(hù)生命周期前端的“獲客”行為的數(shù)據(jù)應(yīng)用。從業(yè)務(wù)層面,其希望解答的問(wèn)題是:邀請(qǐng)的營(yíng)銷(xiāo)費(fèi)用花在哪些人上最有效?邀請(qǐng)效果會(huì)不會(huì)隨時(shí)間衰減,具體情況又是什么樣的?

從具體業(yè)務(wù)場(chǎng)景看,該分析主要研究邀請(qǐng)人與與受邀人注冊(cè)時(shí)間上的間隔關(guān)系,以及邀請(qǐng)層次與邀請(qǐng)效果的關(guān)系。通過(guò)對(duì)數(shù)據(jù)的分析,用于指導(dǎo)P2P平臺(tái)在用戶(hù)注冊(cè)多長(zhǎng)時(shí)間后發(fā)起補(bǔ)貼最為合適、針對(duì)哪些用戶(hù)進(jìn)行補(bǔ)貼最為合適,以及預(yù)測(cè)一輪邀請(qǐng)補(bǔ)貼在一定的時(shí)間內(nèi)帶來(lái)多少新用戶(hù)。

小贏(yíng)科技在對(duì)數(shù)據(jù)分析中發(fā)現(xiàn):對(duì)于普通邀請(qǐng)人(一般用戶(hù))和非普通邀請(qǐng)人(自媒體,大V等),在邀請(qǐng)與注冊(cè)的間隔時(shí)間、衰減效應(yīng)、邀請(qǐng)層次與邀請(qǐng)效果的關(guān)系有著比較大的區(qū)別。具體來(lái)說(shuō),普通邀請(qǐng)人的邀請(qǐng)衰減效應(yīng)較為明顯,而非普通邀請(qǐng)人的衰減效應(yīng)相對(duì)沒(méi)有那么明顯,往往還會(huì)出現(xiàn)二次或三次的峰值;如果再進(jìn)一步量化,普通邀請(qǐng)?jiān)诎l(fā)出邀請(qǐng)后到達(dá)預(yù)期被邀請(qǐng)比例(例如50%)的時(shí)間要更短一些,非普通邀請(qǐng)到達(dá)預(yù)期效果的時(shí)間則更長(zhǎng)一些。通過(guò)經(jīng)過(guò)數(shù)據(jù)分析得到邀請(qǐng)的事實(shí)關(guān)系表,可以大致了解到不同邀請(qǐng)人的再邀請(qǐng)傳播系數(shù),以及在什么時(shí)間激發(fā)、激發(fā)哪些用戶(hù)、通過(guò)什么渠道激發(fā)等指標(biāo),從而可以指導(dǎo)促銷(xiāo)的投放。

第二個(gè)例子則是高凈值聚類(lèi)分析。其背景則是,客服部門(mén)在人力有限的情況下,如何對(duì)高凈值用戶(hù)進(jìn)行更有效的發(fā)展和維護(hù)?在具體的分析過(guò)程中,技術(shù)部門(mén)則根據(jù)業(yè)務(wù)部門(mén)定義高凈值用戶(hù)范圍,以及高凈值用戶(hù)的分類(lèi),采用RFM模型進(jìn)行了分析。


數(shù)據(jù)越多模型越復(fù)雜越好?這家P2P公司認(rèn)為關(guān)鍵在于“意識(shí)”

(雷鋒網(wǎng)按:RFM模型是在用戶(hù)關(guān)系管理中被廣泛應(yīng)用的模型,按照最近一次消費(fèi)(Recency)、消費(fèi)頻率(Frequency)、消費(fèi)金額(Monetary)三個(gè)維度,對(duì)用戶(hù)進(jìn)行細(xì)分,根據(jù)不同的用戶(hù)等級(jí)分類(lèi),采取不同的營(yíng)銷(xiāo)策略,并為客戶(hù)管理提供依據(jù)。)

小贏(yíng)科技將RFM三個(gè)指數(shù)進(jìn)行量化:

R:最近一次消費(fèi),最近一次投資離現(xiàn)在的天數(shù)

F:消費(fèi)頻率,最近30天的投資次數(shù)

M:消費(fèi)金額,最近30天的投資金額

在聚類(lèi)方法選擇中采取等記錄數(shù)和等總數(shù)兩種分類(lèi)劃分方法,其中R采取等記錄數(shù)分類(lèi),越小分?jǐn)?shù)越高;F采取等記錄數(shù)分類(lèi),投資頻率越高分?jǐn)?shù)越高;M采取等總數(shù)分類(lèi),投資金額越高分?jǐn)?shù)越高,并分為5類(lèi)按1-5進(jìn)行評(píng)分,在實(shí)際業(yè)務(wù)中,平臺(tái)可以根據(jù)對(duì)于參數(shù)的重要程度給予不同的權(quán)重,最終加權(quán)得出RFM分?jǐn)?shù),根據(jù)分?jǐn)?shù)劃分不同的用戶(hù)類(lèi)別。

互聯(lián)網(wǎng)金融行業(yè)中,如何發(fā)揮數(shù)據(jù)的最大價(jià)值?

或許是為了“留一手”,在分享中所舉的兩個(gè)例子都比較簡(jiǎn)單,也沒(méi)有涉及到諸如“利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行大數(shù)據(jù)挖掘”的內(nèi)容。但這實(shí)際也引發(fā)了一個(gè)問(wèn)題的討論:在互聯(lián)網(wǎng)金融行業(yè)中,如何發(fā)揮數(shù)據(jù)的最大價(jià)值?

相比起傳統(tǒng)金融服務(wù),互聯(lián)網(wǎng)金融將金融服務(wù)的渠道從線(xiàn)下轉(zhuǎn)移到了線(xiàn)上,借助用戶(hù)流量紅利,互聯(lián)網(wǎng)金融在短時(shí)間內(nèi)發(fā)展出了P2P、眾籌、網(wǎng)貸等創(chuàng)新模式,幫助金融行業(yè)提高了獲客的手段,從而得到了快速發(fā)展。然而在互聯(lián)網(wǎng)金融發(fā)展的早期,互聯(lián)網(wǎng)金融公司的主要利潤(rùn)來(lái)源是“去掉中間環(huán)節(jié)”和流量變現(xiàn),在基于業(yè)務(wù)本身的理解和對(duì)基于數(shù)據(jù)的精細(xì)運(yùn)營(yíng)上做得并不夠。

隨著2015年對(duì)互聯(lián)網(wǎng)金融合規(guī)整頓的展開(kāi)、2016年的平臺(tái)大混戰(zhàn)、2017年的重新洗牌之后,“金融科技”的提法開(kāi)始逐步抬頭。從“互聯(lián)網(wǎng)金融”到“金融科技”,當(dāng)中的區(qū)別不僅僅是名字上的改變,而是在業(yè)務(wù)理解模式和經(jīng)營(yíng)思路上的轉(zhuǎn)變,基于數(shù)據(jù)分析的基礎(chǔ)上,利用機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、區(qū)塊鏈、云計(jì)算等創(chuàng)新技術(shù)手段的金融創(chuàng)新活動(dòng)。在互聯(lián)網(wǎng)金融業(yè)務(wù)的的資金運(yùn)營(yíng)、投資分析、用戶(hù)分析、營(yíng)銷(xiāo)、風(fēng)控等各環(huán)節(jié),金融科技都在發(fā)揮著重要的作用。

據(jù)雷鋒網(wǎng)了解,互聯(lián)網(wǎng)金融企業(yè)面臨的主要風(fēng)險(xiǎn)為惡意欺詐,70%左右的信貸損失來(lái)自于借款人惡意欺詐,每年互金行業(yè)因欺詐所導(dǎo)致的損失在數(shù)百億元級(jí)別。因此,風(fēng)控也成為了互聯(lián)網(wǎng)金融創(chuàng)新的重地,幾乎每家轉(zhuǎn)型的互金公司都在稱(chēng)“我們的核心競(jìng)爭(zhēng)力是大數(shù)據(jù)風(fēng)控”,在對(duì)外的宣傳資料中,這些大數(shù)據(jù)風(fēng)控模型往往具有幾千個(gè)甚至上萬(wàn)個(gè)變量,以“凸顯”其技術(shù)實(shí)力。

然而在會(huì)場(chǎng),一位不愿意透露姓名的從業(yè)人士告訴雷鋒網(wǎng),大數(shù)據(jù)并不能完全解決風(fēng)控的問(wèn)題。在他看來(lái),目前成千上萬(wàn)個(gè)參數(shù)的風(fēng)控模型過(guò)于復(fù)雜,并不一定能完全反應(yīng)實(shí)際的風(fēng)險(xiǎn)情況,甚至由于需要考慮的東西太多,可能會(huì)影響結(jié)果,而且同一套風(fēng)控體系,換了一個(gè)環(huán)境效果就會(huì)大不相同。

“比如說(shuō)支付寶的個(gè)人信貸業(yè)務(wù)做得很好,我們看到的可能是基于芝麻信用成千上萬(wàn)個(gè)參數(shù)的風(fēng)控,但實(shí)際上可能是因?yàn)?,如果一個(gè)人在支付寶借錢(qián)不還,他可能就沒(méi)法使用相關(guān)業(yè)務(wù),沒(méi)法在淘寶上買(mǎi)想要的東西,而這是數(shù)據(jù)上看不出來(lái)的?!彼屠卒h網(wǎng)舉例道。

在機(jī)器學(xué)習(xí)領(lǐng)域,過(guò)多的無(wú)關(guān)參數(shù)帶來(lái)的噪音干擾被稱(chēng)為“過(guò)擬合”。關(guān)于參數(shù)的一個(gè)經(jīng)典故事是費(fèi)米曾經(jīng)說(shuō)過(guò),“我的朋友馮·諾依曼用四個(gè)參數(shù)就可以擬合出一頭大象,用五個(gè)參數(shù)可以讓它的鼻子擺動(dòng)。”引入更多的參數(shù),可能會(huì)增加模型的精確程度,但如果選擇了不恰當(dāng)?shù)膮?shù),則有可能會(huì)反過(guò)來(lái)干擾結(jié)果。

而在實(shí)際業(yè)務(wù)中,基于大數(shù)據(jù)分析也有著不小的難度。金融業(yè)務(wù)屬于業(yè)務(wù)復(fù)雜的強(qiáng)監(jiān)管業(yè)務(wù),存在建模困難的問(wèn)題;同時(shí)可利用的數(shù)據(jù)多元化,但評(píng)價(jià)往往是有限的。成千上萬(wàn)的變量,如何將這些多維數(shù)據(jù)變?yōu)槟芊窠杩?、可以借多少的一維數(shù)據(jù),不同風(fēng)控系統(tǒng)會(huì)有不同評(píng)價(jià),這也是最具挑戰(zhàn)性的地方。

而且這樣的問(wèn)題,并不一定能通過(guò)“開(kāi)放數(shù)據(jù)”的方式得到解決。面對(duì)同一個(gè)征信系統(tǒng),各家銀行的效率、風(fēng)險(xiǎn)控制、定價(jià)能力并不一樣,面對(duì)數(shù)據(jù)開(kāi)放后透明的數(shù)據(jù),即便有許多可以提供解決方案的金融科技公司輸出技術(shù),但真正決定大數(shù)據(jù)的效果的,還在于使用大數(shù)據(jù)這把“屠龍刀”的人。

如林實(shí)立在分享中的觀(guān)點(diǎn):數(shù)據(jù)的運(yùn)營(yíng)不在與多復(fù)雜,而是有沒(méi)有應(yīng)用的意識(shí),在產(chǎn)品、開(kāi)發(fā)、測(cè)試鏈條里對(duì)建模流程,有一個(gè)清晰的認(rèn)識(shí),才能有很好的配合,起到實(shí)際的指導(dǎo)作用。

但真正做好這一點(diǎn)并不容易,想要在成千上萬(wàn)個(gè)參數(shù)中找到對(duì)業(yè)務(wù)起關(guān)鍵作用的參數(shù),不同的人群、不同的環(huán)境、不同的業(yè)務(wù),起決定作用的參數(shù)可能各不相同,這對(duì)金融公司來(lái)說(shuō)無(wú)異于摸著石頭過(guò)河,即便碰巧找對(duì)了參數(shù),也可能只是“煉金巫師的煉金術(shù)”。

“風(fēng)控靠大數(shù)據(jù)模型,盈利靠高息貸款”,這也是整個(gè)P2P乃至整個(gè)互聯(lián)網(wǎng)金融目前存在的問(wèn)題。毫無(wú)疑問(wèn),大數(shù)據(jù)的使用可以?xún)?yōu)化管理,提高風(fēng)控效率,降低風(fēng)控成本,但從目前的應(yīng)用來(lái)看,還是有很長(zhǎng)的路要走。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章

編輯

關(guān)注金融科技前沿!在這里,讀懂智能金融與未來(lái)!
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)