丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給木子
發(fā)送

0

沒人報(bào)案,那就讓數(shù)據(jù)自己報(bào)案吧

本文作者: 木子 2020-05-14 13:56
導(dǎo)語:魔高一尺道高一丈,支付寶能讓數(shù)據(jù)找“匕首”。

從SIGIR2020到IJCAI2020,隨著國際一系列頂級學(xué)術(shù)會議(頂會)的陸續(xù)開啟,全球科學(xué)家們已經(jīng)迎來了2020年屬于自己的一道道“盛筵”。這些不同科技領(lǐng)域內(nèi)的頂級會議是前沿,更是未來。

逛頂會,聊技術(shù),本周實(shí)驗(yàn)室小編就來說說頂會中的那些科學(xué)家的故事。

營銷活動(dòng)是電商平臺最常見的業(yè)務(wù)模式,而針對平臺營銷活動(dòng)主要的攻擊方式,就是通過虛假交易套利。簡單地說,就是賣家和買家合謀,通過作弊,騙取平臺的“紅包”。

這和風(fēng)控領(lǐng)域中的其他風(fēng)險(xiǎn)有很大的不同。類似盜用賬號、欺詐等風(fēng)險(xiǎn),都因?yàn)榈谌绞芎φ叩耐对V或報(bào)案,可以產(chǎn)生明確的風(fēng)險(xiǎn)標(biāo)簽。它意味著,平臺很快可以知道,一項(xiàng)交易違規(guī)與否,并做出反應(yīng)。而合謀欺詐不會有人報(bào)案,也就不可能產(chǎn)生標(biāo)簽。

平臺當(dāng)然絕不允許這種合謀欺詐的存在,但這絕非易事。在相當(dāng)程度上,科學(xué)家們需要讓案件在海量交易中“無中生有”——既然沒人報(bào)案,那就讓數(shù)據(jù)自己“報(bào)案”好了。

過去,人們是要從一群穿藍(lán)色外衣的人中,找到一個(gè)穿黃色衣服的人——那意味著一個(gè)有標(biāo)簽的風(fēng)險(xiǎn);而現(xiàn)在,人們是要從一群都穿藍(lán)色服裝的人群中,找到一個(gè)外衣下藏有匕首的人。

從機(jī)器人足球,到概率圖模型

要在每天上億筆交易里準(zhǔn)確找出這種風(fēng)險(xiǎn),并大幅提升風(fēng)險(xiǎn)攻防效率以滿足實(shí)際業(yè)務(wù)需要,是一件非常有挑戰(zhàn)性的事情。

這里的關(guān)鍵之處在于,支付寶特有的數(shù)據(jù)量為研究提供了基礎(chǔ);而龐大的業(yè)務(wù)量,又讓這種研究有了“性價(jià)比”。

解決這個(gè)問題的工作交到了支付寶天筭安全實(shí)驗(yàn)室手里。

支付寶天筭安全實(shí)驗(yàn)室隸屬于支付寶安全實(shí)驗(yàn)室。該實(shí)驗(yàn)室主要圍繞智能風(fēng)控和反欺詐技術(shù),探索安全領(lǐng)域的機(jī)器學(xué)習(xí)等前沿問題,重點(diǎn)關(guān)注打造全球領(lǐng)先的智能風(fēng)控體系,是守護(hù)支付寶“你敢付我敢賠”承諾的中堅(jiān)力量。

因?yàn)闆]有標(biāo)簽,“我們不能用常規(guī)的分類,去解決這樣的問題”。劉騰飛希望把它變成一個(gè)機(jī)器學(xué)習(xí)的問題,并找到一種方法,來實(shí)現(xiàn)低成本、高效率的檢測。

 沒人報(bào)案,那就讓數(shù)據(jù)自己報(bào)案吧

劉騰飛是螞蟻金服數(shù)據(jù)技術(shù)專家,香港科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)系博士,主要研究無監(jiān)督異常檢測技術(shù)、弱監(jiān)督學(xué)習(xí)技術(shù)在風(fēng)控領(lǐng)域的應(yīng)用。

高考后,因?yàn)榈谝荒瓴环謱I(yè)的原因,劉騰飛選擇了中國科技大學(xué)。按他的思路,這樣就避免了在對自己的興趣點(diǎn)仍然懵懂的情況下,“過早”規(guī)劃未來的職業(yè)方向。

在那一年里,劉騰飛發(fā)現(xiàn)了物理、化學(xué)的“恐怖”之處,而自己對芯片設(shè)計(jì)和通訊那些學(xué)科又提不起興趣,直到聽到一位老師對算法概念的描述,他才動(dòng)了選擇計(jì)算機(jī)系的念頭。那位老師告訴他,算法就是解決問題的方法。

在AI科研領(lǐng)域,機(jī)器人世界杯(Robot World Cup)是一項(xiàng)重要的賽事,它有一個(gè)宏大的目標(biāo),是在人類足球規(guī)則下,用機(jī)器人在2050年戰(zhàn)勝人類的足球世界杯冠軍。

選中計(jì)算機(jī)專業(yè)后,劉騰飛一頭扎了進(jìn)去。

仿真比賽是機(jī)器人足球比賽中“最古老”的比賽項(xiàng)目,它專注于人工智能和團(tuán)隊(duì)策略的應(yīng)用。這個(gè)賽事分2個(gè)組別:2D和3D。

劉騰飛所在的中國科大藍(lán)鷹隊(duì)在2007年拿下了2D仿真組的全國冠軍,之后在2008年時(shí),點(diǎn)球負(fù)于德國隊(duì),拿到了世界亞軍。

因?yàn)殚L期沉湎于“足球”,劉騰飛連留學(xué)申請都沒有準(zhǔn)備,這在中國科大的學(xué)生里,并不多見。于是老師把他推薦去了香港科技大學(xué)念博士。在那段時(shí)間里,他學(xué)習(xí)的領(lǐng)域是概率圖模型。

概率圖模型是一類用圖形模式表達(dá)基于概率相關(guān)關(guān)系的模型的總稱。近10年,它已成為不確定性推理的研究熱點(diǎn),在人工智能、機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺等領(lǐng)域有廣闊的應(yīng)用前景。

但這和劉騰飛在支付寶天筭安全實(shí)驗(yàn)室遇到的風(fēng)險(xiǎn)課題并不直接相關(guān),他和他的同事們要解決的問題都是新的,因此方法也必須是新的——唯一沒變的,就是對技術(shù)的創(chuàng)新——?jiǎng)Ⅱv飛興趣滿滿。

讓數(shù)據(jù)自己找到“匕首”

好消息是,那些同樣身穿藍(lán)衣,但是懷揣匕首的人,仍可能表現(xiàn)得異乎常人。例如衣服局部的外形變化,走路的姿態(tài)變化……從數(shù)據(jù)中找出這些風(fēng)險(xiǎn)交易,最直接的做法是通過異常檢測,利用這些異乎尋常的蛛絲馬跡,來找到比較確定的標(biāo)簽。

不過這種標(biāo)簽在海量交易數(shù)據(jù)里仍只能覆蓋有限的部分,這就引出了另外一個(gè)問題——標(biāo)簽不完全。

在實(shí)際業(yè)務(wù)中,這類標(biāo)簽問題對應(yīng)的風(fēng)控場景是廣泛的,遠(yuǎn)不止于一個(gè)“買賣雙方合謀”的問題。正是因?yàn)檫@個(gè)原因,不止劉騰飛想找到解決方法,支付寶安全實(shí)驗(yàn)室和學(xué)界都對此興趣盎然,這也是此后安全科研基金樂于介入的原因。

弱監(jiān)督學(xué)習(xí)是一個(gè)對應(yīng)的解決手段。它和有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)都是機(jī)器學(xué)習(xí)方法的主要分類,依據(jù)是看算法有無利用以及如何利用訓(xùn)練數(shù)據(jù)中的標(biāo)簽信息。弱監(jiān)督學(xué)習(xí)類算法可以解決標(biāo)簽不準(zhǔn)確、標(biāo)簽不完全和標(biāo)簽不確切的問題。

正樣本和無標(biāo)簽樣本學(xué)習(xí)(PU learning)正是屬于弱監(jiān)督學(xué)習(xí)中的一類算法。它從只有正樣本和無標(biāo)簽樣本的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)得到一個(gè)二分類模型,這里的無標(biāo)簽樣本可能是正樣本,也可能是負(fù)樣本——這個(gè)正、負(fù)樣本,在支付寶等平臺的真實(shí)業(yè)務(wù)場景里,就對應(yīng)了風(fēng)險(xiǎn)的存在與否。

也是因?yàn)檫@個(gè)原因,正類和無標(biāo)記類別學(xué)習(xí)(PU learning)適用于眾多的風(fēng)控場景——?jiǎng)Ⅱv飛能找到了那只帶來風(fēng)險(xiǎn)的“匕首”,依靠的就是它。

不過,它和真實(shí)的場景仍有差距。

“自古以來”,傳統(tǒng)的正類和無標(biāo)記類別學(xué)習(xí)(PU learning)在解決問題時(shí),數(shù)據(jù)都已經(jīng)放在了科學(xué)家的手里,是囊中之物。

但在線交易不是這樣,所有的數(shù)據(jù)像流水一樣持續(xù)涌入。到諸如雙十一時(shí),這種涌入更將有如一道數(shù)據(jù)洪峰。

道高一丈

劉騰飛聯(lián)合署名的那篇論文——由支付寶天筭安全實(shí)驗(yàn)室聯(lián)合南京理工大學(xué)完成的《Online Positive and Unlabeled Learning》,能夠成功被 IJCAI-2020接收,很重要的一個(gè)原因,就是它有效地處理了這種流式數(shù)據(jù),實(shí)現(xiàn)了在線更新模型,提升模型迭代速度的目的。

這篇論文的合作背景源于螞蟻金服的安全科研基金,它是一個(gè)螞蟻金服為促進(jìn)產(chǎn)業(yè)界和學(xué)界交流的平臺項(xiàng)目。

國際人工智能聯(lián)合會議(IJCAI)是人工智能領(lǐng)域最頂尖的綜合性學(xué)術(shù)會議之一,被中國計(jì)算機(jī)學(xué)會(CCF)推薦國際學(xué)術(shù)會議列表認(rèn)定為 A 類會議。會議議題涵蓋了自然語言處理、機(jī)器學(xué)習(xí)、人工智能理論、計(jì)算機(jī)視覺、語音技術(shù)、機(jī)器人科學(xué)等領(lǐng)域。

在這篇論文中,包括劉騰飛在內(nèi)的專家們提出了一種基于正類和無標(biāo)記類別學(xué)習(xí)(PU Learning)以及在線學(xué)習(xí)(Online Learning)的新算法。

對于流式數(shù)據(jù)中的每個(gè)正例或者無標(biāo)記樣本,新算法分別設(shè)計(jì)無偏損失項(xiàng),以構(gòu)建基于流式數(shù)據(jù)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化模型,通過計(jì)算其無偏梯度,算法給出了基于在線梯度下降的分類模型更新迭代的方法。新算法在標(biāo)準(zhǔn)數(shù)據(jù)集和真實(shí)數(shù)據(jù)集上均取得了較好的效果。

這個(gè)“較好”的效果意味著,“更快的模型更新速度,將可以大幅縮短風(fēng)險(xiǎn)的暴露期?!眲Ⅱv飛說,支付寶希望風(fēng)控能夠更快、更智能,而新算法在細(xì)分業(yè)務(wù)領(lǐng)域?qū)崿F(xiàn)了這一點(diǎn)?!澳Ц咭怀?,道高一丈”。

在過去一年中,支付寶的商家風(fēng)控系統(tǒng)ARiskGo為“大潤發(fā)優(yōu)鮮”“餓了么”等累計(jì)1萬APP節(jié)省300億營銷費(fèi)用,并獲得中國支付清算協(xié)會年度“安全應(yīng)用”大獎(jiǎng)。它的能力中,就有支付寶天筭安全實(shí)驗(yàn)室里劉騰飛和他同事們的那些研究成果。

這個(gè)系統(tǒng)賦能了產(chǎn)業(yè)界,解決了職業(yè)羊毛黨薅光羊毛、消費(fèi)者薅不到真羊毛的問題。

劉騰飛說,他當(dāng)年衷愛的機(jī)器人足球世界杯,有一個(gè)目標(biāo),那就是2050年時(shí),機(jī)器人足球隊(duì)要戰(zhàn)勝人類世界杯冠軍,這個(gè)目標(biāo)就像登月,宏大、長遠(yuǎn),前路漫漫,卻總讓人心懷喜悅為之努力,一如他與支付寶天筭安全實(shí)驗(yàn)室的同事,在安全科技的路上涉海登山、步上月亮。


雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說