0
本文作者: 陳伊莉 | 2018-01-25 22:16 |
技術(shù)的深度應用在給人類帶來“光”的同時,也有“暗”在生長??萍硷L險已成為各行業(yè)主要的風險之一,從電信詐騙,到釣魚木馬、買賣個人信息,再到如今有組織的羊毛黨,欺詐者一直在開拓攻擊手段和領域,這也要求著安全和風險分析技術(shù)的更迭換代。
近年來不斷發(fā)展的大數(shù)據(jù)與人工智能技術(shù),逐漸成為風控與反欺詐從業(yè)者的有力武器。成立四年的DataVisor打出“無監(jiān)督學習算法”這一旗幟,再結(jié)合監(jiān)督學習、自動規(guī)則引擎,為客戶提供多應用場景的保護,包括大量虛假賬戶注冊、賬號盜取、欺詐交易、身份盜用、洗錢交易、假冒評估、垃圾郵件、虛假安裝推廣等。
創(chuàng)始人、CEO Yinglian Xie (謝映蓮) 畢業(yè)于卡內(nèi)基梅隆大學計算機系并取得博士學位,有超過十年的安全領域行業(yè)經(jīng)驗,一直致力于打擊大規(guī)模網(wǎng)絡線上攻擊,此前任職微軟硅谷研究院。近日,她與雷鋒網(wǎng)進行了一次深入的訪談。
“人工智能產(chǎn)業(yè)發(fā)展有四個維度:場景、大數(shù)據(jù)、計算能力與算法。大數(shù)據(jù)是基礎,計算能力是前提,算法靠人才。在細分場景已經(jīng)確定的前提下,大數(shù)據(jù)非常重要。而這部分需要行業(yè)頂級專家的深度參與,通過大數(shù)據(jù)的清洗、標簽,把行業(yè)頂級專家的知識轉(zhuǎn)移給機器,從而讓人工智能站在巨人的肩膀之上。”清華教授鄧志東告訴雷鋒網(wǎng)。
在現(xiàn)實中,各行業(yè)或許擁有較多的數(shù)據(jù)積累,但帶標簽的數(shù)據(jù)卻很少,需要依賴行業(yè)頂級專家的深度參與,人力限制是一方面,另一方面是有標簽的數(shù)據(jù)較難得,拿到之后通常也存在滯后效應,無法檢測新型的未知類型的攻擊。而標簽數(shù)據(jù)的及時性和準確性,直接影響模型的效果。無監(jiān)督學習已經(jīng)無法滿足現(xiàn)狀,從業(yè)者開始應用無監(jiān)督學習來應對這種情況。
顧名思義,無監(jiān)督學習可以不依賴于標簽和訓練數(shù)據(jù),自動挖掘新攻擊。當攻擊快速變化時,也能自動繼續(xù)跟蹤挖掘?!八畲蟮暮锰幨?,化‘被動跟著敵人跑’,為‘在攻擊發(fā)生之前或同時做出反應’”,謝映蓮說,并且還能檢測潛伏期賬戶,起到提前預警作用。
據(jù)介紹,DataVisor一般通過挖掘平臺用戶的三類數(shù)據(jù):賬戶注冊信息、行為信息以及其他信息(IP、地理位置、設備等)?!跋乱徊剑言撈脚_一段時間內(nèi)進行同一行為的用戶放在一起來檢測,聚類分析,發(fā)現(xiàn)賬號間的相似性和相關性,形成單個用戶畫像。”比如,當一個新用戶注冊時,平臺無法獲知更多信息,但是聯(lián)系所有用戶時,可能有一些用戶使用非常相同或相似的頭像、名字、手機型號等,行為就凸顯出來了。
謝映蓮告訴雷鋒網(wǎng),目前無監(jiān)督機器學習在實際應用中比較少,難度是在于如何設計算法、體系架構(gòu)以及保障算法的效果。
另一個也在無監(jiān)督學習體系下的技術(shù)是自動規(guī)則引擎。傳統(tǒng)規(guī)則引擎都是人工調(diào)試,DataVisor在此基礎上利用機器學習技術(shù),挖掘出了很多欺詐群組,而每個群組都有一條或者多條規(guī)則,那么如何將這些結(jié)果轉(zhuǎn)化成人類可以理解的規(guī)則,以滿足監(jiān)管或者其他需求呢?
據(jù)稱,他們會總結(jié)規(guī)則的相似性,并用統(tǒng)計原理對規(guī)則的生成進行嚴格的測試,從而使之既有解釋性,又能滿足平臺的需求。
“總的來說,這三種技術(shù)有著不同的作用,形成互補。有監(jiān)督學習在有標簽的情況下,能夠挖掘出有規(guī)律的特征,與無監(jiān)督學習可以結(jié)合利用。而自動規(guī)則引擎主要就是滿足解釋性需求,并且減少人工調(diào)試的繁瑣和錯誤率?!?/p>
此外,他們還打造了DataVisor 全球智能信譽庫,為上述技術(shù)提供數(shù)據(jù)支持。主要通過挖掘、整合攻擊信號,并進行二度計算,提煉出更具有代表性的信號。據(jù)稱,數(shù)據(jù)庫擁有來自不同領域超過20億用戶的欺詐行為數(shù)據(jù),如IP地址、UA信息、郵箱域名、設備類型等。
基于以上三種技術(shù)加全球智能信譽庫,他們開發(fā)了用戶分析平臺。由于該平臺本身就具有通用和可延展性,所以能夠與不同的數(shù)據(jù)、不同的使用場景掛鉤對接,也就出現(xiàn)了八大應用場景。
那么在實際應用,DataVisor是如何結(jié)合應用場景,為客戶提供服務的呢?
謝映蓮表示,第一階段非常重要的工作就是幫助客戶梳理和清洗數(shù)據(jù),數(shù)據(jù)的質(zhì)量與算法的好壞也是密不可分。雖然DataVisor會面臨數(shù)據(jù)全面與準確性的挑戰(zhàn),但她也指出,各機構(gòu)關于數(shù)據(jù)的意識已經(jīng)比較強烈,“會有一些(數(shù)據(jù)梳理)基礎,雖然參差不齊。”
下一步是理解客戶的業(yè)務場景和需求痛點,“將我們的算法和對方數(shù)據(jù)相結(jié)合,幫助客戶解決實際問題。”上述完成后,需要對相當于技術(shù)框架和產(chǎn)品進行調(diào)試,根據(jù)客戶反饋進行一到兩次調(diào)優(yōu),然后進入產(chǎn)品上線階段。
客戶可以通過DataVisor用戶界面、用戶分析控制臺獲取檢測結(jié)果,或者通過DataVisor結(jié)果API批量導出或?qū)崟r傳送檢測結(jié)果,或者直接購買規(guī)則自行建冊。根據(jù)客戶不同的業(yè)務需求,DataVisor數(shù)據(jù)分析平臺提供多種類型部署選項,包括內(nèi)部部署、SaaS服務和私有云部署。
據(jù)稱,DataVisor的客戶有如美國最大點評網(wǎng)站Yelp、Pinterest,以及財富500強金融機構(gòu)等。2016年11月,正式進入中國市場后,在國內(nèi)建立合作的公司包括大眾點評、獵豹移動、今日頭條等。
DataVisor還表示下一步將會發(fā)力金融行業(yè)。據(jù)謝映蓮介紹,當前與金融機構(gòu)的合作主要集中在賬號保護、信貸申請、交易結(jié)算和反洗錢方面。以前述財富500強公司為例,該公司在超過200個國家提供服務并且已經(jīng)進入金融服務行業(yè)超過100年,DataVisor主要為其提供反交易欺詐服務。該欺詐與風險策略總監(jiān)能夠在欺詐者發(fā)起攻擊前數(shù)天或數(shù)小時檢測到他們,使欺詐交易損失減少超過30%。
另外,美國最大的商家結(jié)算支付平臺在采用DataVisor一站式風險數(shù)據(jù)分析平臺后,實時阻止了17%的交易糾紛欺詐,每年平均為平臺商戶節(jié)省超過5萬美元。
而說到國內(nèi)風控市場,儼然一片紅海,相關技術(shù)提供商已經(jīng)不勝枚舉,漂洋過海的DataVisor如何在競爭中占據(jù)一席之地?
“市場廣闊,難免會有競爭,但我認為這會是良性競爭”,謝映蓮持著樂觀的觀點,“市場不同的參與者會起到不同的作用,有些專做白黑名單、識別指紋這些信號類型的工作,有些像我們提供算法和平臺,都是在完善生態(tài)系統(tǒng)?!?/p>
她表示,內(nèi)部有很多華人工程師,中國也是公司未來的戰(zhàn)略重點,并透露了DataVisor國內(nèi)發(fā)展計劃。首先,會繼續(xù)提高無監(jiān)督機器學習技術(shù)的智能化,使之能匹配適用更廣泛的場景,減少人工干預。其次,根據(jù)客戶需求,進行本地化調(diào)整,比如說,對中文語言文字處理的優(yōu)化;另一方面,國內(nèi)有較多羊毛黨、刷機行為,規(guī)模性更強,會考慮中國的攻擊特點進行調(diào)整。
“經(jīng)過微軟的多年經(jīng)驗,意識到無監(jiān)督學習的重要性,大家覺得以前的方法是‘頭痛醫(yī)頭,腳痛醫(yī)腳’,而透過互聯(lián)網(wǎng)上支付、刷單行為,我們看到本質(zhì)其實是賬號層面的欺詐。所以我們誕生一個想法——解決賬號生命周期中存在的各種欺詐?!?/p>
謝映蓮向雷鋒網(wǎng)描述其立項創(chuàng)業(yè)的心路。她表示,微軟研究院有很好的研究氛圍,但是對個人來講,并不滿足于通過和微軟各個部門合作進行的局部創(chuàng)新。其中的“她們”還包括聯(lián)合創(chuàng)始人兼CTO俞舫,同樣來自微軟硅谷研究院。
“反欺詐行業(yè)一個特點是,對手在不斷變化,問題不是靜止的。我們在不停地追求新技術(shù)應對攻擊,另一邊又在將這種技術(shù)能力產(chǎn)品化,兩個過程都充滿著挑戰(zhàn)性,也讓我非常興奮?!?/p>
這些或可總結(jié)為支持她過去十年以及未來可能的數(shù)十年,從事該行業(yè)的動力。
==============全文完==============
【今日福利】技術(shù)的發(fā)展永無止境,在這條探索的道路上,我們看到的不只是尸骨,還有正在建造的座座豐碑。2017年,雷鋒網(wǎng)曾與數(shù)十家區(qū)塊鏈行業(yè)傳統(tǒng)企業(yè)、新創(chuàng)公司進行對話,并報道?,F(xiàn)在我們選取了其中8家代表性機構(gòu)的實踐案例,包括工商銀行、招商銀行、平安集團、銀聯(lián)、螞蟻金服等,匯編成特輯報告。除此外,還有20+智能金融公司案例,涵蓋普惠金融、風控信貸、財富管理等議題。
戳這里 http://www.ozgbdpf.cn/specialEdition/detail/s/5a4c9564b9e38 ,查看雷鋒網(wǎng)Fintech年度特輯全文。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。