0
本文作者: camel | 編輯:郭奕欣 | 2017-08-13 21:41 | 專題:KDD 2017 |
雷鋒網(wǎng) AI 科技評(píng)論按:本周末,每年一度的數(shù)據(jù)挖掘的頂級(jí)會(huì)議ACM SIGKDD在加拿大新斯科舍省省會(huì)哈利法克斯拉開了序幕,整個(gè)會(huì)議13號(hào)到17號(hào),持續(xù)5天。在異國他鄉(xiāng)的頂尖國際會(huì)議上,雷鋒網(wǎng)AI科技評(píng)論發(fā)現(xiàn),不僅在收錄論文列表里頻頻出現(xiàn)中國人的名字,甚至連贊助商都有一系列的中國公司位列前排,其中“滴滴出行”則以鉆石贊助商的身份排在首要位置。這就引起了我們對(duì)滴滴在此次會(huì)議中活動(dòng)的特別注意。
通過查找,雷鋒網(wǎng)發(fā)現(xiàn)滴滴在這次大會(huì)中共有4個(gè)活動(dòng):
14日下午13:30-14:20,在“城市計(jì)算”研討會(huì)中,滴滴副總裁、滴滴出行研究院副院長葉杰平將做一個(gè)關(guān)于“滴滴出行中的大數(shù)據(jù)”的受邀報(bào)告。
14日晚上19:00-22:00,論文報(bào)告“A Taxi Order Dispatch Model based On Combinatorial Optimization”。
15日中午12:30-13:30,滴滴在會(huì)展展位將會(huì)開啟一場(chǎng)精彩對(duì)話。
15日下午13:30-17:00,滴滴副總裁葉杰平也將在中國專場(chǎng)做一次報(bào)告。
目前滴滴平臺(tái)擁有4億用戶,日訂單量超過2000萬。在中國滴滴現(xiàn)在每天新增數(shù)據(jù)量有70TB+,每日處理數(shù)據(jù)4500TB,每日路徑規(guī)劃超200億次。所以滴滴平臺(tái)的大數(shù)據(jù)是毋庸置疑。滴滴如何把實(shí)時(shí)的交通信息整合在一塊,通過背后龐大復(fù)雜的算法和計(jì)算平臺(tái)做到實(shí)時(shí)、智能的決策,這將是非常值得關(guān)注的。通過葉杰平在之前的一些演講,我們可以發(fā)現(xiàn)人工智能、機(jī)器學(xué)習(xí)算法在滴滴出行的大數(shù)據(jù)處理中占據(jù)著極為重要的地位。據(jù)了解,最近滴滴更新了一版深度學(xué)習(xí),其效果如何或許將在這次會(huì)議中對(duì)外揭曉。
作為其研究成果的論文報(bào)告也是非常值得關(guān)注的。在KDD官網(wǎng)上這篇論文《A Taxi Order Dispatch Model based On Combinatorial Optimization》的摘要如下:
出租車的應(yīng)用程序在世界各地非常受歡迎,因?yàn)樗鼈優(yōu)橛脩籼峁┝丝焖俚捻憫?yīng)時(shí)間和便利性。出租車預(yù)訂應(yīng)用程序的關(guān)鍵組成部分是調(diào)度系統(tǒng),該系統(tǒng)旨在提供駕駛員和車手之間的最佳匹配。傳統(tǒng)的調(diào)度系統(tǒng)依次向乘客派出出租車,其目的是最大化每個(gè)獨(dú)立訂單的司機(jī)接受率。但這種調(diào)度系統(tǒng)不能保證全局的成功率,這就會(huì)降低用戶在使用應(yīng)用程序時(shí)的體驗(yàn)。在本文中,我們提出了一個(gè)新的調(diào)度系統(tǒng)來優(yōu)化多個(gè)訂單下的出租車調(diào)度。這個(gè)系統(tǒng)旨在最大化全局調(diào)度的成功率,從而優(yōu)化整體的交通效率,給用戶帶來更好的體驗(yàn)。為了進(jìn)一步提升用戶體驗(yàn),我們還提出了一種在開啟出租車預(yù)約APP時(shí)預(yù)測(cè)用戶目的地的方法。這種方法使用了貝葉斯結(jié)構(gòu)來根據(jù)他/她的旅行歷史來對(duì)用戶的目的地的分布進(jìn)行建模。
我們使用A/B測(cè)試比較了我們新的出租車調(diào)度方法與從北京收集的數(shù)據(jù)建立的最先進(jìn)的模型。實(shí)驗(yàn)結(jié)果表明,該方法在全局成功率(從80%增加到84%)方面優(yōu)于其他最先進(jìn)的模型。此外我們還對(duì)其他指標(biāo)(如用戶的等待時(shí)間和接收距離)進(jìn)行了顯著改善。我們將表明,我們的目標(biāo)預(yù)測(cè)算法優(yōu)于基于KNN方法的基準(zhǔn)模型,與精度排名前三的模型相比,我們的精度提升了89% - 93%。這種新的出租車調(diào)度和目的地預(yù)測(cè)算法已經(jīng)部署在我們的在線系統(tǒng)中,每天為數(shù)千萬用戶服務(wù)。
論文下載:A Taxi Order Dispatch Model based On Combinatorial Optimization
此外,還有一篇入選論文《The Simpler The Better: A Unified Approach to Predicting Original Taxi Demands based on Large-Scale Online Platforms》,雖然不在滴滴的活動(dòng)列表中,但有滴滴副總裁葉杰平和Jie Wang的參與研究(其他研究者還有北航的Yongxin Tong, 第四范式的陳雨強(qiáng),蘇黎世聯(lián)邦理工的Zimu Zhou,香港科大的陳雷和楊強(qiáng))。摘要如下:
Author(s): Yongxin Tong (Beihang University);Yuqiang Chen (4Paradigm Inc.);Zimu Zhou (ETH Zurich);Lei Chen (Hong Kong University of Science and Technology);Jie Wang (Didi Research);Qiang Yang (Hong Kong University of Science and Technology);Jieping Ye (Didi Research)
出租車應(yīng)用程序現(xiàn)在越來越受歡迎,因?yàn)樗鼈兡苡行У貫橛行枰某丝团汕部臻e的出租車。為了更精確地平衡出租車的供應(yīng)和需求,在線出租車平臺(tái)必須預(yù)測(cè)單元出租車需求(UOTD),也即單位時(shí)間(例如每小時(shí))、單位面積(例如每POI)發(fā)起的出租車需求數(shù)。UOTD的預(yù)測(cè)對(duì)于大型在線出租車平臺(tái)來說是沒有意義的,因?yàn)閷?duì)它們來說精確性和靈活性是至關(guān)重要的。復(fù)雜的非線性模型(如GBRT和深度學(xué)習(xí))通常是精確的,但在情景變化(例如新的規(guī)定導(dǎo)致的額外限制)后就需要大量的工作來重新設(shè)計(jì)模型了。為了精確地預(yù)測(cè)UOTD,同時(shí)保持靈活的情景變化,我們提出了LinUOTD,這是一個(gè)具有超過200萬維特征的統(tǒng)一線性回歸模型。這個(gè)簡(jiǎn)單的模型結(jié)構(gòu)消除了模型重設(shè)計(jì)的需要,而且高維特征有助于精確地預(yù)測(cè)UOTD。此外,我們?cè)O(shè)計(jì)了一系列優(yōu)化技術(shù)用于高效的模型訓(xùn)練和更新。我們使用了兩個(gè)來自在線出租車平臺(tái)的大型數(shù)據(jù)集進(jìn)行的評(píng)估證明了LinUOTD在精確性方面優(yōu)于流行的非線性模型。我們認(rèn)為我們?cè)赨OTD預(yù)測(cè)中使用地高維特征的簡(jiǎn)單的線性模型可以作為一個(gè)試點(diǎn)研究,它可以應(yīng)用到深入了解其他工業(yè)大規(guī)模時(shí)空預(yù)測(cè)的問題當(dāng)中。
2015年5月,滴滴正式成立機(jī)器學(xué)習(xí)研究院,將機(jī)器學(xué)習(xí)大規(guī)模應(yīng)用在出行領(lǐng)域;2016年4月,滴滴機(jī)器學(xué)習(xí)研究院升級(jí)為滴滴研究院, 目前其研究項(xiàng)目包括ETA、動(dòng)態(tài)調(diào)價(jià)、智能分單、拼車、供需預(yù)測(cè)、運(yùn)力調(diào)度、熱力圖等核心項(xiàng)目,研究方向則包括機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、人工智能、數(shù)據(jù)挖掘、最優(yōu)化理論、分布式計(jì)算等。在今年3月滴滴出行又宣布在美國加州硅谷成立滴滴美國研究院,把挖人的觸角直接伸到了美國硅谷。從2012年的微不足道,短短五年已至如此,其成長不可謂不迅猛。
SIGKDD 2017大會(huì)將有更多精彩呈現(xiàn),雷鋒網(wǎng)AI科技評(píng)論將從一線帶來精彩報(bào)道及內(nèi)容。
相關(guān)文章:
KDD 2017在即,Keynote內(nèi)容搶先看|KDD 2017
KDD 2017現(xiàn)場(chǎng)探營:務(wù)實(shí)、豐富,數(shù)據(jù)大爆炸的盛會(huì)即將開啟 | KDD 2017
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章