1
本文作者: 李雨晨 | 2017-07-14 22:08 | 專題:GAIR 2017 |
雷鋒網(wǎng)消息,2017 年 7 月 8 日,由 CCF (中國(guó)計(jì)算機(jī)學(xué)會(huì))主辦,雷鋒網(wǎng)與香港中文大學(xué)(深圳)承辦的全球人工智能與機(jī)器人峰會(huì) CCF-GAIR 大會(huì)進(jìn)入第二天。科技谷CEO陳思恩博士進(jìn)行了題為“交通出行大數(shù)據(jù)——引爆智能商業(yè)新浪潮”的演講。他表示,公路、鐵路和民航等交通方式具有巨大的出行量,每年有數(shù)十億的需求,這其中就存在 AI 和大數(shù)據(jù)的需求,AI 落地的場(chǎng)景會(huì)逐步在出行的領(lǐng)域滲透。
陳思恩還認(rèn)為,算法必須要和運(yùn)籌學(xué)結(jié)合起來,因?yàn)樽罱K實(shí)現(xiàn)的是數(shù)據(jù)驅(qū)動(dòng)決策,真正的AI是要跟大數(shù)據(jù)有一個(gè)有效的融合,去解決用戶的痛點(diǎn)。
以下為陳思恩演講實(shí)錄,雷鋒網(wǎng)做了不改變?cè)獾男薷摹?/span>
陳思恩:大家好,今天上午的最后一個(gè)環(huán)節(jié)由我給大家介紹一下 AI+交通出行的方向,其實(shí)大家看到這個(gè)命題就知道在這個(gè)領(lǐng)域里面肯定不會(huì)是一個(gè)偽命題,也不會(huì)是一個(gè)偽賽道,因?yàn)楝F(xiàn)在無論是創(chuàng)業(yè)公司還是投資機(jī)構(gòu)都擔(dān)心做的方向錯(cuò)了??萍脊裙具x擇的方向是在公路、鐵路和民航的出行上。大家知道一年鐵路有 30 億人次的出行量,民航大概有 5 億人次,公路總共有 30 億人次,在這里面有大量?jī)?yōu)化的需求。也就是說他會(huì)存在 AI 和大數(shù)據(jù)的需求。隨著 AI 和大數(shù)據(jù)的推演, AI 落地的場(chǎng)景會(huì)逐步在出行的領(lǐng)域滲透。
傳統(tǒng)的智能改造方向已經(jīng)產(chǎn)生很多的應(yīng)用,從早期的人工智能到現(xiàn)在的機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的一種方法,而深度學(xué)習(xí)是對(duì)機(jī)器學(xué)習(xí)技術(shù)的推進(jìn)??萍脊缺旧韺W⒃诮煌ǔ鲂泻痛髷?shù)據(jù)方向,在這個(gè)方向里面,不管是航空公司還是機(jī)場(chǎng)都有大量的需求,大家可以看到,在運(yùn)營(yíng)方面還是在收益、營(yíng)銷的體系建設(shè)方面都有需求所在,同時(shí)大數(shù)據(jù)的引入需求也是比較旺盛的,所以我們選擇的點(diǎn)主要是在收益優(yōu)化和安防方向,也就是維穩(wěn)這個(gè)方向。
可以看到在交通大數(shù)據(jù)和 AI 這個(gè)方向的結(jié)合是比較好的,因?yàn)榻煌〝?shù)據(jù)比較容易開放,而且開放完以后比較容易產(chǎn)生價(jià)值。首先它也是需要遵循一定的規(guī)則,大數(shù)據(jù)前面這一波的熱潮出來之后使得很多交通數(shù)據(jù)形成了堆積,無論是使用什么樣的大數(shù)據(jù)廠商提供的服務(wù),都把數(shù)據(jù)匯總起來了,這是很關(guān)鍵的。后面就用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的方法去建立相關(guān)的模型,為算法做一些準(zhǔn)備。我們認(rèn)為算法跟運(yùn)籌的最優(yōu)解可以結(jié)合,因?yàn)樽罱K是要實(shí)現(xiàn)某一個(gè)供應(yīng)鏈的配置,比如說通過客流、民航、鐵路和公路找到最優(yōu)解。同時(shí)能夠增加多種收益,比如說收放倉的控制,這種環(huán)節(jié)都需要用到一些比較核心的 AI 的算法,而且能夠自動(dòng)化控制。
我們認(rèn)為在交通出行領(lǐng)域需要三個(gè)要素才能夠比較好地實(shí)現(xiàn)整個(gè)環(huán)節(jié),也就是說它首先是需要有大量的數(shù)據(jù),無論是內(nèi)部還是外部的,這里面需要有大數(shù)據(jù)的掌控公司,同時(shí)還需要有大數(shù)據(jù)的中間商,也就是買賣、交易,現(xiàn)在國(guó)內(nèi)做了很多的交易所,還有一種是大數(shù)據(jù)的技術(shù)公司,可能是從統(tǒng)計(jì)部分的機(jī)器學(xué)習(xí),再加上計(jì)算機(jī)的原理去實(shí)現(xiàn)大數(shù)據(jù)的架構(gòu),到后面需要用深度學(xué)習(xí)的方法去落地,所以三個(gè)環(huán)節(jié)是很重要的,一個(gè)是大數(shù)據(jù)本身,另外一個(gè)是大系統(tǒng),也就是前期在推使用的算法,要用什么樣的構(gòu)架來跑,還有你的服務(wù)器用什么方式來做。后面就是算法跟運(yùn)籌優(yōu)化這一塊結(jié)合,解決一些比較實(shí)際的用戶的痛點(diǎn)。
為什么會(huì)跟運(yùn)籌這一塊結(jié)合起來?因?yàn)槟阕罱K實(shí)現(xiàn)的是數(shù)據(jù)驅(qū)動(dòng)決策,真正的AI是要跟大數(shù)據(jù)這一塊有一個(gè)有效的融合,去解決用戶的痛點(diǎn),比如說如何更好地實(shí)現(xiàn)它的票價(jià),更好地最優(yōu),會(huì)員日的如何更好地把優(yōu)惠券以合理的價(jià)格、合理的時(shí)間推送到真正有需求的用戶手上,這些都是真正去解決它的實(shí)際痛點(diǎn)。
在交通出行這一塊的分布,我們也是采用了漸進(jìn)式的方式。什么叫漸進(jìn)式?就是說它會(huì)采用除了PDCA形成一個(gè)閉環(huán),然后逐步 AI 實(shí)現(xiàn)的就是人工介入部分,把大數(shù)據(jù)落地。然后用工程的方式來做,所以我們把國(guó)外很多facebook、推特這些可以觸達(dá)旅客的點(diǎn)結(jié)合起來,比如說航空公司在訂票的時(shí)候,他根本不知道他的哪些顧客來自facebook,哪些來自推特。但是通過我們和他們合作,可以找到機(jī)票的用戶從哪里來,下一次有優(yōu)惠信息的時(shí)候可以推薦到他的行程上。把國(guó)外的數(shù)據(jù)源帶到國(guó)內(nèi),對(duì)大的航企、12306都有很大的幫助,也就是直接帶客源進(jìn)去,他在整個(gè)大數(shù)據(jù)的連接上面產(chǎn)生價(jià)值之后,就需要開始去做內(nèi)部的數(shù)據(jù)深挖,這時(shí)候就需要用機(jī)器學(xué)習(xí)的方法,甚至是一些AI深度學(xué)習(xí)的方法去做。
外部的數(shù)據(jù)引入之后,就需要對(duì)某個(gè)人或者某個(gè)事件做畫像,這個(gè)航線要怎么畫像,客源是怎么來的,這些都要有深度的識(shí)別,對(duì)我們來說是上百個(gè)維度的識(shí)別。這些推演的背后就是機(jī)器學(xué)習(xí),它是人工智能很好的實(shí)現(xiàn)方法,同時(shí)深度學(xué)習(xí)也是對(duì)機(jī)器學(xué)習(xí)很好的實(shí)現(xiàn),就像《黑鏡》里面的女主角通過機(jī)器學(xué)習(xí)的方式,在社交網(wǎng)絡(luò)上模仿她的男朋友的語態(tài)。你要更了解你的客戶,才能真正實(shí)現(xiàn)更好的策略。
剛才講的是大數(shù)據(jù)的數(shù)據(jù)部分,接下來是系統(tǒng)部分,微軟在這一塊有HD inside,我們也有自己的inside套裝,我們認(rèn)為在企業(yè)需要混合云來搭,就像12306在出行高峰的時(shí)候用阿里云的資源,降低它的主機(jī)的負(fù)荷。所以分布式架構(gòu)用混合云的架構(gòu)會(huì)長(zhǎng)期存在,而且對(duì)云端的依賴會(huì)加大,就像華為進(jìn)入公有云的市場(chǎng),中興通訊也有它的云,國(guó)內(nèi)是阿里云比較有名,我們也把我們的系統(tǒng)搭建在亞馬遜的云上,通過混合云的架構(gòu)幫助客戶實(shí)現(xiàn)大系統(tǒng)的搭建。
接下來這是我們的大系統(tǒng)的架構(gòu),因?yàn)橐平Y(jié)合,里面包含了各種技術(shù)的組合,然后有我們自己的 SDK,封裝了很多方式,這種方法已經(jīng)用在國(guó)內(nèi)的很多大型的航空公司和鐵路的12306,這里面還包括一些推薦的引擎和算法,這完全是To B的架構(gòu),但是它做的是B2C的方向。
這里面有兩個(gè)重要的東西,一個(gè)是平臺(tái),在這個(gè)點(diǎn)上跟其它的平臺(tái)是大同小異的,但是它會(huì)偏行業(yè),因?yàn)樾袠I(yè)的東西是比較不一樣的,特別是數(shù)據(jù)清洗這個(gè)環(huán)節(jié),還包括在數(shù)據(jù)建模。因?yàn)樗惴ㄅ芷饋?,模型是很重要的,還有約束條件、建模的方式都是不一樣的。另外inside這一塊是比較有特點(diǎn)的,也就是我們的套裝化之一,這里面含了畫像的場(chǎng)景、關(guān)系圖譜。知識(shí)圖譜里面很重要的一個(gè)就是建RDF,也就是整個(gè)關(guān)系建立的套件,還有推薦引擎和算法。這里面涉及到數(shù)據(jù)建模的優(yōu)化和神經(jīng)網(wǎng)絡(luò)的東西,所以這個(gè)套件我們花了大概三四年的時(shí)間,而且這個(gè)很需要在大的數(shù)據(jù)庫里面去練。因?yàn)槲覀冏龅帽容^早,在這個(gè)領(lǐng)域里面,像12306,中國(guó)大的企業(yè)都是我們的客戶,所以我們這個(gè)產(chǎn)品得到了很好的歷練,它相對(duì)來說是能夠接受體量很大的數(shù)據(jù)場(chǎng)景去找最優(yōu)解。
在這個(gè)之上,它這里面涉及到大量的運(yùn)算方式,比如說畫像的場(chǎng)景,它可以支持上千個(gè)維度的自動(dòng)化,它是通過參數(shù)配置的,自動(dòng)化形成多種算法的場(chǎng)景。同時(shí)在推薦系統(tǒng)上也是多種關(guān)聯(lián),時(shí)間節(jié)點(diǎn)、分布式算法,同時(shí)對(duì)用戶行為進(jìn)行預(yù)測(cè)。
之后我們關(guān)注在我剛才提到的三個(gè)要素,一個(gè)是數(shù)據(jù),第二個(gè)是平臺(tái),第三個(gè)是算法。算法我們選擇的是收益這個(gè)環(huán)節(jié),我們能夠真正幫用戶實(shí)現(xiàn)收益,也就是 AI 這一塊新的優(yōu)化。就像星河互聯(lián)的傅總講的,航空這一塊的自動(dòng)化程度高,但是對(duì)創(chuàng)業(yè)公司也不意味著沒有太多的機(jī)會(huì),國(guó)外做這一塊的就有好幾家公司,但是國(guó)產(chǎn)化的公司還沒有,酒店行業(yè)現(xiàn)在有幾家起來了,但是航空產(chǎn)業(yè)基本上是沒有的,我們會(huì)從航空和鐵路的收益環(huán)節(jié)去做,把大量的運(yùn)算放在云端,客戶用租用的方式就可以實(shí)現(xiàn)對(duì)算法的采購,用許可的方式和服務(wù)費(fèi)、訂閱費(fèi)的方式去支付我們的產(chǎn)品費(fèi)用。
收益這一塊,我們也是大概6個(gè)月的時(shí)間可以幫助客戶實(shí)現(xiàn)從大數(shù)據(jù)的引入到平臺(tái)的建設(shè),到收益優(yōu)化算法的建立。所以現(xiàn)在已經(jīng)有比較大的合作伙伴在用這套系統(tǒng),而且這個(gè)平臺(tái)可以直接用于更多的平臺(tái)性的客戶,比如說阿里的飛豬、美團(tuán)、滴滴,它需要做求解器,收益有關(guān)場(chǎng)景的用戶都會(huì)去用,我們會(huì)先從航空和鐵路這方面的客戶做起。
這里面具體做什么?在航空領(lǐng)域,它的 NO-SHOW 的模型也是要改變的,因?yàn)樘鞖鈹?shù)據(jù)現(xiàn)在都是開放的,這些維度的數(shù)據(jù)要實(shí)時(shí)的整合,你的算法現(xiàn)在不是靜態(tài)模型,而是需要?jiǎng)討B(tài)模型,同時(shí)你在外部的行為都是動(dòng)態(tài)的,這些環(huán)節(jié)都需要導(dǎo)入,導(dǎo)入完以后你對(duì)NO-SHOW這個(gè)環(huán)節(jié),包括座位分配的環(huán)節(jié),都要重新用機(jī)器學(xué)習(xí)的方式去做,最終實(shí)現(xiàn)一個(gè)最優(yōu)化。對(duì)航空公司來說,雖然是最優(yōu)化,但是它是基于機(jī)器學(xué)習(xí)的,最終它的 AI 對(duì)比就是說我算得比別人更準(zhǔn),我的收益提高得比別人更高,最終它就達(dá)到了結(jié)果,而且全面國(guó)產(chǎn)化是一個(gè)很好的趨勢(shì),因?yàn)楹芏嘌肫笠捕挤浅VС诌@個(gè)事情,我們這個(gè)公司現(xiàn)在就是在立足做國(guó)產(chǎn)化的收益求解器。同時(shí)我們?cè)谧龅臅r(shí)候是用工程的方式落地,而不是把產(chǎn)品推過去用云的方式落地。針對(duì)大的企業(yè)級(jí)用戶,任務(wù)分解必須做得很細(xì)。這里面需要航旅類的企業(yè)配合,需要IT、營(yíng)銷人員參與,當(dāng)然任何做 AI 和大數(shù)據(jù)方向的都是公司的戰(zhàn)略決策,無論是首席數(shù)據(jù)官還是首席信息官,或者是 CEO 都要參與這個(gè)事情。中間它就需要我們的大數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)方面的人一起整合去做這個(gè)事情,長(zhǎng)期迭代服務(wù)才能夠建立比較有效的環(huán)節(jié),同時(shí)還要導(dǎo)入一些外部的數(shù)據(jù),因?yàn)槠髽I(yè)內(nèi)部的數(shù)據(jù)遠(yuǎn)遠(yuǎn)是不夠的,包括 12306 都不敢稱自己是大數(shù)據(jù)公司,當(dāng)然BAT是真正的大數(shù)據(jù)公司,因?yàn)樗臄?shù)據(jù)夠多元化。
對(duì)科技谷來說最主要的是要幫客戶創(chuàng)造商業(yè)價(jià)值,帶來創(chuàng)新。真正使這套技術(shù)落地,給客戶變現(xiàn)帶來收益,所以我們也是立足這個(gè)方向,持續(xù)做這個(gè)市場(chǎng)相關(guān)的東西。
通過這幾年的積累,我們也建立了非常多的合作伙伴和客戶,因?yàn)橐删鸵粋€(gè)比較好的公司,它需要有一個(gè)完整的上下游的產(chǎn)業(yè)鏈配套,很多是我們的兄弟公司一起推動(dòng),對(duì)這種大的企業(yè),單打獨(dú)斗是很難在一個(gè)市場(chǎng)立足的。
我的報(bào)告就到這里,謝謝大家。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章