0
雷鋒網(wǎng) AI 科技評(píng)論按,日前,滴滴副總裁章文嵩的一段演講片段掀起了一波吐槽滴滴的高潮。
他的原文如下:
「所以說,我們這個(gè)問題的復(fù)雜度,比下圍棋要復(fù)雜一百倍以上,就比 AlphaGo 面臨的問題復(fù)雜一百倍,因?yàn)槲覀冎酪惶煊?86400 秒,如果除以兩秒鐘撮合一次,我們的步數(shù)我們要考慮 43200 步,我們知道下圍棋,格子里面只有 19 乘 19,最多 361 步,而且都有確定性的解,是贏,還是輸,還是平局。那我們實(shí)際上最優(yōu)解是怎么樣?都是目前我們?cè)诓粩嗟赃@個(gè)問題復(fù)雜度,比下圍棋復(fù)雜多了,所以這可能是跟大家想象得不一樣,滴滴是真正背后是拿很多科技的手段在解決問題……」
這段話核心觀點(diǎn)如下——滴滴所面臨的問題比 AlphaGo 要復(fù)雜得多。
然而很不幸,雷鋒網(wǎng) AI 科技評(píng)論看到,微博上某些媒體將標(biāo)題引申為:【滴滴派送體驗(yàn)不好?滴滴副總裁:滴滴的算法比 AlphaGo 復(fù)雜很多倍】
當(dāng)然,被有意誤導(dǎo)之后,他第一時(shí)間發(fā)表微博表示:「這標(biāo)題明顯誤導(dǎo)。我是表達(dá)派單問題的復(fù)雜度,搜索空間是巨大的,并沒有對(duì)比滴滴算法和 AlphaGo 算法,實(shí)際上我們也使用增強(qiáng)學(xué)習(xí)算法?!?/p>
但是事情已經(jīng)發(fā)生,出現(xiàn)了很多(讓人覺得標(biāo)題沒常識(shí)的)新聞:
嗯,對(duì)于算法,章文嵩根本就沒有進(jìn)行比較(攤手)。
值得注意的一點(diǎn)是,這些新聞都圍繞棋圣聶衛(wèi)平展開。
據(jù)媒體報(bào)道,在江蘇姜堰觀戰(zhàn)世界女子圍棋擂臺(tái)賽期間,心直口快的聶衛(wèi)平聽說了章文嵩的言論,忍不住反問:
「我就問一句,圍棋有 361 個(gè)格子,你知道這其中的變化量是多少嗎?……中國圍棋協(xié)會(huì)主席林建超在擔(dān)任總參辦公廳主任時(shí)組織力量進(jìn)行研究,得出的結(jié)論是圍棋變化是 10 的 808 次方。如果圍棋的算法比滴滴都簡(jiǎn)單,何須擁有巨大資金和技術(shù)支撐的 AlphaGo 團(tuán)隊(duì)出馬,一個(gè)小學(xué)生就足夠研究透徹了!」
棋圣在這里高冷地表示,我們圍棋并不簡(jiǎn)單。當(dāng)然,他的這番言論中也出現(xiàn)了一個(gè)小 bug——「如果圍棋的算法比滴滴都簡(jiǎn)單」,事實(shí)上章文嵩在演講中并沒有將兩者的算法進(jìn)行比較。
隨后,章文嵩發(fā)文詳細(xì)說明了滴滴派單問題的復(fù)雜性:
在圍棋里,每一步落子都會(huì)影響棋局變化。在 19*19 的棋盤上,最多對(duì)弈 361 步,若不考慮棋盤的對(duì)稱性,圍棋的變化是 361 的階乘,約 10 的 768 次方...,這已經(jīng)是一個(gè)驚人的量。
滴滴派單問題是極為復(fù)雜的時(shí)空調(diào)度問題,一天有幾千萬乘客在不同的時(shí)空中發(fā)出需求,也有大幾百萬司機(jī)在不同的時(shí)空出現(xiàn),每一次不同的派單都會(huì)影響不同的時(shí)空里供需分布,乘客和司機(jī)對(duì)派單響應(yīng)是動(dòng)態(tài)的,交通路況也不斷地變化,優(yōu)化目標(biāo)也挺難刻畫的,不光考慮全局的需求滿足率,還得考慮人們心目中對(duì)服務(wù)的感覺等約束,把服務(wù)確定性描述清楚就不容易,是個(gè)開放的問題。若要跟圍棋對(duì)比,我們簡(jiǎn)單抽象這個(gè)問題,一天完成 2500 萬以上的訂單,每 2 秒的一次撮合完成幾百到上千的派單,一次撮合本身的計(jì)算復(fù)雜度非常高,可載客的車輛數(shù)和需求訂單數(shù)遠(yuǎn)遠(yuǎn)大于派單數(shù),組合的空間非常大 10 萬以上,每 2 秒撮合都會(huì)影響到未來的時(shí)空上供需分布,就像下棋每一步落子都會(huì)影響棋局變化,一天共撮合 43200 次,時(shí)空的變化是(10 萬)43200 次方的量級(jí)。滴滴也用強(qiáng)化學(xué)習(xí)算法來解這個(gè)問題,不斷迭代和改進(jìn)。
圍棋的規(guī)則是確定的,是完美信息博弈,AlphaZero 可以自己根據(jù)規(guī)則創(chuàng)造出棋譜,AlphaGo 和 AlphaZero 在圍棋上可以超過人類棋手。而在開放問題上,AlphaGo 和 AlphaZero 目前還不能超越人類,例如,在星際爭(zhēng)霸上還打不過人類,在王者榮耀上也勝不過人類。相信在大家共同努力下,技術(shù)不斷突破邊界,我們?nèi)祟愐灿行判鸟{馭它,為人類的智慧不斷增長(zhǎng)而服務(wù)。在不同的戰(zhàn)場(chǎng),我們一起加油。
以上。
然而,不幸地是,他的話語又捅出了簍子。身為前阿里云 CTO,LVS(Linux Virtual Server)開源軟件創(chuàng)始人,雖然對(duì)技術(shù)是極懂的,但是看起來卻不那么懂圍棋。
他說道,「我們知道下圍棋,格子里面只有 19 乘 19,最多 361 步?!?/p>
然后,微博下面是一波類似這樣的群嘲:
隨后,他也為自己的失誤道歉并表示,雖然自己前面的說法有誤,但圍棋的復(fù)雜度并不是無限提升的:
圍棋最多 361 步這個(gè)說法不準(zhǔn)確,抱歉!沒有考慮到打劫和提子的情況,感謝大家的討論提升了我的認(rèn)知。圍棋的復(fù)雜度不是無限提升的,不能反復(fù)打劫,提子后空間也有限,聶棋圣在微博上說有專家團(tuán)隊(duì)研究過圍棋變化是 10 的 808 次方。還是挺想學(xué)習(xí)一下里面的計(jì)算方法。
但是,解決的問題越復(fù)雜就意味著更厲害嗎?
對(duì)于這一問題,其實(shí)已經(jīng)有一大批知乎 er 展開了討論。
雖然提問的打開方式并不怎么正確:
如何看待滴滴章文嵩稱,滴滴的算法比 AlphaGo 復(fù)雜 100 倍?(章文嵩哪里有說滴滴的算法比 AlphaGo 復(fù)雜了???)
隨后引發(fā)了一大波不明真相的群眾的歪樓,大家都在嘲笑:
你這個(gè)算法有什么可比的。
算法更復(fù)雜,不就證明代碼越費(fèi)時(shí)費(fèi)力,不就證明你的工程水平不高?
(不明覺厲)
當(dāng)然,也有正正經(jīng)經(jīng)研究過事情始末的人,表達(dá)了這樣的言論:
從理論上來說兩個(gè)問題在很多層面上都是 NP-hard 的復(fù)雜度,無從談起誰更復(fù)雜,當(dāng)事人只是要說明滴滴的時(shí)效性要求高、數(shù)據(jù)量大的事實(shí)。
在這兩種言論之間,也有人站在客觀的立場(chǎng)看待這一問題。
知乎上一位匿名用戶表示,雖然圍棋的復(fù)雜度或許更高,但從用戶體驗(yàn)上來看,滴滴并沒有成功解決問題:
第一,圍棋場(chǎng)景復(fù)雜度也許更高。
圍棋的場(chǎng)景復(fù)雜度,并不在于其每一步最多 361 種選擇。它復(fù)雜在,坐在你對(duì)面是高智商的對(duì)手。需時(shí)刻提防對(duì)手隨時(shí)「留陷阱」,要每一步皆需統(tǒng)籌全局,并能大致預(yù)測(cè)對(duì)方接下來幾步落子位置,且要有與之相應(yīng)的應(yīng)對(duì)措施。
而滴滴的派單場(chǎng)景呢,沒有「高智商對(duì)手」主動(dòng)「下絆子」是前提。在這種相對(duì)穩(wěn)定又絕對(duì)動(dòng)態(tài)的情境下進(jìn)行派單。具體每一步的復(fù)雜程度有多高,按照章所言,43200 種選擇。
我沒有讀過 AlphaGo 源碼,所以只能做一個(gè)不負(fù)責(zé)的數(shù)字推斷:
鑒于隨著棋局的進(jìn)行,每一步的落子選擇也減少,因而保守假設(shè)平均每一步有 100 種選擇。
之前看到報(bào)道說 AlphaGo 最多可以提前預(yù)判 50 步棋。如此,AlphaGo 每走一步棋需要考慮 100 的 50 次方。這個(gè)數(shù)字相信遠(yuǎn)遠(yuǎn)超過 43200 吧。
100 的 50 次方這個(gè)數(shù)字可能有點(diǎn)夸張,畢竟 AlphaGo 不是窮舉的。但是肯定不是章以為的「最多 361 種選擇」這么簡(jiǎn)單。
第二,用戶體驗(yàn)上來看,滴滴沒有成功解決問題。
目前看來,AlphaGo 是成功解決了圍棋爭(zhēng)霸這個(gè)難題了。
至于滴滴嘛,他的派單算法有多復(fù)雜先不談,但是其提供的服務(wù)說實(shí)話是沒辦法硬著脖子講「完全解決」這四個(gè)字的。
退一萬步講,假設(shè)派單場(chǎng)景確實(shí)比下圍棋復(fù)雜的多。那么,章的行為就像某些人宣稱的:「我在試圖形成一個(gè)比相對(duì)論更高的模型,雖然還沒成功,但是我比愛因斯坦更偉大!」
第三,章文嵩本人非算法領(lǐng)域。
有很多答主都提到了,他是阿里的高級(jí)專家,是真正的系統(tǒng)級(jí)開發(fā)高手。但是問題就在這兒。
其實(shí) AlphaGo 算法跟系統(tǒng)開發(fā)是兩個(gè)截然不同的領(lǐng)域。
相比對(duì)算法方面的評(píng)價(jià),其實(shí)他在 AlphaGo 的網(wǎng)絡(luò)延遲、分布式計(jì)算效率、CPU 利用率等問題上會(huì)更專業(yè)。
至于算法復(fù)雜度,鑒于 Deep Learning 是強(qiáng)凸優(yōu)化強(qiáng)矩陣變換的一種統(tǒng)計(jì)學(xué)習(xí)算法,我相信滴滴內(nèi)部的算法相關(guān)負(fù)責(zé)人應(yīng)該更有發(fā)言權(quán)。
而微博上,也有一大票用戶評(píng)論,不管討論的是問題復(fù)雜度還是算法復(fù)雜度,首要問題應(yīng)該是解決用戶體驗(yàn)。
雷鋒網(wǎng) AI 科技評(píng)論也將持續(xù)跟進(jìn)這一問題的后續(xù),敬請(qǐng)期待。
PS:關(guān)于滴滴的調(diào)度系統(tǒng),滴滴研究院副院長(zhǎng)、密歇根大學(xué)終身教授葉杰平博士曾非常全面地進(jìn)行了揭秘,大家可以在看過之后,再回望這場(chǎng)鬧劇。
傳送門:滴滴研究院副院長(zhǎng)葉杰平:揭開滴滴人工智能調(diào)度系統(tǒng)的真面目
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。