0
本文作者: 張棟 | 2018-07-01 21:45 | 專題:2018 CCF-GAIR 全球人工智能與機(jī)器人峰會(huì) |
2018 全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR)于6月29日在深圳召開。本次大會(huì)共吸引超過(guò)2500余位 AI 業(yè)界人士參會(huì),其中包含來(lái)自全球的 140 位在人工智能領(lǐng)域享有盛譽(yù)的頂級(jí)嘉賓。
會(huì)議第二天,CCF-GAIR計(jì)算機(jī)視覺專場(chǎng)也如期盛大開幕。本專場(chǎng)邀請(qǐng)到了多位業(yè)內(nèi)專家盛裝出席,包括香港科技大學(xué)教授、ICCV2011主席、IEEE Fellow權(quán)龍,曠視科技首席科學(xué)家、研究院院長(zhǎng)孫劍,云從科技聯(lián)合創(chuàng)始人姚志強(qiáng),商湯科技聯(lián)合創(chuàng)始人林達(dá)華,臻識(shí)科技CEO任鵬,云天勵(lì)飛聯(lián)合創(chuàng)始人兼首席科學(xué)家王孝宇等。
作為計(jì)算機(jī)視覺專場(chǎng)的重量級(jí)嘉賓,王孝宇博士向與會(huì)觀眾分享了題為“AI,從學(xué)術(shù)到產(chǎn)業(yè)”的精彩演講。
演講伊始,王孝宇博士談到了其在美國(guó)工作期間的所做所感,包括2012年在NEC美國(guó)研究院研發(fā)無(wú)人車,之后去Snap幫助他們創(chuàng)建了一個(gè)人工智能研究院,緊接著,他又介紹了云天勵(lì)飛公司的情況,包括三位聯(lián)合創(chuàng)始人的背景及公司深耕的AI+三大領(lǐng)域等。
在他看來(lái),“AI已經(jīng)無(wú)處不在”。而這句話也并非空穴來(lái)風(fēng),隨后他用多個(gè)lessons去講述他從研究界到工業(yè)界這一過(guò)程中的種種見解。
王孝宇博士分享的第一課便是“timing=money”,合適的時(shí)機(jī)做合適的事,在他看來(lái),做技術(shù)研發(fā)最重要的是找準(zhǔn)時(shí)間點(diǎn),可能某種技術(shù)本身并不值錢,但當(dāng)把握住機(jī)遇,安放在適當(dāng)?shù)钠脚_(tái)上便能引發(fā)聚變。
隨后,其又分享了第二課“技術(shù)不需要完全成熟”。他表示,對(duì)于一項(xiàng)技術(shù)而言,專業(yè)人士的想法往往會(huì)與用戶的看法有差別,如對(duì)于專家而言,某些視頻特效技術(shù)并非是一項(xiàng)高端科研項(xiàng)目,可對(duì)于用戶來(lái)說(shuō),技術(shù)衍生出的功能是一件有趣的事,從而能產(chǎn)生用戶傳播效應(yīng)。
王孝宇博士分享的第三課即是“找到正確的應(yīng)用角度/平臺(tái)”。他表示,Snap曾斥資1.5億美金買下某個(gè)公司,后來(lái)人們發(fā)現(xiàn),其本身價(jià)值其實(shí)遠(yuǎn)遠(yuǎn)達(dá)不到公司的收購(gòu)價(jià)格,原因除了這項(xiàng)技術(shù)出現(xiàn)在了正確的時(shí)間點(diǎn),還有就是Snap是一個(gè)擁有著大量用戶的平臺(tái),當(dāng)這項(xiàng)技術(shù)放在這個(gè)平臺(tái)上供幾億用戶使用的時(shí)候,它的價(jià)值便會(huì)得到顯著提升。事后也印證了Snap的決策是正確的,這項(xiàng)技術(shù)的普及為Snap創(chuàng)造了幾十億美金的利潤(rùn)。
在演講最后,王孝宇博士還為創(chuàng)業(yè)者提供了一些個(gè)人建議。
以下為云天勵(lì)飛首席科學(xué)家王孝宇博士的現(xiàn)場(chǎng)演講內(nèi)容,雷鋒網(wǎng)作了不改變?cè)獾恼砑熬庉嫞?/strong>
謝謝主持人的介紹,今天我主要談?wù)勎覀儚膶W(xué)術(shù)界走到工業(yè)界的一些經(jīng)驗(yàn)和教訓(xùn),希望能給大家?guī)?lái)一些思考。
首先介紹一下我自己,我在美國(guó)待了10年,2012年博士畢業(yè)之后去了硅谷,入職了NEC美國(guó)研究院研究無(wú)人車,當(dāng)時(shí)無(wú)人車還沒有火起來(lái),我們?cè)谀沁呑鲆恍o(wú)人車大規(guī)模的人臉檢索、人臉的屬性識(shí)別。
2015年我去了Snap,Snap當(dāng)時(shí)還是一家非常小的創(chuàng)業(yè)公司,大概只有100人左右;現(xiàn)在在美國(guó)已經(jīng)上市了,市值大概幾百億美金左右。
入職Snap之后,我們幫助他們建立了一個(gè)人工智能研究院。從這來(lái)看,美國(guó)人真的很厲害,他們?cè)僦挥?00個(gè)人的時(shí)候就有想要建立人工智能研究院的野心。
再到后來(lái),我來(lái)到了一個(gè)更好的創(chuàng)業(yè)公司,就是云天勵(lì)飛。云天勵(lì)飛相對(duì)來(lái)說(shuō)比較低調(diào),在大家的視野里面出現(xiàn)的不多。但是我們已經(jīng)是深圳本土成長(zhǎng)起來(lái)的一家獨(dú)角獸企業(yè),融資有數(shù)億美金左右,我們的聯(lián)合創(chuàng)始人都是硅谷背景,有做芯片的,還有做核心系統(tǒng)的。
我們的業(yè)務(wù)領(lǐng)域主要體現(xiàn)在三個(gè)方向:一個(gè)是AI+新警務(wù),毫不慚愧地說(shuō),我們是業(yè)界第一個(gè)把人工智能應(yīng)用到安防領(lǐng)域的創(chuàng)業(yè)公司。另外一個(gè)方向是AI+新治理,也就是社區(qū)的治理。還有一個(gè)方向是AI+新零售,新零售是互聯(lián)網(wǎng)行業(yè)中的一個(gè)全新領(lǐng)域,是這一波AI商機(jī)里面最大的市場(chǎng)。
AI已經(jīng)無(wú)處不在,但想要AI能夠與人們自由交流,我覺得可能要100年之后才能實(shí)現(xiàn)。個(gè)人認(rèn)為,AI人臉識(shí)別目前已經(jīng)在某些領(lǐng)域可以成熟落地,比如10年前用人臉識(shí)別做安防,一定做不好,因?yàn)楦緵]有辦法落地。如今我們?cè)趦|級(jí)的數(shù)據(jù)庫(kù)上,識(shí)別精度可以達(dá)到90%以上,這就是為什么這次人工智能帶來(lái)的改變比較大。
除此之外,AI在衣食住行等方面也已經(jīng)能夠深刻影響著人們。
舉個(gè)例子,我們?cè)谔詫毶腺I衣服的時(shí)候,它會(huì)智能地給你推薦。你買了某件上衣之后穿什么樣的褲子最合適。其實(shí)有專業(yè)研究發(fā)現(xiàn),根據(jù)機(jī)器學(xué)習(xí)推薦的款式,比專業(yè)的服裝搭配師搭配出來(lái)的更受歡迎,因?yàn)榉b搭配師只有一個(gè)或幾個(gè)風(fēng)格,他喜歡那個(gè)風(fēng)格,別人不一定喜歡,但是機(jī)器學(xué)習(xí)推薦的模型更適合大眾的需求。
我們?cè)诔燥埖臅r(shí)候,系統(tǒng)可以識(shí)別出你的飯菜的卡路里構(gòu)成,以鑒定飯菜適不適合你的健康狀況。
我們?cè)谧〖业臅r(shí)候,智能音箱也能夠給我們的家居環(huán)境帶來(lái)一些全新的人工智能體驗(yàn)。(當(dāng)然NLP方面還沒有突破性進(jìn)展)
從以上來(lái)看,實(shí)際上在我們生活的方方面面,都有人工智能的身影,就此,我們就要思考一個(gè)問題:在這其中,到底什么是最重要的?
我把它分成兩個(gè)部分,第一個(gè)叫Lesson,就是我從學(xué)術(shù)界到工業(yè)界,學(xué)到了什么;第二個(gè)是希望大家聽完這個(gè)演講后有一定的觸動(dòng)。
第二個(gè)Lesson,大家看任何一個(gè)技術(shù)的時(shí)候,什么時(shí)間做這個(gè)事情很重要。
Snap是facebook一生揮之不去的夢(mèng)魘,因?yàn)樗脩粼鲩L(zhǎng)非???,而且年輕用戶非常多。在2015年左右,Snap AR產(chǎn)品隨處可見,當(dāng)時(shí)facebook沒有任何相關(guān)產(chǎn)品,而之后就算再快時(shí)間研發(fā)出來(lái)已再無(wú)意義。
這就叫Timing-money,其實(shí)相關(guān)技術(shù)非常簡(jiǎn)單,把3D效果識(shí)別出來(lái),然后加上一些AR的效果。這是我在這個(gè)過(guò)程中學(xué)到的第一個(gè)Lessons,就是你在做的時(shí)候,一定要掐準(zhǔn)你的時(shí)間點(diǎn)是不是對(duì)的,時(shí)間點(diǎn)對(duì)了它比什么都重要,可能技術(shù)本身不值錢,但是到了一個(gè)平臺(tái)之后就會(huì)有放大的效應(yīng)。
第二個(gè)Lesson,技術(shù)不需要完全成熟。
當(dāng)我來(lái)到深圳,看到云天勵(lì)飛正在做的事情,我還在想這個(gè)技術(shù)我10年前就已經(jīng)搞定了,為何會(huì)一直如此底層?后來(lái)發(fā)現(xiàn)實(shí)際上技術(shù)發(fā)展沒有必要太過(guò)完美。
比如說(shuō)人臉識(shí)別,對(duì)于專家而言,某些“高能”視頻特效技術(shù)并非是一項(xiàng)高端科研項(xiàng)目;可對(duì)于用戶來(lái)說(shuō),“看到一些功能后發(fā)現(xiàn)是一件有趣的事,從而能產(chǎn)生用戶傳播效應(yīng)。
第三個(gè)Lesson,要找到正確應(yīng)用的角度和平臺(tái)。
技術(shù)本身是不具備價(jià)值的,此前,Snap曾經(jīng)花了1.5億美金收購(gòu)一個(gè)視頻特效公司,這個(gè)公司你要單獨(dú)把它放成一個(gè)公司來(lái)看150萬(wàn)美金都不值,但是它放在這個(gè)平臺(tái)上供幾億用戶使用的時(shí)候,它的價(jià)值就非常大了,事實(shí)證明我們花了1.5億美金買這個(gè)公司,這個(gè)公司至少給我們賺了幾十億美金,因?yàn)檫@上面的廣告是非常貴的,在Snap上做一天的AR的廣告要50萬(wàn)美金,基本上一年就可以把投入的錢賺回來(lái)。
需要指出的是,我認(rèn)為算法不等于技術(shù),你可能花了很長(zhǎng)的時(shí)間研究出一個(gè)非常好的算法,但是在大的數(shù)據(jù)集上它跟那些簡(jiǎn)單的算法沒什么區(qū)別。
在我們這一輪的AI發(fā)展過(guò)程中,我們尤其要關(guān)注數(shù)據(jù)的重要性,很多算法在小的數(shù)據(jù)上表現(xiàn)很好,但是在大的數(shù)據(jù)上表現(xiàn)很差,所以你一定要在你的產(chǎn)品、技術(shù)設(shè)計(jì)上先突破數(shù)據(jù)的界限,再看技術(shù)的界限在哪兒,算法+數(shù)據(jù)才能說(shuō)是技術(shù),技術(shù)在我們平臺(tái)上的設(shè)計(jì)才能叫產(chǎn)品。這就是我們說(shuō)的系統(tǒng)上的設(shè)計(jì),而不僅僅是關(guān)注一個(gè)點(diǎn)。
后面我再給大家一點(diǎn)建議,如果大家有興趣做創(chuàng)業(yè)公司的話,也不一定對(duì),僅供參考。
首先你一定要想好你到底要做一個(gè)什么樣的公司,你是要賺點(diǎn)快錢,做一個(gè)快速推出的公司;還是做一個(gè)偉大的公司。這兩點(diǎn)完全不一樣,你要做一個(gè)偉大的公司,你要做好老驥伏櫪十年的準(zhǔn)備。
做技術(shù)創(chuàng)業(yè)的公司有很多的途徑,包括剛才說(shuō)的這個(gè)Looksery公司,做了還不到一年,賣了1.5億美金,在Snap買了這家公司之后,F(xiàn)acebook也買了一家類似的公司,也花了很多錢,你針對(duì)一個(gè)大的平臺(tái),可以設(shè)計(jì)一款技術(shù),它的平臺(tái)能夠用,你就可以把你的技術(shù)賣給它,
做創(chuàng)業(yè)者也沒必要非得死磕一輩子,如果你只是想實(shí)驗(yàn)一下你的技術(shù)能不能在現(xiàn)實(shí)中派上用場(chǎng),你不一定要盡可能地完善產(chǎn)品,你可以做一個(gè)技術(shù)點(diǎn),把它應(yīng)用到一個(gè)大的平臺(tái)上,或者是用到一個(gè)大的應(yīng)用上。
而云天勵(lì)飛想做一個(gè)偉大的公司,怎么做一個(gè)偉大的公司?我覺得大家一定要思考一個(gè)問題,如果你是從技術(shù)的角度來(lái)做這個(gè)公司,什么樣的技術(shù)是一些革命性的剛需,而不是說(shuō)有沒有它都一樣,這是一個(gè)根本性的東西。
另外,你要產(chǎn)生一個(gè)與眾不同的商業(yè)模式,它一定要能給這個(gè)產(chǎn)業(yè)帶來(lái)革命性的變化,我有了這個(gè)技術(shù)之后,能給這個(gè)社會(huì)帶來(lái)什么樣的改變。
簡(jiǎn)單舉個(gè)例子,我們做的AI+安防,就是能夠產(chǎn)生不同的應(yīng)用的一個(gè)方向。以前公安破案的時(shí)候,比如說(shuō)發(fā)生了一起命案,很多的民警把周邊的攝像頭調(diào)出來(lái)看一下,可能是一個(gè)星期之前的視頻,你要看好幾天的時(shí)間,熬紅了眼睛,一不小心那個(gè)罪犯還在你打盹的時(shí)間溜過(guò)去了,這是一個(gè)非常低效的做法。
現(xiàn)在有了人像識(shí)別技術(shù),情況就不一樣了,我們可以在一兩秒之內(nèi)把周邊兩年之內(nèi)的所有視頻、人臉全部搜出來(lái),你本來(lái)需要90個(gè)人兩天干的事,現(xiàn)在一個(gè)人兩秒鐘把它干完了,這就是一個(gè)根本性的革命性的變化,其帶來(lái)的經(jīng)濟(jì)效益和社會(huì)效益是非常大的。
再比如說(shuō)AI+新零售??赡苊總€(gè)人對(duì)新零售的理解都不一樣,大家知道在我們國(guó)家前10年到20年,互聯(lián)網(wǎng)發(fā)展的非常之快,產(chǎn)生了很多新的商業(yè)模式,因?yàn)榛ヂ?lián)網(wǎng)上有很多信息,你可以快速對(duì)它進(jìn)行建模,可以產(chǎn)生各種各樣的商業(yè)模式,可以給你推薦商品,給你推薦各種事情,你經(jīng)常會(huì)在郵箱里收到各種各樣的廣告,其實(shí)都是后面有大數(shù)據(jù)分析的。
但是我們?cè)僮屑?xì)看看我們的線下,它是一個(gè)黑盒子,完全是沒有這種分析的,是一個(gè)完全黑的線下世界。與線上相比,線下完全沒有模型,如果我們把線下的黑盒子變成一個(gè)透明的盒子,這里面的商業(yè)機(jī)會(huì)有多大?
這里面也會(huì)產(chǎn)生很多不一樣的跟線上的互聯(lián)網(wǎng)一模一樣的商業(yè)模式。
比如說(shuō)我們現(xiàn)在做的電梯里面的廣告屏都是傻瓜式的,循環(huán)播放一些廣告,你完全可以針對(duì)用戶的特性選擇性的播放,這就是互聯(lián)網(wǎng)的特點(diǎn),你在網(wǎng)上買了一臺(tái)冰箱之后,所有的平臺(tái)都知道你對(duì)冰箱感興趣,后面會(huì)給你推薦冰箱相關(guān)的東西。大家不要小看這么一點(diǎn)點(diǎn)的變化,在互聯(lián)網(wǎng)上那種完全沒有分析的廣告和經(jīng)過(guò)分析的廣告的價(jià)格差10倍以上,它帶來(lái)的實(shí)實(shí)在在的經(jīng)濟(jì)效益。
我們?cè)诰€下可以做同樣的事情,當(dāng)你把所有的智能分析全部分析好,全部量化好,全部信息化之后,你可以在這些信息的基礎(chǔ)上進(jìn)行建模,進(jìn)行針對(duì)性的服務(wù),進(jìn)行針對(duì)性的營(yíng)銷,這上面也會(huì)產(chǎn)生很多完全不一樣的商業(yè)模式。雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章