1
本文作者: 張偉 | 2016-08-12 23:14 | 專題:CCF-GAIR | 全球人工智能與機(jī)器人峰會(huì) |
機(jī)器學(xué)習(xí)大潮氣勢如虹,科技巨頭們?nèi)绾纬孙L(fēng)破浪?CCF-GAIR大會(huì)首場圓桌論壇圍繞這個(gè)話題進(jìn)行了熱議。微軟亞洲研究院主管研究員鄭宇擔(dān)綱主持,小米聯(lián)合創(chuàng)始人黃江吉先生、360人工智能研究院院長顏水成博士、騰訊優(yōu)圖創(chuàng)始人黃飛躍博士、今日頭條科學(xué)家李磊博士參與討論。(內(nèi)容有刪減)
鄭宇:分享一下360最近在人工智能領(lǐng)域取得了哪些進(jìn)展,并且在未來有什么樣的布局。
顏水成:我加入之前360在人工智能方面已經(jīng)做了很多事情,基本視覺、語音、語義還有大數(shù)據(jù)。除了傳統(tǒng)業(yè)務(wù)以外,還有兩個(gè)業(yè)務(wù)對人工智能的使用非常多,一個(gè)是智能硬件,一個(gè)是老周特別喜歡的直播。
從研發(fā)角度來說,我們主要做了兩件事:一方面是當(dāng)我們有了大數(shù)據(jù)之后怎樣更加快速的把這個(gè)模型訓(xùn)練出來?另外是從智能硬件的層面來說,除了傳統(tǒng)的人工智能,在云上的使用還有一個(gè)很重要的場景是端上的人工智能。
端上的人工智能有兩個(gè)層面可以做事情,一個(gè)層面是你怎么樣從算法的角度把模型變得更好,把復(fù)雜度降到更低,用很少的資源把好的人工智能用到端上;另外是從面上,比如提升深度學(xué)習(xí)芯片的計(jì)算能力。但是在中國的特定場景下,用戶對產(chǎn)品的價(jià)值很在意,在我個(gè)人來看,從算法上降低計(jì)算的復(fù)雜度是非常有價(jià)值的,所以在過去一段時(shí)間我們在這方面花的時(shí)間和精力非常多。
對于將來的布局,我覺得主要有兩個(gè)層面:一個(gè)是業(yè)務(wù)層面,繼續(xù)圍繞360公司的核心基因安全業(yè)務(wù),用人工智能為其提供服務(wù)。從研究的層面來說,一方面我們會(huì)繼續(xù)專注打造更好的模型、算法提升端上人工智能的能力;另一方面利用大數(shù)據(jù)來提升深度學(xué)習(xí)的能力。
360人工智能研究院院長顏水成
鄭宇:第二個(gè)問題我想問騰訊優(yōu)圖黃飛躍博士,聽眾們對這個(gè)部門并不是很了解,請你先介紹一下這個(gè)部門,以及在人工智能領(lǐng)域你們都做了什么工作及其特點(diǎn)。
黃飛躍:優(yōu)圖現(xiàn)在是騰訊旗下的部門,團(tuán)隊(duì)成立于2012年,最初的是社交網(wǎng)絡(luò)事業(yè)群下面的一個(gè)團(tuán)隊(duì),到今天我們已經(jīng)自發(fā)成長為一個(gè)部門,我們是做人工智能和相關(guān)算法的研發(fā)和業(yè)務(wù)落地,目前已經(jīng)擁有數(shù)十項(xiàng)先進(jìn)的技術(shù)以及數(shù)千億規(guī)模的圖像計(jì)算的能力……
優(yōu)圖雖然是定義做相關(guān)研發(fā),但我們的所有研發(fā)都是依托業(yè)務(wù)的實(shí)際需求,這樣會(huì)形成一個(gè)比較良好的業(yè)務(wù)、算法落地的閉環(huán),可以及時(shí)知道我們業(yè)務(wù)的好和壞,及時(shí)更新我們的算法。
現(xiàn)在團(tuán)隊(duì)比較看好的方向和主要從事業(yè)務(wù)有識別類的相關(guān)領(lǐng)域。比如說像生物特征識別,我們比較看好的首先是人臉識別、聲紋識別,再往后到指紋識別等一系列的識別:內(nèi)容識別、圖片和語音識別等等。人臉識別技術(shù)層面上我覺得相對比較成熟,相信在往后的幾年中人臉驗(yàn)證有機(jī)會(huì)從互聯(lián)網(wǎng)走到線下,這樣的識別場景比現(xiàn)在的人臉識別有更大的價(jià)值。又比如圖像識別,它的概念和領(lǐng)域相對更廣,我相信后幾年圖像識別會(huì)有一個(gè)爆發(fā)式的增長。
最新的像增強(qiáng)現(xiàn)實(shí)、聊天機(jī)器人這些技術(shù)也是我比較看好的,這些技術(shù)真實(shí)改善了人類的生活體驗(yàn),同時(shí)它也能夠在線下和線上有非常好的結(jié)合,更貼近應(yīng)用,更容易產(chǎn)生比較實(shí)際的價(jià)值和成果。
我們希望通過用人工智能的一些技術(shù)真正改變互聯(lián)網(wǎng)用戶的生活品質(zhì)。與此同時(shí),我們也將把最新的一些研發(fā)成果通過開發(fā)平臺和騰訊云對外輸出,保證相關(guān)的技術(shù)能夠真正給互聯(lián)網(wǎng)用戶帶來生活品質(zhì)的提升。
騰訊優(yōu)圖創(chuàng)始人黃飛躍博士
鄭宇:李磊是交大畢業(yè),剛開始去的是百度,現(xiàn)在到了今日頭條,從你個(gè)人的角度看在人工智能這個(gè)領(lǐng)域里,百度和今日頭條各有什么優(yōu)勢和不足,尤其是不足要講清楚。
李磊:我到頭條之前在百度的深度學(xué)習(xí)研究院工作了兩年,工作的內(nèi)容基本上圍繞深度學(xué)習(xí)和自然語音理解,到了頭條之后我在頭條實(shí)驗(yàn)室工作,工作的內(nèi)容是圍繞深度學(xué)習(xí)、自然語音理解和計(jì)算機(jī)學(xué)習(xí),前后比較,內(nèi)容上我現(xiàn)在做得更多了。
我覺得兩家公司最大的共同點(diǎn)是它們都是人工智能為主的公司。百度毫無疑問,在人工智能方面投入非常大,語音識別和無人駕駛都是代表;大家傳統(tǒng)的觀念認(rèn)為今日頭條是新聞客戶端,但如今頭條是所有信息、內(nèi)容分享創(chuàng)作的平臺。這個(gè)平臺的一邊是內(nèi)容創(chuàng)作者,另一邊是內(nèi)容消費(fèi)者,為了把最好的內(nèi)容推薦給最需要的讀者,需要的是機(jī)器學(xué)習(xí)的技術(shù)。從這一點(diǎn)上來講這兩家公司都是以人工智能技術(shù)為核心的公司。
不同點(diǎn)主要在于發(fā)展階段和體量。百度和谷歌、微軟步調(diào)一致,很早就已經(jīng)開始在這個(gè)領(lǐng)域進(jìn)行研究:微軟在2009年開始語音識別;谷歌在2012年用1000臺計(jì)算機(jī),16000個(gè)CPU做貓臉識別;百度做深度學(xué)習(xí)研究所,做的事情是語音識別和圖像識別,幾乎可以做人工智能所有領(lǐng)域。
今日頭條和這幾家公司不一樣,自2012年創(chuàng)立至今只有4年,大家可以想想成立4年的時(shí)候那些大公司在做什么?Facebook有研究院;百度沒有實(shí)驗(yàn)室;谷歌還在做搜索。今日頭條在2014年的時(shí)候整個(gè)團(tuán)隊(duì)就有這個(gè)意識說要在最前沿的技術(shù)上做非常大的投入。在人工智能這個(gè)前沿技術(shù)上,不管是現(xiàn)在立刻能用到,還是說為了技術(shù)儲(chǔ)備而做前沿研究,這點(diǎn)上今日頭條的理念是非常非常好的。
今日頭條科學(xué)家李磊
鄭宇:小米很多都是人工智能,但是我們想知道小米有哪些不是人工智能,是非常的爛的?因?yàn)樵谧挠泻芏嗟男」敬?,你們做不好的地方可能是他們的機(jī)會(huì)。你就說說什么東西你想做,但是做不好,很難做,不足是什么?
黃江吉:這是個(gè)很好的問題。很多人說現(xiàn)在是人工智能的春天,對很多創(chuàng)業(yè)公司來說是彎道超車的好機(jī)會(huì),我覺得這個(gè)是一個(gè)事實(shí)。但是其實(shí)這個(gè)彎道和過去任何一個(gè)彎道一樣本質(zhì)上并沒有改變創(chuàng)業(yè)的難度。我認(rèn)為如果要?jiǎng)?chuàng)業(yè)成功你依然要很深刻的了解用戶的痛點(diǎn)是什么,如何讓你的產(chǎn)品更好地滿足用戶的痛點(diǎn)。不是因?yàn)閮H僅掌握了一種新技術(shù),就可以自然而然地獲取海量用戶。我覺得今日頭條是一個(gè)很好的案例,不斷使用新技術(shù)去解決用戶的痛點(diǎn)。這是我對創(chuàng)業(yè)公司機(jī)會(huì)的理解。
再回答剛才鄭宇的問題,我覺得不是說小米在人工智能領(lǐng)域的哪些方面做得比較爛,我覺得大家應(yīng)該問的是我們在哪些現(xiàn)有我們做的產(chǎn)品上面功能也好,用戶體驗(yàn)也好,整體的產(chǎn)品的滿足度,哪些做得比較爛,我認(rèn)為這些都是機(jī)會(huì)。如果你關(guān)起門來問我的話,我覺得全部產(chǎn)品做得都不夠智能,我們做的只是冰山一角,還有很長的路要走。
小米聯(lián)合創(chuàng)始人黃江吉
微軟亞洲研究院主管研究員鄭宇
鄭宇:很多高校的老師或者是在研究機(jī)構(gòu)的人想去工業(yè)界做,但是心中有很多的忐忑,我去了以后能不能活下來,所以我想問一個(gè)挑釁一點(diǎn)的問題,你覺得360做人工智能有哪些制約或者你不滿意的地方?
顏水成:我一般解釋問題喜歡從武術(shù)的角度出發(fā),我覺得在學(xué)術(shù)界,人工智能的研究的方法挺像,希望你是一個(gè)名門正派,打敗了別人,還能提煉一些招式出來,這些招式在和別人格斗時(shí)能打贏別人;在工業(yè)界這種招式變得不那么重要,重要的是你有一種武術(shù),用一種合作的方式把別人打敗,把一個(gè)問題解決掉,這就是好的人工智能。
問題的重點(diǎn)是你要有人工智能的思想和方法把這個(gè)問題解決。我加入360是因?yàn)樗兴膬?yōu)勢,在當(dāng)前的特殊時(shí)期,我們可以說是網(wǎng)絡(luò)在人工智能領(lǐng)域稍稍有點(diǎn)領(lǐng)先學(xué)術(shù)界,人工智能的資源有很大的優(yōu)勢。
我加入360的時(shí)候,智能硬件是非常關(guān)鍵的業(yè)務(wù),現(xiàn)在直播也是非常關(guān)鍵的業(yè)務(wù),這些事情恰好是我想做的。如果說有什么弊端的話,就是互聯(lián)網(wǎng)的節(jié)奏比學(xué)術(shù)界要快得多,比如說在學(xué)術(shù)界半年或者是三個(gè)月有很好的成績出來,能有一篇很好的學(xué)術(shù)論文,但這顯然不適合工業(yè)界。
鄭宇:研究院更多的是看未來,老板有沒有給具體的指標(biāo)?
黃江吉:像微軟亞洲的研究院是沒有標(biāo)準(zhǔn)的,在中國一個(gè)好的研究院肯定是兩條腿同時(shí)并進(jìn)。當(dāng)你有什么成果的話需要快速支持現(xiàn)有的業(yè)務(wù),讓人工智能的算法或者是思想在業(yè)務(wù)中發(fā)揮作用。另外你要有一個(gè)長遠(yuǎn)的想法,一年半或者一年以后產(chǎn)品需要什么樣的人工智能技術(shù);或者自己去孵化這樣的業(yè)務(wù),但要能在很短時(shí)間內(nèi)上線的。這是一個(gè)很好的方式,能保證研究院在名企內(nèi)部生存下來。
鄭宇:AI在語音和視覺上都取得了很大的進(jìn)步,但是在文本上沒有很大的進(jìn)步,有什么樣可能的技術(shù)方向去解決這個(gè)問題?
黃江吉:我的感受是用深度學(xué)習(xí)在處理自然語言和自然語言理解方面做出的成果是遠(yuǎn)遠(yuǎn)比以前多了,而且今年幾乎2/3以上的論文是用深度學(xué)習(xí)來做的,所以剛才那一個(gè)前提說我們好像沒有看到深度學(xué)習(xí)在自然語言方面像語音技術(shù)和圖像技術(shù)那樣有很大的成功,其實(shí)不是,只是晚了一些,現(xiàn)在有很大的進(jìn)步。
顏水成:我個(gè)人是做圖像和大數(shù)據(jù)做得比較多,對于自然語言的理解研究得不是特別多,人是怎么處理語言這一塊,跟我們現(xiàn)在所使用的方式其實(shí)還是不一樣的。從人的角度來說,現(xiàn)在的整個(gè)方向,跟人的方式是有本質(zhì)的差別,有很大的變革。另外一方面從圖像的角度,如果你想做一般性質(zhì)的這種圖像搜索的話其實(shí)還是非常困難的,無論是谷歌還是百度。
鄭宇:最后每位專家用一句話總結(jié)人工智能發(fā)展。
黃江吉:我認(rèn)為機(jī)器學(xué)習(xí)有可能改變了一個(gè)工程師開發(fā)產(chǎn)品的方法論,完全顛覆了,跟以前完全不一樣。
顏水成:人工智能讓學(xué)術(shù)界和工業(yè)界的人有了共同語言,這個(gè)是非常好的。
黃飛躍:大家不要將人工智能等同于機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)也不等同于深度學(xué)習(xí)。我們不應(yīng)該把我們的實(shí)業(yè)僅僅局限于一個(gè)問題上,而我們要解決的問題比有監(jiān)督的學(xué)習(xí)更復(fù)雜,我們要讓計(jì)算機(jī)去學(xué)習(xí)一些簡單的問題,但是也要讓計(jì)算機(jī)學(xué)會(huì)邏輯推理,學(xué)會(huì)在復(fù)雜的環(huán)境下怎么去跟環(huán)境交互,同時(shí)也學(xué)會(huì)怎么樣用最少的能量去掌握新的技能。
李磊:一句話就是潤物細(xì)無聲,人工智能就像十幾年前的互聯(lián)網(wǎng)融入我們生活一樣,它能夠融入我們?nèi)粘I?,能夠改善我們的生活品質(zhì),而我們?nèi)藢o所不在的人工智能沒有察覺。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章