0
本文作者: 亞萌 | 2017-04-02 15:54 |
雷鋒網(wǎng)消息,4月2日,2017中國(guó)(深圳)IT領(lǐng)袖峰會(huì)正式開幕,騰訊董事會(huì)主席兼首席執(zhí)行官馬化騰、百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏、微軟全球執(zhí)行副總裁沈向洋圍繞“人工智能”的主題進(jìn)行了高端對(duì)話。
馬化騰由“絕藝”談到騰訊對(duì)于人工智能的理解,他用了“恐怖”這個(gè)詞匯來描述對(duì)于AI強(qiáng)大的自我學(xué)習(xí)能力的感受。李彥宏談及了百度在非常早的時(shí)期布局人工智能的緣由,他還認(rèn)為,人工智能并不是互聯(lián)網(wǎng)的一部分,而是顛覆性的技術(shù)革命。沈向洋博士談到現(xiàn)階段微軟在人工智能方面的主要方向,是交互式人工智能。以下分別是馬化騰、李彥宏、沈向洋對(duì)話實(shí)錄,雷鋒網(wǎng)編輯整理。
馬化騰:其實(shí)李彥宏是人工智能走得更前了,對(duì)騰訊來說我們還是落后一些,只是去年剛開始成立的部門。當(dāng)然在我們所有BG內(nèi)部結(jié)合它的業(yè)務(wù)形態(tài),像我們微信里面,超過上百億條消息,包括我們圖片、特別是做社交網(wǎng)絡(luò),里面有人臉數(shù)據(jù)圖片絕對(duì)是天文數(shù)字,每天高達(dá)上十億張有人臉照片。這方面的技術(shù)研究在各個(gè)BG有相當(dāng)長(zhǎng)時(shí)間研究。包括后臺(tái)數(shù)據(jù)分析、廣告匹配都用了人工智能技術(shù),只是大家感受不到。因?yàn)樗诤蠖?。我們?cè)谇岸艘蚕M龀鲆恍┊a(chǎn)品,剛好一年前Alpha Go它的paper出來,通過人機(jī)對(duì)戰(zhàn)讓全世界對(duì)人工智能認(rèn)知到了一個(gè)新的高潮。我們團(tuán)隊(duì)本著練兵的心態(tài)也做了嘗試。
谷歌收購(gòu)了deepmind團(tuán)隊(duì)發(fā)表的論文,原來做計(jì)算機(jī)圍棋的團(tuán)隊(duì)都紛紛采用深度學(xué)習(xí)方法來融入原有的似乎已經(jīng)走進(jìn)瓶頸的計(jì)算機(jī)圍棋軟件開發(fā)中,大家不約而同在這一年中起步。我們內(nèi)部團(tuán)隊(duì)有三個(gè)團(tuán)隊(duì)也在做,只是分在不同部門。這個(gè)部門剛好是它能夠突破這個(gè)瓶頸,也動(dòng)用了公司相當(dāng)?shù)拇蟮暮蠖说挠?jì)算機(jī)資源,絕藝和Alpha Go最大的不同,是我們的絕藝AI的成長(zhǎng),全程得到了國(guó)家級(jí)圍棋世界冠軍的陪練,然后找出它為什么不同。我們十幾位研發(fā)人員不懂圍棋的,一開始連黑先下還是白先下的規(guī)則都不懂,我們從計(jì)算機(jī)原理、工程實(shí)現(xiàn)以及結(jié)合中國(guó)包括很多的專家來去訓(xùn)練。
我們覺得絕藝算是小小的成功吧,但是也不能過于欣喜,畢竟是站在前人肩膀上,因?yàn)槟銢]有發(fā)布這個(gè)paper,我們也不可能做出來。但是也不能說這是毫無疑義的事情。這里面給我們最大的思考,過去我們對(duì)AI很多是從一些規(guī)則、從簡(jiǎn)單的訓(xùn)練得出來的能夠改善我們計(jì)算處理的這樣一種能力,最終我們發(fā)現(xiàn)其實(shí)還有一個(gè)更恐怖、更深層的意義在于他能夠在計(jì)算機(jī)的后臺(tái)能夠用云計(jì)算、大數(shù)據(jù)方式能夠高速的自學(xué)習(xí),能夠自己跟自己對(duì)弈。所以AlphaGo出來后,它的下一代master,經(jīng)歷了數(shù)十億盤自我對(duì)弈,已經(jīng)超越過去所有人類交戰(zhàn)的盤數(shù),然后它自己尋找規(guī)律,找到的已經(jīng)遠(yuǎn)遠(yuǎn)超過人類過去在圍棋領(lǐng)域認(rèn)知的范圍,是極大的擴(kuò)展,這是給我們一個(gè)很大的啟示。
在很多的領(lǐng)域——圍棋以外的領(lǐng)域,不管是醫(yī)療(剛才講的病理的檢測(cè)),以后的金融,現(xiàn)實(shí)中的每個(gè)行業(yè),如果能用計(jì)算機(jī)后臺(tái)做出一個(gè)模擬器,能夠讓它充分嘗試,就像開車一樣,你可能不用教自動(dòng)駕駛怎么開車,就模擬一個(gè)現(xiàn)實(shí)環(huán)境,給它一個(gè)規(guī)則,讓它駕駛,它去撞,有各種反饋,自然會(huì)琢磨出一套理論和經(jīng)驗(yàn),這是給我們帶來巨大思考。在很多領(lǐng)域如果能做出模擬器,定義出很多參數(shù),自己學(xué)習(xí),他能找到規(guī)律可能遠(yuǎn)超我們現(xiàn)在想象的。這是我們最大的啟示。
馬化騰:我們期待有本質(zhì)性的飛躍,比如說發(fā)現(xiàn)飛機(jī)的空氣動(dòng)力學(xué)、流體動(dòng)力學(xué)和鳥不一樣的,車輪和人型馬一樣,仿生是某些垂直的領(lǐng)域,包括圍棋是選非常窄的領(lǐng)域,通過各種參數(shù)訓(xùn)練。
郭為剛提到用AlphaGo下一盤棋消耗多少能源,垂直領(lǐng)域訓(xùn)練消耗能源,但是實(shí)際用消耗不了多少?,F(xiàn)在訓(xùn)練出來的單機(jī)版本跟職業(yè)棋手差不多,訓(xùn)練需要很長(zhǎng)時(shí)間,最麻煩的是改一個(gè)參數(shù),規(guī)則改一點(diǎn)、算法改一點(diǎn),全部重新來消耗很大,所以這屬于很窄的技能模擬。
未來下一步到通用的,再下一步是不是有更本質(zhì)性的發(fā)現(xiàn)背后的原理,智能其實(shí)可以超越現(xiàn)在碳基智慧,是不是有其他的元素可以形成更高級(jí)的生命和智慧呢?這是超越人類現(xiàn)在發(fā)現(xiàn)的知識(shí),這是有可能的。
有人突發(fā)奇想說,現(xiàn)在認(rèn)識(shí)的宇宙是高智能生命用量子計(jì)算模擬出來的環(huán)節(jié),一切都是模擬起來的,這是發(fā)揮大家腦洞大開的想象力吧。
馬化騰:這個(gè)問題在內(nèi)部我們也有激烈討論。首先看人工智能我們關(guān)注那幾塊,第一個(gè)是場(chǎng)景。第二個(gè)是大數(shù)據(jù)。場(chǎng)景就是你想把這個(gè)技術(shù)應(yīng)用在什么場(chǎng)景下,你是不是有高頻的跟用戶接觸,這是一個(gè)落地的很重要的地方。所以我們看到很多研究院也好,包括我們內(nèi)部研發(fā)團(tuán)隊(duì)。如果沒有場(chǎng)景落地,沒有平臺(tái)支持,基本上就是空中樓閣,研究一半很難往下走。第二個(gè)是大數(shù)據(jù),大數(shù)據(jù)也是從平臺(tái)、業(yè)務(wù)部門有大量實(shí)際運(yùn)轉(zhuǎn)數(shù)據(jù)才能產(chǎn)生出來。但是這里面很多大數(shù)據(jù)是垃圾數(shù)據(jù),因?yàn)闆]有標(biāo)簽,每人做規(guī)劃定義,用多好的算法也學(xué)不出來,學(xué)出來也是走火入魔,沒有用的。數(shù)據(jù)清洗、標(biāo)簽化難度非常高,我們甚至要雇傭很多人用人手的辦法,先用人腦清洗干凈,再讓AI學(xué)習(xí)。這里面是一個(gè)混合結(jié)合的過程。第三,計(jì)算能力,也就是你有云的資源,拿幾十萬核的計(jì)算能力,CPU、GPU,我們還是有這個(gè)能力的。而且在云里面本身就可以很好的調(diào)用,這是我們第三個(gè)優(yōu)勢(shì)。第四個(gè),一年前我們比較缺乏的就是人才。通過一年我們也招了挺多的人,我們?cè)谖④?、在西雅圖還設(shè)置了一個(gè)實(shí)驗(yàn)室。因?yàn)楹芏辔④浀娜瞬辉敢怆x開西雅圖,所以我們就在旁邊設(shè),沒有辦法,人才就是這樣。幾個(gè)方面結(jié)合起來才有辦法真正在某一個(gè)領(lǐng)域看到它的成效。
我們現(xiàn)在觀察到很多的AI所謂的大拿們,他們更關(guān)注怎么落地,能不能把畢生研究成果能夠體現(xiàn)出來,所以在我們內(nèi)部在吸引人才的時(shí)候,往往也會(huì)說你們微信、手機(jī)QQ里面的平臺(tái)數(shù)據(jù)能不能給他們用,但是事實(shí)上大家都知道,BG、部門里面的平臺(tái)他們也很希望近水樓臺(tái)先得月,數(shù)據(jù)就在我身邊流動(dòng),我為什么不能招人先研究一把,為什么給你呢。我們現(xiàn)在還處在內(nèi)部怎么把數(shù)據(jù)分享出來這個(gè)階段。當(dāng)然這里面還有一個(gè)用戶很關(guān)注的個(gè)人隱私,別把我的數(shù)據(jù)都賣了,到時(shí)候大家都知道,這里面還有一個(gè)很復(fù)雜的信息安全個(gè)人隱私脫敏,你是不知道無法根據(jù)數(shù)據(jù)倒推到哪一個(gè)人做了什么事情,我們要把這些處理干凈才能往下一步談。這里面數(shù)據(jù)清理到什么標(biāo)簽,才能給其他部門、包括外部合作伙伴怎么用。同時(shí)有很多數(shù)據(jù)來自合作伙伴,業(yè)界其他公司,他們也遇到這樣的問題那者一堆裸數(shù)據(jù)不怎么用,這樣業(yè)界還要有一個(gè)標(biāo)準(zhǔn),互惠互利交換,這是一個(gè)大方向,還有很長(zhǎng)的路要走。
李彥宏:我其實(shí)也思考過這個(gè)問題。從百度的基因來說,我們從一開始成立到現(xiàn)在最主要是做搜索。搜索本質(zhì)上是機(jī)器試圖理解人想要的東西。我們一開始用各種各樣計(jì)算機(jī)方法試圖理解人的意圖。我在想一個(gè)問題,深度學(xué)習(xí)在圖像檢索里頭的效果不錯(cuò),是一個(gè)偶然還是它代表一種趨勢(shì)?分析完之后,覺得它是代表一種趨勢(shì)的,它不僅僅對(duì)于圖像搜索有用,它對(duì)很多其他計(jì)算機(jī)科學(xué)要解決的問題都是非常有用的。原因就是,隨著互聯(lián)網(wǎng)這么多年發(fā)展,數(shù)據(jù)越來越多,越來越豐富,計(jì)算資源越來越便宜,越來越強(qiáng)大。人工智能有60年歷史,前50年,為什么大家不看好,為什么大家覺得人工智能沒有用?我在美國(guó)讀書的時(shí)候,我就很喜歡人工智能這門課,但是學(xué)完之后,教授告訴我說其實(shí)沒用,人工智能沒有一個(gè)真正有商業(yè)價(jià)值的應(yīng)用,你將來靠這個(gè)是找不著工作的。
到現(xiàn)在最近幾年,原來認(rèn)為沒用東西變成有用,是因?yàn)槭袌?chǎng)環(huán)境變了,條件變了,原來認(rèn)為不可能的事情現(xiàn)在變成可能了。分析了環(huán)境因素之后,覺得人工智能是代表未來的。所以我們?cè)?013年1月份對(duì)外宣布成立深度學(xué)習(xí)研究院,這個(gè)可能是全球工業(yè)界第一個(gè)用深度學(xué)習(xí)來命名的這么一個(gè)研究院。而且等于我自己食言了,我2013年以前不斷跟外界說我們是一個(gè)商業(yè)公司,我們不應(yīng)該成立研究院,不應(yīng)該搞純的研究機(jī)構(gòu),這些機(jī)構(gòu)要想轉(zhuǎn)化成產(chǎn)品,進(jìn)入市場(chǎng)被市場(chǎng)所認(rèn)可的話,應(yīng)該跟那些產(chǎn)品部門、跟那些業(yè)務(wù)部門緊緊結(jié)合在一起,而不是單獨(dú)成立一個(gè)研究院,但是深度學(xué)習(xí)這一波起來之后,我覺得是完全不一樣的東西,他需要在理論上、在算法上,在很多方面有長(zhǎng)遠(yuǎn)的布局和突破,所以從那個(gè)時(shí)候開始大規(guī)模投入去吸引人才,去推進(jìn)算法,其實(shí)不光是算法,在剛才朱民講的時(shí)候也講到各種各樣芯片結(jié)構(gòu)層、CPU到GPU等等,都要審視算法的需求。所以現(xiàn)在看起來人工智能比2013年我們決定進(jìn)入的時(shí)候一個(gè)更要大的產(chǎn)業(yè)。前一陣我對(duì)外講了,互聯(lián)網(wǎng)其實(shí)現(xiàn)在只是一道開胃菜,真正的主菜是人工智能,所以人工智能不是互聯(lián)網(wǎng)的一部分,不是互聯(lián)網(wǎng)第三個(gè)階段,它是堪比工業(yè)革命一個(gè)新的技術(shù)革命。
李彥宏:我覺得人工智能是一個(gè)非常大的產(chǎn)業(yè),而且是會(huì)持續(xù)很長(zhǎng)時(shí)間。像我們現(xiàn)在的判斷未來20-50年都會(huì)是一個(gè)快速發(fā)展的人工智能時(shí)期。在這種時(shí)代大潮下,顯然不是一個(gè)公司能夠把所有的事情都做下來的。相反,對(duì)于一些小機(jī)構(gòu)沒有這么多計(jì)算資源和長(zhǎng)遠(yuǎn)研發(fā)能力,但他們可能會(huì)對(duì)垂直領(lǐng)域的了解更加深刻,我們?yōu)樗麄兲峁┮恍┻@樣的平臺(tái),讓他們?nèi)プ?,這會(huì)推動(dòng)整個(gè)人工智能技術(shù)的發(fā)展。而且我們也能夠在平臺(tái)上看到大家在干什么事情,哪些方向發(fā)展的會(huì)更快,哪些領(lǐng)域更適用于現(xiàn)在已經(jīng)解決的技術(shù)。所以我們把平臺(tái)開放出來,對(duì)大家都有益。
我剛才講人工智能永遠(yuǎn)不可能超過人類的能力,但是當(dāng)他逐步逼近人類能力的時(shí)候,其實(shí)已經(jīng)是可以一個(gè)一個(gè)行業(yè)去顛覆掉。比如說人臉識(shí)別這種應(yīng)用,我們今天如果你去機(jī)場(chǎng)的話,要過好幾道安檢,又要把身份證拿出來,比對(duì)一下,其實(shí)人臉識(shí)別這個(gè)問題解決后,將來到機(jī)場(chǎng)就應(yīng)該大搖大擺就過去了,他那個(gè)攝像頭可以識(shí)別,不需要一道一道檢查的。我們?cè)诩依镒约洪_一個(gè)Party,不可能每個(gè)人進(jìn)來先把身份證看一看。但是人多了,幾千人、幾萬人,甚至更多人的情況就要用現(xiàn)在比較笨的辦法一個(gè)人一個(gè)人對(duì)他的身份,但是現(xiàn)在這個(gè)問題基本上解決了。比如百度大廈,我們那個(gè)閘機(jī)就是刷臉可以進(jìn),到哪兒直接過就可以了。這還是人臉識(shí)別一個(gè)東西。語(yǔ)音的識(shí)別、自然語(yǔ)言的理解等等,都是可以。未來人和物的交流方式,人和工具交流方式,不是人學(xué)習(xí)工具怎么使用。人和動(dòng)物的區(qū)別就是人發(fā)明了工具,但是人發(fā)明了工具之后,是發(fā)明人寫一個(gè)用戶手冊(cè)告訴你這個(gè)東西怎么用,電視怎么用、冰箱怎么用,這些東西,電腦手機(jī)怎么用,我們要學(xué)習(xí)用鍵盤,小時(shí)候都要學(xué)打字。但是未來應(yīng)該是機(jī)器、工具學(xué)習(xí)人的意圖,以后人再也不需要學(xué)習(xí)工具怎么用了,我要這個(gè)工具干什么,他就能夠明白,這就是我希望用人工智能方法解決理解人的自然語(yǔ)言,以后人和機(jī)的對(duì)話、人和物的對(duì)話就變成一種自然語(yǔ)言的對(duì)話,這是未來幾十年可能代表人工智能發(fā)展最大的方向。
沈向洋:我自己從研究生開始到現(xiàn)在,從事人工智能的研究也有20多年的實(shí)踐??吹浆F(xiàn)在人工智能如火如荼,我很激動(dòng),因?yàn)楫?dāng)時(shí)90年代中期我們畢業(yè)的時(shí)候連像樣的工作都找不到。
我覺得人工智能經(jīng)歷了多少個(gè)冬天之后,發(fā)展到現(xiàn)在這個(gè)樣子,主要還是因?yàn)槿齻€(gè)方面的原因。第一,是因?yàn)榇罅繑?shù)據(jù)的出現(xiàn),第二,是強(qiáng)大的運(yùn)算能力,摩爾定律到現(xiàn)在,大家覺得應(yīng)該會(huì)死掉,但是并沒有,持續(xù)有更多新的計(jì)算方法出現(xiàn)。第三,是深度學(xué)習(xí)技術(shù)的突破,以前很多不能解決的問題,現(xiàn)在可以解掉。
從人工智能基本和研究方向來講,還是兩個(gè)不同非常不一樣的階段。一個(gè)是人類感知這件事情上,我們講人工智能,原來對(duì)人工智能的定義就是跟人類智能相比較。人類的智能體現(xiàn)在哪?主要是兩方面,一個(gè)是感知方面、一個(gè)是認(rèn)知方面。感知方面,剛才我提到這幾個(gè)原因,所以在接下來5-10年進(jìn)展會(huì)非???。具體表現(xiàn)在計(jì)算機(jī)語(yǔ)音和計(jì)算機(jī)視覺發(fā)展,我覺得AI會(huì)超過人。很多人會(huì)同意我這個(gè)說法。第二方面問題大家今天還沒有搞的很清楚的地方是人工智能的認(rèn)知方面,包括自然語(yǔ)言,包括知識(shí)的獲取、包括你對(duì)一般的情況下這種解決的方法這樣的思考,包括情感,這些東西今天我們還都是不知道。所以我是覺得現(xiàn)在是非常好的時(shí)代。激動(dòng)之余的話,我覺得我們作為科研人員還是要有一個(gè)平常心,因?yàn)楹芏嗫蒲羞M(jìn)展還需要一些時(shí)間。
從微軟公司來講,我們的研判是,短期之內(nèi)有非常非常大的一些商機(jī)。那具體到哪些行業(yè)有商機(jī)呢?如果這個(gè)行業(yè)已經(jīng)有相當(dāng)量的數(shù)據(jù),并且這個(gè)行業(yè)的從業(yè)人員對(duì)現(xiàn)狀并不滿意,那么這就是人工智能有商機(jī)的地方。從銷售、人事、客戶支持等方面,每一個(gè)商業(yè)應(yīng)用都會(huì)被顛覆。
我們公司內(nèi)部一共有7000多個(gè)工程師和科學(xué)家,但是我們還在繼續(xù)招人。
我覺得微軟在中國(guó)最近幾年推出的最了不起人工智能產(chǎn)品,就是微軟小冰,這個(gè)產(chǎn)品面對(duì)的是比較年輕的人群,大概18到20多歲的一個(gè)用戶群,因?yàn)檫@個(gè)年齡段的人更愿意花時(shí)間跟聊天機(jī)器人對(duì)話。所以我們跟QQ的合作,也主要是為了面對(duì)這樣一個(gè)用戶群。我們?cè)谕菩”@樣一個(gè)產(chǎn)品的過程當(dāng)中,學(xué)到了很多的東西,所以我們現(xiàn)在主推的研究和產(chǎn)品方向,就是對(duì)話式人工智能。
沈向洋:作為大公司來講,特別是成功大公司來講,我們對(duì)社會(huì)有一個(gè)責(zé)任,對(duì)行業(yè)有一個(gè)責(zé)任。當(dāng)我們行業(yè)做的很成功,第一件事情就是開研究院?,F(xiàn)在Pony也開研究院,唯一做的不對(duì)的就是開到微軟門口去了(笑)。我也想分享一下在微軟的工作經(jīng)驗(yàn),你說叫這些公司把數(shù)據(jù)拿出來,讓初創(chuàng)公司或者其他公司去用,我覺得不見得很現(xiàn)實(shí)、不見得很容易。但是我想鼓勵(lì)大家,很多的數(shù)據(jù)如果我們?cè)敢饣〞r(shí)間、花精力做一點(diǎn)處理,然后讓研究人員去用,完全是可以做到的。我們微軟出了兩個(gè)數(shù)據(jù)集,一個(gè)是計(jì)算機(jī)視覺標(biāo)準(zhǔn)方面的集,這樣可以做數(shù)據(jù)分割、物體分割。最近做了另外一個(gè)數(shù)據(jù)集是在自然語(yǔ)言,希望有一批新的做問題問答。這樣推動(dòng)研究領(lǐng)域,大家在標(biāo)準(zhǔn)集下,不斷把標(biāo)準(zhǔn)集數(shù)據(jù)越做越多。我們做的方法是用搜索引擎數(shù)據(jù),非常小心處理過,包括很多隱私的問題等等。拿出一些數(shù)據(jù)讓大家做研究是非常實(shí)際的,完全可以做到。
更多雷鋒網(wǎng)文章:
馬云最新演講談AI:AlphaGo贏了人類?So TM What? | IT領(lǐng)袖峰會(huì)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。