0
雷鋒網(wǎng) AI 科技評(píng)論按:2019年9月21日,2019第五屆中國(guó)人工智能大會(huì)(CCAI 2019)在山東省青島市舉行。大會(huì)為期兩天,包括中國(guó)人工智能學(xué)會(huì)理事長(zhǎng)、中國(guó)工程院院士李德毅,清華大學(xué)人工智能研究院院長(zhǎng)、中國(guó)科學(xué)院院士張鈸,卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)學(xué)院副院長(zhǎng)、蘇格蘭皇家學(xué)院院士賈斯汀·卡塞爾,加拿大滑鐵盧大學(xué)教授、國(guó)際計(jì)算學(xué)習(xí)理論學(xué)會(huì)前主席賽·本·大衛(wèi),騰訊人工智能實(shí)驗(yàn)室主任張正友,中國(guó)人工智能學(xué)會(huì)秘書(shū)長(zhǎng)王衛(wèi)寧等多位重磅學(xué)術(shù)嘉賓出席,還有一百多位國(guó)際人工智能領(lǐng)域頂尖人才,一千多位國(guó)內(nèi)外人工智能領(lǐng)域?qū)<医淌?、頭部企業(yè)高管參會(huì)。這也是青島市「建設(shè)現(xiàn)代化國(guó)際大都市,打造對(duì)外開(kāi)放新高地」戰(zhàn)略下的重要活動(dòng),青島期待打造人工智能的國(guó)際合作新平臺(tái),整合全球的要素資源,加快推進(jìn)人工智能的發(fā)展。
山東省委常委、青島市委書(shū)記王清憲在開(kāi)幕致辭中說(shuō)道,本屆大會(huì)的主題是「智變?nèi)诤稀?,人工智能最大的價(jià)值在于賦能,與場(chǎng)景的應(yīng)用結(jié)合起來(lái),與產(chǎn)業(yè)融合起來(lái),從而帶來(lái)點(diǎn)石成金的變化。人工智能為百業(yè)賦能的過(guò)程,將會(huì)形成巨大的產(chǎn)業(yè);「人工智能科技服務(wù)產(chǎn)業(yè)」,就是利用人工智能的發(fā)展成果,推動(dòng)更廣泛的產(chǎn)業(yè)應(yīng)用,實(shí)現(xiàn)人工智能為百業(yè)賦能的價(jià)值。
清華大學(xué)人工智能研究院院長(zhǎng)、中國(guó)科學(xué)院院士張鈸上午進(jìn)行演講,題目是「邁向第三代人工智能的新征程」。雷鋒網(wǎng) AI 科技評(píng)論根據(jù)現(xiàn)場(chǎng)速記把演講內(nèi)容整理如下。
張鈸:各位領(lǐng)導(dǎo)、各位專(zhuān)家、各位來(lái)賓,我今天講的題目是「邁向第三代人工智能的新征程」。這個(gè)題目是我經(jīng)過(guò)認(rèn)真考慮的,特別加了「新征程」。我一直向大家傳達(dá)一個(gè)信息,人工智能遇到新的機(jī)遇,如果我們有可能突破現(xiàn)在面臨的問(wèn)題,人工智能就會(huì)長(zhǎng)足往前發(fā)展。
人工智能有個(gè)特點(diǎn),我今天在報(bào)告里面主要傳達(dá)這么個(gè)特點(diǎn):大家不能指望人工智能一出來(lái)就「畢其功于一役」。它永遠(yuǎn)在路上,這就是人工智能的魅力所在。
我們看一下人工智能究竟做了什么事兒?第一件事就是第一代人工智能提出的符號(hào)模型,以知識(shí)經(jīng)驗(yàn)為基礎(chǔ)的推理模型,這是人工智能的第一個(gè)重大突破。這個(gè)突破后來(lái)產(chǎn)生了一個(gè)結(jié)果,就是這個(gè)理論提出時(shí)有個(gè)非常樂(lè)觀的估計(jì),1956年由西蒙提出,基于這種模型,十年之后機(jī)器可以打敗所有棋手,二十年以后機(jī)器取代人類(lèi)所有的工作。實(shí)際并不是這樣,六十年以后機(jī)器才打敗棋手,機(jī)器究竟代替人類(lèi)的所有工作是什么時(shí)間,可能還很遙遠(yuǎn),這也是人工智能的另外一個(gè)特點(diǎn),往往被高估。
人工智能的第一代模型,有優(yōu)點(diǎn),但是也有很大局限性。這個(gè)優(yōu)點(diǎn)是顯然的,因?yàn)樗悄7氯祟?lèi)的,它可解釋?zhuān)敯粜院軓?qiáng),但是它的局限性也非常大。因?yàn)樽畲蟮膯?wèn)題是人類(lèi)的知識(shí)經(jīng)驗(yàn),很難準(zhǔn)確表達(dá),這就是產(chǎn)生的后來(lái)人工智能冬天的根本原因。當(dāng)時(shí)的應(yīng)用很有限,幾乎沒(méi)有推廣,但是,有了大數(shù)據(jù)以后,這個(gè)問(wèn)題得到了很大改善,特別是機(jī)器的能力提高以后,可以把大量的數(shù)據(jù)作為知識(shí)放在機(jī)器里,這就是最典型的沃森系統(tǒng)。
沃森系統(tǒng)可以做癌癥的免疫治療,這里面用多少知識(shí)呢?100萬(wàn)個(gè)醫(yī)學(xué)雜志中抽取的2500個(gè)摘要,400萬(wàn)病人的數(shù)據(jù),再加上1861年以前所有藥物的專(zhuān)利,它有醫(yī)學(xué)知識(shí),并聯(lián)的數(shù)據(jù)再加上藥物知識(shí),就可以做癌癥的免疫治療。當(dāng)然了,很多慢性病的治療和管理,這個(gè)系統(tǒng)也做得很好,中國(guó)的國(guó)內(nèi)也有大量這方面的工作在探索和研究。
第二代人工智能,一個(gè)最重要的成果就是深度學(xué)習(xí)。也就是說(shuō),第一代人工智能提出來(lái),如果能夠很好地利用人類(lèi)的知識(shí),就可以建立很好的人工智能系統(tǒng),如果我們有充分?jǐn)?shù)據(jù),也有可能建立起有用的人工智能的系統(tǒng)。
深度學(xué)習(xí)為什么這么受重視?一個(gè)很重要的原因,它有兩個(gè)重大變化。當(dāng)網(wǎng)絡(luò)層次增加以后,有兩個(gè)重大變化:第一個(gè)變化,輸入只要原始數(shù)據(jù),不需要預(yù)處理。第二個(gè)是性能提高很多,這就造成了深度學(xué)習(xí)的重大突破。也就是說(shuō),它從一定意義上有通用工具,對(duì)領(lǐng)域的知識(shí)要求不高,同時(shí)能夠處理大數(shù)據(jù)。
這就帶來(lái)很大的變化,大家也看到了,語(yǔ)音識(shí)別,2001年時(shí)它的識(shí)別率停留在80%,也就是20%的誤識(shí)別率;2016年誤識(shí)率就降到了5.9%,達(dá)到專(zhuān)業(yè)速記員的水平,到了2017年,所有產(chǎn)品包括谷歌、微軟,包括中國(guó)的訊飛、百度,用的全是深度學(xué)習(xí)。
變化更大的是圖像識(shí)別。有一個(gè)標(biāo)準(zhǔn)的圖像識(shí)別數(shù)據(jù)集 ImageNet,大家知道,2011年,它的誤識(shí)率是50%,有一半認(rèn)錯(cuò)了。但是四年以后,2015年就超過(guò)了人類(lèi)水平,原因也是利用了深度學(xué)習(xí)。
最后一個(gè),給大家印象最深就是AlphaGo,大家都知道了。因此就有很多估計(jì),十年之內(nèi)代替40%以上人類(lèi)的工作,三五年里面,智能駕駛車(chē)就可以量產(chǎn),等等,剛剛李院士說(shuō)到了這個(gè)問(wèn)題,他分析得很深刻。實(shí)際三五年里面不可能量產(chǎn)。
技術(shù)已經(jīng)完全成熟,我們現(xiàn)在的研究已不成熟,主要是應(yīng)用問(wèn)題。為什么在人工智能上往往產(chǎn)生樂(lè)觀估計(jì)?主要原因有兩個(gè):一個(gè)是對(duì)發(fā)展人工智能的困難性估計(jì)不足,對(duì)取得的成果估計(jì)過(guò)高。一個(gè)估計(jì)不足,一個(gè)估計(jì)過(guò)高,就產(chǎn)生了問(wèn)題。另外一個(gè)很重要的原因,受歷史事件的影響。過(guò)去我們發(fā)現(xiàn),有了蒸汽機(jī)以后就產(chǎn)生了工業(yè)革命,有了電動(dòng)機(jī)發(fā)動(dòng)機(jī)以后就產(chǎn)生了電氣革命,有了計(jì)算機(jī)以后產(chǎn)生了信息革命,大家很希望有一個(gè)東西出來(lái)以后引起人工智能的革命。
現(xiàn)在的問(wèn)題是,有沒(méi)有?至今為止,還沒(méi)有發(fā)現(xiàn)人工智能里面的蒸汽機(jī)和計(jì)算機(jī)。曾經(jīng)最開(kāi)始寄希望于符號(hào)模型,結(jié)果發(fā)現(xiàn)符號(hào)模型也沒(méi)有那么管用。第二次發(fā)現(xiàn)的是大數(shù)據(jù)+深度學(xué)習(xí),以為大數(shù)據(jù)+深度學(xué)習(xí)就是人工智能的蒸汽機(jī)和計(jì)算機(jī),為什么這樣?
這不能不考慮到人工智能的特點(diǎn),我們說(shuō)深度學(xué)習(xí)根本不是AI的通用機(jī)?,F(xiàn)在大家在尋找通用的人工智能,到底有沒(méi)有,還有爭(zhēng)論,不去管它,但至少深度學(xué)習(xí)不是人工智能。這個(gè)非常明顯,第一代人工智能也好,第二代人工智能也好,它的應(yīng)用場(chǎng)景必須滿足以下五個(gè)條件。
從正面來(lái)講,所有的應(yīng)用場(chǎng)景,如果滿足以下五個(gè)條件,計(jì)算機(jī)絕對(duì)能夠戰(zhàn)勝人類(lèi),不管這個(gè)問(wèn)題多么復(fù)雜:具有豐富的數(shù)據(jù)或知識(shí),完全信息,確定性信息,靜態(tài),單領(lǐng)域和單任務(wù)。
最明顯的例子是圍棋,圍棋多么復(fù)雜,但是圍棋滿足這五個(gè)條件,所以計(jì)算機(jī)戰(zhàn)勝在圍棋上戰(zhàn)勝人類(lèi)是早晚的事情。所以從正面來(lái)講,如果你滿足這五個(gè)條件,不管多復(fù)雜,計(jì)算機(jī)絕對(duì)戰(zhàn)勝人類(lèi)。長(zhǎng)遠(yuǎn)來(lái)看,如果你的應(yīng)用場(chǎng)景不完全滿足這五個(gè)條件,其中有些條件不滿足,你這個(gè)工作就變成困難。自動(dòng)駕駛為什么如此困難?根本的原因在這里。為什么我們難以做出來(lái)廉價(jià)、可靠的自動(dòng)駕駛呢?背后的原因就在這里,因?yàn)樽詣?dòng)駕駛很多條件都不滿足,它不是完全信息,它不是確定性信息,它不是靜態(tài)的環(huán)境,或者是按照確定性規(guī)律演化的,它的很多東西是不可預(yù)測(cè)的,它也不是單領(lǐng)域的,里面有人駕駛的車(chē)、行人、其它車(chē)輛。所以剛剛李院士提出來(lái)專(zhuān)用道,就是把這些東西弄干凈,變成單領(lǐng)域。所以我們一直說(shuō),如果有些條件是不符合這五條,你就需要下功夫。
現(xiàn)在人工智能能夠在這些領(lǐng)域里面得到應(yīng)用,換句話說(shuō),這些領(lǐng)域里面有很多應(yīng)用產(chǎn)品符合剛才講的五個(gè)條件。如果這些領(lǐng)域里面的應(yīng)用場(chǎng)景符合五個(gè)條件,大家大膽去做,絕對(duì)會(huì)超過(guò)人。根據(jù)現(xiàn)在計(jì)算機(jī)強(qiáng)大的力量,是可以做到這一點(diǎn)的。但是,這些應(yīng)用里面,也有大量不符合那五個(gè)條件的,大家必須下功夫,不能指望靠現(xiàn)在的第一代、第二代人工智能去解決它。
舉個(gè)簡(jiǎn)單的例子,復(fù)合場(chǎng)景下的決策,完全信息條件下的決策或者完全信息下的博弈,計(jì)算機(jī)戰(zhàn)勝人類(lèi)是絕對(duì)的。下面一個(gè)問(wèn)題,不完全信息的博弈及打牌,大家都知道,今年5月份對(duì)撲克牌這個(gè)問(wèn)題也解決了。換句話說(shuō),6人無(wú)限注的德州撲克,計(jì)算機(jī)能戰(zhàn)勝人類(lèi),這就意味著概率意義下的不確定性,機(jī)器也可以戰(zhàn)勝人類(lèi)。但是人類(lèi)的決策環(huán)境都不符合前面兩個(gè)條件。所以在復(fù)合環(huán)境下的博弈或者復(fù)雜環(huán)境下的決策,機(jī)器跟人類(lèi)還差得比較遠(yuǎn)。從這里來(lái)講,應(yīng)用場(chǎng)景是極為重要的。
第二個(gè),我們必須要重視的,用數(shù)據(jù)驅(qū)動(dòng)的方法做出來(lái)的系統(tǒng),有大量毛病,或者說(shuō)這些毛病是根本性的,是極為危險(xiǎn)的。這里面列出來(lái)的,簡(jiǎn)單舉個(gè)例子,一個(gè)圖像識(shí)別系統(tǒng),都可以說(shuō)它的識(shí)別率超過(guò)人類(lèi),但是這個(gè)圖象識(shí)別系統(tǒng)跟人類(lèi)的感知完全不同。
就是這樣的系統(tǒng),你給它噪聲,它可以識(shí)別為知更鳥(niǎo)。你給它一個(gè)噪聲,它可以識(shí)別為獵豹。換句話說(shuō),模式識(shí)別系統(tǒng)并沒(méi)有達(dá)到人類(lèi)認(rèn)知的水平,只達(dá)到低等動(dòng)物的水平,所以感知這個(gè)詞翻譯得非常好,感覺(jué)+知覺(jué),低等動(dòng)物只有感覺(jué),沒(méi)有認(rèn)知。所以機(jī)器現(xiàn)在達(dá)到的水平是低等動(dòng)物的水平,它可以分辨不同的物體,但是它本質(zhì)上不認(rèn)識(shí)這個(gè)物體。另外是它非常脆弱,非常容易受攻擊。
這是阿爾卑斯山圖片,人起來(lái)是,機(jī)器看起來(lái)也是,只要給它加上噪聲,右邊這個(gè)圖和左邊那個(gè)圖,唯一的區(qū)別是噪聲多一點(diǎn),人看起來(lái)還是阿爾卑斯山,機(jī)器看起來(lái)是一條購(gòu),而且它的置信度是99.99%,它99.99%認(rèn)為這是一條狗,非常容易受欺騙,這就說(shuō)明機(jī)器跟人的認(rèn)知差異非常大。
語(yǔ)音也是同樣的道理,前面的英文說(shuō)的是一句話,我們加上一點(diǎn)點(diǎn)噪聲,人聽(tīng)起來(lái)還是一樣的,機(jī)器聽(tīng)起來(lái)就是另外的內(nèi)容,這就非常危險(xiǎn)。
搞軍事的人說(shuō),過(guò)去你語(yǔ)音傳過(guò)去,它進(jìn)行干擾,你聽(tīng)不見(jiàn)而已?,F(xiàn)在語(yǔ)音傳過(guò)去,它說(shuō)進(jìn)攻,可以讓你聽(tīng)成退卻,加一點(diǎn)噪聲就行了,這就是AI的安全性。
另外,缺少自我知識(shí),這是非常重要的。你說(shuō)我用這個(gè)話,讓它翻譯,「說(shuō)你行的人行」,這句話計(jì)算機(jī)怎么翻呢?「說(shuō)你專(zhuān)業(yè)的人行道」,瞎翻,為什么瞎翻?它不知道自己不知道,沒(méi)有任何自知之明。這是很危險(xiǎn)的。為什么翻譯成人行道呢?「人行」,它以為是人行道。為什么翻譯成「你的專(zhuān)業(yè)」呢?「你行」。這是非常危險(xiǎn)的。大家想想,我?guī)Я艘粋€(gè)翻譯,翻譯水平挺高的,大多數(shù)翻譯是很準(zhǔn)確的,但是他會(huì)瞎說(shuō),你敢用嗎?人類(lèi)不會(huì),因?yàn)樗肋@句話如果沒(méi)有聽(tīng)明白會(huì)再問(wèn)是什么意思,計(jì)算機(jī)沒(méi)有自知之明,人貴有自知之明,這是人類(lèi)智慧的一個(gè)部分。怎么讓機(jī)器有自知之明?這是很困難的事。
下一步,我們現(xiàn)在有個(gè)新的歷史機(jī)遇,就是邁向第三代人工智能。第三代人工智能就要糾正前面說(shuō)的兩個(gè)局限性,建立可解釋、魯棒的人工智能理論,發(fā)展安全、可信、可用的人工智能技術(shù),促進(jìn)人工智能的創(chuàng)新應(yīng)用。
我們成立人工智能研究院就是想擔(dān)負(fù)這個(gè)責(zé)任,用什么辦法解決這個(gè)問(wèn)題?就通過(guò)一個(gè)核心和兩個(gè)融合:一個(gè)核心是加強(qiáng)基礎(chǔ)研究,必須從理論上去突破。我們剛才講了,深度學(xué)習(xí),所以有這么多毛病,這個(gè)原因是它的原理開(kāi)始的,它的原理就不對(duì),不是用人類(lèi)一樣的原理。所以我們必須更好地去解決它,才有可能往前邁進(jìn)。用的方法主要是兩條:一個(gè)是多學(xué)科交叉,必須多學(xué)科交叉,跟心理學(xué)、神經(jīng)科學(xué)。大家知道,第一個(gè)模型是心理學(xué)家提出來(lái)的,第二個(gè)模型是神經(jīng)科學(xué)家和數(shù)學(xué)家提出來(lái)的,都不是計(jì)算機(jī)的人提出來(lái)的,必須要加強(qiáng)學(xué)科交叉,應(yīng)用結(jié)合。
我們一共成立了十個(gè)研究中心,包括全校的18個(gè)系和學(xué)院,利用各種學(xué)科,不光是計(jì)算機(jī)的,不光是信息領(lǐng)域的,也有心理學(xué)的、法律的、文學(xué)的,都參與進(jìn)來(lái)。
除了技術(shù)上的研究以外,目前人工智能的技術(shù)與治理也是重大的問(wèn)題,現(xiàn)在清華大學(xué)也參與了這個(gè)工作,必須在國(guó)際上要有我們的話語(yǔ)權(quán),要在這個(gè)問(wèn)題上發(fā)出中國(guó)的聲音。做的辦法有兩條:一條是新原理和新模型,就是跟其它學(xué)科交叉,我們都在做。還有腦科學(xué)啟發(fā)的,還有神經(jīng)科學(xué)的。把數(shù)據(jù)驅(qū)動(dòng)和知識(shí)驅(qū)動(dòng)結(jié)合起來(lái),也是重點(diǎn)做的內(nèi)容,我們已經(jīng)有不少成果。大家看展覽,我們用的珠算平臺(tái)開(kāi)了一個(gè)公司,就是應(yīng)用新的算法,比谷歌算法又進(jìn)了一步,帶了第三代算法的特色。第一輪投資,對(duì)我們平臺(tái)的估值是7億人民幣。這個(gè)平臺(tái)跟國(guó)際已有的其它平臺(tái)相比,還是有很多優(yōu)勢(shì)的。我們也在知識(shí)表示、知識(shí)推理上做了很多工作,還有小樣本、因果推理。常識(shí),剛才李院士也提到常識(shí)推理。
最后做一下總結(jié),人工智能的確是本世紀(jì)最重要的發(fā)展領(lǐng)域之一,它的發(fā)展將會(huì)對(duì)人類(lèi)產(chǎn)生重大影響。但是我們一直強(qiáng)調(diào),人工智能不像以前遇過(guò)的科學(xué),以為某一個(gè)定理解決了,所有問(wèn)題就迎刃而解。人工智能太復(fù)雜了,我們要不斷往前推進(jìn),才能使人工智能進(jìn)一步發(fā)展。
(完)
更多 CCAI 2019 內(nèi)容請(qǐng)期待后續(xù)報(bào)道。雷鋒網(wǎng) AI 科技評(píng)論現(xiàn)場(chǎng)報(bào)道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。