0
本文作者: 高婓 | 2016-10-06 23:33 | 專題:CCF-GAIR | 全球人工智能與機(jī)器人峰會(huì) |
編者按:近兩年人工智能技術(shù)的研究與應(yīng)用驟然增速,產(chǎn)業(yè)界,無論是身經(jīng)百戰(zhàn)的科技巨頭,抑或是默默無聞的中小企業(yè),都想要抓住這一難得的機(jī)遇,在業(yè)內(nèi)嶄露頭角。但是,如何將人工智能與自身原始的商業(yè)模式相結(jié)合,實(shí)現(xiàn)產(chǎn)業(yè)創(chuàng)新,很多企業(yè)都還在“摸著石頭過河”,難免遇到迷茫期。
在2016 年GAIR大會(huì)上,楊強(qiáng)教授深入淺出地為大家分享了自己多年來的智慧與經(jīng)驗(yàn)總結(jié)——人工智能要取得成功應(yīng)當(dāng)具備的五個(gè)必要條件,這五個(gè)條件將成為推動(dòng)人工智能長足發(fā)展的動(dòng)力源泉。
楊強(qiáng),香港科技大學(xué)計(jì)算機(jī)與工程系教授, IEEE Fellow,IAPR Fellow, AAAS Fellow 和ACM杰出科學(xué)家。,第四范式首席科學(xué)家、機(jī)器學(xué)習(xí)領(lǐng)域國際學(xué)術(shù)帶頭人,主要研究領(lǐng)域?yàn)闄C(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和自動(dòng)規(guī)劃。到目前為止,楊教授在學(xué)術(shù)研究中碩果累累,在人工智能和數(shù)據(jù)挖掘方面,已發(fā)表了超過了200篇的學(xué)術(shù)文章,還組織籌辦了多個(gè)人工智能和數(shù)據(jù)挖掘的國際會(huì)議。
當(dāng)下人工智能在圖像識(shí)別、語音識(shí)別和大規(guī)模的產(chǎn)品推薦方面取得了巨大的成功,那么人工智能的成功應(yīng)用究竟取決于哪些條件?
為什么只在我們這個(gè)時(shí)代迎來了人工智能發(fā)展的高峰期?對于這兩個(gè)備受關(guān)注的問題,楊教授從人工智能的科學(xué)與應(yīng)用兩個(gè)方面著手,娓娓道來。
人工智能技術(shù)的發(fā)展大體可以分為兩個(gè)方面:人工智能的科學(xué)與人工智能的應(yīng)用。
從科學(xué)層面談及人工智能要回歸到該研究領(lǐng)域最根本的問題:機(jī)器能夠思維嗎?這個(gè)問題最早起源于人工智能之父圖靈,之后經(jīng)過60多年的努力,計(jì)算機(jī)科學(xué)家及各行各業(yè)對人工智能感興趣的人士都競相研發(fā)計(jì)算能力更強(qiáng)的計(jì)算機(jī),匯聚更多的數(shù)據(jù),提出更高級的算法,致力于回答這個(gè)最基本、也是最重要的問題。
談到應(yīng)用層面,除去人工智能已經(jīng)為我們的生活帶來的便利,我們更關(guān)心它對人類未來生活將產(chǎn)生什么樣的影響。要將人工智能技術(shù)成功地應(yīng)用于商業(yè)領(lǐng)域,既要站在科學(xué)前沿,也要具備一定的商業(yè)頭腦,兩者兼?zhèn)洳拍茉谏虡I(yè)浪潮中立于不敗之地。
會(huì)上,楊教授言簡意賅為我們分享了決定人工智能成功的五個(gè)必要條件:
清晰的目標(biāo)(商業(yè)模式)
高質(zhì)量的大數(shù)據(jù) (持續(xù)反饋)
清晰的問題定義和領(lǐng)域邊界
懂人工智能的跨界人才(擅長應(yīng)用和算法)
計(jì)算能力
首先,要有 “清晰的目標(biāo)”,即清晰的商業(yè)模式,這就好比游戲中明確規(guī)定何為贏,何為輸,延伸到人工智能在商業(yè)領(lǐng)域的應(yīng)用,即要確定明確的運(yùn)行模式和運(yùn)行目的。
其次,高質(zhì)量的大數(shù)據(jù)資源是人工智能成功的核心條件。楊教授特別強(qiáng)調(diào),高質(zhì)量的數(shù)據(jù)要求收集到的數(shù)據(jù)能夠具備持續(xù)性、反饋性,且反饋的方式與內(nèi)容要與具體的算法相匹配。有人會(huì)覺得,在某個(gè)領(lǐng)域擁有了幾千萬個(gè)數(shù)據(jù)樣本便具備從事人工智能的條件了,楊教授認(rèn)為,這種觀點(diǎn)是站不住腳的,原因如下:首先,已收集的數(shù)據(jù)樣本可能無法與某個(gè)特定的算法相匹配;其次,所用到的算法可能不具備可持續(xù)性;最后,得到的反饋方式與內(nèi)容不一定與期望相符。
第三,清晰的問題定義和領(lǐng)域邊界。要求在應(yīng)用人工智能技術(shù)時(shí)要對所遇到的問題有清晰的理解與定義,就像下棋一樣,在有限定的領(lǐng)域里完成特定的行為操作。
第四,人工智能成功的核心競爭力在于懂人工智能的跨界人才(擅長應(yīng)用和算法),即我們需要一個(gè)既精通人工智能,又在商界游刃有余的人才。當(dāng)然,很多人會(huì)質(zhì)疑:我們到哪里去找這樣的人才?楊教授號(hào)召我們做生活中的有心人,善于關(guān)注身邊會(huì)學(xué)習(xí)的人,著重培養(yǎng)其跨領(lǐng)域才能,這樣的人才將具備把兩個(gè)看似不同的垂直領(lǐng)域聯(lián)系在一起的能力,在未來能夠做出突出的成就。
最后,楊教授提出,強(qiáng)大的計(jì)算能力是人工智能技術(shù)在各領(lǐng)域成功應(yīng)用的硬實(shí)力。在計(jì)算能力方面,我們有云計(jì)算、并行計(jì)算、GPU,這都為人工智能的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
此外,楊教授提到,人工智能已經(jīng)在機(jī)器學(xué)習(xí)領(lǐng)域已經(jīng)取得了突出的成就,特別是在深度學(xué)習(xí)方面,此外,還特別強(qiáng)調(diào)了強(qiáng)化學(xué)習(xí)與遷移學(xué)習(xí)的應(yīng)用前景。
楊教授講到,強(qiáng)化學(xué)習(xí)的優(yōu)點(diǎn)在于它不僅能夠?qū)W習(xí)人的行為,而且能夠更好地使用延遲反饋功能。以Google DeepMind采用的強(qiáng)化學(xué)習(xí)流程為例,我們可以將這個(gè)流程圖理解為一個(gè)計(jì)算機(jī)內(nèi)部的表達(dá)形式,一個(gè)矢量,這個(gè)矢量與我們得到的反饋信息相結(jié)合,將有助于改進(jìn)我們采用的策略。流程圖中的策略,簡單來講,就是我們平常的行為規(guī)劃,工作規(guī)劃,就好比游戲中的一個(gè)動(dòng)作就對應(yīng)一個(gè)策略,這個(gè)策略再返回來,產(chǎn)生一個(gè)新的界面,如此我們便能夠進(jìn)行持續(xù)學(xué)習(xí)。在這個(gè)循環(huán)過程中,我們只有到最后才能夠獲得反饋,稱之為延遲的反饋。就好比我們投資一只股票,過了很長時(shí)間才知道收益如何。
但是,這個(gè)循環(huán)暴露出強(qiáng)化學(xué)習(xí)的一個(gè)局限性:人們永遠(yuǎn)無法準(zhǔn)確定義這個(gè)策略里的空間,我們稱之為“狀態(tài)空間”,即強(qiáng)化學(xué)習(xí)的結(jié)果具有不可預(yù)測性。說到這里,楊教授以Google DeepMind的第二個(gè)目標(biāo)——端到端的深度學(xué)習(xí)為例。當(dāng)該有的狀態(tài)預(yù)先在學(xué)習(xí)器內(nèi)表達(dá)好后,就形成了一種從輸入端到輸出端的端到端的深度學(xué)習(xí)模型,經(jīng)過幾百次的訓(xùn)練學(xué)習(xí)后,機(jī)器將能夠?qū)W會(huì)如何更好地玩一個(gè)游戲。
以下各個(gè)圖對應(yīng)不同游戲的學(xué)習(xí)效果。圖中橫軸表示隨著游戲輪數(shù)越來越多,機(jī)器的自學(xué)習(xí)效果不斷提升,直至達(dá)到上限。
遷移學(xué)習(xí)是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的結(jié)合體,能夠?qū)⑦m用于大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,實(shí)現(xiàn)個(gè)性化遷移,這樣一來能夠避免數(shù)據(jù)寡頭的出現(xiàn)。
楊教授提出一點(diǎn):
大數(shù)據(jù)設(shè)計(jì)出來的模型用于小數(shù)據(jù)上,它的副產(chǎn)品就是個(gè)性化。這就是遷移學(xué)習(xí)的目的。
運(yùn)用遷移學(xué)習(xí)把在一個(gè)數(shù)據(jù)領(lǐng)域已經(jīng)建立的非常好的模型,應(yīng)用到另一個(gè)領(lǐng)域,這樣既節(jié)省了資源,又能夠節(jié)省時(shí)間,效果又好。
楊教授談到,我們?nèi)撕茏匀痪途邆溥@種舉一反三的遷移能力,比如我們學(xué)會(huì)騎自行車后,學(xué)騎摩托車就很簡單了;會(huì)打羽毛球,再學(xué)打網(wǎng)球也就沒那么難了。
在演講中,楊教授總結(jié)了遷移學(xué)習(xí)的四種實(shí)現(xiàn)方式,每一種方式都很直觀。
第一種為樣本遷移,就是在數(shù)據(jù)集(源領(lǐng)域)中找到與目標(biāo)領(lǐng)域相似的數(shù)據(jù),把這個(gè)數(shù)據(jù)放大多倍,與目標(biāo)領(lǐng)域的數(shù)據(jù)進(jìn)行匹配。樣本遷移的特點(diǎn)是:1)需要對不同例子加權(quán);2)需要用數(shù)據(jù)進(jìn)行訓(xùn)練。
第二種為特征遷移,就是通過觀察源領(lǐng)域圖像與目標(biāo)域圖像之間的共同特征,然后利用觀察所得的共同特征在不同層級的特征間進(jìn)行自動(dòng)遷移。
第三種為模型遷移,其原理時(shí)利用上千萬的圖象訓(xùn)練一個(gè)圖象識(shí)別的系統(tǒng),當(dāng)我們遇到一個(gè)新的圖象領(lǐng)域,就不用再去找?guī)浊f個(gè)圖象來訓(xùn)練了,可以原來的圖像識(shí)別系統(tǒng)遷移到新的領(lǐng)域,所以在新的領(lǐng)域只用幾萬張圖片同樣能夠獲取相同的效果。模型遷移的一個(gè)好處是我們可以區(qū)分,就是可以和深度學(xué)習(xí)結(jié)合起來,我們可以區(qū)分不同層次可遷移的度,相似度比較高的那些層次他們被遷移的可能性就大一些。
第四種為關(guān)系遷移,比如社會(huì)網(wǎng)絡(luò),社交網(wǎng)絡(luò)之間的遷移。
遷移學(xué)習(xí)的最終目的就是實(shí)現(xiàn)AI for Everyone。比如我們利用一個(gè)由訓(xùn)練三萬個(gè)的對話模式獲得的大對話模型可以遷移到個(gè)人的小型對話中,這種基于強(qiáng)化學(xué)習(xí)所獲取的個(gè)性化效果非常具有實(shí)用性,因?yàn)槲覀儾挥梅爆嵉貑栍脩艉芏嗤瑯拥膯栴}。此外,楊教授在會(huì)上曾提到一個(gè)愿景——利用遷移學(xué)習(xí),即使是自身沒有條件獲得大量訓(xùn)練數(shù)據(jù)的小公司也可以按照自己的需要應(yīng)用大公司訓(xùn)練出來的模型,從而普及AI的應(yīng)用,從而克服數(shù)據(jù)“寡頭”現(xiàn)象。不論怎樣,遷移學(xué)習(xí)是一種極具潛力的解決方案,將在未來大顯身手。
此外,楊教授用一個(gè)人工智能技術(shù)應(yīng)用的熱點(diǎn)——對話系統(tǒng),清晰地闡明上述五個(gè)條件對人工智能技術(shù)發(fā)展所產(chǎn)生的推動(dòng)性作用。
一般來講,市場上現(xiàn)有的對話系統(tǒng)可以分為兩類:閑聊類與功能類。
在上圖中,我們可以看到:60年代的Eliza與微軟的小冰屬于閑聊類對話系統(tǒng),百度的小度與微軟的Cortana介乎閑聊類與功能類之間,F(xiàn)acebook的M與HKUST最新的Magic Mirror系統(tǒng)屬于功能類對話系統(tǒng)。楊教授講到,我們大家應(yīng)該都有體驗(yàn),微軟小冰很幽默,但是也只能止于閑聊;功能類對話系統(tǒng)則給我們的生活帶來了很多便利,例如,我們打電話到酒店預(yù)定房間,在銀行辦理個(gè)人業(yè)務(wù),不過,在一定程度上,目前的功能類對話系統(tǒng)依然存在一些不太便利的地方,例如,在使用過程中,我們要根據(jù)系統(tǒng)提醒依次按服務(wù)鍵,這可能導(dǎo)致用戶體驗(yàn)下降。
從技術(shù)層面上進(jìn)行分析,楊教授提到對話系統(tǒng)可以大致分為兩種:基于原則的系統(tǒng)與基于學(xué)習(xí)的系統(tǒng)。最早的對話系統(tǒng)是基于原則的,有很多專家來制定這些規(guī)則,其優(yōu)點(diǎn)在于準(zhǔn)確性高,但是卻難以擴(kuò)展,與數(shù)據(jù)無關(guān),對數(shù)據(jù)的靈敏度不高。此外,基于原則的對話系統(tǒng)的由于無法擴(kuò)展,通常情況下不能應(yīng)對不同的意外事件,所以現(xiàn)在大家關(guān)注較多的是基于機(jī)器學(xué)習(xí)算法研發(fā)的對話系統(tǒng)。
楊教授透露說,香港科技大學(xué)實(shí)驗(yàn)室正在研究如何運(yùn)用新技術(shù)來改進(jìn)現(xiàn)有的對話系統(tǒng)。在大會(huì)上,楊教授向我們展示了一個(gè)三明治式的三層結(jié)構(gòu)算法模型:
第一層是我們熟知的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)——遞歸深度神經(jīng)網(wǎng)絡(luò)(RNN)
第二層是一個(gè)策略學(xué)習(xí)器——強(qiáng)化學(xué)習(xí)(RL)
第三層是遷移學(xué)習(xí)(TL)
在演講中,楊教授特別強(qiáng)調(diào)了強(qiáng)化學(xué)習(xí)(RL)中最難的階段:人工智能機(jī)器人只能部分觀察周圍的世界,研究者用一個(gè)奇怪的名字來描述這種現(xiàn)象——基于部分觀察的馬爾可夫決策過程。遷移學(xué)習(xí)(TL),正如在前面講到的,能夠?qū)⒁粋€(gè)已經(jīng)做好的模型遷移應(yīng)用到一個(gè)新的領(lǐng)域中。楊教授講到,希望利用這樣一個(gè)三層結(jié)構(gòu)賦予對話系統(tǒng)以下功能,比如說閑聊、推薦、引導(dǎo)、提醒、學(xué)習(xí),如果一個(gè)對話系統(tǒng)能夠具備這些功能,它就像一個(gè)真人一樣。
但是,如何達(dá)到這個(gè)目的呢?
根據(jù)楊教授的觀點(diǎn),首先,對話系統(tǒng)應(yīng)當(dāng)具備基本的對話功能,即自然語言生成能力,這種能力主要依賴RNN來實(shí)現(xiàn)。
其次,我們需要一個(gè)策略,用這個(gè)策略引導(dǎo)對話的對象來完成一個(gè)特定的任務(wù),即對話控制,主要通過RL實(shí)現(xiàn)。
最后,要實(shí)現(xiàn)個(gè)性化,滿足用戶不同的需求指令,主要依靠TL實(shí)現(xiàn)。
為此,楊教授給我們提供了一個(gè)實(shí)例,香港科技大學(xué)現(xiàn)在和一個(gè)O2O的公司合作,用真是的數(shù)據(jù)訓(xùn)練這個(gè)對話系統(tǒng),上圖中綠色代表用戶所提的問題,白色代表系統(tǒng)的回答,該系統(tǒng)的中文名字叫做“魔鏡系統(tǒng)”,就是童話故事白雪公主里面的魔鏡,當(dāng)然這是一個(gè)好的魔鏡。“魔鏡系統(tǒng)”是個(gè)性化學(xué)習(xí)的一個(gè)實(shí)例。
在這個(gè)系統(tǒng)中,我們是把整個(gè)對話系統(tǒng)放置在一個(gè)機(jī)器人里面,讓機(jī)器人通過語音的方式與用戶對答,實(shí)際上,這個(gè)系統(tǒng)可以在手機(jī)上與人進(jìn)行交流。楊教授的研究團(tuán)隊(duì)將“魔鏡系統(tǒng)”與大家熟悉的一些對話系統(tǒng)作對比,下圖中,綠色代表用戶的問題,黃色是小冰的回答,可以看到相比之下,小冰的回答多富有調(diào)侃性,準(zhǔn)確度很低,而之前“魔鏡系統(tǒng)”的回答更容易滿足用戶的需求。此外,我們還可以看到siri(灰色)的回答很多都是“抱歉沒有找到匹配”,因?yàn)閟iri是基于搜索的對話系統(tǒng)。
楊教授表示,他們之所以對這種對話系統(tǒng)進(jìn)行研究,歸根到底是對背后的系統(tǒng)感興趣,即我們在剛開始講到的——人工智能成功的五個(gè)必備條件。在對該對話系統(tǒng)背后的原理進(jìn)行剖析,可以發(fā)現(xiàn),其研究團(tuán)隊(duì)具有很明確的目標(biāo),有很好的反饋,有不斷到來的數(shù)據(jù),有跨界人才,此外,和O2O公司有聯(lián)絡(luò)。
談及清晰的問題定義與領(lǐng)域邊界這個(gè)必要條件,楊教授表示,我們不一定像在下圍棋一樣,要確定明確的邊界,在這里我們可以考慮說當(dāng)我們現(xiàn)在的談話進(jìn)行到這里時(shí),到底離我們的目標(biāo)還有多遠(yuǎn),這就好像在下棋里面一樣,我們對當(dāng)前的盤面有一個(gè)估算,同時(shí)我們可以接著往下問不同的問題,就像我們下面要下的棋子一樣,所以對話系統(tǒng)的問題定義與領(lǐng)域邊界問題實(shí)質(zhì)上與Alphago的思維很相像。
楊教授講到,同深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)及遷移學(xué)習(xí)一樣,這個(gè)三層結(jié)構(gòu)算法模型也具有通用性。比如楊教授的學(xué)生就把這種模型應(yīng)用到大家公認(rèn)的很難的領(lǐng)域中——預(yù)測股市走勢。下圖所示為A股里面的某個(gè)股票,用過去十年的數(shù)據(jù)訓(xùn)練該模型。首先,運(yùn)用數(shù)據(jù)之間的連接,產(chǎn)生不同的狀態(tài),讓各個(gè)狀態(tài)之間能夠互相遷移。其次,不同狀態(tài)之間將發(fā)生變化,我們運(yùn)用用一個(gè)強(qiáng)化學(xué)習(xí)器模擬這種變化。最后。我們發(fā)現(xiàn)深度學(xué)習(xí)的隱含層里面會(huì)自動(dòng)產(chǎn)生幾百個(gè)狀態(tài),基本就能夠?qū)@十年來的經(jīng)濟(jì)狀況做出一個(gè)很完善的總結(jié)。所以,運(yùn)用這種三層結(jié)構(gòu)算法模型可以很好地對股市走勢作出預(yù)測,對此,我們也做了一些相關(guān)測試。
楊教授表示,這個(gè)例子只是在金融領(lǐng)域的一個(gè)小小的試驗(yàn)。不過,一旦我們對一個(gè)領(lǐng)域有了透徹的了解,并掌握更多的高質(zhì)量數(shù)據(jù),就可以將人工智能技術(shù)遷移到這個(gè)領(lǐng)域來,在應(yīng)用過程中對所遇到的問題作清晰的定義,最終能夠?qū)崿F(xiàn)通用型人工智能的目的。
在演講接近尾聲時(shí),楊教授對所講的內(nèi)容做出總結(jié):通過同大家分享谷歌DeepMind的應(yīng)用實(shí)例,講解強(qiáng)化遷移學(xué)習(xí)和三層結(jié)構(gòu)算法模型,及個(gè)性化學(xué)習(xí),最終我們都要回歸到人工智能成功的五個(gè)必要條件——清晰的商業(yè)模式(明確的目標(biāo))、高質(zhì)量的大數(shù)據(jù)、清晰的問題定義和領(lǐng)域邊界、懂人工智能的跨界人才及計(jì)算能力,這五個(gè)條件相互影響,缺一不可,是人工智能技術(shù)長足發(fā)展的動(dòng)力機(jī)。
本文由雷鋒網(wǎng)獨(dú)家編寫,未經(jīng)許可拒絕轉(zhuǎn)載!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章