0
本文作者: 老王 | 2016-08-12 11:44 | 專(zhuān)題:CCF-GAIR | 全球人工智能與機(jī)器人峰會(huì) |
人工智能的兩個(gè)研究分支:一個(gè)是科學(xué),一個(gè)是應(yīng)用。
在人工智能科學(xué)領(lǐng)域,人們一直有個(gè)問(wèn)題:機(jī)器思維嗎?過(guò)去60年,計(jì)算機(jī)專(zhuān)家們一直努力在回答這個(gè)問(wèn)題。而在人工智能應(yīng)用方面,研究人員探討的問(wèn)題是它如何對(duì)人們產(chǎn)生作用和影響。
楊強(qiáng)提到,AI的成功有著5大必要條件:
清晰的商業(yè)模式
高質(zhì)量的大數(shù)據(jù)
清晰的問(wèn)題定義和領(lǐng)域邊間
懂人工智能的跨界人才,擅長(zhǎng)應(yīng)用和算法
計(jì)算能力
人工智能在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方面已經(jīng)有著很高的成就。此外,另外一種技術(shù)正在開(kāi)始應(yīng)用:強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)不僅僅能夠?qū)W習(xí)人的行為,還能夠更好的使用延遲反饋功能。而之后人們能否發(fā)明一種新的學(xué)習(xí)方法,能把大數(shù)據(jù)的模型在用于小數(shù)據(jù)身上,于是楊強(qiáng)提到了遷移學(xué)習(xí)。遷移學(xué)習(xí)是把深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)疊加在一起。
三層結(jié)構(gòu)算法系統(tǒng)
目前人機(jī)交互的對(duì)話(huà)系統(tǒng)包括閑聊類(lèi)和功能類(lèi)。而從技術(shù)上層面來(lái)講,這種對(duì)話(huà)系統(tǒng)分成兩種,第一種最早出現(xiàn)的是基于規(guī)則的系統(tǒng),這些就像在符號(hào)領(lǐng)域,它的好處是很準(zhǔn)確。但存在的問(wèn)題是很難擴(kuò)展,對(duì)數(shù)據(jù)不夠敏感。此外,它還不能應(yīng)付很多不同的意外事件,所以學(xué)界關(guān)注的是機(jī)器學(xué)習(xí)的算法。
而對(duì)于機(jī)器學(xué)習(xí)的算法,楊強(qiáng)認(rèn)為深度學(xué)習(xí)之后的最新算法模型是一個(gè)三明治式的三層結(jié)構(gòu):第一層就是遞歸的深度學(xué)習(xí),在這之上的第二層有一個(gè)強(qiáng)化學(xué)習(xí)的學(xué)習(xí)器,而第三層就是遷移學(xué)習(xí),它能把一個(gè)已有的模型遷移到一個(gè)新的領(lǐng)域。
遞歸深度神經(jīng)網(wǎng)絡(luò)RNN(深度學(xué)習(xí))
強(qiáng)化學(xué)習(xí)RL
遷移學(xué)習(xí)TL
能否把一個(gè)成熟的人機(jī)交互對(duì)話(huà)系統(tǒng)算法模型用在其他領(lǐng)域?楊強(qiáng)現(xiàn)場(chǎng)演一個(gè)把對(duì)話(huà)系統(tǒng)置入機(jī)器人反應(yīng),之后他提到,他的學(xué)生曾把這個(gè)系統(tǒng)應(yīng)用在了金融領(lǐng)域,用于股市預(yù)測(cè)。當(dāng)人們一旦掌握某個(gè)領(lǐng)域,把它套用在其他領(lǐng)域就是遷移學(xué)習(xí)的作用。
個(gè)性化遷移
深度學(xué)習(xí)離不開(kāi)大數(shù)據(jù),強(qiáng)化學(xué)習(xí)重在反饋,但也離不開(kāi)大數(shù)據(jù),而大數(shù)據(jù)離不開(kāi)大公司,當(dāng)其他公司沒(méi)有大數(shù)據(jù)時(shí),它們?cè)撛趺崔k?
楊強(qiáng)提出一點(diǎn)
大數(shù)據(jù)設(shè)計(jì)出來(lái)的模型用于小數(shù)據(jù)上,它的副產(chǎn)品就是個(gè)性化。這就是遷移學(xué)習(xí)的目的。
有了這套系統(tǒng),如果換在其他領(lǐng)域就沒(méi)必要收集大量數(shù)據(jù)了,直接套用模型即可。類(lèi)似人學(xué)會(huì)騎自行車(chē) 后,就差不多學(xué)會(huì)了騎摩托車(chē)。
遷移學(xué)習(xí)分為兩種:樣本遷移,特征遷移。其在應(yīng)用場(chǎng)景中則如下:
基于模型的遷移:如圖像識(shí)別,訓(xùn)練萬(wàn)張頂千萬(wàn)張。相似度越大,遷移的概率大。
社交網(wǎng)絡(luò)之間的遷移:將千萬(wàn)人的大數(shù)據(jù)模型遷移到某個(gè)人身上。
最后,楊強(qiáng)指出,人工智能有很多領(lǐng)域,到現(xiàn)在為止最成功的一個(gè)領(lǐng)域就是機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)的一個(gè)基本概念就是從數(shù)據(jù)里面經(jīng)常重復(fù)的現(xiàn)象匯總學(xué)出規(guī)律,從而把現(xiàn)實(shí)中簡(jiǎn)單重復(fù)煩瑣的工作給替代掉。
今天早上聽(tīng)了非常精彩的報(bào)告,在這里我要跟大家分享有一些我個(gè)人的想法,尤其是我們今天,大家都知道人工智能有了很多的成就,我們能不能總結(jié)出一點(diǎn)點(diǎn)經(jīng)驗(yàn),能供給我們后面的人來(lái)使用。
首先我們看到人工智能尤其在商業(yè)上有很多的成就,我們看到在圖象識(shí)別,在語(yǔ)音識(shí)別,包括在大規(guī)模的產(chǎn)品推薦,我們今天每個(gè)人都是這些服務(wù)的享用者,我們都受益于它。但是我們有沒(méi)有想過(guò),這些人工智能的成就到底來(lái)自哪些條件的滿(mǎn)足,為什么這些成就十年以前二十年以前卻沒(méi)有呢?所以我們下面要來(lái)問(wèn)問(wèn)這些問(wèn)題。
在問(wèn)這些問(wèn)題之前,我們首先要來(lái)區(qū)分人工智能的兩個(gè)研究的分支,一個(gè)是人工智能的科學(xué),人工智能的科學(xué)我們要追溯到它的鼻祖圖靈問(wèn)的這個(gè)最關(guān)鍵最中心的問(wèn)題:就是機(jī)器可以思維嗎?六十多年的努力,大家都是計(jì)算機(jī)學(xué)家,各行各業(yè)都在朝著這個(gè)方面努力,我們?cè)旄斓挠?jì)算機(jī),我們會(huì)聚更多的數(shù)據(jù),我們研究更高級(jí)的算法,都是在試圖回答這樣的問(wèn)題。
今天人工智能的這些成就也就了機(jī)會(huì)讓我們把它應(yīng)用在我們的生活當(dāng)中,所以這又帶來(lái)一個(gè)嶄新的問(wèn)題,就是我們?nèi)绾文軌蛉ヮA(yù)測(cè)一個(gè)人工智能的技術(shù),是不是能夠產(chǎn)生它應(yīng)該有的作用。我們都說(shuō),如果它的應(yīng)用面很廣也是它成功的一個(gè)標(biāo)志。所以今天我想來(lái)看看人工智能在應(yīng)用方面到底有哪些條件來(lái)驅(qū)使它讓它產(chǎn)生應(yīng)該有的應(yīng)用面。
在這里我要說(shuō)一下,人工智能已經(jīng)有的很大的成就,比如機(jī)器學(xué)習(xí),深度學(xué)習(xí)方面,但是在現(xiàn)在我們看到的一些端倪,已經(jīng)給了我們很興奮的理由,就是強(qiáng)化學(xué)習(xí),強(qiáng)化學(xué)習(xí)不僅僅能夠?qū)W習(xí)人的行為,而且能夠特別好的使用這種延遲反饋,這種反饋可以延遲在一個(gè)時(shí)間段上。明天我們能不能發(fā)明一種新的學(xué)習(xí)方法,能讓它在小數(shù)據(jù)上也能適用?這就是我下面要講的遷移學(xué)習(xí)。所以我們也在這個(gè)角度來(lái)看,我們可以使用哪一種人工智能技術(shù)讓它產(chǎn)生應(yīng)該有的作用。
提到強(qiáng)化學(xué)習(xí),剛剛Michael Wooldridge教授說(shuō)到Deepmind,我也是Deepmind的粉絲,這是Deepmind的一個(gè)流程,我們觀察到流程以后,緊接著我們可以理解這是一個(gè)計(jì)算機(jī)內(nèi)部的表達(dá)形式,一個(gè)適量,這個(gè)適量加上我們得到的反饋,就可以幫助我們改進(jìn)我們的策略,這個(gè)策略是什么呢?就是我們所說(shuō)的平常我們做行為的規(guī)劃,我們工作的規(guī)劃,游戲里面的動(dòng)作就對(duì)應(yīng)著一個(gè)策略,這個(gè)策略又返回來(lái),產(chǎn)生一個(gè)新的界面,我們觀察到這個(gè)界面又可以回去學(xué)習(xí)。大家看一下,這里面很強(qiáng)的一點(diǎn)是這個(gè)反饋是不斷給的,而且我們到終點(diǎn)的時(shí)候,我們才知道我們到底是贏家還是輸家。我們?cè)诂F(xiàn)實(shí)生活中是不是有很多這樣的例子,是沒(méi)有用深度學(xué)習(xí)來(lái)選擇的。比如我們上一門(mén)課,只有考試的時(shí)候才知道我們的成就,我們投資一支股票,過(guò)了很長(zhǎng)時(shí)間才知道效果怎么樣,所以這是延遲的反饋。
但是這種學(xué)習(xí)有一個(gè)弱點(diǎn),就是如果我們?nèi)藶榈膩?lái)定義這個(gè)策略里面的空間,叫做狀態(tài)空間的話(huà),這個(gè)限制是非常大的,因?yàn)槲覀內(nèi)擞肋h(yuǎn)定不準(zhǔn),我們永遠(yuǎn)不能事先地預(yù)計(jì)這個(gè)世界會(huì)發(fā)生什么,這里面有來(lái)了谷歌Deegming的第二個(gè)目標(biāo),就是端到端的深度學(xué)習(xí),該有的狀態(tài)讓在學(xué)習(xí)器內(nèi)部表達(dá)好了,整個(gè)我們形成了從輸入端到輸出端的端到端的深度學(xué)習(xí),我們經(jīng)過(guò)幾百輪的學(xué)習(xí)之后,自我學(xué)會(huì)了怎么更好地玩一個(gè)游戲,這是當(dāng)時(shí)的學(xué)習(xí)效果,每個(gè)圖對(duì)應(yīng)不同的游戲。橫軸是隨著時(shí)間、隨著游戲的輪數(shù)越來(lái)越多,它的效果我們看到的是越來(lái)越好,這和我們?nèi)说膶W(xué)習(xí)過(guò)程是一樣的。我們說(shuō)這個(gè)人的學(xué)習(xí)效率就大大地提高,學(xué)習(xí)效果大大提高。
我們總結(jié)一下,這些成功來(lái)自于什么呢?我們可以首先看到它有非常清晰的目標(biāo),什么叫贏什么叫輸,延到商業(yè)上也要有很強(qiáng)的目標(biāo)。其次需要高質(zhì)量的大數(shù)據(jù),這里我特別要強(qiáng)調(diào)的是高質(zhì)量,這個(gè)數(shù)據(jù)要持續(xù)地反饋,不能收一次就完了,不斷地到達(dá)才能使得我們學(xué)習(xí)不斷地提高。同時(shí)一定要有反饋,反饋的方式和內(nèi)容和算法一定要匹配。所以我們常常聽(tīng)到有一些人說(shuō),我這個(gè)領(lǐng)域有了幾千萬(wàn)樣本的數(shù)據(jù),一定可以做人工智能,我要告訴他不一樣,因?yàn)槭紫饶隳莻€(gè)樣本不一定是針對(duì)這個(gè)算法收集的,其次你的算法不一定持續(xù)得到,最后你的反饋不一定很好。
第三是問(wèn)題不能非常寬泛和模糊,定義一定要非常清楚,清楚到像下棋一樣,我們知道什么時(shí)候邊界就達(dá)到了。另外一個(gè)是我們需要既懂人工智能又懂商業(yè)領(lǐng)域的人才,我們說(shuō)這樣的人才到哪兒去找,從今天還是大家就關(guān)注身邊善于學(xué)習(xí)的人,著重培養(yǎng)他,這樣的人才能把兩個(gè)完全不同的垂直領(lǐng)域聯(lián)結(jié)在一起的人才是必不可少的。最后我要提的是計(jì)算能力,今天大家都有很強(qiáng)的計(jì)算能力,我們有云計(jì)算、并行計(jì)算、GPU,所以這個(gè)能力也是必不可少的。
再下面我要講的是另外一個(gè)例子,今天我就用例子再來(lái)繼續(xù)闡述我剛剛講的五個(gè)條件,這里我要講,我們現(xiàn)在知道對(duì)話(huà)系統(tǒng)是人工智能的熱點(diǎn),甚至有的公司出來(lái)說(shuō)對(duì)話(huà)系統(tǒng),就是這種人機(jī)交互的對(duì)話(huà)系統(tǒng),可能是下一個(gè)入口,下一個(gè)搜索引擎,我們先不管這些商業(yè)的說(shuō)法,我們來(lái)看一看現(xiàn)在我們市場(chǎng)上有的這些對(duì)話(huà)系統(tǒng),我們可以大致把它們分兩類(lèi),首先我們看到有很多是閑聊類(lèi)的,我們大概很清楚的小冰,很幽默,但是也止于閑聊,還有一類(lèi)是功能類(lèi),當(dāng)我們打電話(huà)給酒店、航空公司,在尋求特殊具體垂直服務(wù)的時(shí)候,往往會(huì)受益于這樣一種功能型的對(duì)話(huà)。我們知道在不久以前,甚至很多的公司也有這種對(duì)話(huà),但是它們的方式都是說(shuō)你要這個(gè)服務(wù)按1,要那個(gè)服務(wù)按2,我們感覺(jué)體驗(yàn)非常不好。
從技術(shù)上來(lái)說(shuō),這種對(duì)話(huà)系統(tǒng)也分成兩種,第一種最早出現(xiàn)的是基于規(guī)則,很多人專(zhuān)家來(lái)寫(xiě)這些規(guī)則,這些就像在符號(hào)領(lǐng)域,它的好處是很準(zhǔn)確的,但是不好的地方就是很難擴(kuò)展,和數(shù)據(jù)無(wú)關(guān),對(duì)數(shù)據(jù)不夠敏感。另外有很多不同的意外事件都不能應(yīng)付,所以現(xiàn)在大家比較關(guān)注的是機(jī)器學(xué)習(xí)的算法。
我們?cè)谙愀劭萍即髮W(xué)的實(shí)驗(yàn)室里面也在進(jìn)行研究,我們研究的一個(gè)主要目的是說(shuō)如果我們?cè)侔讶斯ぶ悄芡巴七M(jìn)一步,在深度學(xué)習(xí)之后,到底還有哪些技術(shù)是下一個(gè)熱點(diǎn),我們關(guān)心的是明天的技術(shù),這里我要說(shuō)的是我們有一個(gè)三明治式的一個(gè)三層結(jié)構(gòu):第一層就是我們熟知的深度學(xué)習(xí),這是一個(gè)遞歸的深度學(xué)習(xí);在這個(gè)之上,我們有一個(gè)策略的學(xué)習(xí)器,叫做強(qiáng)化學(xué)習(xí)的學(xué)習(xí)器,在這里我要特別強(qiáng)調(diào)的是強(qiáng)化學(xué)習(xí)里面最難的一部分是當(dāng)人工智能的機(jī)器人它不能全部觀察周?chē)氖澜?,只能部分觀察,所以這個(gè)有一個(gè)很怪的名字,叫做基于部分觀察的馬爾可夫的決策過(guò)程,簡(jiǎn)化來(lái)說(shuō)它是強(qiáng)化學(xué)習(xí)里非常難的階段。第三個(gè)就是遷移學(xué)習(xí),它能讓我們把一個(gè)做好的模型遷移到一個(gè)新的領(lǐng)域來(lái),所以我們希望這樣一個(gè)系統(tǒng)它能具有以下這兒功能,比方說(shuō)閑聊、推薦、引導(dǎo)、提醒、學(xué)習(xí),這個(gè)我們看到如果它具有這些功能的話(huà),它就像一個(gè)真人一樣。
怎么達(dá)到這樣呢?我們首先要有基本的對(duì)話(huà)功能,就是深度學(xué)習(xí)的對(duì)話(huà)功能,其次我們要有一個(gè)策略,這個(gè)策略要能引導(dǎo)對(duì)話(huà)的對(duì)象去完成一個(gè)任務(wù)。最后我們要能實(shí)現(xiàn)個(gè)性化,我們最好能夠貼近用戶(hù),讓用戶(hù)跟它對(duì)話(huà)以后,這個(gè)體驗(yàn)覺(jué)得非常好,非常簡(jiǎn)潔明了。怎么才能達(dá)到這一點(diǎn),這就是我們的一些例子,比方說(shuō)我們現(xiàn)在和一個(gè)O2O的公司合作,用真實(shí)的數(shù)據(jù)來(lái)訓(xùn)練這個(gè)系統(tǒng),這個(gè)綠色的就是用戶(hù)提的問(wèn)題,白色的是系統(tǒng),我們這個(gè)中文名字叫做“魔鏡系統(tǒng)”,就是白雪公主里面的魔鏡,當(dāng)然這是一個(gè)好的魔鏡。
剛才的這個(gè)系統(tǒng),它的演示,我們是把整個(gè)的對(duì)話(huà)系統(tǒng)給放到一個(gè)機(jī)器人的里面,讓機(jī)器人通過(guò)語(yǔ)音跟我們回答,實(shí)際上這個(gè)真正的系統(tǒng)是在手機(jī)上可以和人交流的。這里我要跟我們大家熟悉的一些系統(tǒng)來(lái)做比較,比方說(shuō)小冰的話(huà),左邊是用戶(hù)提的問(wèn)題,綠色的,黃色這里是小冰的回答,這是真實(shí)的一個(gè)截圖。我們看小冰雖然很調(diào)侃,我們也試著用siri來(lái)做回答,siri是基于搜索,它很多的就是抱歉沒(méi)有找到匹配。
我們這樣一個(gè)系統(tǒng)之所以研究它,是我們對(duì)背后的系統(tǒng)感興趣,所以有這樣的應(yīng)用領(lǐng)域,我們剛剛講的幾個(gè)條件,首先我們有很明確的目標(biāo),有很好的反饋,有不斷到來(lái)的數(shù)據(jù),然后我們也有跨界的人才,我們和O2O公司的聯(lián)絡(luò)。另外這個(gè)問(wèn)題最后我們是有非常明確的,不一定有明確的邊界條件,使得我們最后把這個(gè)問(wèn)題的表達(dá)就好像是在下圍棋一樣,因此我們這里面也可以考慮說(shuō)我們現(xiàn)在談話(huà)談到這兒,到底離我們的目標(biāo)有多遠(yuǎn),這就好像在下棋里面我們有一個(gè)狀態(tài)網(wǎng)絡(luò),我們對(duì)現(xiàn)在的狀態(tài)有一個(gè)估算,同時(shí)我們可以往下問(wèn)的不同的話(huà),可以當(dāng)做我們下面要下的棋子,所以這和阿爾法狗的思維有很相象的地方。
有一個(gè)非常有趣的現(xiàn)象,就是這樣一個(gè)三層的模型,我剛才講的深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)還有遷移學(xué)習(xí),這樣一個(gè)模型是非常通用的,對(duì)話(huà)領(lǐng)域是我們的適用場(chǎng)所,這樣的模型把它放到完全不一樣的應(yīng)用領(lǐng)域去它也能工作,這就是通用型的發(fā)展目標(biāo),比如我們有的學(xué)生就把它應(yīng)用在大家公認(rèn)很難的領(lǐng)域,就是股市大勢(shì)的預(yù)測(cè)。這是A股里面的某個(gè)股票,我們拿過(guò)去好多年的數(shù)據(jù),十年的數(shù)據(jù)做訓(xùn)練,所有數(shù)據(jù)之間的連接,首先我們產(chǎn)生不同的狀態(tài),讓這個(gè)狀態(tài)之間能夠互相遷移。其次是狀態(tài)和狀態(tài)之間的變化,我們用一個(gè)強(qiáng)化學(xué)習(xí)來(lái)模擬,最后我們發(fā)現(xiàn)深度學(xué)習(xí)的隱含層里面它自動(dòng)產(chǎn)生出來(lái)的幾百個(gè)狀態(tài),基本就把這幾年的經(jīng)濟(jì)狀況給了一個(gè)很完善的總結(jié),所以它可以給一個(gè)非常好的大勢(shì)的走向,我們也做了一些測(cè)試。
這個(gè)例子當(dāng)然是在金融領(lǐng)域的一個(gè)小的試驗(yàn),所以我應(yīng)該說(shuō)這個(gè)是我們有所保留的,但是我想說(shuō)的事情是一旦我們對(duì)一個(gè)領(lǐng)域有了足夠的了解,一旦這個(gè)領(lǐng)域足夠的數(shù)據(jù)我們掌握了,我們就可以套用人工智能,剛剛講的一個(gè)邊界清晰的方法來(lái)解決它,以達(dá)到通用型的人工智能的目的。
我下面要講的,最后一個(gè)題目就是如何能做到個(gè)性化,這里其實(shí)有兩個(gè)題目:一個(gè)是我個(gè)人就是有一個(gè)很強(qiáng)烈的感覺(jué),深度學(xué)習(xí)是離不開(kāi)大數(shù)據(jù)的,大數(shù)據(jù)又離不開(kāi)大公司,我們熟知的一些大公司都是大數(shù)據(jù)的擁有者,我們有一些中型和小型公司沒(méi)有大數(shù)據(jù),也沒(méi)有這個(gè)能力去取得大數(shù)據(jù)。所以這里我說(shuō)像深度學(xué)習(xí),它的紅利來(lái)自于特征的選取,特征的準(zhǔn)確選取又離不開(kāi)大數(shù)據(jù),這些大數(shù)據(jù)只有富人才能得到。
強(qiáng)化學(xué)習(xí)是把重點(diǎn)放在另一個(gè)角度,就是反饋,就是世界對(duì)系統(tǒng)的反饋,這個(gè)反饋可以延遲,但是它的訓(xùn)練也離不開(kāi)大數(shù)據(jù),也是一個(gè)富人的游戲。我們要達(dá)到世界上每一個(gè)人都可以用到人工智能,我們一定要做這樣的研究,就是如何能把一個(gè)大的模型,大數(shù)據(jù)訓(xùn)練出來(lái)的模型遷移到一個(gè)小數(shù)據(jù)的范圍內(nèi),讓它能在一個(gè)小數(shù)據(jù)上面也能起作用。它還帶來(lái)一個(gè)副產(chǎn)品,這個(gè)副產(chǎn)品就叫做個(gè)性化,也就是如果我們讓一個(gè)產(chǎn)品能夠有很強(qiáng)的用戶(hù)感覺(jué),用戶(hù)體驗(yàn),那么我們一定要達(dá)到個(gè)性化的效果,這個(gè)就是我們之所以做遷移學(xué)習(xí)的目的。
什么是遷移學(xué)習(xí)呢?就是我們?cè)谝粋€(gè)數(shù)據(jù)領(lǐng)域已經(jīng)有了很好的領(lǐng)域建立了非常好的模型,我們換一個(gè)模型也能讓它應(yīng)用,這樣既節(jié)省了資源,又達(dá)到時(shí)間和效果的好處。所以這樣的一個(gè)學(xué)習(xí)過(guò)程,把一個(gè)已有模型遷移到一個(gè)未知領(lǐng)域,就叫做遷移學(xué)習(xí)。所以我們?nèi)耸亲詣?dòng)地就會(huì)做這種舉一反三的嫌疑學(xué)習(xí)了,比如我們學(xué)會(huì)騎自行車(chē)以后,我們又去學(xué)摩托車(chē),發(fā)現(xiàn)很簡(jiǎn)單,我們打球、學(xué)語(yǔ)言、學(xué)物理化學(xué)也有很多這樣的例子。遷移學(xué)習(xí)大家也有了將近十年的努力,也積累了大量的文獻(xiàn),這里我總結(jié)一下,通過(guò)幾種不同的方式,我們可以達(dá)到遷移,每一種方式都是很直觀的。第一種就是我們?cè)跀?shù)據(jù)集里面找到跟目標(biāo)領(lǐng)域相似的數(shù)據(jù),把這個(gè)數(shù)據(jù)放大多倍,這個(gè)叫做樣本遷移,通過(guò)樣本來(lái)達(dá)到遷移的目的。其次我們可以觀察到有些相似的特征,然后利用這些特征,在不同的層次的特征,來(lái)進(jìn)行自動(dòng)的遷移,這種叫做特征遷移。然后我們還可以做到基于模型的遷移,這是這樣的一個(gè)工作。利用上千萬(wàn)的圖象來(lái)訓(xùn)練一個(gè)圖象識(shí)別的系統(tǒng),我們遇到一個(gè)新的圖象領(lǐng)域,我們就不用再去找?guī)浊f(wàn)個(gè)圖象來(lái)訓(xùn)練了,我們就把原來(lái)的那個(gè)遷移到新的領(lǐng)域,所以在新的領(lǐng)域只用幾萬(wàn)張圖片就夠,同樣可以得到很高的效果,這叫做模型遷移,模型遷移的一個(gè)好處是我們可以區(qū)分,就是可以和深度學(xué)習(xí)結(jié)合起來(lái),我們可以區(qū)分不同層次可遷移的度,相似度比較高的那些層次他們被遷移的可能性就大一些。最后我們也可以通過(guò)關(guān)系來(lái)進(jìn)行遷移,比方說(shuō)社會(huì)網(wǎng)絡(luò),社交網(wǎng)絡(luò)之間的遷移。
如果用了遷移學(xué)習(xí),我剛才講一個(gè)副產(chǎn)品就是從很多人的大數(shù)據(jù)遷移到一個(gè)人的小數(shù)據(jù)上,這樣可以達(dá)到一個(gè)效果,比方說(shuō)我們僅用一個(gè)用戶(hù)的九個(gè)對(duì)話(huà)來(lái)訓(xùn)練這樣的一個(gè)遷移學(xué)習(xí)的效果,從一個(gè)三萬(wàn)人得到的大模型遷移到一個(gè)人的小模型身上,這個(gè)效果在強(qiáng)化學(xué)習(xí)的基礎(chǔ)上做起來(lái)就特別地得心應(yīng)手,因?yàn)閺?qiáng)化學(xué)習(xí)就使得我們能夠把遷移的結(jié)果變成短路,就好像是在電路當(dāng)中的短路,使得我們能夠不用很煩瑣的去問(wèn)用戶(hù)很多同樣的問(wèn)題。
對(duì),剛剛有幾個(gè)部分,其實(shí)系統(tǒng)都沒(méi)有具體地去問(wèn)答案,它基本上就在問(wèn)還是上一次那個(gè)答案嗎?還是送到你家嗎?這樣就節(jié)省了很多,所以就是這樣。
最后我就來(lái)再總結(jié)一下,就是我剛剛講的這幾個(gè)必要條件,剛才我是通過(guò)舉第一個(gè)例子谷歌Deepmind,第二個(gè)是強(qiáng)化遷移學(xué)習(xí),就是三層的結(jié)構(gòu),同時(shí)我講了具有通用性、個(gè)性化的學(xué)習(xí)。這里我要再次強(qiáng)調(diào)一下我們總結(jié)的幾個(gè)條件:一個(gè)是要有清晰邊界的問(wèn)題定義,一定要有持續(xù)不斷的外部反饋,要有足夠的計(jì)算資源、要有頂尖的數(shù)據(jù)科學(xué)家還要有足夠質(zhì)量的大數(shù)據(jù)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章