0
雷鋒網(wǎng) AI 科技評(píng)論按:12 月 13 日,谷歌開發(fā)者大會(huì) 2017 在上海召開,多名谷歌工程師和重量級(jí)嘉賓登臺(tái)演講,宣布了許多振奮人心的消息,美國(guó)工程師的中文演講也讓現(xiàn)場(chǎng)聽眾覺得親切有趣。
最令廣大 AI 研究和從業(yè)者感興趣的,是谷歌云首席科學(xué)家李飛飛宣布谷歌 AI 中國(guó)中心在北京成立,并且也正是由李飛飛和她曾經(jīng)的博士生、現(xiàn)在的谷歌云研發(fā)負(fù)責(zé)人李佳共同領(lǐng)導(dǎo)谷歌 AI 中國(guó)中心的工作。谷歌云 AI、谷歌大腦以及谷歌的中國(guó)本土團(tuán)隊(duì)的工作也將由李飛飛統(tǒng)籌。
在李飛飛的主會(huì)場(chǎng)演講結(jié)束后,李飛飛和李佳來(lái)到分會(huì)場(chǎng),和受邀請(qǐng)參與面對(duì)面溝通活動(dòng)的學(xué)生、教授、AI 從業(yè)人員以及媒體進(jìn)行了更多溝通和交流。
李佳也在現(xiàn)場(chǎng)進(jìn)行了一個(gè)小演講,介紹了她帶領(lǐng)的谷歌云研發(fā)團(tuán)隊(duì)近期的一些研發(fā)思路和技術(shù)產(chǎn)品。雷鋒網(wǎng) AI 科技評(píng)論也有記者在現(xiàn)場(chǎng)參與活動(dòng),我們把演講的主要內(nèi)容整理如下。
李佳:很高興在這里見到大家,我叫李佳。我是谷歌云 AI 的研發(fā)主管,自己也是一個(gè)開發(fā)者,今天想在這里分享一下 AI 研究的一些心得和谷歌云團(tuán)隊(duì)研發(fā)的 AI 的一些應(yīng)用。
在過(guò)去的幾天里我花了很多的時(shí)間練習(xí)用中文說(shuō)話。這是我第一次用中文演講,如果有很多的英文或者是說(shuō)英文的單詞,請(qǐng)大家諒解。我一度曾經(jīng)想放棄,想用英文來(lái)講,但是今天看到有這么多的我們外國(guó)的友人,在很拼命的用中文來(lái)講,我感到非常的慚愧。練習(xí)到昨天我還發(fā)覺,大概我的演講里面大概 70% 的部分還是英文的單詞,但是我希望今天能做的更好一點(diǎn)。
今天我想講這個(gè)的原因是,作為一個(gè)開發(fā)者,我自己覺得很幸運(yùn),可以參與一個(gè)想法到成為一個(gè)完成產(chǎn)品的過(guò)程,所以我今天在這里想給大家分享這樣的一個(gè)歷程。希望有更多的人投身到這樣過(guò)程當(dāng)中,能夠促成 AI 產(chǎn)品的產(chǎn)生。我把這個(gè)過(guò)程叫做 AI Journey(AI 歷程)。
它有幾個(gè)主要的組成部分。
首先,不管我們想要做任何的 AI 也好,它總是從問(wèn)題本身開始,我們想要發(fā)覺、發(fā)現(xiàn)哪一個(gè)問(wèn)題值得去解決,這就是第一步。
有了這個(gè)問(wèn)題以后,我們就會(huì)去升級(jí),去考慮用什么樣的方式來(lái)表現(xiàn)這個(gè)問(wèn)題,這就是第二步。
一旦有了我們的數(shù)據(jù)過(guò)后,我們可以在數(shù)據(jù)上面有很多很多的應(yīng)用,有很多的算法的創(chuàng)新。
最后一步就是一旦我們有了很好的算法過(guò)后,我們?cè)鯓影阉兊酶?,更?zhǔn)確。經(jīng)過(guò)了這些過(guò)程,它就會(huì)成為一個(gè)很成熟的產(chǎn)品技術(shù)。
這個(gè) AI 的歷程通常是從最初的問(wèn)題定義開始,比如圖像分類識(shí)別。如果想從這個(gè)圖里面識(shí)別出有個(gè)毛線團(tuán),這個(gè)問(wèn)題的表達(dá)形式有很多種,它的解決方案也有各種各樣的。
從 ImageNet 數(shù)據(jù)集發(fā)布以后,很多的研究者在它上面去運(yùn)行他們的算法,很大推動(dòng)了這個(gè)領(lǐng)域的發(fā)展。最近我們自己在上面也有一些小的嘗試。
可能在座的同學(xué)們、老師們,你們有一些人可能聽說(shuō)過(guò) Neural Architecture Search(神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索),這個(gè)就是我們最早的一些嘗試。開始是由我們研究的一個(gè)算法,最近我們谷歌云和谷歌的其他的一些團(tuán)隊(duì),也在這上面做了一些新的嘗試。這個(gè)是什么樣的算法呢?它會(huì)嘗試搜索、組合不同的基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu),形成一個(gè)完整的網(wǎng)絡(luò)。它的最終目的,是想讓機(jī)器自動(dòng)生成神經(jīng)網(wǎng)絡(luò)。圖中是一個(gè)例子,我們?cè)趺礃由稍?nbsp;ImageNet 和 CIFAR 上有良好表現(xiàn)的神經(jīng)網(wǎng)絡(luò)。
現(xiàn)在在我們最新的嘗試?yán)锩妫@種機(jī)器生成的算法已經(jīng)是頂級(jí)的了。但我想提醒大家的是,雖然這是一個(gè)很激動(dòng)人心的技術(shù)發(fā)展成果,但是,目前這種機(jī)器生成的模型只局限于某一個(gè)特定的問(wèn)題,是端到端的一種解決方案。但是在現(xiàn)實(shí)生活中,或者對(duì)于現(xiàn)實(shí)當(dāng)中的問(wèn)題,會(huì)涉及到許許多多不同技術(shù)的共同應(yīng)用。在這個(gè)例子里面,數(shù)據(jù)都是收集好的,但是在很多的情況里面我們是沒有辦法收集數(shù)據(jù)的,比如說(shuō)罕見的疾病,還有自然災(zāi)害當(dāng)中發(fā)生的問(wèn)題,很多的數(shù)據(jù)是非常難以收集的,或者是收集起來(lái)非常危險(xiǎn)的。
這里就有一個(gè)例子,在自動(dòng)駕駛技術(shù)中我們根本沒有辦法去訓(xùn)練算法如何應(yīng)對(duì)交通事故,或者比較罕見遇到的交通情況,因?yàn)闆]有這樣的數(shù)據(jù)。這種情況是否能有替代做法呢?我想提下這個(gè)模擬器的技術(shù)。這樣我們可以自由生成各種各樣的數(shù)據(jù),來(lái)表現(xiàn)這些復(fù)雜的情況。
另外一個(gè)有名的例子就是 AlphaGo 和很多很多的棋牌游戲,當(dāng)我們對(duì)游戲的規(guī)則非常明確了之后,就可以讓算法自己生成許多數(shù)據(jù),然后從生成的數(shù)據(jù)中學(xué)習(xí)。
這個(gè)技術(shù)經(jīng)常被用在遷移學(xué)習(xí)里面,我們可能在原有領(lǐng)域有很多數(shù)據(jù),但很難在新的領(lǐng)域收集同樣多的數(shù)據(jù);這是其中一個(gè)問(wèn)題。還有很多其它問(wèn)題,比如說(shuō)我們?cè)诠雀柙粕厦嬗龅降暮芏鄦?wèn)題,它們通常是沒有已知的解決辦法的,它們也沒有辦法找到這樣大量的數(shù)據(jù)。
我們這里要解決的是一個(gè)小數(shù)據(jù)的問(wèn)題,不是大數(shù)據(jù)的問(wèn)題。在這個(gè)過(guò)程中,遷移學(xué)習(xí)、模擬器技術(shù)都是非常值得去研究去探索的,在能夠真正的解決實(shí)際問(wèn)題之前,能夠達(dá)到我們希望的能夠處理任何情況之前,先用這樣的技術(shù)讓模型快速成長(zhǎng)。
我們同時(shí)也能挖掘出一個(gè)很大的寶藏,機(jī)器人技術(shù)。比如說(shuō)用模擬器的方法解決機(jī)器人技術(shù)的問(wèn)題。
我當(dāng)時(shí)和我的同事一起去把 Gazebo 平臺(tái)的代碼收集好,開放給大家來(lái)用。我們自己在上面做了一些探索,發(fā)現(xiàn)如果我們把大量的問(wèn)題放在里面,就算不是從直覺上能完美解決好的問(wèn)題,只要能夠把問(wèn)題和大規(guī)模計(jì)算、大規(guī)模仿真模擬進(jìn)行結(jié)合的話,實(shí)際上它還是能得到非常好的效果的。
我剛才談到一些有關(guān)模擬器生成數(shù)據(jù)的探索,實(shí)際上算法也對(duì)這個(gè)領(lǐng)域至關(guān)重要,其中包含了怎么樣有效讓我們?nèi)酥笇?dǎo)機(jī)器來(lái)進(jìn)行學(xué)習(xí)。當(dāng)然,讓機(jī)器學(xué)習(xí)也還有各種不同的辦法。
我剛才談到了幾個(gè)比較小的例子,都有什么樣的問(wèn)題是值得我們?nèi)ソ鉀Q的。而數(shù)據(jù)中蘊(yùn)含的價(jià)值很多、數(shù)據(jù)的來(lái)源和用途很廣,我們實(shí)際需要數(shù)據(jù)相關(guān)技術(shù)來(lái)解決的問(wèn)題比剛才我談到的還要更廣泛。舉一些簡(jiǎn)單的例子,我們?cè)?nbsp;flickr 數(shù)據(jù)的數(shù)據(jù)清洗上面還是取得了一些令人振奮的結(jié)果。但是在這樣的技術(shù)上面,我們有很多的問(wèn)題需要去解決。我們最終需要考慮的是其中有什么樣的人、他們?cè)谧鲆恍┦裁礃拥氖虑?、里面還有怎么樣的內(nèi)容、從一個(gè)時(shí)間段到下一個(gè)時(shí)間段有哪些變化、這個(gè)變化怎么產(chǎn)生的。實(shí)際上我們作為數(shù)據(jù)領(lǐng)域的研究者還沒有特別多關(guān)注和投入在這些方面。
我剛才談到了機(jī)器人方面的很多問(wèn)題,另外一個(gè)大的方向是自然語(yǔ)言。大家看到有很多的好玩的聊天機(jī)器人,是一種為了好玩的、隨意的聊天。但是在我們?nèi)撕腿酥g,我們聊天的雙方或者是多方是有不同的背景的,整個(gè)聊天的過(guò)程是有一個(gè)希望達(dá)成的目的的。對(duì)話的目的的理解、利用和算法更新現(xiàn)在都做得不多。所以很多問(wèn)題,很多聊天的問(wèn)題是有一個(gè)目標(biāo)需要完成的,這樣才能讓機(jī)器和人類的交流更有價(jià)值。我們非常感興趣將來(lái)繼續(xù)探索這方面的問(wèn)題。
在谷歌云,我們有非常非常多的傳統(tǒng)的行業(yè)跟我們進(jìn)行合作,我們?cè)诟麄兘涣鞯倪^(guò)程或者溝通的過(guò)程,發(fā)覺有好多的問(wèn)題,我們整個(gè) AI 領(lǐng)域還沒有給予特別多的關(guān)注,比如說(shuō)其中一個(gè)就是 AI 醫(yī)療。
我們知道醫(yī)療技術(shù)里面,實(shí)際上有很多非常非常有意思的問(wèn)題,比如說(shuō)我們的醫(yī)生資源非常少,特別是中國(guó),一個(gè)醫(yī)生一天看上百人的病人,我覺得這對(duì)醫(yī)生來(lái)說(shuō)是非常繁重的勞動(dòng),而且病人也沒有得到足夠的關(guān)照。如果有更多的、足夠的時(shí)間去探討和理解他的疾病的話,應(yīng)該會(huì)非常有幫助。在很多發(fā)展中國(guó)家,甚至都沒有很多的醫(yī)生來(lái)幫助這些病人解決問(wèn)題。所以,我們想看看 AI 能怎么樣幫助解決這些問(wèn)題。
這里我想給一個(gè)比較簡(jiǎn)單的例子,我們自己在這上面做了一些小的、比較新的探索,實(shí)際上就是讓 AI 識(shí)別胸部 X 光片。
通常人類醫(yī)生做這個(gè)過(guò)程、判斷疾病的嚴(yán)重程度非?;〞r(shí)間,而且它對(duì)醫(yī)生的要求也非常高。假設(shè)我們?nèi)绻幸粋€(gè)基于 AI 的 X 光疾病識(shí)別算法,就可以極大地減少人類醫(yī)生的工作量。但這里也有一個(gè)悖論:一方面,我們想做這樣的 AI 去幫助醫(yī)生做一些判斷,幫助醫(yī)生對(duì)疾病形成更好、更深的理解;而通?,F(xiàn)在的技術(shù)就是深度學(xué)習(xí),如果我們要做這個(gè)問(wèn)題的話,深度學(xué)習(xí)會(huì)需要大量的標(biāo)注數(shù)據(jù)才能做出一些成果。這樣就回到了我們開始想要解決的問(wèn)題:我們本來(lái)是想幫我們的人員減少他們的工作量,減少他們對(duì)數(shù)據(jù)的處理,結(jié)果我們做這些事情,反而要讓他們處理更多的數(shù)據(jù)。
我們這里就開始在看怎么樣去解決這個(gè)具體問(wèn)題。通常來(lái)說(shuō),如果我們要去獲取這種標(biāo)注數(shù)據(jù),對(duì)做標(biāo)注的醫(yī)生要求是非常高的。不過(guò)其實(shí)我們有很多的 X 光圖像都是帶有醫(yī)學(xué)的報(bào)告的,這些醫(yī)學(xué)的報(bào)告來(lái)自于以往積累的真實(shí)診療記錄。我們合作研究的醫(yī)院有十多萬(wàn)張 X 光圖像,然而在這么大量的圖像里面只有小于一千張有這種帶邊界框的數(shù)據(jù)標(biāo)注。
我們最近一段時(shí)間對(duì)這個(gè)問(wèn)題進(jìn)行了一些探討,去考慮如何用深度學(xué)習(xí)的方法來(lái)解決這個(gè)問(wèn)題。中間我們的 Wang Chong 博士也是對(duì)這個(gè)項(xiàng)目的學(xué)習(xí)算法貢獻(xiàn)非常大,我們想的是怎么用半監(jiān)督學(xué)習(xí),和這些小量的數(shù)據(jù),用一個(gè)算法來(lái)極大地提高了這些少量數(shù)據(jù)的有效性。這樣的結(jié)果我們就可以不但有對(duì)這個(gè)疾病的類別的判定,同時(shí)還能給我們的一些建議,怎么樣解決這個(gè)問(wèn)題。
這是一個(gè)簡(jiǎn)單的例子去怎么看從我們?nèi)绾稳ピO(shè)計(jì)算法。在我們這個(gè)里面,我們還有做很多的嘗試,中間包括數(shù)據(jù)收集和總體解決方案的建立。我剛才介紹到對(duì) AI 醫(yī)療的領(lǐng)域,我們整個(gè)團(tuán)隊(duì)也是非常感興趣。因?yàn)橛泻芏嗟男袠I(yè)的這種合作,所以我們也會(huì)用開放的態(tài)度積極參與。用 AI 改善人們的生活是我們非常關(guān)注的問(wèn)題,我們想用 AI 來(lái)對(duì)相關(guān)行業(yè)做出更多的貢獻(xiàn)。
在中國(guó)我們有很多有意思的事情在計(jì)劃中或者是說(shuō)已經(jīng)在執(zhí)行了,今天給大家介紹了一些我們近期做的技術(shù)和產(chǎn)品,給大家分享了一下我們?cè)谧龅氖虑椤V蟮臅r(shí)間里也希望谷歌 AI 中國(guó)中心的研究員們能和全中國(guó)的 AI 學(xué)生、專家、教授們都有更多的合作,合力解決更多尚未解決的問(wèn)題。
謝謝大家!
(完)
在面對(duì)面交流活動(dòng)結(jié)束后,許多專家、教授也紛紛在朋友圈發(fā)出活動(dòng)照片,這是對(duì)谷歌想要在中國(guó)大力開展廣泛的 AI 合作研究的愿景的認(rèn)可,也是更深入、更豐富的未來(lái) AI 研究態(tài)勢(shì)的前站。雷鋒網(wǎng) AI 科技評(píng)論也會(huì)繼續(xù)關(guān)注谷歌 AI 中國(guó)中心,以及更多谷歌下屬機(jī)構(gòu)在中國(guó)展開的 AI 研究和開發(fā)合作狀況,共祝中國(guó) AI 繼續(xù)大踏步前進(jìn)、在基礎(chǔ)研究方面也做出更多更大的成果。
相關(guān)文章:
Google AI 中國(guó)中心在北京成立,由李飛飛李佳領(lǐng)導(dǎo)
谷歌開源 TFGAN,讓訓(xùn)練和評(píng)估 GAN 變得更加簡(jiǎn)單
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。