1
本文作者: 老王 | 2017-01-22 20:18 |
近日,多名 AI 大佬在科技大會(huì)中發(fā)表演講,分享了他們正在做的研究以及對(duì)目前 AI 進(jìn)展的評(píng)價(jià)。雷鋒網(wǎng)也跟隨大佬的步伐,從北京到硅谷全程跟進(jìn)。
人工智能發(fā)展到今天已有 60 年的歷史,成果累累,當(dāng)然也遺留了 60 多年沒有解決的問題。那么到底哪個(gè)問題 60 年都沒解決,而且會(huì)繼續(xù)延續(xù)下去,其中被人提及最多的就是如何賦予 AI 情商。
雷鋒網(wǎng)了解到,在 AI 研究方面,微軟有著 25 年的積累。環(huán)顧全球所有科技寡頭,鮮有可與微軟 AI 匹敵的公司。近日,微軟全球執(zhí)行副總裁、微軟人工智能負(fù)責(zé)人沈向洋在北京的“未來論壇”中發(fā)表了《有情商的人工智能,讓世界更美好》的演講,深入講述了自己多年的 AI 從業(yè)經(jīng)驗(yàn)、微軟 25 年的 AI 研究成果,以及他對(duì)賦予 AI 智商和情商的看法。
近期李飛飛教授在北京發(fā)表名為《視覺智能的探索》 (The Quest for Visual Intelligent)演講。李飛飛教授分別從四個(gè)視角講述了她眼里的AI,提到她加入谷歌后從事的幾項(xiàng)工作,并致力于推動(dòng)AI的多樣性發(fā)展。
李飛飛在演講過程中提到自己在谷歌的工作:
我們也開始把焦點(diǎn)轉(zhuǎn)向其它一些領(lǐng)域,尤其是視頻。我們要看看,圖片中學(xué)習(xí)到的東西能否復(fù)制到視頻領(lǐng)域中去,讓真實(shí)世界從中獲益。我們的實(shí)驗(yàn)室和谷歌YouTube團(tuán)隊(duì)合作,把YouTube上100萬個(gè)運(yùn)動(dòng)相關(guān)的視頻樣本抓取出來,它們分別屬于450種運(yùn)動(dòng)類別。我們希望有一天這樣的技術(shù)能夠幫助我們?nèi)ス芾?、索引和搜索大量的視頻和圖片。計(jì)算機(jī)能自動(dòng)對(duì)屏幕上的體育項(xiàng)目進(jìn)行分類,這里包括各種各樣的體育項(xiàng)目,武術(shù)、籃球、帆船運(yùn)動(dòng)等等。
最近我們的實(shí)驗(yàn)室,聯(lián)合谷歌和Facebook一起進(jìn)一步擴(kuò)展了我們工作的范圍,不僅僅能夠讓機(jī)器識(shí)別出運(yùn)動(dòng)的類型,而且可以看看單個(gè)隊(duì)員做了哪些事情。我們來看NBA的籃球,機(jī)器可以追蹤每個(gè)隊(duì)員在重要事件中的表現(xiàn),譬如三分球投籃成功等。
我們拿了一些安全監(jiān)控視頻(比如醫(yī)院里的),通過深度傳感器的視頻來進(jìn)行分析應(yīng)用,識(shí)別出當(dāng)中人的姿勢(shì)和動(dòng)作,這個(gè)是非常有價(jià)值的。
我們和歐洲一個(gè)火車站進(jìn)行了合作,將成百上千個(gè)視覺傳感器安裝在公共空間,利用這些計(jì)算機(jī)的傳感器來追蹤乘客的行動(dòng),火車站有數(shù)百萬的人流穿梭,通過這樣一種監(jiān)測(cè)可以幫助優(yōu)化火車站的空間,調(diào)整火車發(fā)車時(shí)間表。
在 AI Frontiers 會(huì)議上,鄧力博士為參會(huì)嘉賓做了口語對(duì)話系統(tǒng)的專題演講。雷鋒網(wǎng)與會(huì)記者將現(xiàn)場(chǎng)演講記錄下來,結(jié)合 PPT 為大家整理出這份演講實(shí)錄。此次鄧?yán)蠋熃榻B了口語對(duì)話系統(tǒng)的分類,三代演變史,以及三大研究前沿領(lǐng)域:
今天,我想講一講口語對(duì)話系統(tǒng)(Spoken Dialogue System)。 “Spoken Dialogue System” 成為一個(gè)術(shù)語已經(jīng)有 30 年了,現(xiàn)在我們也稱其為對(duì)話式交互界面(conversational UI),或者稱為“bots”。所以它有好幾個(gè)術(shù)語,但基本指的是同一件事。開發(fā)這類系統(tǒng),需要能夠與人對(duì)話,要么通過語音,要么通過文字。這次我專門講語音,以及這兩類 bots 之間的根本性區(qū)別。
第三代技術(shù)用深度學(xué)習(xí)取代了淺層學(xué)習(xí)的部分。和第二代技術(shù)一樣,數(shù)據(jù)被用來學(xué)習(xí)對(duì)話系統(tǒng)中的所有東西。第三代的神經(jīng)模型和表示遠(yuǎn)遠(yuǎn)比前兩代要強(qiáng)大,端到端的學(xué)習(xí)也變得可行。從兩年前開始,它吸引了全世界范圍內(nèi)巨大的研究興趣。但它也有許多局限性:
解釋、修補(bǔ)漏洞、更新系統(tǒng)仍然不容易。
在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和符號(hào)自然語言之間缺乏交互界面
跨領(lǐng)域的擴(kuò)展,但相當(dāng)多的研究在想辦法利用深度遷移學(xué)習(xí)和強(qiáng)化學(xué)習(xí)來實(shí)現(xiàn)
尚無明確的商業(yè)成功案例。
前天晚上,小度與“水哥”王昱珩人臉識(shí)別比賽播出,最終小度機(jī)器人以2:0勝出,然而這個(gè)結(jié)果似乎并不服眾。在很多論壇、貼吧里,充斥著大量百度“黑幕”的帖子,很多人懷疑這次王昱珩實(shí)際上是“被輸”。陰謀論太多,以至于《最強(qiáng)大腦》節(jié)目組不得不進(jìn)行了一場(chǎng)“澄清直播”,然而這場(chǎng)直播似乎并沒有多少效果,該黑的繼續(xù)黑,想罵的也仍然繼續(xù)罵。
同樣是帶有PR性質(zhì)的“人機(jī)大戰(zhàn)”,跟AlphaGo與李世乭對(duì)弈相比,為什么谷歌沒有被質(zhì)疑,反而達(dá)到了震驚全球的效果(因AlphaGo的影響,2016年甚至成為了“中國人工智能元年”),而百度這次有人工智能界的權(quán)威人物吳恩達(dá)坐鎮(zhèn),甚至當(dāng)事人王昱珩進(jìn)行一場(chǎng)“澄清直播”都顯得不夠。
為什么百度這場(chǎng)“人機(jī)大戰(zhàn)”會(huì)招徠這么多質(zhì)疑?
其中有一個(gè)很重要的部分,是“播出形式”對(duì)比賽的真實(shí)性打了折扣。AlphaGo與李世乭對(duì)弈戰(zhàn)況,是實(shí)時(shí)直播的。站在第三方觀戰(zhàn)的角度來說,觀眾可以看到比賽全程,雙方落下的每一步棋、思考時(shí)間等等細(xì)節(jié),都一覽無遺地呈現(xiàn)出來。所以李世乭“神之一手”這樣具有“戲劇化”的一幕才會(huì)一直到現(xiàn)在都被人們津津樂道,人們并不會(huì)去質(zhì)疑這是否是經(jīng)過了編排,因?yàn)橛^眾都是“親歷者”。
另外,第一期節(jié)目里,王峰是臨時(shí)受命上場(chǎng)的,人類在毫無準(zhǔn)備的情況下去對(duì)決一臺(tái)訓(xùn)練充足的機(jī)器,這種比賽規(guī)則并不公平。還有一點(diǎn),就是小度的語音問答系統(tǒng)的真實(shí)度確實(shí)不高,但是節(jié)目里卻營造出小度在跟主持人、嘉賓聊得風(fēng)生水起的效果,普通觀眾或許真的會(huì)因此認(rèn)為AI的能力已經(jīng)達(dá)到這樣的高度了。
總的來說,這次小度參加《最強(qiáng)大腦》遭黑,是因?yàn)檫@場(chǎng)秀里“若干個(gè)謊言包裹著真實(shí)”,確實(shí)有一點(diǎn)難以服眾,當(dāng)然你把它當(dāng)個(gè)娛樂節(jié)目來看,也就沒什么了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。