1
本文作者: 老王 | 2017-01-22 20:18 |
近日,多名 AI 大佬在科技大會中發(fā)表演講,分享了他們正在做的研究以及對目前 AI 進展的評價。雷鋒網(wǎng)也跟隨大佬的步伐,從北京到硅谷全程跟進。
人工智能發(fā)展到今天已有 60 年的歷史,成果累累,當然也遺留了 60 多年沒有解決的問題。那么到底哪個問題 60 年都沒解決,而且會繼續(xù)延續(xù)下去,其中被人提及最多的就是如何賦予 AI 情商。
雷鋒網(wǎng)了解到,在 AI 研究方面,微軟有著 25 年的積累。環(huán)顧全球所有科技寡頭,鮮有可與微軟 AI 匹敵的公司。近日,微軟全球執(zhí)行副總裁、微軟人工智能負責人沈向洋在北京的“未來論壇”中發(fā)表了《有情商的人工智能,讓世界更美好》的演講,深入講述了自己多年的 AI 從業(yè)經(jīng)驗、微軟 25 年的 AI 研究成果,以及他對賦予 AI 智商和情商的看法。
近期李飛飛教授在北京發(fā)表名為《視覺智能的探索》 (The Quest for Visual Intelligent)演講。李飛飛教授分別從四個視角講述了她眼里的AI,提到她加入谷歌后從事的幾項工作,并致力于推動AI的多樣性發(fā)展。
李飛飛在演講過程中提到自己在谷歌的工作:
我們也開始把焦點轉向其它一些領域,尤其是視頻。我們要看看,圖片中學習到的東西能否復制到視頻領域中去,讓真實世界從中獲益。我們的實驗室和谷歌YouTube團隊合作,把YouTube上100萬個運動相關的視頻樣本抓取出來,它們分別屬于450種運動類別。我們希望有一天這樣的技術能夠幫助我們?nèi)ス芾?、索引和搜索大量的視頻和圖片。計算機能自動對屏幕上的體育項目進行分類,這里包括各種各樣的體育項目,武術、籃球、帆船運動等等。
最近我們的實驗室,聯(lián)合谷歌和Facebook一起進一步擴展了我們工作的范圍,不僅僅能夠讓機器識別出運動的類型,而且可以看看單個隊員做了哪些事情。我們來看NBA的籃球,機器可以追蹤每個隊員在重要事件中的表現(xiàn),譬如三分球投籃成功等。
我們拿了一些安全監(jiān)控視頻(比如醫(yī)院里的),通過深度傳感器的視頻來進行分析應用,識別出當中人的姿勢和動作,這個是非常有價值的。
我們和歐洲一個火車站進行了合作,將成百上千個視覺傳感器安裝在公共空間,利用這些計算機的傳感器來追蹤乘客的行動,火車站有數(shù)百萬的人流穿梭,通過這樣一種監(jiān)測可以幫助優(yōu)化火車站的空間,調(diào)整火車發(fā)車時間表。
在 AI Frontiers 會議上,鄧力博士為參會嘉賓做了口語對話系統(tǒng)的專題演講。雷鋒網(wǎng)與會記者將現(xiàn)場演講記錄下來,結合 PPT 為大家整理出這份演講實錄。此次鄧老師介紹了口語對話系統(tǒng)的分類,三代演變史,以及三大研究前沿領域:
今天,我想講一講口語對話系統(tǒng)(Spoken Dialogue System)。 “Spoken Dialogue System” 成為一個術語已經(jīng)有 30 年了,現(xiàn)在我們也稱其為對話式交互界面(conversational UI),或者稱為“bots”。所以它有好幾個術語,但基本指的是同一件事。開發(fā)這類系統(tǒng),需要能夠與人對話,要么通過語音,要么通過文字。這次我專門講語音,以及這兩類 bots 之間的根本性區(qū)別。
第三代技術用深度學習取代了淺層學習的部分。和第二代技術一樣,數(shù)據(jù)被用來學習對話系統(tǒng)中的所有東西。第三代的神經(jīng)模型和表示遠遠比前兩代要強大,端到端的學習也變得可行。從兩年前開始,它吸引了全世界范圍內(nèi)巨大的研究興趣。但它也有許多局限性:
解釋、修補漏洞、更新系統(tǒng)仍然不容易。
在神經(jīng)網(wǎng)絡學習和符號自然語言之間缺乏交互界面
跨領域的擴展,但相當多的研究在想辦法利用深度遷移學習和強化學習來實現(xiàn)
尚無明確的商業(yè)成功案例。
前天晚上,小度與“水哥”王昱珩人臉識別比賽播出,最終小度機器人以2:0勝出,然而這個結果似乎并不服眾。在很多論壇、貼吧里,充斥著大量百度“黑幕”的帖子,很多人懷疑這次王昱珩實際上是“被輸”。陰謀論太多,以至于《最強大腦》節(jié)目組不得不進行了一場“澄清直播”,然而這場直播似乎并沒有多少效果,該黑的繼續(xù)黑,想罵的也仍然繼續(xù)罵。
同樣是帶有PR性質的“人機大戰(zhàn)”,跟AlphaGo與李世乭對弈相比,為什么谷歌沒有被質疑,反而達到了震驚全球的效果(因AlphaGo的影響,2016年甚至成為了“中國人工智能元年”),而百度這次有人工智能界的權威人物吳恩達坐鎮(zhèn),甚至當事人王昱珩進行一場“澄清直播”都顯得不夠。
為什么百度這場“人機大戰(zhàn)”會招徠這么多質疑?
其中有一個很重要的部分,是“播出形式”對比賽的真實性打了折扣。AlphaGo與李世乭對弈戰(zhàn)況,是實時直播的。站在第三方觀戰(zhàn)的角度來說,觀眾可以看到比賽全程,雙方落下的每一步棋、思考時間等等細節(jié),都一覽無遺地呈現(xiàn)出來。所以李世乭“神之一手”這樣具有“戲劇化”的一幕才會一直到現(xiàn)在都被人們津津樂道,人們并不會去質疑這是否是經(jīng)過了編排,因為觀眾都是“親歷者”。
另外,第一期節(jié)目里,王峰是臨時受命上場的,人類在毫無準備的情況下去對決一臺訓練充足的機器,這種比賽規(guī)則并不公平。還有一點,就是小度的語音問答系統(tǒng)的真實度確實不高,但是節(jié)目里卻營造出小度在跟主持人、嘉賓聊得風生水起的效果,普通觀眾或許真的會因此認為AI的能力已經(jīng)達到這樣的高度了。
總的來說,這次小度參加《最強大腦》遭黑,是因為這場秀里“若干個謊言包裹著真實”,確實有一點難以服眾,當然你把它當個娛樂節(jié)目來看,也就沒什么了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。