1
本文作者: 思睿 | 2015-08-27 15:22 |
人工智能的現(xiàn)實是:蘋果的虛擬語音助手 Siri 十分糟糕,多數(shù)時候她完全不知道你在說什么。即使當(dāng) Siri 識別出你的問題,有時也會用一個包含了網(wǎng)頁鏈接的頁面作為回應(yīng),并不會直接告訴你答案。
原因在于,蘋果的語音助理是建立在舊技術(shù)之上的。但即使 Siri 升級到最新的人工智能,她也遠(yuǎn)遠(yuǎn)不如有血有肉的真助理。人工智能在過去的幾年有了十足的進步,但它距離智能仍然有很長的路要走。
“M”是 Facebook 目前正在研發(fā)的全新虛擬助理,它也印證了這一點。
這一語音助手建立在 Facebook 即時通訊應(yīng)用 Messenger 之上。根據(jù)雷鋒網(wǎng)消息,M 于本周三亮相,舊金山灣區(qū)的數(shù)百名用戶開始測試這一功能了。毫無疑問,這是 Facebook 為了與 Siri、Google Now 和微軟的 Cortana 競爭而交出的答卷。不過,根據(jù) Facebook 的描述,它能夠執(zhí)行更廣的任務(wù),你能向 M 下達(dá)指令,幫你訂晚餐,規(guī)劃下一個假期等。
這是因為 M 會讓人工智能在人類的協(xié)同下,回應(yīng)你的問題。Wit.ai 的創(chuàng)始人 Alex Lebrun 表示:“人工智能試圖做一切事情,但它需要受到人類監(jiān)督”。雷鋒網(wǎng)曾介紹,Wit.ai 是 Facebook 收購的一家人工智能創(chuàng)業(yè)公司,幫助開發(fā)了 M。
在這個由人工智能驅(qū)動私人助理的大環(huán)境下,M 的誕生似乎是一種倒退。Facebook 才剛剛公開測試,目前還不清楚這種人機合作的方式,在擴展到更多普通用戶身上時能否跟上步伐。雖然這是一個違反直覺的方式,但實際上 M 可能更加智能的人工智能。
Facebook 的想法是,人類不僅僅能回答人工智能無法回答的問題,而且從長遠(yuǎn)來看,有利于提高它們能力。如今的人工智能,都至少需要獲得人類的一些訓(xùn)練。如果你想要一個系統(tǒng)能自動識別 YouTube 視頻中的貓咪,首先人類必須告訴它貓咪是什么樣,而且還必須標(biāo)注各種貓科動物的照片,提供其他必要的數(shù)據(jù)。通過人類對 M 提供支持,F(xiàn)acebook 正在以異常復(fù)雜的方式做這類事情。
具有諷刺意味的是,Wit.ai 提供的依然是很老的人工智能技術(shù)。這一技術(shù)基于兩個算法——條件隨機域和最大熵分類器。這兩個算法已經(jīng)服務(wù)于這個高科技世界十多年了。不過,這種方法為 M 在找到更好的人工智能技術(shù)之前,提供了跳板。
Lebrun 于2013年成立了 Wit.ai,之后開發(fā)了一個AT&T公司用于與客戶溝通的數(shù)字代理。Wit.ai 提供了一種可以幫助軟件程序員開發(fā)類似于 Siri 系統(tǒng)的服務(wù),其可以識別語音,并在一定程度上理解自然語言。這一服務(wù)正是基于上述所說的舊算法,但它不需要像蘋果和 Google 一樣,收集大量的語音數(shù)據(jù)就可以學(xué)會識別語音。
負(fù)責(zé) Messenger 的 Facebook 副總裁 David Marcus,之前曾想擴大 Messenger 的使用范圍,產(chǎn)生更多收入,之后他接觸到了 Lebrun 和他的公司。今年一月 Facebook 收購了這家僅有10人的創(chuàng)業(yè)公司,收購金額不詳。Marcus 表示,F(xiàn)acebook 拿下了“在全球人與人工智能交互中做的最好的團隊之一”。不過當(dāng)時,Lebrun 并不清楚 Facebook 要做什么。
約三個月后,他們團隊產(chǎn)生了開發(fā)一個運行在 Messenger 之上的虛擬助手的想法,但它不會是另一個 Siri。首先,它主要是通過文字溝通,而不是聲音。其次,它也會回答一系列更復(fù)雜的問題。Lebrun 表示:“如今有很多的人工智能助手,如 Siri、Google Now 和 Cortana,但應(yīng)用范圍有限。我們希望開始做一些更加雄心勃勃的事情,給人們他們真正想要的答案?!?/p>
當(dāng)你向 M 提問,人工智能會理解你的問題,并制定相應(yīng)的回應(yīng)。但它不會將結(jié)果發(fā)送給用戶,系統(tǒng)會先將結(jié)果發(fā)送給人工智能“培訓(xùn)師”——也就是 Wit.ai 團隊的員工。培訓(xùn)人員經(jīng)過審核,再決定為你提供所要尋找的內(nèi)容。
根據(jù) Lebrun 的說法,該人工智能可以自動完成大部分簡單的工作,例如講笑話。對于更復(fù)雜的任務(wù),比如預(yù)約駕駛考試,人類會在其中擔(dān)當(dāng)最繁重的工作,并會真正向目標(biāo)公司預(yù)約。
在有人為參與的任務(wù)中,人類會因特定的問題應(yīng)該如何回答,產(chǎn)生相應(yīng)的操作路線圖,每一步都會被記錄下來。未來,這些數(shù)據(jù)可以幫助推動基于深度學(xué)習(xí)而產(chǎn)生的更先進的系統(tǒng),基于深度學(xué)習(xí)的人工智能會通過機器的龐大網(wǎng)絡(luò)分析信息,這些網(wǎng)絡(luò)就像是在模仿人類大腦中的神經(jīng)元。
這種神經(jīng)網(wǎng)絡(luò)已經(jīng)被證明在識別圖像、識別語音、定向廣告,甚至是指導(dǎo)機器人擰上瓶蓋等方面極為有效。Facebook 現(xiàn)在使用神經(jīng)網(wǎng)絡(luò)來識別照片中的面部,確定哪些內(nèi)容可能是你想要在新鮮事中看到的。采用了 M 之后,它的目的就是將技術(shù)進一步在產(chǎn)品中應(yīng)用。
那么為什么不從一開始就用神經(jīng)網(wǎng)絡(luò)開發(fā) M 呢?如果沒有正確的數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)將無法提供如此強大的服務(wù)。有了幾千個數(shù)據(jù)點,你就可以開始建立一個模型,之后采用這一模型,就會得到更多的數(shù)據(jù),一旦你有了一百萬個數(shù)據(jù)點,就會得到一定程度的深度學(xué)習(xí)能力。
正如 Lebrun 所描述的那樣,這是一個非常宏大的計劃。即使將神經(jīng)網(wǎng)絡(luò)混合進去之后,F(xiàn)acebook 將在未來幾年繼續(xù)使用人類參與這項計劃。隨著 M 的不斷使用,它就需要更多的數(shù)據(jù)才能繼續(xù)提升。你知道的越多,你不知道的也越多。人工智能做的越多,也就有更復(fù)雜的任務(wù)需要去做。
隨著 M 的使用范圍擴大到越來越多的用戶,就需要越來越多的“培訓(xùn)師”。Lebrun 預(yù)計其培訓(xùn)人員的數(shù)量將會隨著用戶的數(shù)量的增長而增長,這會帶來的負(fù)擔(dān)將是巨大的。Messenger 目前有7億人在使用。
但同時,即使 Facebook 能夠保持系統(tǒng)持續(xù)運行,人工智能可能不會像 Lebrun 所期望的那樣快速進化。數(shù)字助理創(chuàng)業(yè)公司 x.ai 的 Dennis Mortensen 表示,讓人類和人工智能一起工作實際上可能會放慢改革的步伐。他拿無人駕駛汽車作類比,除了像Google這樣的完全無人駕駛,現(xiàn)在還有一種方式是在汽車中逐漸加入智能功能。但后者的問題是,它可能并不會最終達(dá)到完全的無人駕駛,畢竟所收集的數(shù)據(jù)可能人工智能并不需要。
但Mortensen也承認(rèn)了數(shù)據(jù)的重要性,并表示,如果Facebook適當(dāng)使用了培訓(xùn)師,或許能為人工智能找到捷徑,不過它要將重點放在未來,而不是看它現(xiàn)在能做什么。
via wired
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。