0
本文作者: 劉子榆 | 2017-02-12 15:39 | 專題:AAAI 2017 |
朱小燕教授在雷鋒網(wǎng)組織的 AAAI 中國之夜活動(dòng)上進(jìn)行分享
在雷鋒網(wǎng)組織的 AAAI 中國之夜活動(dòng)上,AAAI 現(xiàn)任執(zhí)委楊強(qiáng)教授、清華大學(xué)智能技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室主任、信息獲取課題組的學(xué)術(shù)帶頭人朱小燕教授、今日頭條實(shí)驗(yàn)室總監(jiān)李磊、iFly.vc 合伙人沈瀚、物靈科技人工智能首席科學(xué)家吳惟心、iPIN 創(chuàng)始人楊洋在現(xiàn)場(chǎng)做了分享。沙龍從下午五點(diǎn)半持續(xù)到晚上九點(diǎn),據(jù)雷鋒網(wǎng)現(xiàn)場(chǎng)編輯團(tuán)隊(duì)表示,活動(dòng)氛圍非常熱烈。
本篇是雷鋒網(wǎng)根據(jù)朱小燕教授在現(xiàn)場(chǎng)的分享整理而成。朱小燕教授所在的研究小組近十幾年來在自然語言處理、文本挖掘、問答/對(duì)話系統(tǒng)等領(lǐng)域,針對(duì)文本信息內(nèi)容,在信息度量、知識(shí)表示等方面進(jìn)行了過深入研究。發(fā)表論文100余篇,曾經(jīng)獲得Coling2010最佳論文、ACL2012最佳學(xué)生論文。目前主要工作圍繞基于知識(shí)的智能信息獲取、基于語義的信息服務(wù)展開。
互聯(lián)網(wǎng)為人類生活帶來了翻天覆地的變化。我們都覺得互聯(lián)網(wǎng)是無所不能的,大家都說內(nèi)事找百度,外事找 Google。但是,經(jīng)過一段時(shí)間的研究,我們發(fā)現(xiàn),實(shí)際上從互聯(lián)網(wǎng)上用搜索技術(shù)能夠直接得到的信息最多也就是70-80%。因?yàn)?,有些表達(dá)結(jié)果的內(nèi)容不是簡(jiǎn)單地,以顯性的形式放在那里,而是要通過邏輯分析推理才能夠得到的。人類最偉大的地方是發(fā)明了文字。它將語言記錄下來,文字描述的內(nèi)容中蘊(yùn)含了豐富的知識(shí)沉淀,代代相傳,是的人類能夠 “站在巨人的肩膀上”去了解這個(gè)世界,推動(dòng)這個(gè)世界發(fā)展。如果在對(duì)互聯(lián)網(wǎng)信息處理的時(shí)候,不使用知識(shí),而僅僅是依賴互聯(lián)網(wǎng)表面的內(nèi)容的話,就會(huì)像現(xiàn)在女孩家里的東西一樣,買買買,但是買了之后沒有很好分類、入庫、管理。不停的堆積,很多東西很快就找不到了,也就不去找了,再去繼續(xù)地買買買……即影響使用時(shí)的效率,又造成無比的浪費(fèi)。因此,現(xiàn)代的智能信息處理必須要充分地利用各種知識(shí)。
我們現(xiàn)在生活在信息社會(huì),信息如何表示、信息與信息之間的關(guān)系如何度量(使用什么度量衡,什么叫大小,什么叫相似?)人類的知識(shí)絕大多數(shù)是以文字形式存儲(chǔ)的。知識(shí)如何表示、知識(shí)與知識(shí)之間的關(guān)系如何計(jì)算?這些問題在信息社會(huì),尤其在全社會(huì)都非常迫切地希望利用AI技術(shù)進(jìn)行智能信息處理的今天,變得越來越重要。
因此我們?cè)?jīng)提出過一個(gè)努力的目標(biāo):信息能夠度量,知識(shí)能夠計(jì)算?,F(xiàn)在主要工作之一也在做各種努力使得智能信息處理系統(tǒng)能夠建立在知識(shí)庫的基礎(chǔ)上,對(duì)知識(shí)進(jìn)行各種處理和調(diào)用,使之能夠在系統(tǒng)計(jì)算框架中起到應(yīng)有的作用。
此外,朱小燕教授還以一名被咨詢者的角度分享了她本人對(duì)從業(yè)者的一些建議。要做好AI+,以下四個(gè)方面需要注意:
第一, 要想“+”人工智能,企業(yè)本身就需要清楚自己到底想要AI為你改變些什么。希望“+AI”后面產(chǎn)生什么變化(結(jié)果),比如產(chǎn)品想換個(gè)大方向還是換一個(gè)新面孔? 用它來創(chuàng)業(yè),你必須要清楚所做的是否能夠真正體現(xiàn)人工智能的特色。 這樣人工智能工程師才會(huì)能幫你。
第二,要跟人工智能專家溝通。目前的AI技術(shù)絕對(duì)是有可為而且有可不為的。有的成熟了,有的還在嘗試甚至是幻想階段。產(chǎn)品設(shè)計(jì)時(shí)要用成熟的技術(shù)才有可能達(dá)到實(shí)用效果,產(chǎn)品才能上線?;蛘呔褪窃诖笃髽I(yè)研究院做概念產(chǎn)品,也行。例如,在學(xué)術(shù)界,現(xiàn)在的最先進(jìn)的機(jī)器人靈巧操作必須是觸覺、視覺、控制,甚至還有語音的交互的多模態(tài)融合系統(tǒng)才是有挑戰(zhàn)性的。國際比賽,十樣?xùn)|西堆放在一起,在視覺引導(dǎo)下兩個(gè)小時(shí)抓起來四個(gè)就是第一,有好幾個(gè)組一個(gè)都沒抓起來。因?yàn)橹甘疽サV泉水瓶,抓起來香蕉,不算成功,要眼手配合,眼指揮手上下左右自由行動(dòng)靈巧抓取才行?,F(xiàn)在的機(jī)器人多任務(wù)靈巧操作/抓取離實(shí)用還有一定距離了。期待機(jī)器人(臂)像人甚至像猴子那樣在樹枝上采摘蘋果,是不太現(xiàn)實(shí)的。而且也沒必要。實(shí)際產(chǎn)品沒必要要求做多維度靈巧抓取,3-4個(gè)維度就可以了,看起來沒有電影里的機(jī)器人那么酷,但是能夠比較好地完成自動(dòng)采摘任務(wù)。有公司已經(jīng)設(shè)計(jì)出產(chǎn)品,看起來挺靠譜。
第三,關(guān)于數(shù)據(jù)。大家會(huì)覺得有很多(大)數(shù)據(jù)。但是需要考慮一下:這些數(shù)據(jù)你真的能拿到嗎?即便在手真的好用嗎?之前有個(gè)世界五百強(qiáng)的企業(yè)跟我們說手上有很多數(shù)據(jù),確實(shí)是。而且提出的任務(wù)也是非常符合人工智能信息處理的場(chǎng)景的。但是項(xiàng)目開始后不斷發(fā)現(xiàn)問題,幾經(jīng)周折,第一期的數(shù)據(jù)終于到手,不過,從中提取出來的有用信息基本上是 0。這個(gè)任務(wù)可真是“任重而道遠(yuǎn)”,值得慶幸的是最終應(yīng)該能夠完成。數(shù)據(jù)處理的時(shí)間和資源消耗是非常大的,而且在一些場(chǎng)景下是一時(shí)的,在另一些場(chǎng)景下將會(huì)是永遠(yuǎn)的,沒有一定的經(jīng)濟(jì)實(shí)力和思想準(zhǔn)備,是很困難的。另一方面如果數(shù)據(jù)與時(shí)間相關(guān)與社會(huì)媒體內(nèi)容相關(guān),比如社會(huì)輿情數(shù)據(jù),就更要考慮數(shù)據(jù)獲取的穩(wěn)定性,如果不能及時(shí)第一手拿到或者產(chǎn)生數(shù)據(jù),萬一被人掐住,可能會(huì)直接威脅到產(chǎn)品的生命。
第四,通用人工智能是很難的。語音處理是通用性比較好的一個(gè)領(lǐng)域,圖像其次。文字是語言語義的沉淀積累,現(xiàn)在要在其上邊在做語義處理,就是更加具有挑戰(zhàn)性的了。我們現(xiàn)在在做的問答對(duì)話系統(tǒng),也想做成通用的。但是一句話叫隔行如隔山啊,做什么都能干的東西是挺困難的。另外一個(gè)方面,還需要注意的是在領(lǐng)域?qū)<液图夹g(shù)專家之間要有一個(gè)溝通,有很多領(lǐng)域?qū)S械谋磉_(dá)形式在面向大眾的產(chǎn)品中是難以被理解的。
如果說到有什么可發(fā)展的地方,我個(gè)人期待語音再往前邁一步,使得我們60歲以上的尤其是南方老人也能夠比較自如地使用語音與機(jī)器交互了,那么在居家養(yǎng)老領(lǐng)域應(yīng)該能夠有更好的產(chǎn)品出來。語音技術(shù)和產(chǎn)品在別的方向上很好,但是離用到老人使用還差那么一點(diǎn)點(diǎn),就這樣一點(diǎn)點(diǎn)就很重要。對(duì)于孩子而言,這個(gè)東西怎樣才能讓他們不是玩了兩天就膩了,而是成為他們真的意義上的一個(gè)陪伴,這還真挺難的,挑戰(zhàn)不在技術(shù)。
在分享的最后,雷鋒網(wǎng)還向朱小燕教授請(qǐng)教了做 NLP 學(xué)術(shù)和產(chǎn)業(yè)有什么不同的問題。
朱小燕教授說做計(jì)算機(jī)應(yīng)用領(lǐng)域的學(xué)術(shù)研究,內(nèi)容應(yīng)該是跳起來能夠夠得著的,當(dāng)下不那么踏實(shí),但是,條件好了就能夠使用。比如某研究院說要做能夠觀察人的面部表情情感變化,做能夠進(jìn)行情感交流的機(jī)器人。作為研究可以,作為概念產(chǎn)品可以試試,作為賺錢的產(chǎn)品就比較困難了。首先你就要叫計(jì)算機(jī)知道什么叫表情變化,大喜大悲容易,平時(shí)的細(xì)微表情變化就難了。又有多少人會(huì)察言觀色,會(huì)到什么程度?家庭陪伴機(jī)器人假定的服務(wù)對(duì)象多半是老人,老人臉上就更不容易識(shí)別出喜怒哀樂的變化了。這些做研究是可以,有能力的企業(yè)可以做這樣的研究做基礎(chǔ)沉淀和展示,但是做產(chǎn)業(yè)就要想清楚了。再比如做陪伴老人的機(jī)器人產(chǎn)品。如果是行走機(jī)器人就要想清楚,機(jī)器人腿腳不方便,老人腿腳也不方便,兩個(gè)腿腳不方便的在一起(笑)。這個(gè)東西還有不少問題需要解決。但是研究肯定是可以的。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章