1
本文作者: no name | 2016-10-28 11:36 |
雷鋒網(wǎng)按:本文轉(zhuǎn)載自微軟研究院AI頭條公眾號(hào)。
當(dāng)我們?cè)谟懻撊斯ぶ悄軙r(shí),請(qǐng)注意,我們通常在討論弱人工智能。
雖然我們現(xiàn)有的資源與之前可謂不同日而語(yǔ)——部署在云端的海量計(jì)算資源已經(jīng)像水和電一樣唾手可得了;互聯(lián)網(wǎng)所容納的信息也遠(yuǎn)遠(yuǎn)超過(guò)了過(guò)去幾千年來(lái)人們所有的知識(shí)儲(chǔ)備;以深度學(xué)習(xí)等為代表的機(jī)器學(xué)習(xí)算法的發(fā)展,也讓計(jì)算機(jī)能夠從這些龐大的數(shù)據(jù)中獲取知識(shí)。
但是我們也不得不正視一些事實(shí),當(dāng)前的人工智能更多的是針對(duì)某個(gè)具體的問(wèn)題,發(fā)展對(duì)應(yīng)的算法和技術(shù),有人稱之為“拼圖式”的工作方法:我們做出了視覺(jué)模塊、再拼上語(yǔ)音模塊、推理模塊——把每個(gè)子領(lǐng)域的功能做好,然后再組合出一個(gè)完整的智能系統(tǒng)出來(lái)。
微軟一直在為這份屬于全人類的人工智能大拼圖貢獻(xiàn)力量。從底層的可編程芯片F(xiàn)PGA,到Azure云平臺(tái)的部署,從微軟認(rèn)知工具包(Microsoft Cognitive Toolkit),到應(yīng)用層面的能供每一個(gè)沒(méi)有人工智能背景也能開(kāi)發(fā)出屬于自己的智能應(yīng)用的微軟認(rèn)知服務(wù)……隨著人工智能拼圖不斷趨于完整,科學(xué)家們始終會(huì)問(wèn)自己:計(jì)算機(jī)真的能像人類一樣智能了嗎?
今天,我們很高興地宣布,微軟亞洲研究院正式發(fā)布Microsoft Concept Graph知識(shí)圖譜和Microsoft Concept Tagging模型,用于幫助機(jī)器更好地理解人類交流并且進(jìn)行語(yǔ)義計(jì)算。Microsoft Concept Graph是一個(gè)大型的知識(shí)圖譜系統(tǒng)。其包含的知識(shí)來(lái)自于數(shù)以億計(jì)的網(wǎng)頁(yè)和數(shù)年積累的搜索日志,可以為機(jī)器提供文本理解的常識(shí)性知識(shí)。(了解更多信息,請(qǐng)?jiān)L問(wèn)https://concept.research.microsoft.com/)
10月初,你的微博、微信可能都被一首叫《PPAP》的神曲占領(lǐng)了。什么,你還沒(méi)聽(tīng)過(guò)?那讓我們先來(lái)看看這首曲子:
這首歌是有日本諧星古坂和仁(PIKO太郎)于8月25日發(fā)布在YouTube上的,一開(kāi)在日本小范圍內(nèi)炒紅;后來(lái)由新媒體9GAG發(fā)布,其瀏覽數(shù)據(jù)立馬飆升。9月25日,9GAG在Facebook上傳了PPAP,被大V轉(zhuǎn)發(fā)以后,迅速火起來(lái)。目前,這個(gè)視頻的播放量已經(jīng)過(guò)億,并且榮登美國(guó)公告牌單曲榜Hot 100。能登陸Hot 100是個(gè)什么概念呢?對(duì)于亞洲歌曲上榜歷史數(shù)據(jù)來(lái)說(shuō),最近的一次,是2012年鳥(niǎo)叔的 《江南Style》蟬聯(lián)了7周亞軍的位置。
這首魔性的神曲的歌詞非常簡(jiǎn)單易學(xué):“I have a pen. I have an apple. Apple-pen!”
小編為什么要把這個(gè)魔性的神曲分享給大家呢?下面問(wèn)題來(lái)了:當(dāng)PIKO太郎說(shuō)出“I have an apple.”時(shí),你第一反應(yīng)這個(gè)“apple”是一種水果,還是一家公司?
你也許會(huì)意識(shí)到,很多時(shí)候幫助你做出判斷的并不是一些能夠清晰列在書(shū)本的知識(shí),而是大量常識(shí)性的概念。例如“筆是一種寫(xiě)字的工具”、 “筆是豎直形的可以捏在手里”、“蘋(píng)果是一種水果或一家公司”等等概念,都有助于我們對(duì)歌詞的判斷和理解。
當(dāng)下,計(jì)算機(jī)究竟有多智能了?它可能能輕而易舉的戰(zhàn)勝一個(gè)三四十歲經(jīng)驗(yàn)豐富的世界頂尖棋手,但是它的學(xué)習(xí)能力以及完成一般任務(wù)的能力可能都遠(yuǎn)不及一個(gè)三四歲的孩童。研究員們從人類的學(xué)習(xí)成長(zhǎng)過(guò)程開(kāi)始入手,試圖找到逐步實(shí)現(xiàn)機(jī)器智能的解決方法。
這個(gè)問(wèn)題的答案可能是“常識(shí)”——理解是萬(wàn)物的基礎(chǔ)。人們?cè)谡缴闲W(xué)、初中接受系統(tǒng)性教育開(kāi)始,已經(jīng)早早地開(kāi)始了學(xué)習(xí)的過(guò)程。這種與生俱來(lái)的本能能讓你進(jìn)入小學(xué)之前已經(jīng)了解諸如“糖是甜的食品”、“水是一種液體”這一類基礎(chǔ)的概念,并且隨著年齡的增長(zhǎng),這種并不屬于某個(gè)專業(yè)領(lǐng)域的開(kāi)放性常識(shí)也在人們的認(rèn)知中日積月累,并不斷豐富。
微軟亞洲研究院今天發(fā)布的Microsoft Concept Graph就在試圖讓計(jì)算機(jī)復(fù)制這些常識(shí)性概念,其核心知識(shí)庫(kù)包含了超過(guò)540萬(wàn)條概念。除了包含一些被絕大部分通用知識(shí)庫(kù)包含的概念,例如“城市”、“音樂(lè)家”等,Microsoft Concept Graph還包含數(shù)百萬(wàn)長(zhǎng)尾概念,例如“抗帕金森治療”、“名人婚紗設(shè)計(jì)師”、“基礎(chǔ)的水彩技巧”等,而這些概念在其他的數(shù)據(jù)庫(kù)中很難被找到。除了概念,Microsoft Concept Graph同樣包含了大量數(shù)據(jù)空間(每條知識(shí)概念都包含一系列的實(shí)體或者子概念,例如“太陽(yáng)系”底下可能就會(huì)包括“水星”、“火星”、“地球”等等)。
當(dāng)你看到“Apple是甜的”這句話時(shí),你幾乎可以肯定這里的“Apple”指的是我們最常見(jiàn)的那種水果。在這幾毫秒的時(shí)間里,你觸發(fā)的是“根據(jù)上下文語(yǔ)境確定語(yǔ)義”這一技能。微軟亞洲研究院的研究員們同樣也為計(jì)算機(jī)點(diǎn)亮了這棵技能樹(shù)。
Microsoft Concept Tagging模型可以將文本詞條實(shí)體映射到不同的語(yǔ)義概念,并根據(jù)實(shí)體文本內(nèi)容被標(biāo)記上相應(yīng)的概率標(biāo)簽。例如“微軟”這個(gè)詞可以被自動(dòng)映射到“軟件公司”和“科技巨頭”等概念,并帶有相應(yīng)的概率標(biāo)簽。這個(gè)模型讓計(jì)算機(jī)擁有常識(shí)性的計(jì)算能力,讓機(jī)器“了解”人類的意識(shí),從而讓機(jī)器可以更好地理解人類的文本交流。具體來(lái)說(shuō),概念模型根據(jù)人類的概念推理將實(shí)體或者短語(yǔ)映射到大量自動(dòng)習(xí)得的概念空間(向量空間)。這種映射關(guān)系是人類和機(jī)器都可以理解的。因此該模型提供了文本理解所需的文本概念映射、短語(yǔ)語(yǔ)義化理解等功能。
Microsoft Concept Tagging模型區(qū)別于以往常見(jiàn)的文本推理模型的根本區(qū)別是他是基于網(wǎng)絡(luò)之上的一個(gè)推理模型,將文本映射到一個(gè)顯式的知識(shí)空間,將文本概念化。以搜索引擎為例,絕大多數(shù)的用戶的查詢?cè)~數(shù)量是很少的,搜索引擎在返回結(jié)果時(shí)需要將查詢?cè)~進(jìn)行額外的信息化,將很短的文本映射到大量的概念空間里面,從而解釋了這一段文本。傳統(tǒng)的模型對(duì)于文本的推理幾乎不可解釋,而Microsoft Concept Tagging模型用不同的概念去描述一個(gè)詞,并給出對(duì)應(yīng)的概率,使機(jī)器能夠更好地理解文本,另一方面可計(jì)算的顯性詞向量也體現(xiàn)了我們?nèi)祟愔悄芘c人工智能相結(jié)合的理念(HI+AI,human in the loop)。例如社交網(wǎng)絡(luò)的設(shè)置中,工程師可能會(huì)人為設(shè)置一些關(guān)鍵字去屏蔽一些不當(dāng)言論,但是并不是每一個(gè)敏感詞工程師都能準(zhǔn)確找到。例如工程師屏蔽了“希特勒”、“納粹”,卻忽略了“法西斯”,現(xiàn)在Microsoft Concept Tagging模型就能對(duì)已有的概念進(jìn)行延展,在系統(tǒng)中找到其他類似的相關(guān)性很大的關(guān)鍵字,做更多智能的擴(kuò)展。
“我們想做的,是讓計(jì)算機(jī)能夠更好地理解人類?!爆F(xiàn)負(fù)責(zé)Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的微軟亞洲研究院資深研究經(jīng)理閆峻博士說(shuō),“理解是萬(wàn)事萬(wàn)物的基礎(chǔ),我們用計(jì)算機(jī)抓取過(guò)去這些不成文的開(kāi)放領(lǐng)域的常識(shí),能夠幫助計(jì)算機(jī)更具象地了解這個(gè)世界?!?nbsp;
圖(從左至右)為微軟亞洲研究院研究員紀(jì)蕾,資深研究經(jīng)理閆峻,研究員張大衛(wèi)
對(duì)于這類知識(shí)圖譜,學(xué)術(shù)界和工業(yè)界都有參與,但始終離不開(kāi)一些根本問(wèn)題:如何去獲取實(shí)體、實(shí)體和實(shí)體之間的屬性和關(guān)聯(lián)。在過(guò)去,知識(shí)庫(kù)系統(tǒng)和人類的思考方式差異巨大。例如“奧巴馬生日”,過(guò)去計(jì)算機(jī)能理解這個(gè)詞的含義,但是卻不能直接給你回答,而此次微軟開(kāi)放的Microsoft Concept Graph 和 Microsoft ConceptTagging模型就希望能為人們提供一個(gè)更智能化知識(shí)圖譜,借助它,從實(shí)體到抽象概念,計(jì)算機(jī)都能夠理解。
談及Microsoft Concept Graph 和 Microsoft Concept Tagging模型的下一步計(jì)劃,閆峻博士表示目前該模型暫只能支持英文,還要和高校合作完成中文的支持工作。在完成中文的知識(shí)庫(kù)構(gòu)建之后,再逐步擴(kuò)展到多語(yǔ)言版本。其次,人類的語(yǔ)言還涉及到比喻、夸張和玩笑等高層次跨領(lǐng)域的抽象表達(dá)方法,這也是接下來(lái)需要讓機(jī)器不斷學(xué)習(xí)的方向。最后,從短文本的理解到長(zhǎng)文本的理解,如理解兩個(gè)完全不同的故事,但語(yǔ)義層面在表達(dá)同樣的道理,也是他們接下來(lái)不斷努力的方向。
Microsoft Concept Graph 和 Microsoft Concept Tagging模型可以應(yīng)用于不同的文本處理應(yīng)用,包括搜索引擎、自動(dòng)問(wèn)答系統(tǒng)、在線廣告系統(tǒng)、推薦引擎、聊天機(jī)器人、以及人工智能系統(tǒng)等。目前這個(gè)模型已經(jīng)進(jìn)入了微軟的多個(gè)產(chǎn)品和服務(wù)中。微軟亞洲研究院高級(jí)研究經(jīng)理閆峻博士表示:“我們希望Microsoft Concept Graph和Microsoft Concept Tagging模型的發(fā)布可以推動(dòng)知識(shí)挖掘、自然語(yǔ)言處理等領(lǐng)域的發(fā)展,最終推動(dòng)人工智能的進(jìn)步?!?/p>
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。