丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給no name
發(fā)送

1

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

本文作者: no name 2016-10-28 11:36
導(dǎo)語:微軟亞洲研究院發(fā)布Microsoft Concept Graph知識圖譜和Microsoft Concept Tagging模型,幫助機器更好地理解人類交流。

雷鋒網(wǎng)按:本文轉(zhuǎn)載自微軟研究院AI頭條公眾號。

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

當我們在討論人工智能時,請注意,我們通常在討論弱人工智能。

 雖然我們現(xiàn)有的資源與之前可謂不同日而語——部署在云端的海量計算資源已經(jīng)像水和電一樣唾手可得了;互聯(lián)網(wǎng)所容納的信息也遠遠超過了過去幾千年來人們所有的知識儲備;以深度學習等為代表的機器學習算法的發(fā)展,也讓計算機能夠從這些龐大的數(shù)據(jù)中獲取知識。

但是我們也不得不正視一些事實,當前的人工智能更多的是針對某個具體的問題,發(fā)展對應(yīng)的算法和技術(shù),有人稱之為“拼圖式”的工作方法:我們做出了視覺模塊、再拼上語音模塊、推理模塊——把每個子領(lǐng)域的功能做好,然后再組合出一個完整的智能系統(tǒng)出來。 

微軟一直在為這份屬于全人類的人工智能大拼圖貢獻力量。從底層的可編程芯片F(xiàn)PGA,到Azure云平臺的部署,從微軟認知工具包(Microsoft Cognitive Toolkit),到應(yīng)用層面的能供每一個沒有人工智能背景也能開發(fā)出屬于自己的智能應(yīng)用的微軟認知服務(wù)……隨著人工智能拼圖不斷趨于完整,科學家們始終會問自己:計算機真的能像人類一樣智能了嗎? 

今天,我們很高興地宣布,微軟亞洲研究院正式發(fā)布Microsoft Concept Graph知識圖譜和Microsoft Concept Tagging模型,用于幫助機器更好地理解人類交流并且進行語義計算。Microsoft Concept Graph是一個大型的知識圖譜系統(tǒng)。其包含的知識來自于數(shù)以億計的網(wǎng)頁和數(shù)年積累的搜索日志,可以為機器提供文本理解的常識性知識。(了解更多信息,請訪問https://concept.research.microsoft.com/)

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

Apple是什么

10月初,你的微博、微信可能都被一首叫《PPAP》的神曲占領(lǐng)了。什么,你還沒聽過?那讓我們先來看看這首曲子:

這首歌是有日本諧星古坂和仁(PIKO太郎)于8月25日發(fā)布在YouTube上的,一開在日本小范圍內(nèi)炒紅;后來由新媒體9GAG發(fā)布,其瀏覽數(shù)據(jù)立馬飆升。9月25日,9GAG在Facebook上傳了PPAP,被大V轉(zhuǎn)發(fā)以后,迅速火起來。目前,這個視頻的播放量已經(jīng)過億,并且榮登美國公告牌單曲榜Hot 100。能登陸Hot 100是個什么概念呢?對于亞洲歌曲上榜歷史數(shù)據(jù)來說,最近的一次,是2012年鳥叔的 《江南Style》蟬聯(lián)了7周亞軍的位置。

這首魔性的神曲的歌詞非常簡單易學:“I have a pen. I have an apple. Apple-pen!”

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

小編為什么要把這個魔性的神曲分享給大家呢?下面問題來了:當PIKO太郎說出“I have an apple.”時,你第一反應(yīng)這個“apple”是一種水果,還是一家公司?

你也許會意識到,很多時候幫助你做出判斷的并不是一些能夠清晰列在書本的知識,而是大量常識性的概念。例如“筆是一種寫字的工具”、 “筆是豎直形的可以捏在手里”、“蘋果是一種水果或一家公司”等等概念,都有助于我們對歌詞的判斷和理解。

當下,計算機究竟有多智能了?它可能能輕而易舉的戰(zhàn)勝一個三四十歲經(jīng)驗豐富的世界頂尖棋手,但是它的學習能力以及完成一般任務(wù)的能力可能都遠不及一個三四歲的孩童。研究員們從人類的學習成長過程開始入手,試圖找到逐步實現(xiàn)機器智能的解決方法。

這個問題的答案可能是“常識”——理解是萬物的基礎(chǔ)。人們在正式上小學、初中接受系統(tǒng)性教育開始,已經(jīng)早早地開始了學習的過程。這種與生俱來的本能能讓你進入小學之前已經(jīng)了解諸如“糖是甜的食品”、“水是一種液體”這一類基礎(chǔ)的概念,并且隨著年齡的增長,這種并不屬于某個專業(yè)領(lǐng)域的開放性常識也在人們的認知中日積月累,并不斷豐富。

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

微軟亞洲研究院今天發(fā)布的Microsoft Concept Graph就在試圖讓計算機復(fù)制這些常識性概念,其核心知識庫包含了超過540萬條概念。除了包含一些被絕大部分通用知識庫包含的概念,例如“城市”、“音樂家”等,Microsoft Concept Graph還包含數(shù)百萬長尾概念,例如“抗帕金森治療”、“名人婚紗設(shè)計師”、“基礎(chǔ)的水彩技巧”等,而這些概念在其他的數(shù)據(jù)庫中很難被找到。除了概念,Microsoft Concept Graph同樣包含了大量數(shù)據(jù)空間(每條知識概念都包含一系列的實體或者子概念,例如“太陽系”底下可能就會包括“水星”、“火星”、“地球”等等)。

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

Apple是甜的

當你看到“Apple是甜的”這句話時,你幾乎可以肯定這里的“Apple”指的是我們最常見的那種水果。在這幾毫秒的時間里,你觸發(fā)的是“根據(jù)上下文語境確定語義”這一技能。微軟亞洲研究院的研究員們同樣也為計算機點亮了這棵技能樹。 

Microsoft Concept Tagging模型可以將文本詞條實體映射到不同的語義概念,并根據(jù)實體文本內(nèi)容被標記上相應(yīng)的概率標簽。例如“微軟”這個詞可以被自動映射到“軟件公司”和“科技巨頭”等概念,并帶有相應(yīng)的概率標簽。這個模型讓計算機擁有常識性的計算能力,讓機器“了解”人類的意識,從而讓機器可以更好地理解人類的文本交流。具體來說,概念模型根據(jù)人類的概念推理將實體或者短語映射到大量自動習得的概念空間(向量空間)。這種映射關(guān)系是人類和機器都可以理解的。因此該模型提供了文本理解所需的文本概念映射、短語語義化理解等功能。

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

Microsoft Concept Tagging模型區(qū)別于以往常見的文本推理模型的根本區(qū)別是他是基于網(wǎng)絡(luò)之上的一個推理模型,將文本映射到一個顯式的知識空間,將文本概念化。以搜索引擎為例,絕大多數(shù)的用戶的查詢詞數(shù)量是很少的,搜索引擎在返回結(jié)果時需要將查詢詞進行額外的信息化,將很短的文本映射到大量的概念空間里面,從而解釋了這一段文本。傳統(tǒng)的模型對于文本的推理幾乎不可解釋,而Microsoft Concept Tagging模型用不同的概念去描述一個詞,并給出對應(yīng)的概率,使機器能夠更好地理解文本,另一方面可計算的顯性詞向量也體現(xiàn)了我們?nèi)祟愔悄芘c人工智能相結(jié)合的理念(HI+AI,human in the loop)。例如社交網(wǎng)絡(luò)的設(shè)置中,工程師可能會人為設(shè)置一些關(guān)鍵字去屏蔽一些不當言論,但是并不是每一個敏感詞工程師都能準確找到。例如工程師屏蔽了“希特勒”、“納粹”,卻忽略了“法西斯”,現(xiàn)在Microsoft Concept Tagging模型就能對已有的概念進行延展,在系統(tǒng)中找到其他類似的相關(guān)性很大的關(guān)鍵字,做更多智能的擴展。

理解是萬事萬物的基礎(chǔ)

“我們想做的,是讓計算機能夠更好地理解人類。”現(xiàn)負責Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的微軟亞洲研究院資深研究經(jīng)理閆峻博士說,“理解是萬事萬物的基礎(chǔ),我們用計算機抓取過去這些不成文的開放領(lǐng)域的常識,能夠幫助計算機更具象地了解這個世界?!?nbsp;

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

圖(從左至右)為微軟亞洲研究院研究員紀蕾,資深研究經(jīng)理閆峻,研究員張大衛(wèi)

對于這類知識圖譜,學術(shù)界和工業(yè)界都有參與,但始終離不開一些根本問題:如何去獲取實體、實體和實體之間的屬性和關(guān)聯(lián)。在過去,知識庫系統(tǒng)和人類的思考方式差異巨大。例如“奧巴馬生日”,過去計算機能理解這個詞的含義,但是卻不能直接給你回答,而此次微軟開放的Microsoft Concept Graph 和 Microsoft ConceptTagging模型就希望能為人們提供一個更智能化知識圖譜,借助它,從實體到抽象概念,計算機都能夠理解。

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

談及Microsoft Concept Graph 和 Microsoft Concept Tagging模型的下一步計劃,閆峻博士表示目前該模型暫只能支持英文,還要和高校合作完成中文的支持工作。在完成中文的知識庫構(gòu)建之后,再逐步擴展到多語言版本。其次,人類的語言還涉及到比喻、夸張和玩笑等高層次跨領(lǐng)域的抽象表達方法,這也是接下來需要讓機器不斷學習的方向。最后,從短文本的理解到長文本的理解,如理解兩個完全不同的故事,但語義層面在表達同樣的道理,也是他們接下來不斷努力的方向。

Microsoft Concept Graph 和 Microsoft Concept Tagging模型可以應(yīng)用于不同的文本處理應(yīng)用,包括搜索引擎、自動問答系統(tǒng)、在線廣告系統(tǒng)、推薦引擎、聊天機器人、以及人工智能系統(tǒng)等。目前這個模型已經(jīng)進入了微軟的多個產(chǎn)品和服務(wù)中。微軟亞洲研究院高級研究經(jīng)理閆峻博士表示:“我們希望Microsoft Concept Graph和Microsoft Concept Tagging模型的發(fā)布可以推動知識挖掘、自然語言處理等領(lǐng)域的發(fā)展,最終推動人工智能的進步?!?/p>

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

讓計算機掌握常識:微軟發(fā)布Microsoft Concept Graph和Microsoft Concept Tagging模型

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說