丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給奕欣
發(fā)送

0

iPIN 研究員李雙印博士獨(dú)家解析:循環(huán)聚焦機(jī)制如何與主題模型碰撞火花?

本文作者: 奕欣 2017-03-03 09:38
導(dǎo)語:彼時 iPIN 成立伊始,CEO 楊洋邀請潘嶸教授一同合作,李雙印也跟隨導(dǎo)師到 iPIN 參與算法研發(fā)工作,自然成為了第一號實(shí)習(xí)生。

雷鋒網(wǎng) AI 科技評論按:李雙印博士曾在香港科技大學(xué)攻讀博士后,師從香港科技大學(xué)計(jì)算機(jī)系主任楊強(qiáng)教授。他的主要研究方向主要包括數(shù)據(jù)挖掘、人工智能、文本建模、深度學(xué)習(xí),論文曾被 IJCAI、ICDM、UAI 等頂級國際會議收錄。李雙印作為第一作者的論文《Recurrent Attentional Topic Model》入選 oral presentation,入選口頭展示論文(oral),雷鋒網(wǎng)AI科技評論與李博士日前進(jìn)行了交流,并整理成文與讀者分享。

iPIN 研究員李雙印博士獨(dú)家解析:循環(huán)聚焦機(jī)制如何與主題模型碰撞火花?

李雙印博士

李雙印在 iPIN 的工牌號為 intern01。在公司里,大家只知道叫他「大師兄」,但他與 iPIN 的淵源,很多在公司實(shí)習(xí)的研究生們也不甚清楚。這一切最早還要追溯到 2013 年,當(dāng)時李雙印還在中山大學(xué)跟隨潘嶸教授攻讀博士,并在微軟亞洲研究院(MSRA)實(shí)習(xí),主要的工作是用深度學(xué)習(xí)的方法實(shí)現(xiàn)半結(jié)構(gòu)化文本建模。彼時 iPIN 成立伊始,CEO 楊洋邀請潘嶸教授一同合作,李雙印也跟隨導(dǎo)師到 iPIN 參與算法研發(fā)工作,自然成為了第一號實(shí)習(xí)生。

雷鋒網(wǎng)此前對 iPIN 做過不少覆蓋和報道,目前 iPIN 在信息提取、語義認(rèn)知及檢索排序等積累了實(shí)踐經(jīng)驗(yàn),涵蓋高考志愿填報、招聘及生涯規(guī)劃等領(lǐng)域。在李雙印看來,iPIN 的業(yè)務(wù)主要集中人和企業(yè)的商業(yè)價值挖掘,憑借語義認(rèn)知平臺,將人從繁瑣的工作中釋放出來,聚焦更具價值的商業(yè)決策?!冈诩夹g(shù)上,我們的進(jìn)展還是比較突出的,比如文本生成、文本分類、檢索排序等、都有很深的基礎(chǔ)和經(jīng)驗(yàn)?!苟铍p印在 AAAI 2017 上發(fā)表的這篇論文,則屬于在語義認(rèn)知方面研究工作的一個探索。

循環(huán)機(jī)制與聚焦機(jī)制在深度神經(jīng)網(wǎng)絡(luò)上的應(yīng)用十分廣泛,而李雙印之前一直是做主題模型的相關(guān)課題,因此他很自然地想到,能否將這兩種方法應(yīng)用于主題模型上,并提出了名為「Recurrent Attentional Topic Model(簡稱 RATM)」的新概念。句子作為一種文本信息的基本組成單元,RATM 主要基于文本中句子之間的主題連貫性,利用文檔中的單詞信息,以及句子間的序列信息對文檔進(jìn)行有效建模。文檔建模與分類是一個非常古老的問題,對于它的解決沒有止境。不論是之前的基于貝葉斯理論的主題模型,還是當(dāng)前火熱的深度學(xué)習(xí)技術(shù)等,在文本特征提取與分類上,本質(zhì)上都是提供了一種提取文本特征信息的方法。

在 AAAI 2017 oral presentation 時,李雙印博士介紹了 RATM 如何應(yīng)用于社會經(jīng)濟(jì)圖譜,這是一個針對整個經(jīng)濟(jì)社會的各個主體,以及主體間關(guān)系進(jìn)行建模和量化的一個龐大系統(tǒng)。其中的各個主體(比如人、職位、學(xué)校、公司、行業(yè)等),這些比較高層次的信息相當(dāng)于金字塔的塔頂。而基礎(chǔ)概念(類似于百科和 wiki 中的詞條)相當(dāng)于塔底,即語言系統(tǒng)中基礎(chǔ)信息的認(rèn)知、關(guān)系以及推理,「缺少這些基礎(chǔ)的信息認(rèn)知,社會經(jīng)濟(jì)圖譜就像空中樓閣。因此,我們還需要對語言系統(tǒng)中的基礎(chǔ)信息進(jìn)行建模和認(rèn)知。我們在單詞,句子及文本上的建模研究和探索,比如提出 RATM 模型,都是在試圖解決社會經(jīng)濟(jì)圖譜和基礎(chǔ)信息之間的鴻溝,并希望能夠?qū)⑸鐣?jīng)濟(jì)圖譜構(gòu)建的更加完善和落地?!?/p>

作為研究性課題,李雙印表示目前該論文成果尚未應(yīng)用于實(shí)際場景中。他認(rèn)為,此工作未來的主要研究方向,依然會集中于充分利用文本特點(diǎn),如何快速提取有效的文本及句子的特征向量,以及向量的可解釋性。此前雷鋒網(wǎng) AI 科技評論在報道國內(nèi)企業(yè)的 AAAI 2017 論文收錄情況時,也提及了這篇論文。iPIN CEO 楊洋在接受采訪時也表示,他們會嘗試將機(jī)器在決策中的分析過程以邏輯的形式梳理出來。相信在未來,iPIN 在認(rèn)知框架上會有更多的嘗試和突破。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

iPIN 研究員李雙印博士獨(dú)家解析:循環(huán)聚焦機(jī)制如何與主題模型碰撞火花?

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說