丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給黃善清
發(fā)送

0

AMiner 新功能:技術(shù)趨勢(shì)分析—挖掘技術(shù)源頭、近期熱度和全局熱度

本文作者: 黃善清 2018-12-30 13:23
導(dǎo)語:系統(tǒng)基于機(jī)器學(xué)習(xí)、自然語言處理、數(shù)據(jù)挖掘、社會(huì)網(wǎng)絡(luò)分析以及語義搜索等技術(shù),實(shí)現(xiàn)了科技情報(bào)網(wǎng)絡(luò)的語義化和智能化搜索。

雷鋒網(wǎng) AI 科技評(píng)論按:AMiner (http://aminer.org) 是科研人員和知識(shí)圖譜為中心的科技情報(bào)智能挖掘系統(tǒng)。系統(tǒng)基于機(jī)器學(xué)習(xí)、自然語言處理、數(shù)據(jù)挖掘、社會(huì)網(wǎng)絡(luò)分析以及語義搜索等技術(shù),實(shí)現(xiàn)了科技情報(bào)網(wǎng)絡(luò)的語義化和智能化搜索。系統(tǒng)相關(guān)技術(shù)獲得北京市科技進(jìn)步一等獎(jiǎng)和中國人工智能學(xué)會(huì)科技進(jìn)步一等獎(jiǎng)。系統(tǒng)上線運(yùn)行超過十年,用戶超過 1000 萬,覆蓋全球 220 個(gè)國家和地區(qū)。本文轉(zhuǎn)載自「學(xué)術(shù)頭條」,微信搜索「SciTouTiao」即可關(guān)注。

開放全新功能 技術(shù)趨勢(shì)分析

近日,AMiner 開放了一個(gè)全新功能:技術(shù)趨勢(shì)分析 ( http://trend.aminer.cn )。

該功能基于 AMiner 超過 2 億篇論文數(shù)據(jù)進(jìn)行深入挖掘,包括對(duì)技術(shù)來源、熱度、發(fā)展趨勢(shì)進(jìn)行研究,進(jìn)而預(yù)測(cè)未來的技術(shù)前景。

AMiner 新功能:技術(shù)趨勢(shì)分析—挖掘技術(shù)源頭、近期熱度和全局熱度

技術(shù)趨勢(shì)分析的方法

技術(shù)趨勢(shì)分析描述了技術(shù)的出現(xiàn)、變遷和消亡的全過程,它可以幫助研究人員理解領(lǐng)域的研究歷史和現(xiàn)狀,快速識(shí)別研究的前沿?zé)狳c(diǎn)問題。學(xué)者運(yùn)用統(tǒng)計(jì)分析、模型構(gòu)建、AHP 等方法對(duì)技術(shù)發(fā)展路徑進(jìn)行了一系列研究,這些方法大多是偏重于專家德爾菲法的定性分析,重點(diǎn)在于指標(biāo)的設(shè)定,缺乏定量數(shù)據(jù)分析。另有一些研究者利用專利主路徑分析研究技術(shù)的變遷,然而較少考慮技術(shù)主題隨著時(shí)間的繼承、分裂和融合?;跀?shù)據(jù)挖掘的主題變遷通過挖掘深層次的科技文本語義信息,能夠有效的解決這一問題。

主題變遷是指一個(gè)領(lǐng)域的研究主題的內(nèi)容和熱度隨著時(shí)間變化的現(xiàn)象,通過識(shí)別并關(guān)聯(lián)不同時(shí)間片的技術(shù)主題,探索和分析領(lǐng)域主題變遷并通過可視化的方式進(jìn)行展示,可以從更全面的視角感知技術(shù)的演進(jìn),對(duì)于技術(shù)發(fā)展路徑識(shí)別具有重要意義。

技術(shù)流程

基于科技知識(shí)圖譜,AMiner 以可視化的方式,對(duì)查詢領(lǐng)域 q 的熱度演化趨勢(shì)進(jìn)行總結(jié)。

具體而言,某一技術(shù)領(lǐng)域 q 的熱度,可以定義為該技術(shù)相關(guān)術(shù)語集合 T q = {t} 在 y 年中的所有文獻(xiàn)內(nèi)的詞頻數(shù)。在這一設(shè)定下,問題的關(guān)鍵在于如何定位一個(gè)技術(shù)領(lǐng)域所相關(guān)的術(shù)語集合。AMiner 將領(lǐng)域術(shù)語集合定義為該領(lǐng)域內(nèi)專家常用的關(guān)鍵詞。其具體算法流程如下:

首先,根據(jù)輸入的領(lǐng)域查詢?cè)~ q 進(jìn)行專家搜索,得到候選專家集合 {A}q。

其次,對(duì)候選 {A}q 根據(jù)與 q 的相關(guān)度和該專家的權(quán)威度(見公式 (6-1))進(jìn)行排序。取出排序結(jié)果中的前 K 個(gè)專家 {A}K q 作為分析對(duì)象。

最后,獲取 {A}K q 中每位專家歷年的研究成果,分別抽取關(guān)鍵詞,構(gòu)成術(shù)語集合 T q。進(jìn)而,技術(shù)趨勢(shì)分析被轉(zhuǎn)化為針對(duì)術(shù)語集合 T q 熱度的分析。

相關(guān)研究

主題識(shí)別

主題識(shí)別是指利對(duì)領(lǐng)域文獻(xiàn)進(jìn)行挖掘,以發(fā)現(xiàn)其中隱含的研究主題。隨著文獻(xiàn)爆發(fā)式增長,主題識(shí)別面臨著文本維度高和數(shù)據(jù)類型復(fù)雜的挑戰(zhàn),傳統(tǒng)的基于專家知識(shí)的定性方法不再適應(yīng)現(xiàn)實(shí)情況,基于機(jī)器學(xué)習(xí)的自動(dòng)化識(shí)別逐漸成為主流。目前研究人員針對(duì)自動(dòng)主題識(shí)別提出了許多方法和模型,其中主題模型已經(jīng)成為技術(shù)主題識(shí)別領(lǐng)域最常用的方法模型。

專家學(xué)者是科學(xué)研究的主體,一些杰出學(xué)者往往引領(lǐng)著學(xué)科的發(fā)展,可以通過挖掘杰出學(xué)者公開發(fā)表的科技文獻(xiàn),發(fā)現(xiàn)科學(xué)領(lǐng)域的主要研究主題以及主題之間的聯(lián)系。一些關(guān)鍵詞被某一學(xué)者在發(fā)表的文章中提及,可能表明這些關(guān)鍵詞之間存在一定的關(guān)聯(lián)關(guān)系;如果這些關(guān)鍵詞被不同的作者提及,可能說明不同作者認(rèn)可這些關(guān)鍵詞之間的關(guān)聯(lián)關(guān)系,可認(rèn)為這些關(guān)鍵詞能夠構(gòu)成研究主題。如果某個(gè)關(guān)鍵詞在作者的文章中多次出現(xiàn),可以表明作者對(duì)關(guān)鍵詞所代表的研究主題做了大量研究,并間接說明作者對(duì)該領(lǐng)域具有一定的影響力。

主題關(guān)聯(lián)和可視化

為了分析技術(shù)主題變遷,通常需要根據(jù)發(fā)表時(shí)間將文獻(xiàn)劃分到相應(yīng)的時(shí)間片內(nèi),通過文本挖掘獲得不同時(shí)間片上的主題,將這些主題關(guān)聯(lián)起來是主題變遷的核心步驟,主題能否關(guān)聯(lián)決定著主題之間是否存在變遷關(guān)系。崔凱等利用 KL 相對(duì)熵來度量主題之間差異性,李湘東等利用 JS 距離對(duì)期刊主題相似度進(jìn)行衡量。為了便于直觀了解技術(shù)發(fā)展路徑,主題關(guān)聯(lián)需要進(jìn)行可視化展示,主題關(guān)聯(lián)和可視化關(guān)系密不可分,可視化是為了更好的主題變遷分析,并可以展示技術(shù)發(fā)展路徑。

現(xiàn)有的路徑可視化工具眾多,其中陳超美基于 java 開發(fā)出 Citespace I 和 Citespace Ⅱ,這兩款軟件具有時(shí)序分割,同被引分析、時(shí)序網(wǎng)絡(luò)可視化等功能。Susan Havre 等推出 ThemeRiver 模型,用于反應(yīng)文檔主題強(qiáng)度信息的變化過程。微軟亞洲研究院提出 TextFlow 方法,在海量文本分析中引入主題合并和分裂的信息。

具體分析

我們將為大家展示 AMiner 中技術(shù)趨勢(shì)分析系統(tǒng)的 Answer machine 領(lǐng)域的界面截圖。在該系統(tǒng)中,術(shù)語集合的熱度被可視化地展示為 Sorted Stream Graph 的形式。

其中,圖中的每個(gè)彩色分支表示一個(gè)術(shù)語,其寬度表示該術(shù)語在當(dāng)年的熱度,各分支在每一年份在圖中按照其熱度進(jìn)行排序。

系統(tǒng)包括三個(gè)視圖:技術(shù)源頭、近期熱度和全局熱度,用于展示領(lǐng)域發(fā)展的開端和現(xiàn)狀,以及相關(guān)領(lǐng)域熱度的變化趨勢(shì)。

AMiner 新功能:技術(shù)趨勢(shì)分析—挖掘技術(shù)源頭、近期熱度和全局熱度

技術(shù)源頭圖

從圖中可以觀察到,綜合來看,Answer machine 由 language generation、knowledge engineering、text planning、text classification 等領(lǐng)域演化而來。在 1971 年至 1981 年十年間,該領(lǐng)域的來源關(guān)鍵詞主要是 knowledge engineering,此后關(guān)鍵詞逐漸多元化,language generation 和 text planning 開始加入進(jìn)來。

AMiner 新功能:技術(shù)趨勢(shì)分析—挖掘技術(shù)源頭、近期熱度和全局熱度

全局熱度圖

全局熱度展示了該領(lǐng)域相關(guān)術(shù)語在所有年份上的平均熱度,綜合來看,Answer machine 的全局熱度包含了 question answering、community question answering、machine translation 和 Neural Network 等關(guān)鍵詞。

我們還可以看出,machine translation 這一概念自二十世紀(jì)九十年代開始興起,但是于 2000 年前后熱度下降。這是由于 information retrieval、question answering 和 Support Vector Machine 等技術(shù)與其競(jìng)爭(zhēng)導(dǎo)致的。并且 question answering 在 2001 年至 2010 年間呈現(xiàn)爆發(fā)式地增長。

AMiner 新功能:技術(shù)趨勢(shì)分析—挖掘技術(shù)源頭、近期熱度和全局熱度

近期熱度圖

上圖為該領(lǐng)域近期熱度,綜合來看,近期 Answer machine 的熱點(diǎn)集中在 question answering、community question answering、machine translation 和 Neural Network 等關(guān)鍵詞,與全局熱度圖是相似的。

技術(shù)趨勢(shì)分析這一功能可以幫助用戶了解技術(shù)的來龍去脈,技術(shù)發(fā)展趨勢(shì)。技術(shù)趨勢(shì)的發(fā)展是科技工作者和科研管理部門必須要考慮的因素。實(shí)時(shí)的分析技術(shù)的發(fā)展趨勢(shì),了解領(lǐng)域動(dòng)態(tài),并且實(shí)時(shí)的分析趨勢(shì)發(fā)展中各個(gè)國家的分析和對(duì)比,及時(shí)的了解學(xué)科發(fā)展?fàn)顩r,領(lǐng)跑,并跑還是跟跑。

我就想問大家有沒有心動(dòng)?想不想用?

網(wǎng)址: http://trend.aminer.cn

雷鋒網(wǎng) AI 科技評(píng)論 轉(zhuǎn)載 雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

AMiner 新功能:技術(shù)趨勢(shì)分析—挖掘技術(shù)源頭、近期熱度和全局熱度

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說