0
本文作者: 汪思穎 | 2017-08-29 18:59 |
雷鋒網(wǎng) AI 科技評論消息:日前,清華大學(xué)副教授、Arnetminer創(chuàng)始人唐杰在微博公開表示AMiner將發(fā)布計算機領(lǐng)域的專業(yè)知識圖譜Science Knowledge Graph (SciKG)。
據(jù)其介紹,
這個計算機領(lǐng)域的知識圖譜包含1萬個知識概念、概念關(guān)系以及概念定義,20萬專家信息(專家和知識概念對應(yīng))以及50萬相關(guān)論文。這個數(shù)據(jù)可以用來做一些領(lǐng)域信息理解,信息推薦和檢索。
雷鋒網(wǎng) AI 科技評論了解到,AMiner官網(wǎng)目前已經(jīng)更新了該數(shù)據(jù)集的下載通道。
從官網(wǎng)可以看到相關(guān)介紹,
SciKG是一個豐富的知識圖譜,用于科學(xué)領(lǐng)域(目前包括計算機科學(xué)(CS)),由概念、專家和論文組成。概念和概念之間的關(guān)系是從ACM計算分類系統(tǒng)中提取出來的,每個概念的定義都從維基等數(shù)據(jù)集中進行了補充。
數(shù)據(jù)集中包括每個專家的職位、隸屬機構(gòu)、研究興趣,以及與AMiner的鏈接(如果有必要,還可以獲得更多信息),每一篇論文包括標題、作者、摘要、出版機構(gòu)和年份等元數(shù)據(jù)信息。
數(shù)據(jù)集的統(tǒng)計結(jié)果如下圖,包括908個概念,20多萬條專家信息,50多萬篇出版論文,9668個關(guān)鍵詞。
此外,在數(shù)據(jù)集中,每個對象都是JSON格式 。關(guān)鍵詞的數(shù)據(jù)結(jié)構(gòu)如下表:
示例如下:
另外,官網(wǎng)上同時也強調(diào),該數(shù)據(jù)集能助于更好地理解計算機科學(xué)領(lǐng)域的動態(tài)和發(fā)展,幫助搜索和推薦CS領(lǐng)域的專家和論文。
詳細信息可在https://aminer.org/scikg查看。
雷鋒網(wǎng) AI 科技評論
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。