0
本文作者: 汪思穎 | 2017-11-03 16:12 | 專題:CNCC 2017 |
雷鋒網(wǎng) AI科技評論按:由中國計算機學(xué)會(CCF)主辦,福州市人民政府、福州大學(xué)承辦,福建師范大學(xué)、福建工程學(xué)院協(xié)辦的 2017 中國計算機大會(CNCC 2017)于 10.26—10.28 日在福州·海峽國際會展中心舉辦。
此次會議規(guī)模空前,會議主辦方邀請了包括丘成桐、沈向洋、李飛飛、叢京生在內(nèi)的學(xué)界、業(yè)界知名人物,這次大會除了14場非常值得關(guān)注的特邀報告,還有2場大會主題論壇、40余場學(xué)術(shù)論壇、30余場特色活動以及3個頒獎大會,同期還將有80余家企業(yè)舉辦科技成果展。雷鋒網(wǎng)作為獨家戰(zhàn)略合作媒體對大會內(nèi)容進行了全程覆蓋和報道。
如何建立相對公正合理的學(xué)術(shù)評價體系,這是在人工智能研究飛速發(fā)展的今天被國際學(xué)術(shù)界高度關(guān)注的話題。在 CNCC 2017《大數(shù)據(jù)驅(qū)動下的學(xué)術(shù)評價》技術(shù)論壇上,邀請到CCF 術(shù)語工委會主任周明,上海交通大學(xué)教授王新兵,中國工程院院士高文,北京大學(xué)教授金芝,微軟研究院研究員王冠三共聚于此,探討如何構(gòu)建大規(guī)模異構(gòu)學(xué)術(shù)圖譜,有效利用圖譜為廣大學(xué)者服務(wù),為學(xué)術(shù)評價和社會發(fā)展服務(wù)。此次論壇由清華大學(xué)副教授唐杰、微軟亞洲研究院李銳博士主持,在panel討論環(huán)節(jié),還邀請到南京大學(xué)教授周志華、中科院計算所研究員陳熙霖。
從左至右依次為清華大學(xué)副教授唐杰、北京大學(xué)教授金芝、南京大學(xué)教授周志華、微軟研究院研究員王冠三、中科院計算所研究員陳熙霖、上海交通大學(xué)教授王新兵、微軟亞洲研究院李銳博士
作為第一位嘉賓,周明在論壇中介紹了CCF術(shù)語工作委員會,并詳述了術(shù)語工作委員會中的分工。為了更好的進行術(shù)語工作,他們構(gòu)建了三級火箭,第一級是專家火箭,這一級火箭主要涵蓋的是之前一些專家的研究工作。下一級是網(wǎng)絡(luò)火箭,其中包括新詞挖掘,詞義挖掘,合并、擇優(yōu)等,第三級是眾包火箭,這一級會鼓勵網(wǎng)友貢獻新詞條并審核編纂詞條內(nèi)容,為術(shù)語工作委員會做出貢獻。
為什么會構(gòu)造這樣的三級火箭?他表示,專家火箭可能存在詞條老舊的問題,這時候網(wǎng)絡(luò)火箭就出現(xiàn)了,可以增加新的詞條,例如AlphaGo等,但是又出現(xiàn)了新的問題,比如分類體系不一致,要進行很多調(diào)整,另外在增加新詞條的時候,必須要通過人工甄別斷定分類,還有如何將網(wǎng)絡(luò)上的簡繁體文本對應(yīng)起來。總體來說,網(wǎng)上找的資源良莠不齊,格式多樣,無法用自動化手段去做,必須靠眾包去做。
專家火箭和網(wǎng)絡(luò)火箭目前進展順利,眾包火箭現(xiàn)在發(fā)展也不錯。他們在做這件事的時候會有激勵機制,為大家設(shè)計了不同的頭銜以表彰其對計算機術(shù)語工作做出的貢獻。大家可以基于他們的術(shù)語工作,做搜索、問答等各種各樣的研究。
接下來,王新兵教授介紹了他們在學(xué)術(shù)地圖上的一些研究。他表示,目前的數(shù)據(jù)量很大,要從數(shù)據(jù)中挖掘出某位老師或者學(xué)生的研究水平,需要進行多方面的考慮。他也提到如何將論文之間的關(guān)系聯(lián)系起來,有什么好的做法,為實現(xiàn)這些目標(biāo)有哪些核心的考慮。
在論壇中,他為大家詳解了他們做的一些圖。他們現(xiàn)在做的分析有挖掘論文之間的相關(guān)性,挖掘出某個領(lǐng)域比較重要的研究人員,以及誰在那個領(lǐng)域成長比較快,影響力比較大,挖掘某些研究的地理核心區(qū)域。在進行核心區(qū)域的研究中,也能看到中國在過去二十年間取得的發(fā)展。他還舉例分析了幾個重要會議(SIGMOD和SIGIR、CVPR和ICCV、AES和OOPSLA)之間的交叉和聯(lián)系。
他們的愿景是希望能通過數(shù)據(jù)分析來幫助大家,例如根據(jù)文章之間的關(guān)聯(lián)性,進行文章推薦,或者進行關(guān)聯(lián)的作者推薦。
隨之而來的是高文院士的精彩演講,他談到最近討論比較多的雙一流建設(shè),這個排名請了許多知名的專家來評價、討論、制定規(guī)則,然后讓機器去計算,但網(wǎng)上有很多對這個排名的調(diào)侃和不滿。他表示,通過專家制定規(guī)則,然后再用提交的數(shù)據(jù)進行排序的方法,里面有些值得改進的地方。“用大數(shù)據(jù)做學(xué)術(shù)評價,很多時候能不能得獎和你的數(shù)據(jù)的公開程度直接相關(guān),如果在網(wǎng)上幾乎查不到你的信息,很大可能得不到高分?!?/p>
此外,他也發(fā)表了對利用論文數(shù)量做學(xué)術(shù)評價的看法?!皩W(xué)術(shù)評價一定要有科學(xué)性在里面,純粹的數(shù)論文一定不行,但是論文數(shù)有一定的參考性。如果沒有其他可參考的,那么數(shù)量可能是主要參考的點?!?/p>
“以前評價學(xué)者的水平靠人的判斷,現(xiàn)在數(shù)據(jù)正在慢慢發(fā)揮作用,亞洲學(xué)者也多起來了?!彼f道,“從社會進步、學(xué)科發(fā)展、個人發(fā)展來說,我們應(yīng)該逐步關(guān)注、整理和維護數(shù)據(jù),另外也應(yīng)該樂于分享數(shù)據(jù)。此外,不能為了追求數(shù)據(jù)而數(shù)據(jù),要科學(xué)地使用、判斷數(shù)據(jù)?!?/p>
而現(xiàn)場觀眾也進行了踴躍的提問,比如什么時候機器可以制定規(guī)則,自然基金委在基礎(chǔ)研發(fā)投入方面的做法,如何看待最近《美國新聞和全球報道》排出的全球高校排名。
下一位演講嘉賓是金芝教授。本次論壇的主題為大數(shù)據(jù)驅(qū)動下的學(xué)術(shù)評價,她對學(xué)術(shù)評價做了介紹,目前存在定性和定量兩種評價方法,比較科學(xué)的方法是將定量與定性有機的結(jié)合起來,給出全面的評價。另外,在做評價時需要考慮多維性,要尊重不同的價值體系。論壇的另一個關(guān)鍵點是大數(shù)據(jù),她介紹了億級學(xué)術(shù)圖譜Open Academic Graph,她表示,構(gòu)建學(xué)術(shù)大數(shù)據(jù)的目的有三,一是集成豐富的學(xué)術(shù)知識數(shù)據(jù),二是數(shù)據(jù)共享,三是服務(wù)共享。這些都非常有價值的,對于學(xué)術(shù)研究有很大的貢獻。
在論壇中,她從窄義和廣義上闡述了知識圖譜的概念。而知件是計算機可操作性的知識模塊,分為源數(shù)據(jù)層、策略層、表現(xiàn)層。關(guān)于知件她們也做了一些研究,在知件的基礎(chǔ)上,如何進行模型驅(qū)動的知識抽取、知識的編排和演算,以及進行綜合報告的深層化 ,這些都非常有意義。
在演講的最后她提到,“我們希望在開放性學(xué)術(shù)知識圖譜和可定制學(xué)術(shù)評價上,構(gòu)建一個開放的學(xué)術(shù)評價社群?!?/p>
之后,王冠三先為大家描述了他認(rèn)為的AI是什么,然后為大家描述了知識圖譜的概念、包含哪些東西。他表示,他們之前在研究中讓機器來讀所有的論文,看機器是否能自己教會自己讀取出需要抽取出來的信息等。
在對學(xué)者的排序過程中,對影響力的評估很重要。他們通過用不同的方法來進行排序,然后通過對結(jié)果來進行分析,來判斷排序方法。目前有很多進行高校排名的方法,也出現(xiàn)了很多不同的名單,但并不是所有的方法都公平。他表示,他們用的是迭代算法來進行計算。在對學(xué)科進行評比的過程中,有些學(xué)校并不是每個小學(xué)科都能涵蓋,這時候就需要選擇有效的評比方法。另外,目前學(xué)術(shù)界每個月都會涌現(xiàn)出大量的論文,這時候就需要借助于機器。
最后,他也介紹到Open Academic Graph數(shù)據(jù)的使用方式,以及一些與它相關(guān)的技術(shù)手段,例如如何構(gòu)建關(guān)系,將圖畫出來。
作為最后一位演講的嘉賓,唐杰副教授先是總結(jié)了大家前面的演講,然后介紹了開放學(xué)術(shù)組織(Open Academic Society),從理論研究、技術(shù)推廣、國內(nèi)國際合作等多個方面介紹了AMiner的總體情況,目前他們已經(jīng)與多個機構(gòu)合作成立了研究中心,包括與中國工程院合作成立了知識智能聯(lián)合實驗室,與微軟合作成立數(shù)據(jù)研究院科技大數(shù)據(jù)研究中心等。
此外,他也提到了Open Academic Graph開放數(shù)據(jù),他初步介紹了這個數(shù)據(jù)集的一些基本情況,除了論文數(shù)據(jù),他們還發(fā)布了學(xué)者的相關(guān)信息、學(xué)者之間的關(guān)聯(lián)信息、profile信息等。基于這些數(shù)據(jù),他們還組織了一些數(shù)據(jù)挖掘比賽。
他表示,現(xiàn)在可以結(jié)合大數(shù)據(jù)、知識分析等,做出很多的學(xué)術(shù)地圖畫像,他為大家展示了他們做的人才遷徙圖,可以看到國際上頂尖人才的遷徙路徑。此外,基于那些學(xué)術(shù)大數(shù)據(jù),他們還做了機構(gòu)排名,也發(fā)布了CS領(lǐng)域最有影響力的學(xué)者排名?!按蠹乙怯信d趣可以在這個數(shù)據(jù)上做非常多的工作,我們這個數(shù)據(jù)集完全開放?!?/p>
在最后panel討論環(huán)節(jié)的嘉賓有金芝、周志華、王冠三、陳熙霖、王新兵,大家針對數(shù)據(jù)VS知識、大數(shù)據(jù)VS小數(shù)據(jù)、簡單評價方法VS復(fù)雜評價方法等進行了精彩的討論。針對最近的熱門話題Alphago Zero,也有現(xiàn)場觀眾進行踴躍提問。欲知更多詳細(xì)內(nèi)容,敬請關(guān)注雷鋒網(wǎng) AI科技評論。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章