0
本文作者: 黃善清 | 2019-01-22 09:33 |
雷鋒網(wǎng) AI 科技評論按:美國斯坦福大學創(chuàng)立的 AI Index 項目旨在追蹤人工智能的活動和進展,以可靠、可驗證數(shù)據(jù)為基礎,研究人工智能對人們生活的影響。2018 年度的《AI Index》在 2018 年 12 月 17 日如期發(fā)布,從學界和業(yè)界的角度對全球的 AI 生態(tài)進行了全盤總結。
AI Index 最早可追溯至美國斯坦福大學一個名叫「AI100」的項目,其首要目標是持續(xù)地去調查、總結人工智能未來 100 年在學術研究、經(jīng)濟、道德倫理、法律等方面的進展和對此的展望,然而遺憾的是,該報告每五年推出一次,不能及時跟蹤 AI 的發(fā)展。2016 年,斯坦福大學計算機科學院教授,前谷歌首席科學家 Yoav Shoham 決定退出「AI100」的領導小組,并和 Ray、Erik、Jack 和 Kelven 等人開始領導、開發(fā)一項旨在及時跟蹤并反映人工智能當前發(fā)展的現(xiàn)狀的一個指標體系——AI Index。
第一份報告《AI Index 2017》于 2017 年 12 月份正式推出,上個月 17 日,第二份報告《AI Index 2018》如期發(fā)布。
經(jīng)雷鋒網(wǎng) AI 科技評論分析,與上一年相比,《AI Index 2018》的分析指標更全面細致,同時不再只注重于北美地區(qū)的 AI 活動分析。具體內容方面,有幾個亮點值得我們關注:
中國在 2017 年產(chǎn)出全球 25% 的 AI 論文(排名第一的歐洲也才 28%),AI 論文發(fā)表數(shù)量與 2007 年相比,增幅將近 150%,然而論文影響力部分依然存在增長空間。
美國依然是全球論文引用影響力最高的地區(qū),美國學者的論文引用影響力要比全球平均水平高出 83%。
自 2007 年以來,中國政府署名 AI 論文經(jīng)歷了 400% 的增長,而同期中國企業(yè)署名 AI 論文增長只有 73%。
中國擁有最高比例的固守類 AI 學者(76%),其次為歐洲(52%)和美國(38%)。固守類 AI 學者即那些未曾在家鄉(xiāng)以外地區(qū)發(fā)表過論文的活躍研究人員。中國的非固守類學者雖然占比較小,然而論文出版率卻高于其他兩個地區(qū)的非固守類學者,說明中國的非固守類學者更有效率。
自 2014 年開始,計算機視覺與模式識別一直是 arXiv 上為數(shù)最多的 AI 子類論文。
神經(jīng)網(wǎng)絡論文在 2010 年——2014 年的復合年增長率(CAGR)為 3 %,而這個數(shù)值在 2014 年——2017 年期間則是 37 %。
2014 年,30% 的 AI 專利源自美國,韓國和日本分別以 16% 排在第二、第三。
由于報告信息體量較大,雷鋒網(wǎng) AI 科技評論挑選了其中大部分的學術章節(jié)與小部分的業(yè)界章節(jié)進行翻譯,其他內容可自行查閱:
http://cdn.aiindex.org/2018/AI%20Index%202018%20Annual%20Report.pdf
活動體量
【AI 學術論文發(fā)表情況】
1)主題
下圖展示不同主題的學術論文的年度發(fā)表情況(與 1996 年對比),報告將這些主題劃分為:AI 、計算機科學以及所有領域。
數(shù)據(jù)來源:Scopus
結果表明:
與 1996 年相比,AI 學術論文的年度發(fā)表率增加 8 倍,計算機科學學術論文則是 6 倍。
AI 學術論文在年度發(fā)表率上持續(xù)超越計算機科學學術論文,說明如今 AI 學術論文的增長不僅僅是出于學界對計算機科學領域的濃厚興趣。
2)地區(qū)
下圖展示不同地區(qū)的 AI 論文的年度發(fā)表情況。
數(shù)據(jù)來源:Elsevier
結果表明:
歐洲繼續(xù)穩(wěn)坐 AI 論文發(fā)表戶的頭把交椅,在 2017 年產(chǎn)出全球 28% 的 AI 論文。
緊隨其后的中國在 2017 年產(chǎn)出全球 25% 的 AI 論文,AI 論文發(fā)表數(shù)量與 2007 年相比,增幅將近 150%(盡管 2008 年前后曾出現(xiàn)異常波動)。
排名第三的美國在 2017 年產(chǎn)出全球 17% 的 AI 論文。
3)子類別
下圖展示不同子類別的 AI 論文的發(fā)表情況。需要強調的是,這些子類別之間并非排他關系。
數(shù)據(jù)來源:Elsevier
結果表明:
機器學習與概率推理論文占到 2017 年論文總數(shù)的 56%,而這個比例在 2010 年時只有 28 %。
相較 2010 年——2014 年,大部分子類別的論文發(fā)表率在 2014——2017 年期間經(jīng)歷了高速增長。
值得注意的是,神經(jīng)網(wǎng)絡論文在 2010 年——2014 年的復合年增長率(CAGR)為 3 %,而這個數(shù)值在 2014 年——2017 年期間則是 37 %。
4)arXiv
下圖展示幾個關鍵子類別的 AI 論文在 arXiv 上的發(fā)表數(shù)量。右軸是 arXiv 上所有 AI 論文的總和(由灰色虛線進行表示)。
數(shù)據(jù)來源:arXiv
結果表明:
arXiv 上的 AI 論文在總體與個別子類上處于增長狀態(tài),說明 AI 學者傾向于對研究進行傳播,無論該研究是否經(jīng)過同行評審或者被學術會議所接收。這也從側面反映了該領域的競爭性。
自 2014 年開始,計算機視覺與模式識別一直是 arXiv 上為數(shù)最多的 AI 子類論文,2014 年之前,該子類論文在增長上還是緊隨人工智能子類和機器學習子類之后。
5)側重領域
下圖展示美國、歐洲與中國的 Relative Activity Index (RAI 指數(shù))——RAI 指數(shù)通過將具體某個地區(qū)的 AI 研究活動與全球進行對比,從而近似某個地區(qū)的 AI 研究側重。
如果指數(shù)是 1,說明與全球保持一致,大于 1 意味重視,小于 1 則意味較少被關注。
數(shù)據(jù)來源:Elsevier
結果表明:
中國的 AI 論文更側重于工程技術和農(nóng)業(yè)科學領域,而美國和歐洲的 AI 論文則傾向于人文科學和醫(yī)學健康領域。
與 2000 年相比,這三個地區(qū)的領域 AI 專業(yè)水平在 2017 年都有明顯提升,其中中國的側重領域轉向了農(nóng)業(yè)科學。中國的轉變基本符合我們的預期,因為它是世界上最大的食品生產(chǎn)國,同時傾向于將研究重點放在 AI 應用上。
6)署名機構
下圖展示 Scopus 上由政府、企業(yè)和醫(yī)療機構署名的論文總量,涉及中國、美國和歐洲 3 個地區(qū)。此外,我們也展示了企業(yè)署名論文與政府署名論文的增長情況。
數(shù)據(jù)來源:Elsevier
數(shù)據(jù)來源:Elsevier
結果表明:
2017 年,中國政府署名 AI 論文的產(chǎn)量幾乎是中國企業(yè)署名論文的 4 倍。自 2007 年以來,中國政府署名 AI 論文經(jīng)歷了 400% 的增長,同期中國企業(yè)署名 AI 論文的增長只有 73%。
美國的 AI 論文很大比例都是由企業(yè)產(chǎn)出的,單就 2017 年而言,其企業(yè)署名 AI 論文的比例是中國的 6.6 倍,歐洲的 4.1 倍。
需要強調的是,三個地區(qū)的高校署名論文(圖中未顯示)在數(shù)量上都超過了政府、企業(yè)和醫(yī)療機構。
7)論文引用影響力
下圖展示不同地區(qū) AI 學者的科研論文影響力(Field Weighted Citation Impact,簡稱 FWCI)——FWCI 將某地區(qū) AI 學者的論文引用平均值除以了所有 AI 學者的論文引用平均值。圖中的 FWCI 被我們重新進行調整,其引用影響力是相對于世界平均值進行展示的。
如果其指數(shù)是 1,說明論文的引用影響力與世界平均值保持一致,如果指數(shù)是 0.85,說明論文的引用影響力要比世界平均值低 15%。
數(shù)據(jù)來源:Elsevier
結果表明:
作為全球每年發(fā)布 AI 論文最多的地區(qū),歐洲 AI 論文的引用影響力維持在相對平穩(wěn)的水平,基本與全球平均水平相當。
中國的論文引用影響力有明顯增長,中國學者在 2016 年的論文引用影響力要比 2000 年高出 44%。
美國依然是全球論文引用影響力最高的地區(qū),美國學者的論文引用影響力要比全球平均水平高出 83%。
8)學者流動性與論文發(fā)表的關系
下圖展示流動性如何對論文發(fā)表率以及 AI 學者的論文引用影響力造成影響。
我們主要關注這 4 種流動類型的學者:固守(Sedentary)、短暫流出(Transitory)、流入遷移(Migratory Inflow)和流出遷移(Migratory Outflow)。固守類學者是指那些未在家鄉(xiāng)以外地區(qū)發(fā)表過論文的活躍研究人員;短暫流出類學者是指那些曾在家鄉(xiāng)以外地區(qū)發(fā)表過兩年或以下論文的研究人員;遷移類學者是指那些曾在家鄉(xiāng)以外地區(qū)發(fā)表過兩年或以上論文的研究人員,至于屬于「流出」還是「流入」,主要取決于圖表的視角。
x 軸展示的是論文相對發(fā)表率(每個類別作者的平均出版數(shù)除以該區(qū)域的整體平均出版數(shù));y 軸展示的是 FWCI(每個類別作者的平均論文引用數(shù)除以該區(qū)域的整體平均論文引用數(shù))。本章節(jié)的分析只考慮 AI 學者,即寫過的論文中起碼有 30% 是關于 AI 的研究人員。學者的家鄉(xiāng)則取決于他第一篇論文的發(fā)表地區(qū)。
數(shù)據(jù)來源:Elsevier
結果表明:
無論是美國、中國還是歐洲,固守類學者的論文發(fā)表率都是最低的。
無論是美國、中國還是歐洲,遷移類學者(包括流入遷移與流出遷移)的論文引用影響力(FWCI)都是最高的。這說明經(jīng)常流動的學者往往擁有更多的論文引用,并傾向于頻繁發(fā)表論文。
在上述 3 個地區(qū)當中,中國擁有最高比例的固守類學者(76%),其次為歐洲(52%)和美國(38%)。中國的非固守類學者雖然占比較小,然而論文出版率卻高于其他兩個地區(qū)的非固守類學者,說明中國的非固守類學者更有效率。
流動性強的學者在論文引用數(shù)與論文發(fā)布頻率上都要更高。
9)頂會論文發(fā)表
下圖展示了 2018 年 AAAI 大會的論文提交與接收情況(按國別統(tǒng)計),大會于 2018 年 2 月份在美國路易斯安那州新奧爾良市舉行。
數(shù)據(jù)來源:AAAI
結果表明:
70% 的提交論文來自中國和美國,中國以 1242 篇排名第一。
就接收論文數(shù)量方面,中國與美國相差無幾,分別為 265 篇(接收率 21%)和 268 篇(接收率 29%)。
德國與意大利的論文接收率最高,達到了 41%,然而兩者提交的論文數(shù)量較少。
10)高校 AI 課程報讀情況
下圖展示了美國地區(qū)以外幾所計算機學科處于領先地位的大學,它們的 AI + ML 相關課程的注冊情況。第一張圖展示這些院校在 2010 年——2017 年的課程注冊增長情況,第二張圖則展示的是 2016 年——2018 年的課程注冊增長情況。關于院校的選擇標準、實際入學人數(shù)及完整高校名稱可參閱報告中的「附錄」。
數(shù)據(jù)來源:高校數(shù)據(jù)
結果表明:
中國清華大學的 AI + ML 課程在 2017 年的報讀人數(shù)是 2010 年的 16 倍。
在研究中我們發(fā)現(xiàn),報讀人數(shù)的增長并未受到地理位置的特別影響,而是跟院校本身的關系更大一些。我們會在未來的報告中持續(xù)完善這一假設。
11)大型頂會參會情況
下圖分別展示了大型頂會的出席人數(shù)以及對比 2012 年的增長情況。這里的「大型」指的是那些 2017 年出席人數(shù)超過 2000 人的頂會。
數(shù)據(jù)來源:頂會數(shù)據(jù)
結果表明:
NeurIPS (原 NIPS )、 CVPR 和 ICML 作為出席率最高的 AI 頂會,它們的出席增長率(自 2012 年以來)同樣也是最高的,當中又以 NeurIPS 和 ICML 的增長速度最快,分別達到 2012 年的 4.8 倍 & 6.8 倍,說明 ML 作為 AI 子領域持續(xù)受到大家的密切關注。
與此同時,專注符號推理(symbolic reasoning)的大型頂會的增長率相對較小。
12)小型頂會參會情況
下圖分別展示了小型頂會的出席人數(shù)以及相比 2012 年的增長情況。這里的「小型」指的是那些 2017 年出席人數(shù)少于 2000 人的頂會。
數(shù)據(jù)來源:頂會數(shù)據(jù)
結果表明:
ICLR 2018 的出席人數(shù)對比 2012 年增長了 20 倍,我們認為這一增長可能與近年大家更加關注深度與強化學習有關。
【AI 業(yè)界應用情況】
1)AI 初創(chuàng)企業(yè)融資情況
下圖展示了在特定年份中獲得風險投資支持的美國初創(chuàng)企業(yè)數(shù)量。藍線(左軸)顯示的是 AI 領域的初創(chuàng)企業(yè),灰線(右軸)則顯示的是綜合領域的初創(chuàng)企業(yè)(含 AI 初創(chuàng)公司)。這些數(shù)據(jù)是逐年積累的。
數(shù)據(jù)來源:Sand Hill Econometrics
結果表明:
2015 年 1 月—2018 年 1 月,活躍的 AI 初創(chuàng)企業(yè)增加了 2.1 倍,綜合領域的初創(chuàng)企業(yè)則是增加了 1.3 倍。
在多數(shù)情況下,綜合領域的初創(chuàng)企業(yè)都保持相對穩(wěn)定的增長速度,而 AI 初創(chuàng)企業(yè)則是呈指數(shù)級的增長。
2)AI 初創(chuàng)企業(yè)融資情況
下圖展示了風險投資向不同階段美國初創(chuàng)企業(yè)提供的的年度融資金額。藍線(左軸)顯示的是 AI 初創(chuàng)企業(yè)的融資金額,灰線(右軸)則顯示的是綜合初創(chuàng)企業(yè)(含 AI 初創(chuàng)公司)的融資金額。這些數(shù)據(jù)是年度總結而非逐年累積的。
數(shù)據(jù)來源:Sand Hill Econometrics
結果表明:
從 2013 到 2017 年,AI 初創(chuàng)企業(yè)的融資金額增加了 4.5 倍,綜合初創(chuàng)企業(yè)則增加了 2.08 倍。
1997 年—2000 年的爆發(fā)性增長可用互聯(lián)網(wǎng)泡沫(dot-com bubble)來進行解釋。
2014 年與 2015 年小幅度爆發(fā)增長反映了當時的經(jīng)濟繁榮增長。
3)崗位所需 AI 技能
下圖分別展示了 AI 型崗位的歷年缺口及增長情況。需要注意的是,這些崗位所需的 AI 技能之間并非排他關系。
數(shù)據(jù)來源:Monster.com
結果表明:
機器學習是這些崗位中需求量最大 AI 技能。
深度學習的需求在 2015 年—2017 年經(jīng)歷高速增長,相關崗位數(shù)量增加了 35 倍。
4)AI 專利
下圖展示了不同區(qū)域 AI 專利的增長情況。這些 AI 專利通過 IPC 專利碼進行匯總,主要集中在認知與意義理解(Cognition and meaning understanding)和人機交互領域。按時間追蹤專利發(fā)布情況是一項富有挑戰(zhàn)性的事情,關于指標的注釋和差異說明,請參閱報告的「附錄」。
數(shù)據(jù)來源:amplified
結果表明:
2014 年,30% 的 AI 專利源自美國,韓國和日本分別以 16% 排在第二、第三。
韓國和中國臺灣在 2014 年的增長幅度最大,比 2004 年增加了將近 5 倍。
5)AI 在企業(yè)中的使用情況(按地區(qū))
下圖展示的是麥肯錫公司針對 2135 名企業(yè)雇員的調查結果,可以反映 AI 技能在企業(yè)業(yè)務中的使用情況,涉及地區(qū)包括北美洲、發(fā)展中國家(含中國)、歐洲、亞太地區(qū)、印度、中東與北非和拉丁美洲,
數(shù)據(jù)來源:麥肯錫公司
結果表明:
雖然部分地區(qū)出現(xiàn)更加倚重某個 AI 技能的情況,然而大體而言,不同地區(qū)在 AI 技能的采用上是相對均衡的。我們將持續(xù)跟蹤這一結果隨著時間的變化情況。
6)Github 星標數(shù)量
下圖展示了不同 AI 和 ML 軟件包在 GitHub 上的星標數(shù)量,從中可以初步判斷不同 AI 編程框架的流行程度。
數(shù)據(jù)來源:Github
結果表明:
幾個由主要企業(yè)開源的編程框架日益流行,它們分別為谷歌的 Tensorflow、Facebook 的 Pytorch 以及亞馬遜的 mxnet,當中又以 TensorFlow 的普及程度最為明顯。
衍生測量指標
本章節(jié)試圖分析前邊提及的趨勢之間的關系。
學界-業(yè)界動態(tài)分析(Academia-Industry Dynamics)
為了探索 AI 分別在學界和業(yè)界的趨勢之間的關系,我們首先從前邊內容中選取了一些有代表性的測量指標,尤其是 Scopus 上的 AI 論文發(fā)表情況、美國多所大學的入門級 AI 課程注冊情況,以及 AI 初創(chuàng)公司的融資情況。
由于這些指標無法直接進行對比,為了能夠更好分析趨勢之間的關系,我們從 2010 年起開始對每個指標進行標準化,以確保顯示的是增長情況,而非絕對數(shù)字。
數(shù)據(jù)來源:Sand Hill Econometrics、Scopus 以及大學數(shù)據(jù)
AI 活躍指數(shù)(The AI Vibrancy Index)
該指數(shù)將論文發(fā)表、課程注冊以及風險投資 3 個學術-業(yè)界指標匯總成一個衡量標準,以量化 AI 作為獨立領域活躍程度。和學界-業(yè)界動態(tài)分析(Academia-Industry Dynamics)一樣,AI 活躍指數(shù)(The AI Vibrancy Index)在 2010 年是進行了統(tǒng)一標準化。
數(shù)據(jù)來源:Sand Hill Econometrics、Scopus 以及大學數(shù)據(jù)
AI 活躍指數(shù)在很大程度上由風險投資推動,這是因為相對其他兩個指標,風險投資的增長幅度最大。不過三個指標的權重是相等的。我們鼓勵讀者們自行下載我們的數(shù)據(jù),并對指標和權重進行調整,進而創(chuàng)建出一個最符合個人需求的 AI 活躍指數(shù)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。