0
本文作者: 我在思考中 | 2022-03-21 10:27 |
作者 | 西西
編輯 | 陳彩嫻
剛剛,斯坦福大學(xué)發(fā)布了著名的《2022年人工智能報告》(Artificial Intelligence Index Report 2021,以下簡稱「報告」),迅速在人工智能領(lǐng)域引起傳閱。
報告鏈接:https://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf
從2017年至今,斯坦福大學(xué) AI Index 每年都會發(fā)布一份報告,由于數(shù)據(jù)詳細、調(diào)查來源清晰、觀點充實等等優(yōu)點,在總結(jié)過去一年的 AI 發(fā)展上有著較為權(quán)威的發(fā)聲,一向為讀者關(guān)注。到今年,由李飛飛領(lǐng)導(dǎo)的 HAI 實驗室領(lǐng)導(dǎo),已是第五版。
除了原先的技術(shù)趨勢分析,今年該報告還增加了對全球機器人的調(diào)查,以及25個國家與地區(qū)(不包含中國,所以此處不討論)在 AI 層面的立法活動。
更值得注意的是,今年斯坦福的AI指數(shù)報告首次大篇幅地討論了人工智能在現(xiàn)實生活中的落地問題,包括 AI 在經(jīng)濟發(fā)展中的角色,以及 AI 在落地推廣過程中所引起的潛在倫理問題。
報告指出,一方面,外界對 AI 領(lǐng)域的投資比例在上升:與2020年(460億美元)相比,2021年 AI 投資的資金增長了103%(965億美元)。同時,AI 出現(xiàn)「物更美、價更廉」的特征,例如,自 2018 年以來,訓(xùn)練圖像分類系統(tǒng)的成本降低了 63.6%,而訓(xùn)練效率卻了 94.4%。
但另一方面,AI 在現(xiàn)實生活中的日益滲透也加劇了社會倫理的危機。因此,接下來,我們也許會看到,越來越多對 AI 的討論不僅再局限于模型與算法的創(chuàng)新,或連接主義與符號主義孰劣孰優(yōu),而是:在人工智能時代全面來臨之前,我們應(yīng)該做好哪些「基建層面」的準備工作?
由于報告內(nèi)容長達200多頁,所以AI科技評論僅從中美對比的角度對報告進行了整理:
根據(jù)報告,從研究機構(gòu)看,全球范圍內(nèi)高校對 AI 研究出版物的貢獻比例最高,高達59.58%,而公司僅占 5.21%:
單就這一層面,美國的 AI 出版物中,高校比例不斷下降,2021年占 57.63%,企業(yè)占 9.76%:
而中國的 AI 出版物中,高校比例不斷上升,占比 60.24%,企業(yè)占比雖然也不斷上升,但2021年僅占比 3.93%:
盡管中美關(guān)系緊張,但報告發(fā)現(xiàn),在 2010 年到 2021 年期間,中美合作的AI論文數(shù)量在跨國合作論文數(shù)量排行中位居榜首,是第二名(中英合作)的2.7倍:
報告還對比了中國、歐盟&英國、與美國在過去12年的AI出版物占比,其中中國的數(shù)量一直保持第一,占比31.04%,其次是歐盟與英國(19.05%),美國為 13.67%:
在 AI 期刊論文的引用數(shù)上,中國的占比逐漸上升,2021年排名第一(27.84%),美國的被引用數(shù)則為 17.45%:
在 AI 會議上,中國的論文發(fā)表數(shù)量也是排名全球第一,占比 27.6%,而美國為 16.9%,位居第三:
盡管出版數(shù)量上中國占優(yōu)勢,但報告發(fā)現(xiàn),美國在 AI 會議上的論文被引數(shù)最高,占比29.52%,中國則只有15.32%:
在AI存儲庫(如arXiv)出版物上,美國自2011年以來一直保持領(lǐng)先地位,2021年占比 32.52%,但中國也不甘落后,比例一直上升,2021年占比16.6%:
在AI存儲庫出版物的引用數(shù)上,美國在2021年也是位居第一,引用率高達 38.6%,而中國為 16.4%:
在人工智能專利的申請上,2021年中國申請了全球一半以上的人工智能專利(51.69%),美國則為 16.92%:
首先,在人才招聘一塊,報告顯示,中國香港在 AI 人才的招聘增長速度上位于全球第二,較 2016 年增長了 1.56 倍:
通過計算 2015 年至 2021 年期間 LinkedIn 用戶在給定領(lǐng)域的自我添加技能的頻率,報告發(fā)現(xiàn),在AI 技能的滲透率上,印度的平均滲透率最高,其次是美國(2.24),而中國為 1.56,排名全球第四:
此外,在 AI 產(chǎn)業(yè)的投資上,美國的 AI 公司在獲得總體私人投資上位居世界第一,約為 529 億美元,而中國位居第二,為 172 億美元,美國是中國的三倍:
而在2013年至2021年的私人投資總額上,美國投資總額為 1490 億美元,中國投資總額為 619 億美元:
值得注意的是,從 2013 年到 2021 年,美國對人工智能公司的私人投資是中國的兩倍多,而中國本身是同期英國總投資的六倍左右。按地理區(qū)域劃分,如圖 4.2.6 所示,2020 年至 2021 年美國、中國和歐盟的投資均有所增長,其中美國分別領(lǐng)先中國和歐盟的 3.1 倍和 8.2 倍:
從 AI 公司的數(shù)量上看,2021 年,美國以 299 家公司領(lǐng)先,其次是中國,有 119 家:
在 AI 的采用率上,2021年采用率最高的是高科技/電信的產(chǎn)品和/或服務(wù)開發(fā)(45%),其次是金融服務(wù)的服務(wù)運營(40%), 高科技/電信(34%)和金融服務(wù)的風(fēng)險職能(32%):
而采用的 AI 能力類型上,2021 年,嵌入率最高的是高科技/電信行業(yè)的自然語言文本理解(34%),其次是金融服務(wù)和汽車和裝配行業(yè)的機器人流程自動化(33%)和金融服務(wù)的自然語言文本理解(32%):
那么,采用人工智能的風(fēng)險可能有哪些?
報告稱,55% 的受訪者認為 2021 年最突出的 AI 應(yīng)用風(fēng)險是網(wǎng)絡(luò)安全,其次是監(jiān)管合規(guī)性(48%)、可解釋性(41%)和個人隱私(41%):
報告還稱,「盡管人工智能在全球范圍內(nèi)部署,許多研究人工智能倫理的論文還是集中在英語模型與數(shù)據(jù)集上」。
由于 AI 系統(tǒng)已被部署到世界各地,研究人員開始加大對 AI 與現(xiàn)實交互的關(guān)注度,尤其是 AI 落地可能帶來的危害,例如帶有種族歧視的人臉識別系統(tǒng)、帶有性別歧視的簡歷篩選系統(tǒng),以及經(jīng)濟收入歧視的 AI 臨床工具等。
AI 模型在落地過程中展示出來的社會偏見,使研究者們增加了對研究 AI 倫理、公平與偏見的興趣,并驅(qū)使相關(guān)從業(yè)者積極尋找解救措施。
如前所述,該報告還增加了對 AI 倫理的探討。報告發(fā)現(xiàn):
語言模型所展現(xiàn)出的「偏見」問題最明顯,且新數(shù)據(jù)表明:語言模型的規(guī)模越大,在訓(xùn)練數(shù)據(jù)中反映出來的偏見也越普遍。比如,一個2021年開發(fā)的 2800 億參數(shù)模型比 2018 年 1.17 億參數(shù)的模型的毒性增加了 29%
自 2014 年以來,針對 AI 公平性與透明性的研究呈爆炸式增長,相關(guān)出版物增加了五倍,算法公平與偏見的研究逐漸成為主流研究課題,而且工業(yè)界在該方向的研究工作發(fā)表同比增加了 71%
多模態(tài)模型也呈現(xiàn)出多種多樣的、創(chuàng)紀錄的「偏見」,例如,關(guān)于 CLIP 的實驗表明,黑人圖像被錯誤分類為非人類的比率是其他種族的兩倍以上
此外,報告指出,雖然全球范圍內(nèi)的研究者都對 AI 公平性、問責(zé)性與透明性的研究越發(fā)感興趣,但在相關(guān)會議 FAccT 上,大多數(shù)的論文都由美國的研究人員撰寫。從2020年到2021年,來自北美機構(gòu)的論文比例從70.2%上升到75.4%:
與其他語言的事實檢驗數(shù)據(jù)集相比,英語數(shù)據(jù)集的比例最高,有 142 個,而非英語數(shù)據(jù)集只有35個(其中中文數(shù)據(jù)集只有5個):
這一點間接地諷刺了人工智能領(lǐng)域的中文研究者缺少對 AI 倫理的論文發(fā)表。換言之:較少中國研究者從事 AI 倫理層面的科研工作。那么,報告的觀點是否有失偏頗呢?也許只能評論區(qū)見分曉。
在 AI 的落地研究上,如何縮小中美差距?談?wù)勀愕目捶ā?/span>
參考鏈接:
https://aiindex.stanford.edu/report/
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。