丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能學術 正文
發(fā)私信給我在思考中
發(fā)送

0

國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!

本文作者: 我在思考中 2021-10-11 18:46
導語:也許科研的真正危機不是造假,而是平庸論文泛濫。

國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!

 作者 | 琰琰 
從2012年至今,我國科研論文的發(fā)表數(shù)量一直在持續(xù)增長。據(jù)Web of science數(shù)據(jù)統(tǒng)計,近10年中國科研人員發(fā)表 SCI 論文總數(shù)已累計339.7萬篇,反超美國躍居全球榜首。
 然而,論文數(shù)量的暴增是否真的代表科學的進步?
近日,美國著名SCI期刊PNAS(Proceedings of the National Academy of Sciences  )刊登文章《Slowed canonical progress in large fields of science》指出,在科學研究領域,“同質化”論文的大規(guī)模生產可能會阻礙新興思想的出現(xiàn)。
國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!
這篇文章出自美國西北大學和芝加哥大學聯(lián)合研究團隊,他們通過241門細分學科的9000萬篇論文的18億次引用的定量分析發(fā)現(xiàn),大量論文的發(fā)表不但沒有加快研究范式的更替,反而鞏固了經(jīng)典研究。那些可能蘊含潛在的、顛覆性觀點的新論文正面臨出版難、閱讀量低、引用量少的困境,并且沒有因為時間的演進而吸引更多人的關注。
這種現(xiàn)象所帶來的后果是:如果科學家和研究機構仍然以“數(shù)量”來衡量科研能力,而不是關注科研質量和影響力,那么論文的暴增將從根本上阻礙科學的進步!

1

新論文引用率低,無創(chuàng)新是普遍現(xiàn)狀 

對大多數(shù)人而言,科學進步最直觀的表現(xiàn)就是“越多越好”,某一學科發(fā)表的論文越多,科學進步的速度就越快;研究人員越多,覆蓋的范圍就越廣。即使不是每一篇論文都有翻天覆地的影響力,但每一篇論文都可以為聚沙成塔貢獻一粒沙子,增加新范式出現(xiàn)的可能。
事實上,眾多科學領域每年的論文發(fā)表數(shù)量正在快速增長。以人工智能為例,從2007年到2017年,近10年的時間中國AI論文增長了400%,企業(yè)論文增長了73%。在國際學術會議中,ACL 2019年的投稿量超過2800篇,相比2018的1544篇,增量超過81%。同年NeurIPS也增長40%,投稿量達6809篇。CVPR\ICCV\ECCV三大計算機視覺頂會更是增幅明顯。
其背后的原因一方面與學術政策和激勵措施密切相關。在科學研究領域,不論是職位晉升還是考量績效,專利、發(fā)表文章、文章的引用以及刊登雜志的影響因子都會成為核心指標。這些量化指標決定了科研人員的職業(yè)軌跡以及學術機構、企業(yè)和評估標準。對于一名高校學者而言,如果在規(guī)定的時間內發(fā)表足夠多的論文,就有可能獲得晉升或者終身教職的機會。
而另一層原因是,論文的“質量”也越來越傾向于定量化評估,引用量普遍被用來衡量某一學科領域內個人、出版商和期刊的重要程度。一篇引用次數(shù)多的論文會被默認為最佳、最有價值的研究,甚至會被視為該領域內的里程碑之作。
然而,這項研究中發(fā)現(xiàn)大量科研成果的發(fā)表不但沒有推動科學的發(fā)展,反而成了行進的阻力,這是因為某一科學領域發(fā)表的論文數(shù)量逐年增多時,學者更傾向于引用已有的經(jīng)典論文,而不是新論文,反過來,較低的引用次數(shù)又進一步影響了新論文的關注度,這導致學術研究很難擺脫現(xiàn)經(jīng)典研究思想的束縛,而事實也證明,更多的新論文創(chuàng)新度不高,多局限于已有的理論框架。
作者在文中具體列出了六項可能帶來的影響,并強調如果是研究范圍更廣的科研領域,以下現(xiàn)象可能會更明顯:
1)新引用更偏向經(jīng)典論文,而不是引用較少的新論文;
2) 引用最多的論文在每年的引用排名中幾乎保持不變;
3) 一篇新論文最終成為最常引用論文的概率下降; 
4) 新論文不會通過長時間的累積傳播進入最常引用行列;
5) 新論文延續(xù)現(xiàn)有科學思想的比例增加,顛覆性思想的比例減少;
6)具有足夠影響力的論文,出現(xiàn)的可能性降低。
至于為什么會出現(xiàn)這種現(xiàn)象,作者認為在理論上可能存在兩方面因素,一是大量的新論文可能會剝奪專家和學者充分認識和理解一個新想法所需的時間和認知程度。二是過多新想法之間的競爭也可能會妨礙學者們發(fā)現(xiàn)或者將意力集中在一個有前景idea上。
隨著每年各學科領域科研成果數(shù)量的持續(xù)增長,這種影響會只增不減,且不可避免,除非采取政策措施重組科學生產的價值鏈,使大眾的注意力集中在有前途的、新穎的想法上。

2

實驗證明及分析

總結來看,在大多數(shù)學科領域中,高引用量的經(jīng)典論文一直持續(xù)占據(jù)主導地位,這導致新論文的引用幾率較低,并隨著時間的推移淹沒在了海量論文庫中。此外,從內容上來講,最新發(fā)表的論文更傾向于擴展現(xiàn)有理論,而不是進行底層創(chuàng)新,很少有打破常規(guī)的新觀點被提出。以下是241門細分學科和9000萬篇論文的實證結論:
一、在大多數(shù)學科中,引用最多的論文獲得了更高的引用份額。
如圖1(A),引用次數(shù)最多的論文在最大研究領域的基尼系數(shù)為0.5,相當于貧富差距最大的兩個國家的系數(shù)水平——只有中國和南非的基尼系數(shù)高于0.5。重要的是,論文引用份額的嚴重失衡,導致研究方向出現(xiàn)明顯的“馬太效應”。

國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!

圖1:不同學科論文引用量的動態(tài)變化過程
左圖(A)表明,當某個領域發(fā)表的論文越多,被引用最多的論文在新引用中所占比例就會越大;右圖(B)表明,當某個領域發(fā)表的論文越多,高引用論文的排名就越穩(wěn)定。
如電氣和電子工程領域,如果每年有10000篇論文出版,前0.1%的論文獲得1.5%的引用概率,前1%的論文獲得8.6%的引用;如果發(fā)表50000篇論文,前0.1%的論文獲得3.5%的引用,前1%的論文獲得11.9%的引用;如果發(fā)表10萬篇論文,前0.1%的論文獲得5.7%的引用,前1%的論文獲得16.7%的引文。相比之下,隨著每年論文發(fā)表量的增多,50%低引用論文在新引用中所占份額明顯下降,從每年10000篇論文 43.7%的引用次數(shù)占比,下降到每年50000篇和100000篇論文占比僅稍稍高于20%。 
二、在范圍更大的學科領域,論文發(fā)表數(shù)量越多,引用最多的論文在高引排名中的波動越小。
如圖1(B)所示,在引用最多的前50篇論文中,論文發(fā)表的本年和下一年之間在排名上存在明顯的相關性。而在隨后的幾年,如果預測前50名引用最多的論文的斯皮爾曼等級系數(shù),該系數(shù)從一年1000篇論文的0.25,增加到了一年100000篇論文的0.74。這是因為當研究范圍較大時,引用最多的論文每年都會保持其引用次數(shù),而其他所有論文的引用次數(shù)都會減少。 
國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!

 圖2:引用衰減率

圖(A)表明盡管有大量新論文發(fā)表,引用最多的論文平均每年保持在高引用前列;圖(B-C)表明除引用最多的論文外,所有論文在該研究領域的引用次數(shù)均逐年減少。圖(D)表明在所有學科領域,只有引用最多的論文每年保持高引用水平,其他所有論文平均每年的引用量都較少。
上圖顯示了在不同引用份額上論文本年與上一年引用的預測比率。可以看出,在論文發(fā)表量少的年份,引用最多的論文比例明顯低于1,與引用較少的論文沒有太大區(qū)別。然而,當論文發(fā)表量增加時,引用最多的論文比例接近1,明顯超過引用量較少的論文。如果某領域一年發(fā)表100000篇新論文,引用最多的論文平均每年收到的引用數(shù)量不會出現(xiàn)明顯下降,但在年度引用最多的論文中,排名前1%的論文每年平均會損失約17%的引用次數(shù),而排名前5%及以下的論文會損失四分之一的引用次數(shù)。 
三、如果同年發(fā)表大量論文,其中一篇論文進入該領域最高引用0.1%的概率會明顯下降,且不同學科和各個年份都遵循這一規(guī)律。
圖3(A)表明,如果是小眾學科領域,論文會隨著時間的推移而慢慢上升到最常引用的前0.1%。如圖3(B),1980年所有學科的線性回歸預測顯示,在1000篇新論文中,一篇論文達到該領域引用率最高的0.1%需要9年時間。

國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!

圖3:新論文進入高引用排名的可能性
圖(A)表明,一篇新在該學科領域進入最常引用0.1%的概率會隨著論文的增多而降低。圖(B)表明如果同一年發(fā)表大量論文,其中一篇并不會隨著時間而逐漸積累到最常引用0.1%的范圍內。
相比之下,如果是主流學科領域,一篇新論文會迅速躍升到排名列表的頂端。如圖3(B)的回歸預測,在100000篇新論文中,一篇進入前0.1%的中位數(shù)只需要不到一年的時間。 
四、同年發(fā)表的論文大多建立在現(xiàn)有文獻的基礎上,而不是突破現(xiàn)有文獻。 
圖4(A)表明,當某個學科領域每年發(fā)表1000篇論文時,顛覆性的創(chuàng)新論文占比49%;當每年發(fā)表10000篇論文時,該比例下降至27%;每年發(fā)表100000篇論文時,進一步下降到13%。即使當D>0時,新發(fā)表論文的創(chuàng)新性也會在更廣泛的研究領域內被減弱。

國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!

圖4:學術創(chuàng)新傾向圖
圖(A)表明多年來各個學科發(fā)表的新論文傾向于擴展現(xiàn)有的理論,而不是引入顛覆性的創(chuàng)新觀點(藍色代表D>0;紅色代表D<0)。圖(B)表明在各個學科中,同一年發(fā)表的大量論文普遍不太可能具有高度的創(chuàng)新性(D≥ 0.0256).
研究人員注意到,“場大小”所帶來的影響明顯超過了時間維度的影響。隨著一個科學研究領域的擴展,資深學者的引用模式會發(fā)生明顯變化。即使是久負盛名、經(jīng)驗豐富的學者,在許多新論文發(fā)表時也會更多地引用經(jīng)典文章。

3

如何打破“論文泛濫”的局面? 

這項研究發(fā)現(xiàn)讓我們不得不面對一個現(xiàn)實:如在短時間內發(fā)表太多的論文,新的idea很可能淹沒在傳統(tǒng)觀念中,科學發(fā)現(xiàn)的過程也就無法選擇更有價值的創(chuàng)新。更諷刺的是,當今科學事業(yè)的“數(shù)量驅動”性質可能從根本上阻礙科學的進步,而訪問權限,期刊的激增和刊物體系的失衡又會加劇這一現(xiàn)象。
那么我們可以減少論文發(fā)表的數(shù)量嗎?答案顯然不可能。
我們不可能能禁止出版、關閉期刊、限制科研機構,或者減少科學家的數(shù)量。對于科學家而言,即使他們知道大量“無用”論文可能會對學科發(fā)展產生影響,但考慮到個人的職業(yè)發(fā)展和學生的學術前景,他們也不會主動減少科研“數(shù)量”。而如果采取強制措施,無疑又可能增加破壞科研氛圍、阻礙科研創(chuàng)新的風險。
作者認為,如果不從根本上改變激勵政策和評估準則,這種現(xiàn)象只會持續(xù)惡化。他在文章中提出了幾點改進措施,并表示雖然政策很難落實和推進,但它能夠引導科研人員從經(jīng)典研究走向更新穎的前沿領域。
  • 構建更清晰的期刊等級體系,通過最具影響力的出版機構,引導科研人員從常規(guī)工作轉向學術創(chuàng)新。
  • 調整科研機構和企業(yè)的獎勵和晉升制度,避免數(shù)量的權衡,提升質量、創(chuàng)新性貢獻等指標的重要性。
  • 在研究生培養(yǎng)、科研能力評估、科研經(jīng)費申請方面制定新的考核標準,激勵科研人員擺脫既定教條,提出新奇的idea。
雖然各個學科引用最多的論文在每年的高引排名中基本保持不變,但我們很難說學科發(fā)展就因此而停滯不前。不過現(xiàn)有證據(jù)表明,每年生產大量“無用”的科學成果耗費了昂貴的人力成本的資金,生產率也正在急劇下降。而更重要的是,我們是否可能因為沉浸在泛濫的論文中而錯過更豐富的新范式?
論文地址:https://www.pnas.org/content/118/41/e2021636118


國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!

雷鋒網(wǎng)雷鋒網(wǎng)


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

國際頂刊PNAS發(fā)文:“同質化”論文暴增,從根本上阻礙了科學的進步!

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說