丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能學術(shù) 正文
發(fā)私信給我在思考中
發(fā)送

0

arXiv創(chuàng)立三十周年之際,創(chuàng)始人在Nature發(fā)文:arXiv是信息共享的先鋒

本文作者: 我在思考中 2021-08-17 15:04
導語:該文講述了arXiv三十年的發(fā)展變化,從創(chuàng)立初期便為社會信息共享作出了巨大貢獻,在社會共享信息方面積累的大量經(jīng)驗。

arXiv創(chuàng)立三十周年之際,創(chuàng)始人在Nature發(fā)文:arXiv是信息共享的先鋒

AI科技評論報道

編譯 | 王曄

此文章于8月4日發(fā)表在nature reviews physics期刊,作者為arXiv的創(chuàng)立者Paul Ginsparg。該文講述了arXiv三十年的發(fā)展變化,從創(chuàng)立初期便為社會信息共享作出了巨大貢獻,在社會共享信息方面積累的大量經(jīng)驗。arXiv作為巨大的信息資源庫,為公眾和研究團隊提供了公平的信息競爭環(huán)境。

自30年前arXiv創(chuàng)立,社會信息傳播模式發(fā)生了巨大的變化——并不總是向好發(fā)展。arXiv創(chuàng)立者Paul Ginsparg討論了電子預印本的學術(shù)經(jīng)驗是怎樣為更加廣泛的信息共享提供參考的。

三十年前,arXiv創(chuàng)立之時,許多人都對互聯(lián)網(wǎng)的潛力持樂觀態(tài)度,認為它可以培養(yǎng)了解更多資訊的公民,并創(chuàng)造公平的信息競爭環(huán)境。在arXiv這樣的新平臺上,學術(shù)界引領(lǐng)了這一潮流。但是現(xiàn)在,這些最初的理想似乎難以實現(xiàn),政治上的兩極分化因信息“回聲室效應”而加劇,甚至對什么是客觀證據(jù)也不再達成共識。在如此危急情況之下,也許我們學術(shù)界可以重拾30年前的領(lǐng)先地位,通過展示如何負責任地、有成效地分享信息,重燃新的希望。


1

更為簡約的質(zhì)量控制的興起

在其早期,arXiv實施了衛(wèi)生和內(nèi)容相關(guān)形式的質(zhì)量控制,后者隨著arXiv對公眾透明度的增加而變得越來越重要(更多關(guān)于arXiv的歷史見下文)。這里的 "衛(wèi)生 "指的是淺層次的——文本應該可以提取;參考文獻、作者和摘要應該包括在內(nèi);不應該有分散注意力的行號或水印,等等——可以直接自動進行檢測。在內(nèi)容方面,arXiv早期實施了一種最低標準的質(zhì)量控制,雇用了一批活躍的科學家,對收到的稿件(通常只根據(jù)標題和摘要)進行掃描,并迅速判斷它是否對目標研究群體有合理的興趣。這種監(jiān)督是為了保護讀者不受離題內(nèi)容的影響,并保持與最低學術(shù)標準的一致性。它還預見到一直存在的風險,即邪惡分子的行為不一定符合社會的最佳利益,這種風險在后來的幾年里或許沒有得到社交媒體公司的足夠重視——見證了自由流通的虛假信息所帶來的高風險的社會損失。


2

arXiv的三十年
arXiv創(chuàng)立于1991年的純印刷時代。始于美國洛斯阿拉莫斯國家實驗室,在1998年之前被稱為xxx.lanl.gov,目的是通過提供平等的時間來獲取最新科研成果,從而為全球研究提供公平的競爭環(huán)境。在萬維網(wǎng)出現(xiàn)之前,當時的出版商和圖書館員對任何短期內(nèi)向數(shù)字內(nèi)容的過渡都持懷疑態(tài)度。在20世紀90年代初,arXiv作為一個自動資料庫發(fā)揮了先鋒作用,第一個實現(xiàn)了使用文章摘要登陸網(wǎng)頁,并與相關(guān)資源鏈接,包括全文附注和pdf。arXiv在開放存取運動中也優(yōu)先發(fā)揮了作用,催化了PubMedCentral等資源、PLoS等出版商以及后來其他預印本服務(wù)器,包括bioRxiv和medRxiv。

十年后,arXiv需要一個合適的機構(gòu),以繼續(xù)其從短期的軟件實驗過渡到更長期的可持續(xù)服務(wù)。在學術(shù)交流領(lǐng)域,傳統(tǒng)的參與者是機構(gòu)圖書館和專業(yè)協(xié)會。2001年,我選擇了進入康奈爾大學圖書館(1981年在此獲得物理學博士學位),理由是圖書館不會與自己的期刊出版業(yè)務(wù)有潛在的利益沖突。盡管是出發(fā)點是好的,但隨著時間的推移,這種配合變得越來越糟糕。大學圖書館的主要任務(wù)是為其內(nèi)部社區(qū)提供由他人認證的內(nèi)容,而arXiv的職權(quán)范圍是向全球研究人員社區(qū)傳播有時難以辨別出處的資料。

2019年,康奈爾大學內(nèi)部對arXiv的監(jiān)督從圖書館轉(zhuǎn)移到了計算機和信息科學,但長期規(guī)劃受到了大流行病相關(guān)問題的阻礙。也許arXiv會在康奈爾內(nèi)部找到一些新的平衡點,也許專業(yè)協(xié)會會利用自己的出版經(jīng)驗,幫助創(chuàng)建一個更加分散和可持續(xù)的長期資源。arXiv仍然是許多全球研究社區(qū)的主要研究交流模式,提供了必不可少的基礎(chǔ)設(shè)施。每天的提交率正在迅速增長(見圖;主題由arxiv.org上使用的標準縮寫標明),預計2021年的新文章總數(shù)約為19萬篇。不管arXiv未來的具體情況如何,預印本的傳播不再是異端,目前傳播量增加的趨勢不太可能逆轉(zhuǎn)。

arXiv創(chuàng)立三十周年之際,創(chuàng)始人在Nature發(fā)文:arXiv是信息共享的先鋒


3

24小時的AI審查
但是,arXiv的運作方式是無情的每日周轉(zhuǎn), 所以近年來,我創(chuàng)建的自動機器學習框架對人工審核進行了補充,以標記和保留有潛在問題的提交材料,以便進行額外的人工審查。自動程序不會休假、生病、分心或繁忙,并能在幾毫秒內(nèi)全面評估全文內(nèi)容,包括對照整個后臺數(shù)據(jù)庫檢查每份新提交的文件是否有重復或過多的文字重疊?,F(xiàn)在,大部分的內(nèi)部人力都被用于調(diào)解和裁決各種人類和機器人的規(guī)模性疏忽。

4

從健康隱患到救命稻草
盡管早期有人懷疑預印本的分發(fā)會與高能物理學以外的領(lǐng)域有關(guān),但它是在使用量激增的催化下,持續(xù)向新領(lǐng)域發(fā)展的。例如,2001年對二硼化鎂超導體的關(guān)注,以及后來從2008年開始對鎳鐵超導體的關(guān)注,導致相關(guān)的實驗團體使用arXiv來報告突破性的結(jié)果并提出先例。最近,機器學習界在2015年左右大規(guī)模地采用了arXiv。這些研究人員仍然是忠實的用戶;到目前為止,沒有一個采用arXiv進行快速傳播的社區(qū)后來放棄了使用。

但是,與更廣泛的社會中的信息共享問題最相關(guān)的預印本使用量的飆升是由COVID-19大流行引發(fā)的bioRxiv和medRxiv的增長。這些預印本服務(wù)器在大流行的第一年就容納了超過10,000篇文章(bioRxiv的數(shù)據(jù);medRxiv的數(shù)據(jù)),這種增長很可能成為其他研究領(lǐng)域的一個轉(zhuǎn)折點?;仡?995年《新英格蘭醫(yī)學雜志》關(guān)于預印本的一篇社論,它表達了合理的公共衛(wèi)生關(guān)切,因為 "互聯(lián)網(wǎng)上關(guān)于健康問題的許多信息,如藥物的風險和各種食物對健康的影響,都是不確定的來源 "。盡管近期似乎加強了對其的關(guān)注,但我想說,迄今為止多種證據(jù)表明,開放預印本的分發(fā)并不是當前問題的根源,而且在許多情況下可以幫助緩解這些問題。

與COVID-19有關(guān)的向bioRxiv和medRxiv提交的材料并沒有造成重大的公共衛(wèi)生危害(盡管可以肯定的是這些資源比arXiv受到了更嚴格的審查 )。相反,最嚴重的非法者反而發(fā)表在傳統(tǒng)的參考文獻中。其中包括一篇頌揚羥氯喹優(yōu)點的文章(其出版商發(fā)布了一封關(guān)注信,但沒有撤回),以及其他基于捏造數(shù)據(jù)的研究,這些研究很快被《柳葉刀》和《新英格蘭醫(yī)學雜志》撤回。也許這些雜志和其他雜志的編輯會因為在出版前看到更多的專家公開評論而受到啟發(fā):迄今為止,已經(jīng)有超過120篇經(jīng)同行評審的COVID-19文章被撤回或撤銷。相比之下,一項以預印本形式發(fā)布的COVID-19研究,高估了先前的感染率,并很快被媒體報道,專家們很快說明了其統(tǒng)計學上的缺陷。一份預印本報告了關(guān)于藥物地塞米松的嚴格臨床研究的結(jié)果,導致該研究在作為期刊出版物出現(xiàn)之前的半年內(nèi)被使用,可能挽救了許多生命。而正是這篇預印本對實際的健康危害進行了反擊,糾正了長期以來假定的(落下的)飛沫和(空中的)氣溶膠之間的5微米界限背后的錯誤觀念,并表明需要對COVID-19傳播的健康預防措施進行更有效的修訂。


5

窺探未來
我并不是說預印本的發(fā)行是解決同行評議期刊出版延誤和偏見的良方,而是說在適當?shù)那闆r下,其利遠大于弊。記者在提到預印本服務(wù)器上的文章時,經(jīng)常會加上 "尚未審查 "的警告語,并且通常會咨詢專家以核實事實,避免誤導公眾。盡管并非所有的數(shù)字媒體都對COVID-19預印本進行了必要的限定,但肯定有可能對 "正在審查 "的某些表述進行標準化處理,以表達不確定性。如果我們確實不可避免地要在更多領(lǐng)域公開傳播預印本,那么所有參與者——研究人員、同行評議的期刊和大眾媒體——都需要接受這一趨勢,并設(shè)計各種方法,讓研究人員更好地了解情況,讓普通公眾少受誤導。
原文鏈接:https://www.nature.com/articles/s42254-021-00360-z

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

arXiv創(chuàng)立三十周年之際,創(chuàng)始人在Nature發(fā)文:arXiv是信息共享的先鋒

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說