丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給鄭佳美
發(fā)送

0

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

本文作者: 鄭佳美 2024-10-23 15:44
導(dǎo)語:科學(xué)家看著生成結(jié)果,不敢相信這是AI整出來的東西。

還記得今年夏天讓眾多科研工作者“瑟瑟發(fā)抖”的 AI scientist 嗎?

彼時(shí)的它,作為一個(gè)由谷歌Transformer 論文作者 Llion Jones 和前谷歌研究人員 David Ha 共同創(chuàng)立的全自動(dòng)科學(xué)研究平臺(tái),從提出研究設(shè)想、檢查創(chuàng)新程度,再到設(shè)計(jì)實(shí)驗(yàn)、編寫程序、再GPU上執(zhí)行實(shí)驗(yàn)并收集結(jié)果,到最后完成論文的撰寫,一氣呵成,讓不少科研工作者早早就有了“事業(yè)危機(jī)感”。 此外,該項(xiàng)目還獲得了New Enterprise Associates、Khosla Ventures、Lux Capital等多家全球知名投資機(jī)構(gòu)以及NVIDIA等產(chǎn)業(yè)投資人的投資,進(jìn)一步推動(dòng)了其技術(shù)突破和市場化落地。

而這陣科學(xué)家“失業(yè)風(fēng)”剛刮走沒多久,又一位國產(chǎn)“AI科學(xué)家” Nova 便橫空出世。

Nova 能夠生成大量突破性的科學(xué)Idea,在創(chuàng)新性、價(jià)值性、可行性等方面可以媲美甚至超過人類科學(xué)家。

歷史證明,突破性的Idea具有開啟新技術(shù)紀(jì)元的潛力——比如Transformer的出現(xiàn)引領(lǐng)了波瀾壯闊的AGI時(shí)代,ImageNet極大地加速了深度學(xué)習(xí)的發(fā)展,而最近的諾貝爾獎(jiǎng)授予了幾位AI領(lǐng)域的科學(xué)家,也標(biāo)志著AI發(fā)展史上的一個(gè)重要轉(zhuǎn)折點(diǎn)。如今,Nova正站在這樣的歷史節(jié)點(diǎn)上,以2.5倍于AI scientist的Idea生成能力,迅速在科研領(lǐng)域掀起新一輪風(fēng)暴。直觀地說,當(dāng)AI scientist還在思考第2個(gè)Idea時(shí),Nova已經(jīng)提出了5個(gè)高質(zhì)量的創(chuàng)新Idea,每一個(gè)都有可能成為開啟未來科技新紀(jì)元的鑰匙。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

這個(gè)“妙 idea 連珠”的  Nova 大模型,是由西湖大學(xué)藍(lán)振忠團(tuán)隊(duì)聯(lián)合浙江大學(xué)、電子科技大學(xué)等多所高校研發(fā)的。

而他們的出發(fā)點(diǎn),就是解決現(xiàn)代科研工作中的一個(gè)難題:我要做什么?

他們希望大模型可以迅速閱讀最新的Paper,幫助科研工作者提取其中的關(guān)鍵信息,根據(jù)提取的信息,生成多個(gè)高質(zhì)量的 Idea。涉及到跨領(lǐng)域的知識(shí),大模型也可以輕松完成。人類科學(xué)家只需要根據(jù)模型生成的內(nèi)容進(jìn)行判斷,大大節(jié)省了科研的時(shí)間,從而提升科研的效率。

藍(lán)振忠說:“我身邊的科學(xué)家,包括我自己做科研這么多年了,有一個(gè)特別明顯的感受,就是我們雖然做著最前沿的最具探索性的事情,但實(shí)際組織工作的方式卻是非常傳統(tǒng)的,甚至像是手工作坊?!?/p>

“正因如此,Nova的誕生不僅僅是一個(gè)技術(shù)突破,更像是科研領(lǐng)域的一場革命,將極大地加速科研創(chuàng)新的過程。Nove模型的發(fā)布,只是團(tuán)隊(duì)邁出的第一步,后續(xù)將持續(xù)發(fā)力:

1)從0到1:先讓模型在單個(gè)學(xué)科、領(lǐng)域?qū)崿F(xiàn)創(chuàng)新,快速驗(yàn)證算法和模型效果,把基建和底子打好,讓模型成為一個(gè)可以給科學(xué)家使用的產(chǎn)品。

2)從1到10:進(jìn)一步拓展模型的橫向能力,成為多學(xué)科的創(chuàng)新專家,不僅能生成創(chuàng)新的科學(xué)Idea,而且能自動(dòng)執(zhí)行驗(yàn)證,最終發(fā)表科研論文。

3)終極目標(biāo):讓模型能夠自驅(qū)地進(jìn)行科學(xué)探索、商業(yè)創(chuàng)新,讓模型推進(jìn)人類的科學(xué)突破與產(chǎn)業(yè)提升。

妙 idea 連珠

而 Nova 的實(shí)力也并不是紙上談兵,研究團(tuán)隊(duì)為了評(píng)估Nova模型的綜合性能,分別從質(zhì)量、多樣性、新穎性三個(gè)方面對(duì)其進(jìn)行了全面評(píng)估。

他們先是利用Claude-3 Sonnet作為裁判按照瑞士制錦標(biāo)賽(Swiss System Tournament)對(duì)各個(gè)方法產(chǎn)生的idea的質(zhì)量進(jìn)行評(píng)估。結(jié)果顯示,Nova方法生成的想法在質(zhì)量上顯著高于其他方法,有619和2521個(gè)想法得分為5和4,遠(yuǎn)超過其他最新的方法。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

多樣性方面,研究團(tuán)隊(duì)通過計(jì)算idea之間的相似度來對(duì)生成的idea來進(jìn)行去重。實(shí)驗(yàn)中,隨著生成的想法數(shù)量的增加,Nova 模型可以通過迭代規(guī)劃和搜索不斷產(chǎn)生新的想法。在非重復(fù)百分比方面,Nova 的表現(xiàn)明顯優(yōu)于其他方法,超過80%的想法都是不重復(fù)的。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

最終,團(tuán)隊(duì)為了探索文章提出的方法對(duì)持續(xù)生成新的idea的影響,還進(jìn)一步通過消融實(shí)驗(yàn)證明了該方法能持續(xù)生成新穎的非重復(fù)的idea。

實(shí)驗(yàn)中,當(dāng)不采用文章提出的規(guī)劃搜索方法時(shí),迭代三次中的獨(dú)特想法數(shù)量(44.1)與迭代兩次 (42.4) 相比不再增加。這表明,如果沒有規(guī)劃搜索,僅依靠基于種子想法的檢索會(huì)限制獲取有價(jià)值的外部知識(shí)以進(jìn)行創(chuàng)新。當(dāng)規(guī)劃和檢索都被刪除時(shí),由于沒有引入外部知識(shí),獨(dú)特新穎想法的數(shù)量在迭代兩次后略有增加(從25.3增加到 30.6),在迭代三次的時(shí)候相比迭代兩次則停滯不前(從30.6增加到31.35)。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

除此之外,他們還找來了10位專家(包括對(duì)應(yīng)領(lǐng)域的博士,博后以及資深教授),對(duì)生成idea在Overall(整體),Novelty(新穎性),F(xiàn)easibility(可行性),Effectiveness(有效性)進(jìn)行全面的評(píng)估。

最終研究人員發(fā)現(xiàn)在人工評(píng)估中,Nova 在整體質(zhì)量和新穎性方面均獲得了最高分。Nova貢獻(xiàn)了前4個(gè)想法的 37.5%,是四種方法中最高的。此外,Nova 在最差的 4個(gè)想法中所占比例非常低,在整體質(zhì)量方面僅占17.53%。在新穎性評(píng)估中也觀察到了類似的模式。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

研究團(tuán)隊(duì)透露,當(dāng)他們將得到的結(jié)果拿給身邊的科學(xué)家看,一眾科學(xué)家都不敢相信這是AI創(chuàng)作的!

Nova如何給科學(xué)家“整迷糊”

Nova模型之所以能讓科學(xué)家都“恍惚”,是因?yàn)樗肓艘环N增強(qiáng)的規(guī)劃和搜索方法,用于提升大語言模型的能力:

迭代規(guī)劃:Nova模型通過迭代的方式制定搜索計(jì)劃,旨在識(shí)別能夠增強(qiáng)當(dāng)前想法新穎性和多樣性的文獻(xiàn)。這種規(guī)劃過程使得模型能夠不斷優(yōu)化生成的想法。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

除了迭代規(guī)劃外,Nova還有其他的方法來輔助提升模型的創(chuàng)新性,包括:

外部知識(shí)檢索:Nova模型結(jié)合了外部知識(shí)檢索機(jī)制,通過獲取相關(guān)文獻(xiàn)來豐富生成的想法。這一過程利用了最新的研究成果,確保生成的想法與當(dāng)前科學(xué)前沿保持一致。

檢索增強(qiáng)生成:使用了檢索增強(qiáng)生成的方法,結(jié)合了檢索到的信息與生成模型的內(nèi)部知識(shí),以提高生成內(nèi)容的質(zhì)量和相關(guān)性。

自我反思機(jī)制:為了防止生成的想法出現(xiàn)幻覺,模型利用了自我檢查、自我批評(píng)和反思等機(jī)制,確保生成的想法邏輯合理且符合實(shí)際。

多源種子想法生成:Nova模型通過多種科學(xué)發(fā)現(xiàn)方法生成初始種子想法,確保生成的想法具有多樣性和創(chuàng)新性。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

綜合以上方法,當(dāng)Nova拿到一篇文章后,就能自動(dòng)化的去想如何提出好的idea來提升當(dāng)前文章里提到的方法。

比如,下面的idea是當(dāng)團(tuán)隊(duì)把微軟的Research Agent原始paper作為輸入得到的優(yōu)化方法,它能自動(dòng)分析當(dāng)前方法沒有接入實(shí)時(shí)的數(shù)據(jù)流的缺陷,并提出方案去解決這個(gè)問題,具有較強(qiáng)的創(chuàng)新性。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

同時(shí)還能分析引入一個(gè)實(shí)時(shí)的反饋機(jī)制和自適應(yīng)的研究框架能進(jìn)一步提升該方法的效果,這些都是一些實(shí)實(shí)在在可以研究和發(fā)表的idea,科學(xué)家想不“迷糊”都難:

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

制造“AI科學(xué)家”的科學(xué)家

西湖大學(xué)團(tuán)隊(duì)領(lǐng)導(dǎo)人藍(lán)振忠,是Google輕量級(jí)大模型“ALBERT”(學(xué)術(shù)引用量約8000)的第一作者,《麻省理工科技評(píng)論》評(píng)選的2021年度亞太地區(qū)“35歲以下科技創(chuàng)新35人”,前Google人工智能科學(xué)家。

目前為西湖大學(xué)博士生導(dǎo)師,深度學(xué)習(xí)實(shí)驗(yàn)室創(chuàng)辦人及負(fù)責(zé)人,西湖心辰創(chuàng)始人。

此外,他共同推出了對(duì)標(biāo)GLUE的中文大模型評(píng)價(jià)基準(zhǔn)ChineseGLUE(后簡稱為CLUE),廣受業(yè)界歡迎。他還帶領(lǐng)團(tuán)隊(duì)研發(fā)了側(cè)重情感感知的西湖大模型和國內(nèi)首個(gè)輔助心理咨詢的AI咨詢師“小天”。

而西湖心辰推出的多模態(tài)通用大模型:西湖大模型,也具備長期記憶、情感感知和主動(dòng)聊天等卓越的能力。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))據(jù)悉,他曾說:“讓AI自驅(qū)的進(jìn)化,推進(jìn)我們?nèi)祟惖目茖W(xué)突破與產(chǎn)業(yè)提升?!?/p>

AI可以代替人類科學(xué)家產(chǎn)生突破性的科學(xué)Idea嗎?最后,我們?cè)賿伋鲞@個(gè)問題。至于這個(gè)問題的答案,或許就像追逐地平線一般,每當(dāng)以為接近之時(shí),它卻又在更遠(yuǎn)的地方等待,留給我們的,是永恒的追求與思考。

“但追逐的腳步不會(huì)停止?!?/p>

論文地址:https://arxiv.org/abs/2410.14255


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說