0
本文作者: 岑大師 | 2024-08-23 11:43 |
站在科技創(chuàng)新的浪潮之巔,我們見證了人工智能領(lǐng)域的巨大飛躍,尤其是大模型技術(shù)與強(qiáng)化學(xué)習(xí)中的結(jié)合和突破性應(yīng)用,正在引領(lǐng)我們進(jìn)入一個(gè)全新的智能時(shí)代。
在過去幾年中,強(qiáng)化學(xué)習(xí)作為人工智能的一個(gè)重要分支,已經(jīng)從理論研究的深?yuàn)W殿堂走向了實(shí)踐應(yīng)用的廣闊天地,從實(shí)驗(yàn)室的封閉空間走向了我們?nèi)粘I畹母鱾€(gè)角落。在自動(dòng)駕駛、游戲AI、機(jī)器人控制等領(lǐng)域,強(qiáng)化學(xué)習(xí)的身影無處不在,它們正逐步成為我們生活中不可分割的一部分。
而當(dāng)我們展望未來時(shí),大模型技術(shù)將在強(qiáng)化學(xué)習(xí)領(lǐng)域扮演何種角色?它們將如何進(jìn)一步聯(lián)動(dòng),推動(dòng)強(qiáng)化學(xué)習(xí)和大模型技術(shù)的發(fā)展,使其更加智能、高效,并更好地服務(wù)于人類社會(huì)?
這些問題不僅激發(fā)了科技界的無限遐想,也引領(lǐng)著我們不斷探索和前進(jìn)。隨著大模型技術(shù)的不斷進(jìn)步,我們有理由相信,未來的強(qiáng)化學(xué)習(xí)將更加貼近人類的需求,成為我們生活中更加緊密的合作伙伴。
為了深入剖析這一話題,雷峰網(wǎng)將于8月28日(周三)晚間8點(diǎn)~10點(diǎn),舉辦一場主題為「大模型時(shí)代的強(qiáng)化學(xué)習(xí)」的線上圓桌論壇。
本次論壇榮幸邀請(qǐng)到了:新加坡南洋理工大學(xué)校長講席教授,人工智能系主任安波教授、南京大學(xué)人工智能學(xué)院俞揚(yáng)教授、天津大學(xué)智能與計(jì)算學(xué)部、華為諾亞決策推理實(shí)驗(yàn)室主任郝建業(yè)副教授、清華大學(xué)交叉信息研究院許華哲助理教授,將分享他們的深刻見解和最新研究成果。
在這場論壇中,我們將深入探討以下幾個(gè)核心議題:
全球視野下的突破: 在國內(nèi)外,哪些學(xué)術(shù)團(tuán)隊(duì)和工業(yè)團(tuán)隊(duì)在強(qiáng)化學(xué)習(xí)領(lǐng)域取得了顯著成就?他們的研究成果如何推動(dòng)了這一領(lǐng)域的發(fā)展?
大模型的融合與創(chuàng)新: 如何利用大模型技術(shù)提升強(qiáng)化學(xué)習(xí)的效率和智能性?在這一過程中,我們面臨哪些技術(shù)難題,又是如何一一克服的?
強(qiáng)化學(xué)習(xí)的實(shí)際應(yīng)用: 強(qiáng)化學(xué)習(xí)技術(shù)在自動(dòng)駕駛、游戲AI、機(jī)器人控制等領(lǐng)域有哪些成功的應(yīng)用案例?這些應(yīng)用如何改變了我們的生活?
未來趨勢與挑戰(zhàn): 隨著技術(shù)的不斷進(jìn)步,強(qiáng)化學(xué)習(xí)將面臨哪些新的挑戰(zhàn)和機(jī)遇?我們應(yīng)該如何準(zhǔn)備迎接這些變化?
技術(shù)與倫理的平衡: 在強(qiáng)化學(xué)習(xí)技術(shù)快速發(fā)展的同時(shí),我們應(yīng)該如何確保技術(shù)的倫理性和可持續(xù)性?
添加策劃人 岑峰 微信(微信號(hào):8019788),備注“姓名+職位”,即可邀請(qǐng)進(jìn)入專家群,實(shí)時(shí)交流與提問。
嘉賓介紹
安波,南洋理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院校長講習(xí)教授、人工智能系主任
安波博士現(xiàn)任南洋理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院校長講席教授、人工智能系主任,人工智能研究院聯(lián)席院長。主要研究領(lǐng)域包括人工智能、多智能體系統(tǒng)、算法博弈論、強(qiáng)化學(xué)習(xí)及優(yōu)化。他是國際人工智能頂級(jí)期刊 AIJ、JAIR、JAAMAS 等副主編,有 150 余篇論文發(fā)表在人工智能領(lǐng)域的國際頂級(jí)會(huì)議 AAMAS、IJCAI、AAAI、ICAPS、KDD、UAI、EC、WWW、ICLR、NeurIPS、ICML,先后多次獲得會(huì)議杰出論文獎(jiǎng),在國際評(píng)測比賽中也屢獲佳績。他在人工智能領(lǐng)域內(nèi)有重要影響力和專業(yè)認(rèn)可度,2018 年入選 IEEE Intelligent Systems 雜志評(píng)選的“AI’s 10 to watch”。他將擔(dān)任IJCAI’27的程序委員會(huì)主席。
俞揚(yáng),南京大學(xué)人工智能學(xué)院教授
俞揚(yáng)博士現(xiàn)任南京大學(xué)人工智能學(xué)院教授,博士生導(dǎo)師。主要研究領(lǐng)域?yàn)槿斯ぶ悄堋C(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、演化學(xué)習(xí)。共同出版專著《Evolutionary Learning: Advances in Theories and Algorithms》(2019)及其中文版本《演化學(xué)習(xí):理論與算法進(jìn)展》(2021)。在Artificial Intelligence、TPAMI、TKDE、TNNLS、NeurIPS、ICML、IJCAI、AAAI、KDD等人工智能、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘國際頂級(jí)期刊和頂級(jí)會(huì)議發(fā)表多篇論文,研究成果獲得DAI'23 Best Paper、IDEAL'16 Best Paper、KDD'12 Best Poster、GECCO'11 Best Theory Paper、PAKDD'08 Best Paper等論文獎(jiǎng),獲得ICAPS'21 L2RPN with Trust冠軍、OpenAI RetroContest 2018冠軍、PAKDD’06數(shù)據(jù)挖掘競賽冠軍等競賽獎(jiǎng)。
郝建業(yè),華為諾亞決策與推理實(shí)驗(yàn)室主任,天津大學(xué)智算學(xué)部副教授
郝建業(yè)博士,華為諾亞決策推理實(shí)驗(yàn)室主任,天津大學(xué)智算學(xué)部副教授。主要研究方向?yàn)樯疃葟?qiáng)化學(xué)習(xí)、多智能體系統(tǒng)。發(fā)表人工智能領(lǐng)域國際會(huì)議和期刊論文100余篇,專著2部。 主持國家科技部2030人工智能重大項(xiàng)目課題、基金委人工智能重大培育項(xiàng)目、國防科技創(chuàng)新重點(diǎn)項(xiàng)目課題等項(xiàng)目10余項(xiàng),研究成果榮獲國際會(huì)議最佳論文獎(jiǎng)3次,NeurIPS20-22大會(huì)競賽冠軍4次。相關(guān)成果在工業(yè)基礎(chǔ)軟件智能化、自動(dòng)駕駛、游戲AI、廣告及推薦、5G優(yōu)化、物流調(diào)度等領(lǐng)域落地應(yīng)用。
許華哲,清華大學(xué)交叉信息研究院助理教授
許華哲博士現(xiàn)任清華大學(xué)交叉信息研究院助理教授,博士后就讀于斯坦福大學(xué),博士畢業(yè)于加州大學(xué)伯克利分校。其研究領(lǐng)域是具身人工智能(Embodied AI)的理論、算法與應(yīng)用,具體研究方向包括深度強(qiáng)化學(xué)習(xí)、機(jī)器人學(xué)、基于感知的控制(Sensorimotor)等。其科研圍繞具身人工智能的關(guān)鍵環(huán)節(jié),系統(tǒng)性地研究了視覺深度強(qiáng)化學(xué)習(xí)在決策中的理論、模仿學(xué)習(xí)中的算法設(shè)計(jì)和高維視覺預(yù)測中的模型和應(yīng)用,對(duì)解決具身人工智能領(lǐng)域中數(shù)據(jù)效率低和泛化能力弱等核心問題做出多項(xiàng)貢獻(xiàn)。其發(fā)表頂級(jí)會(huì)議論文四十余篇,代表性工作曾被MIT Tech Review,Stanford HAI等媒體報(bào)道。
講座信息
主題: 大模型時(shí)代的強(qiáng)化學(xué)習(xí)
時(shí)間: 8月28日(周三),北京時(shí)間20:00-22:00
觀看方式:「雷峰網(wǎng)」視頻號(hào) 與 「AI科技評(píng)論」 視頻號(hào)同步直播
參考資料:
1,TWOSOME: An Efficient Online Framework to Align LLMs with Embodied Environments via Reinforcement Learning
https://gairdao.com/doi/10.1142/S2972335324500042
2,《對(duì)話南洋理工大學(xué)安波教授:如何讓大語言模型適應(yīng)動(dòng)態(tài)環(huán)境?丨IJAIRR》https://mp.weixin.qq.com/s/85TOawIFQ6uZaGXR4Y2RCA
IJAIRR正在邀約論文和專題
《International Journal of Artificial Intelligence and Robotics Research》(簡稱IJAIRR),是由新加坡GAIR研究院與世界科技出版社(WSP)聯(lián)合出版的國際學(xué)術(shù)期刊。
作為全球首本專注于人工智能(AI)、機(jī)器人技術(shù)(Robotics)以及基礎(chǔ)科學(xué)交叉研究(Research)的期刊,IJAIRR致力于成為AI與機(jī)器人領(lǐng)域研究的權(quán)威發(fā)布平臺(tái)。
IJAIRR歡迎各類研究論文、評(píng)論文章、短篇論文、書評(píng)以及專題(Special Issue)形式的投稿。我們特別關(guān)注那些在頂級(jí)AI會(huì)議上發(fā)表并現(xiàn)場展示,但缺乏長期沉淀平臺(tái)的優(yōu)秀論文。為了給這些論文及其作者提供一個(gè)更廣泛的發(fā)表和推廣渠道,IJAIRR現(xiàn)正積極邀約相關(guān)論文投稿。
如果您在本領(lǐng)域頂級(jí)會(huì)議上發(fā)表的文章(或即將發(fā)表)不超過一年,我們將協(xié)助您稍作修改后在IJAIRR期刊上發(fā)表。
如果您領(lǐng)導(dǎo)的團(tuán)隊(duì)在頂級(jí)會(huì)議上有多篇論文發(fā)表,并希望在IJAIRR上圍繞特定主題策劃一個(gè)專題(Special Issue),我們誠摯邀請(qǐng)您深入討論合作事宜。
如果您是頂級(jí)會(huì)議的組織者,并有意與IJAIRR合作,針對(duì)特定會(huì)議策劃一個(gè)專題(Special Issue),我們也期待與您具體商討合作細(xì)節(jié)。
IJAIRR期待與您攜手,共同推動(dòng)人工智能與機(jī)器人研究的發(fā)展。
聯(lián)系人:IJAIRR創(chuàng)刊主編朱曉蕊博士,xiaorui_zhu@gair.sg
關(guān)于期刊創(chuàng)刊主編等更多信息,可點(diǎn)擊 https://mp.weixin.qq.com/s/gEctQolbEqqf2eVwBAkdoA
關(guān)于雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)))、GAIR大會(huì)、GAIR研究院(期刊和在線社區(qū))的詳細(xì)介紹,請(qǐng)閱讀朱曉蕊教授的專訪:
https://mp.weixin.qq.com/s/Qn7Gc3rVijQhhK0hTSrgxw
IJAIRR期刊的主頁鏈接為:
https://gairdao.com/journals/ijairr
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。