講座預約丨四位專家大論道：大模型時代的強化學習丨GAIR live

本文作者：岑大師

2024-08-23 11:43

導語：洞察未來趨勢，更能夠激發(fā)新的思考，共同推動強化學習與大模型技術的結(jié)合與應用

站在科技創(chuàng)新的浪潮之巔，我們見證了人工智能領域的巨大飛躍，尤其是大模型技術與強化學習中的結(jié)合和突破性應用，正在引領我們進入一個全新的智能時代。

在過去幾年中，強化學習作為人工智能的一個重要分支，已經(jīng)從理論研究的深奧殿堂走向了實踐應用的廣闊天地，從實驗室的封閉空間走向了我們?nèi)粘Ｉ畹母鱾€角落。在自動駕駛、游戲AI、機器人控制等領域，強化學習的身影無處不在，它們正逐步成為我們生活中不可分割的一部分。

而當我們展望未來時，大模型技術將在強化學習領域扮演何種角色？它們將如何進一步聯(lián)動，推動強化學習和大模型技術的發(fā)展，使其更加智能、高效，并更好地服務于人類社會？

這些問題不僅激發(fā)了科技界的無限遐想，也引領著我們不斷探索和前進。隨著大模型技術的不斷進步，我們有理由相信，未來的強化學習將更加貼近人類的需求，成為我們生活中更加緊密的合作伙伴。

為了深入剖析這一話題，雷峰網(wǎng)將于8月28日（周三）晚間8點～10點，舉辦一場主題為「大模型時代的強化學習」的線上圓桌論壇。

講座預約丨四位專家大論道：大模型時代的強化學習丨GAIR live

本次論壇榮幸邀請到了：新加坡南洋理工大學校長講席教授，人工智能系主任安波教授、南京大學人工智能學院俞揚教授、天津大學智能與計算學部、華為諾亞決策推理實驗室主任郝建業(yè)副教授、清華大學交叉信息研究院許華哲助理教授，將分享他們的深刻見解和最新研究成果。

在這場論壇中，我們將深入探討以下幾個核心議題：

全球視野下的突破： 在國內(nèi)外，哪些學術團隊和工業(yè)團隊在強化學習領域取得了顯著成就？他們的研究成果如何推動了這一領域的發(fā)展？

大模型的融合與創(chuàng)新： 如何利用大模型技術提升強化學習的效率和智能性？在這一過程中，我們面臨哪些技術難題，又是如何一一克服的？

強化學習的實際應用： 強化學習技術在自動駕駛、游戲AI、機器人控制等領域有哪些成功的應用案例？這些應用如何改變了我們的生活？

未來趨勢與挑戰(zhàn)： 隨著技術的不斷進步，強化學習將面臨哪些新的挑戰(zhàn)和機遇？我們應該如何準備迎接這些變化？

技術與倫理的平衡： 在強化學習技術快速發(fā)展的同時，我們應該如何確保技術的倫理性和可持續(xù)性？

添加策劃人岑峰微信（微信號：8019788），備注“姓名+職位”，即可邀請進入專家群，實時交流與提問。

嘉賓介紹

講座預約丨四位專家大論道：大模型時代的強化學習丨GAIR live

安波，南洋理工大學計算機科學與工程學院校長講習教授、人工智能系主任

安波博士現(xiàn)任南洋理工大學計算機科學與工程學院校長講席教授、人工智能系主任，人工智能研究院聯(lián)席院長。主要研究領域包括人工智能、多智能體系統(tǒng)、算法博弈論、強化學習及優(yōu)化。他是國際人工智能頂級期刊 AIJ、JAIR、JAAMAS 等副主編，有 150 余篇論文發(fā)表在人工智能領域的國際頂級會議 AAMAS、IJCAI、AAAI、ICAPS、KDD、UAI、EC、WWW、ICLR、NeurIPS、ICML，先后多次獲得會議杰出論文獎，在國際評測比賽中也屢獲佳績。他在人工智能領域內(nèi)有重要影響力和專業(yè)認可度，2018 年入選 IEEE Intelligent Systems 雜志評選的“AI’s 10 to watch”。他將擔任IJCAI’27的程序委員會主席。

講座預約丨四位專家大論道：大模型時代的強化學習丨GAIR live

俞揚，南京大學人工智能學院教授

俞揚博士現(xiàn)任南京大學人工智能學院教授，博士生導師。主要研究領域為人工智能、機器學習、強化學習、演化學習。共同出版專著《Evolutionary Learning: Advances in Theories and Algorithms》(2019)及其中文版本《演化學習：理論與算法進展》(2021)。在Artificial Intelligence、TPAMI、TKDE、TNNLS、NeurIPS、ICML、IJCAI、AAAI、KDD等人工智能、機器學習和數(shù)據(jù)挖掘國際頂級期刊和頂級會議發(fā)表多篇論文，研究成果獲得DAI'23 Best Paper、IDEAL'16 Best Paper、KDD'12 Best Poster、GECCO'11 Best Theory Paper、PAKDD'08 Best Paper等論文獎，獲得ICAPS'21 L2RPN with Trust冠軍、OpenAI RetroContest 2018冠軍、PAKDD’06數(shù)據(jù)挖掘競賽冠軍等競賽獎。

講座預約丨四位專家大論道：大模型時代的強化學習丨GAIR live

郝建業(yè)，華為諾亞決策與推理實驗室主任，天津大學智算學部副教授

郝建業(yè)博士，華為諾亞決策推理實驗室主任，天津大學智算學部副教授。主要研究方向為深度強化學習、多智能體系統(tǒng)。發(fā)表人工智能領域國際會議和期刊論文100余篇，專著2部。主持國家科技部2030人工智能重大項目課題、基金委人工智能重大培育項目、國防科技創(chuàng)新重點項目課題等項目10余項，研究成果榮獲國際會議最佳論文獎3次，NeurIPS20-22大會競賽冠軍4次。相關成果在工業(yè)基礎軟件智能化、自動駕駛、游戲AI、廣告及推薦、5G優(yōu)化、物流調(diào)度等領域落地應用。

講座預約丨四位專家大論道：大模型時代的強化學習丨GAIR live

許華哲，清華大學交叉信息研究院助理教授

許華哲博士現(xiàn)任清華大學交叉信息研究院助理教授，博士后就讀于斯坦福大學，博士畢業(yè)于加州大學伯克利分校。其研究領域是具身人工智能（Embodied AI）的理論、算法與應用，具體研究方向包括深度強化學習、機器人學、基于感知的控制（Sensorimotor）等。其科研圍繞具身人工智能的關鍵環(huán)節(jié)，系統(tǒng)性地研究了視覺深度強化學習在決策中的理論、模仿學習中的算法設計和高維視覺預測中的模型和應用，對解決具身人工智能領域中數(shù)據(jù)效率低和泛化能力弱等核心問題做出多項貢獻。其發(fā)表頂級會議論文四十余篇，代表性工作曾被MIT Tech Review，Stanford HAI等媒體報道。

講座信息

主題： 大模型時代的強化學習

時間： 8月28日（周三），北京時間20:00-22:00

觀看方式：「雷峰網(wǎng)」視頻號與「AI科技評論」視頻號同步直播

參考資料：

1，TWOSOME: An Efficient Online Framework to Align LLMs with Embodied Environments via Reinforcement Learning

https://gairdao.com/doi/10.1142/S2972335324500042

2，《對話南洋理工大學安波教授：如何讓大語言模型適應動態(tài)環(huán)境？丨IJAIRR》https://mp.weixin.qq.com/s/85TOawIFQ6uZaGXR4Y2RCA

IJAIRR正在邀約論文和專題

《International Journal of Artificial Intelligence and Robotics Research》（簡稱IJAIRR），是由新加坡GAIR研究院與世界科技出版社（WSP）聯(lián)合出版的國際學術期刊。

作為全球首本專注于人工智能（AI）、機器人技術（Robotics）以及基礎科學交叉研究（Research）的期刊，IJAIRR致力于成為AI與機器人領域研究的權威發(fā)布平臺。

IJAIRR歡迎各類研究論文、評論文章、短篇論文、書評以及專題（Special Issue）形式的投稿。我們特別關注那些在頂級AI會議上發(fā)表并現(xiàn)場展示，但缺乏長期沉淀平臺的優(yōu)秀論文。為了給這些論文及其作者提供一個更廣泛的發(fā)表和推廣渠道，IJAIRR現(xiàn)正積極邀約相關論文投稿。

如果您在本領域頂級會議上發(fā)表的文章（或即將發(fā)表）不超過一年，我們將協(xié)助您稍作修改后在IJAIRR期刊上發(fā)表。

如果您領導的團隊在頂級會議上有多篇論文發(fā)表，并希望在IJAIRR上圍繞特定主題策劃一個專題（Special Issue），我們誠摯邀請您深入討論合作事宜。

如果您是頂級會議的組織者，并有意與IJAIRR合作，針對特定會議策劃一個專題（Special Issue），我們也期待與您具體商討合作細節(jié)。

IJAIRR期待與您攜手，共同推動人工智能與機器人研究的發(fā)展。

聯(lián)系人：IJAIRR創(chuàng)刊主編朱曉蕊博士，xiaorui_zhu@gair.sg

關于期刊創(chuàng)刊主編等更多信息，可點擊 https://mp.weixin.qq.com/s/gEctQolbEqqf2eVwBAkdoA

關于雷峰網(wǎng)(公眾號：雷峰網(wǎng))(公眾號：雷峰網(wǎng))、GAIR大會、GAIR研究院（期刊和在線社區(qū)）的詳細介紹，請閱讀朱曉蕊教授的專訪：

https://mp.weixin.qq.com/s/Qn7Gc3rVijQhhK0hTSrgxw

IJAIRR期刊的主頁鏈接為：

https://gairdao.com/journals/ijairr

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。