讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

2024-08-23 11:43

站在科技创新的浪潮之巅，我们见证了人工智能领域的巨大飞跃，尤其是大模型技术与强化学习中的结合和突破性应用，正在引领我们进入一个全新的智能时代。在过去几年中，强化学习作为人工智能的一个重要分支，已经从理论研究的深奥殿堂走向了实践应用的广阔天地，从实验室的封闭空间走向了我们日常生活的各个角落。在自动驾驶、游戏AI、机器人控制等领域，强化学习的身影无处不在，它们正逐步成为我们生活中不可分割的一部分。

站在科技创新的浪潮之巅，我们见证了人工智能领域的巨大飞跃，尤其是大模型技术与强化学习中的结合和突破性应用，正在引领我们进入一个全新的智能时代。

在过去几年中，强化学习作为人工智能的一个重要分支，已经从理论研究的深奥殿堂走向了实践应用的广阔天地，从实验室的封闭空间走向了我们日常生活的各个角落。在自动驾驶、游戏AI、机器人控制等领域，强化学习的身影无处不在，它们正逐步成为我们生活中不可分割的一部分。

而当我们展望未来时，大模型技术将在强化学习领域扮演何种角色？它们将如何进一步联动，推动强化学习和大模型技术的发展，使其更加智能、高效，并更好地服务于人类社会？

这些问题不仅激发了科技界的无限遐想，也引领着我们不断探索和前进。随着大模型技术的不断进步，我们有理由相信，未来的强化学习将更加贴近人类的需求，成为我们生活中更加紧密的合作伙伴。

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

本次论坛荣幸邀请到了：新加坡南洋理工大学校长讲席教授，人工智能系主任安波教授、南京大学人工智能学院俞扬教授、天津大学智能与计算学部、华为诺亚决策推理实验室主任郝建业副教授、清华大学交叉信息研究院许华哲助理教授，将分享他们的深刻见解和最新研究成果。

在这场论坛中，我们将深入探讨以下几个核心议题：

全球视野下的突破： 在国内外，哪些学术团队和工业团队在强化学习领域取得了显著成就？他们的研究成果如何推动了这一领域的发展？

大模型的融合与创新： 如何利用大模型技术提升强化学习的效率和智能性？在这一过程中，我们面临哪些技术难题，又是如何一一克服的？

强化学习的实际应用： 强化学习技术在自动驾驶、游戏AI、机器人控制等领域有哪些成功的应用案例？这些应用如何改变了我们的生活？

未来趋势与挑战： 随着技术的不断进步，强化学习将面临哪些新的挑战和机遇？我们应该如何准备迎接这些变化？

技术与伦理的平衡： 在强化学习技术快速发展的同时，我们应该如何确保技术的伦理性和可持续性？

添加策划人岑峰微信（微信号：8019788），备注“姓名+职位”，即可邀请进入专家群，实时交流与提问。

嘉宾介绍

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

安波，南洋理工大学计算机科学与工程学院校长讲习教授、人工智能系主任

安波博士现任南洋理工大学计算机科学与工程学院校长讲席教授、人工智能系主任，人工智能研究院联席院长。主要研究领域包括人工智能、多智能体系统、算法博弈论、强化学习及优化。他是国际人工智能顶级期刊 AIJ、JAIR、JAAMAS 等副主编，有 150 余篇论文发表在人工智能领域的国际顶级会议 AAMAS、IJCAI、AAAI、ICAPS、KDD、UAI、EC、WWW、ICLR、NeurIPS、ICML，先后多次获得会议杰出论文奖，在国际评测比赛中也屡获佳绩。他在人工智能领域内有重要影响力和专业认可度，2018 年入选 IEEE Intelligent Systems 杂志评选的“AI’s 10 to watch”。他将担任IJCAI’27的程序委员会主席。

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

俞扬，南京大学人工智能学院教授

俞扬博士现任南京大学人工智能学院教授，博士生导师。主要研究领域为人工智能、机器学习、强化学习、演化学习。共同出版专著《Evolutionary Learning: Advances in Theories and Algorithms》(2019)及其中文版本《演化学习：理论与算法进展》(2021)。在Artificial Intelligence、TPAMI、TKDE、TNNLS、NeurIPS、ICML、IJCAI、AAAI、KDD等人工智能、机器学习和数据挖掘国际顶级期刊和顶级会议发表多篇论文，研究成果获得DAI'23 Best Paper、IDEAL'16 Best Paper、KDD'12 Best Poster、GECCO'11 Best Theory Paper、PAKDD'08 Best Paper等论文奖，获得ICAPS'21 L2RPN with Trust冠军、OpenAI RetroContest 2018冠军、PAKDD’06数据挖掘竞赛冠军等竞赛奖。

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

郝建业，华为诺亚决策与推理实验室主任，天津大学智算学部副教授

郝建业博士，华为诺亚决策推理实验室主任，天津大学智算学部副教授。主要研究方向为深度强化学习、多智能体系统。发表人工智能领域国际会议和期刊论文100余篇，专著2部。主持国家科技部2030人工智能重大项目课题、基金委人工智能重大培育项目、国防科技创新重点项目课题等项目10余项，研究成果荣获国际会议最佳论文奖3次，NeurIPS20-22大会竞赛冠军4次。相关成果在工业基础软件智能化、自动驾驶、游戏AI、广告及推荐、5G优化、物流调度等领域落地应用。

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

许华哲，清华大学交叉信息研究院助理教授

许华哲博士现任清华大学交叉信息研究院助理教授，博士后就读于斯坦福大学，博士毕业于加州大学伯克利分校。其研究领域是具身人工智能（Embodied AI）的理论、算法与应用，具体研究方向包括深度强化学习、机器人学、基于感知的控制（Sensorimotor）等。其科研围绕具身人工智能的关键环节，系统性地研究了视觉深度强化学习在决策中的理论、模仿学习中的算法设计和高维视觉预测中的模型和应用，对解决具身人工智能领域中数据效率低和泛化能力弱等核心问题做出多项贡献。其发表顶级会议论文四十余篇，代表性工作曾被MIT Tech Review，Stanford HAI等媒体报道。

讲座信息

主题： 大模型时代的强化学习

时间： 8月28日（周三），北京时间20:00-22:00

参考资料：

1，TWOSOME: An Efficient Online Framework to Align LLMs with Embodied Environments via Reinforcement Learning

https://gairdao.com/doi/10.1142/S2972335324500042

2，《对话南洋理工大学安波教授：如何让大语言模型适应动态环境？丨IJAIRR》https://mp.weixin.qq.com/s/85TOawIFQ6uZaGXR4Y2RCA

IJAIRR正在邀约论文和专题

《International Journal of Artificial Intelligence and Robotics Research》（简称IJAIRR），是由新加坡GAIR研究院与世界科技出版社（WSP）联合出版的国际学术期刊。

作为全球首本专注于人工智能（AI）、机器人技术（Robotics）以及基础科学交叉研究（Research）的期刊，IJAIRR致力于成为AI与机器人领域研究的权威发布平台。

IJAIRR欢迎各类研究论文、评论文章、短篇论文、书评以及专题（Special Issue）形式的投稿。我们特别关注那些在顶级AI会议上发表并现场展示，但缺乏长期沉淀平台的优秀论文。为了给这些论文及其作者提供一个更广泛的发表和推广渠道，IJAIRR现正积极邀约相关论文投稿。

如果您在本领域顶级会议上发表的文章（或即将发表）不超过一年，我们将协助您稍作修改后在IJAIRR期刊上发表。

如果您领导的团队在顶级会议上有多篇论文发表，并希望在IJAIRR上围绕特定主题策划一个专题（Special Issue），我们诚挚邀请您深入讨论合作事宜。

如果您是顶级会议的组织者，并有意与IJAIRR合作，针对特定会议策划一个专题（Special Issue），我们也期待与您具体商讨合作细节。

IJAIRR期待与您携手，共同推动人工智能与机器人研究的发展。

联系人：IJAIRR创刊主编朱晓蕊博士，[email protected]

关于期刊创刊主编等更多信息，可点击 https://mp.weixin.qq.com/s/gEctQolbEqqf2eVwBAkdoA

https://mp.weixin.qq.com/s/Qn7Gc3rVijQhhK0hTSrgxw

IJAIRR期刊的主页链接为：

https://gairdao.com/journals/ijairr

耶鲁大学教授亲自授课，教你EM算法的全局收敛

Online Seminar on Mathematical Foundations of Data Science (Math for DS) [1]是在线的、每周举办的系列研讨会。研讨会旨在讨论数据科学、机器学习、统计以及优化背后的数学原理，邀请了北美诸多知名学者进行主题演讲。『运筹OR帷幄』和『机器之心』作为合作媒体，将在B站发布往期的回放视频。本期，受邀嘉宾将为我们带来主题为“Global Convergence of EM?”的演讲。

4/8/2021 9:34:00 PM

新闻助手

如何更科学地研究AI+科学？顶级学者将云集这次ICML研讨会

ICML将举办一个AI+科学的研讨会，由来自全球顶尖机构的研究人员举办，集结了AI+各科学领域的领跑者。

3/30/2022 10:14:00 AM

新闻助手

征稿｜ CVPR 2024 Workshop ｜第一届 Virtual Humans for Robotics and Autonomous Driving

探索虚拟人（数字人）赋能机器人与自动驾驶领域的前沿问题在人类居住的世界中，人类是最为核心的元素。因此，智能机器（例如，自动驾驶车辆和机器人）必须在人口密集的环境中具备社会意识, 与人交互。而如何感知和理解人类在智能机器研究中至关重要。然而，由于现实世界中的人类行为多样性，其对环境变化的影响，再加上智能体与人类互动时的安全考虑，种种因素使得在真实环境中训练具备社会意识的智能体变得极为困难。近年来，仿真环境作为训练智能体的一种有效的方式应运而生。但是，这些仿真环境就像无人居住的幽灵城市一样，并未包括对人类的有效模拟。如

4/2/2024 10:32:00 AM

机器之心

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna AI视频资讯早读！7个产品更新+8个案例精选纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验 Figma 推 AI 革命：开发智能应用制作器与网站创建工具即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测人形机器人百度伟达苹果 Transformer 深度学习模态 xAI 大语言模型字节跳动 Claude 搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊训练特斯拉 AGI 2024

顶部

讲座预约丨四位专家大论道 ：大模型时代的强化学习丨GAIR live

相关资讯

耶鲁大学教授亲自授课，教你EM算法的全局收敛

如何更科学地研究AI+科学？顶级学者将云集这次ICML研讨会

征稿｜ CVPR 2024 Workshop ｜第一届 Virtual Humans for Robotics and Autonomous Driving

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live