上海交大卢策吾:具身智能与他的首个刮胡子机器人 | 智者访谈

查阅历史资料后表明,上海交通大学的卢策吾教授是世界上第一个被机器人用刀片刮胡子的人。视频展示了上海交通大学卢策吾教授亲自体验其团队研发成果的过程——在一个具身智能大模型操控下,机械臂完成了刮胡子的动作。机器人给人刮胡子,看似简单,实则蕴含巨大挑战,除了行为泛化性,更重要的是需要极致鲁棒性。可以看到,当卢教授的头部移动时,这个嵌入了高精度力反馈模块的具身智能大模型能够瞬时决策压力和切向力的变化,既把胡须刮干净,又不会伤到他。如果大模型仅通过视觉判定轨迹输出,将难以完成任务。这也无法通过遥操作实现。在大模型风靡的 20

查阅历史资料后表明,上海交通大学的卢策吾教授是世界上第一个被机器人用刀片刮胡子的人。

上海交大卢策吾:具身智能与他的首个刮胡子机器人 | 智者访谈

视频展示了上海交通大学卢策吾教授亲自体验其团队研发成果的过程——在一个具身智能大模型操控下,机械臂完成了刮胡子的动作。

机器人给人刮胡子,看似简单,实则蕴含巨大挑战,除了行为泛化性,更重要的是需要极致鲁棒性。

可以看到,当卢教授的头部移动时,这个嵌入了高精度力反馈模块的具身智能大模型能够瞬时决策压力和切向力的变化,既把胡须刮干净,又不会伤到他。如果大模型仅通过视觉判定轨迹输出,将难以完成任务。这也无法通过遥操作实现。

在大模型风靡的 2024 年,如果说 AI 领域还有哪些热点,「具身智能」必定位列其中。

与被动接收信息不同,具身智能(Embodied AI)强调智能体主动与物理环境进行交互。这种交互并非毫无代价,每一次行动都可能改变环境状态,带来新的挑战,需要智能体不断调整自身策略。

探索具身智能,为理解智能的本质提供了一个独特视角,基于身体发展智能,也是一种与既有 AI 研究完全不同的范式。

人工智能的卓越发展,源于对技术和产业本质的思考。

机器之心推出全新视频栏目「智者访谈」,邀请领域专家,洞悉 AI 核心技术与行业趋势。为从业者量身打造,旨在深化行业认知,激发创新思考。在本期节目中,上海交通大学的卢策吾教授深度剖析具身智能,带来从原理到落地的全方位思考。

图片

上海交大卢策吾:关于具身智能、Scaling Law 以及大模型上海交大卢策吾:具身智能与他的首个刮胡子机器人 | 智者访谈

时间戳

00:00    嘉宾介绍

01:00    具身智能的内涵与特性

03:09    具身智能「身体」与「智能」的标准?

06:42    99.X%:除了通用性,还需要鲁棒性

13:09    不同技术路径及分析

15:20    Sora 能理解物理世界吗?

20:18    具身智能大模型:两级火箭架构

25:11    Scaling Law 在具身智能领域会如何体现?

32:03    「数据即科研」

38:20    具身智能评估:成本与有效性难兼顾

46:53    具身智能创业:只有正确的技术路径,才能达到 99.X%

55:16    具身智能人才:顶级人才将一直稀缺

嘉宾简介

卢策吾,上海交通大学教授,博士生导师,科学探索奖获得者(获奖原因:具身智能贡献),2018 年被《麻省理工科技评论》评为 35 位 35 岁以下中国科技精英(MIT TR35),2019 年获求是杰出青年学者,2020 年获上海市科技进步特等奖,吴文俊自然科学一等奖,2022 年获教育部青年科学奖,2021/2022 获中国高被引学者,2022 年获国际机器人顶会 IROS 最佳论文之一(6/3579),RSS 最佳系统论文提名,以通讯作者或第一作者在《自然》,《自然-机器智能》,TPAMI,T-RO,IJRR 等高水平期刊和会议发表论文 100 多篇;担任 Science 正刊,Nature 子刊,Cell 子刊等期刊审稿人,NeurIPS,CVPR,ICCV ,ECCV,IROS ,ICRA 领域主席。研究兴趣包括具身智能,机器人学习,计算机视觉。作为联合创始人,首席科学家,创立具身智能公司穹彻智能。

精彩片段上海交大卢策吾:具身智能与他的首个刮胡子机器人 | 智者访谈

关注机器之心视频号及 B 站账号

更多精彩内容等你来看!

相关资讯

北大王立威:理论视角看大模型,为什么AI既聪明又愚蠢 | 智者访谈

人工智能的卓越发展源于对技术与产业本质的洞察AI在线全新视频栏目「智者访谈」邀请领域专家,洞悉 AI 核心技术与行业趋势为从业者量身打造深化行业认知,激发创新思考与智者同行,共创 AI 未来以英伟达为代表,近期美股科技巨头市值蒸发超过万亿,引发了市场对 AI 泡沫破裂的担忧,特别引发焦虑的是大模型领域,甚至有人将其与互联网泡沫相提并论。我们惊叹于当前 AI 的成果,但若深究其过程则往往感到失落。在生成式 AI 盛行的当下,这种矛盾心理尤为突出。大语言模型(LLM)的通用能力是一个意外的收获,为了改进机器翻译序列处理

小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里?| 智者访谈

一线 AI 洞察,智者深度思考                                                                 深入产业变革,共创 AI 未来多模态能力的融合正在改写 AI 发展路径。 语音、视觉与自然语言处理的边界日益模糊,以 Transformer 为代表的通用解决方案,正在重塑传统技术领域。 在这个技术范式转变的关键时期,那些长期深耕细分领域的研究者又在思考什么?

上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈

一线 AI 洞察,智者深度思考                                                                                深入产业变革,共创 AI 未来DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗? 在医疗诊断、自动驾驶、法律判决等高风险领域,我们能否真正信任 AI 的决策? 本期《智者访谈》邀请到上海交通大学张拳石教授,他在神经网络可解释性研究领域开创了新的理论框架。