上海交大卢策吾：具身智能与他的首个刮胡子机器人 | 智者访谈

2024-06-03 03:31

查阅历史资料后表明，上海交通大学的卢策吾教授是世界上第一个被机器人用刀片刮胡子的人。视频展示了上海交通大学卢策吾教授亲自体验其团队研发成果的过程——在一个具身智能大模型操控下，机械臂完成了刮胡子的动作。机器人给人刮胡子，看似简单，实则蕴含巨大挑战，除了行为泛化性，更重要的是需要极致鲁棒性。可以看到，当卢教授的头部移动时，这个嵌入了高精度力反馈模块的具身智能大模型能够瞬时决策压力和切向力的变化，既把胡须刮干净，又不会伤到他。如果大模型仅通过视觉判定轨迹输出，将难以完成任务。这也无法通过遥操作实现。在大模型风靡的 20

查阅历史资料后表明，上海交通大学的卢策吾教授是世界上第一个被机器人用刀片刮胡子的人。

视频展示了上海交通大学卢策吾教授亲自体验其团队研发成果的过程——在一个具身智能大模型操控下，机械臂完成了刮胡子的动作。

机器人给人刮胡子，看似简单，实则蕴含巨大挑战，除了行为泛化性，更重要的是需要极致鲁棒性。

可以看到，当卢教授的头部移动时，这个嵌入了高精度力反馈模块的具身智能大模型能够瞬时决策压力和切向力的变化，既把胡须刮干净，又不会伤到他。如果大模型仅通过视觉判定轨迹输出，将难以完成任务。这也无法通过遥操作实现。

在大模型风靡的 2024 年，如果说 AI 领域还有哪些热点，「具身智能」必定位列其中。

与被动接收信息不同，具身智能（Embodied AI）强调智能体主动与物理环境进行交互。这种交互并非毫无代价，每一次行动都可能改变环境状态，带来新的挑战，需要智能体不断调整自身策略。

探索具身智能，为理解智能的本质提供了一个独特视角，基于身体发展智能，也是一种与既有 AI 研究完全不同的范式。

人工智能的卓越发展，源于对技术和产业本质的思考。

机器之心推出全新视频栏目「智者访谈」，邀请领域专家，洞悉 AI 核心技术与行业趋势。为从业者量身打造，旨在深化行业认知，激发创新思考。在本期节目中，上海交通大学的卢策吾教授深度剖析具身智能，带来从原理到落地的全方位思考。

上海交大卢策吾：关于具身智能、Scaling Law 以及大模型

时间戳

00:00 嘉宾介绍

01:00 具身智能的内涵与特性

03:09 具身智能「身体」与「智能」的标准？

06:42 99.X%：除了通用性，还需要鲁棒性

13:09 不同技术路径及分析

15:20 Sora 能理解物理世界吗？

20:18 具身智能大模型：两级火箭架构

25:11 Scaling Law 在具身智能领域会如何体现？

32:03 「数据即科研」

38:20 具身智能评估：成本与有效性难兼顾

46:53 具身智能创业：只有正确的技术路径，才能达到 99.X%

55:16 具身智能人才：顶级人才将一直稀缺

嘉宾简介

卢策吾，上海交通大学教授，博士生导师，科学探索奖获得者（获奖原因：具身智能贡献），2018 年被《麻省理工科技评论》评为 35 位 35 岁以下中国科技精英（MIT TR35），2019 年获求是杰出青年学者，2020 年获上海市科技进步特等奖，吴文俊自然科学一等奖，2022 年获教育部青年科学奖，2021/2022 获中国高被引学者，2022 年获国际机器人顶会 IROS 最佳论文之一(6/3579)，RSS 最佳系统论文提名，以通讯作者或第一作者在《自然》，《自然-机器智能》，TPAMI，T-RO，IJRR 等高水平期刊和会议发表论文 100 多篇；担任 Science 正刊，Nature 子刊，Cell 子刊等期刊审稿人，NeurIPS，CVPR，ICCV ，ECCV，IROS ，ICRA 领域主席。研究兴趣包括具身智能，机器人学习，计算机视觉。作为联合创始人，首席科学家，创立具身智能公司穹彻智能。

精彩片段

关注机器之心视频号及 B 站账号

更多精彩内容等你来看！

北大王立威：理论视角看大模型，为什么AI既聪明又愚蠢 | 智者访谈

人工智能的卓越发展源于对技术与产业本质的洞察AI在线全新视频栏目「智者访谈」邀请领域专家，洞悉 AI 核心技术与行业趋势为从业者量身打造深化行业认知，激发创新思考与智者同行，共创 AI 未来以英伟达为代表，近期美股科技巨头市值蒸发超过万亿，引发了市场对 AI 泡沫破裂的担忧，特别引发焦虑的是大模型领域，甚至有人将其与互联网泡沫相提并论。我们惊叹于当前 AI 的成果，但若深究其过程则往往感到失落。在生成式 AI 盛行的当下，这种矛盾心理尤为突出。大语言模型（LLM）的通用能力是一个意外的收获，为了改进机器翻译序列处理

9/8/2024 1:39:00 PM

机器之心

小米语音首席科学家 Daniel Povey：语音识别卷完了，下一个机会在哪里？| 智者访谈

一线 AI 洞察，智者深度思考深入产业变革，共创 AI 未来多模态能力的融合正在改写 AI 发展路径。语音、视觉与自然语言处理的边界日益模糊，以 Transformer 为代表的通用解决方案，正在重塑传统技术领域。在这个技术范式转变的关键时期，那些长期深耕细分领域的研究者又在思考什么？

1/19/2025 12:12:00 PM

机器之心

上海交大张拳石：思维链只是表象，DeepSeek凭什么更强 | 智者访谈

一线 AI 洞察，智者深度思考深入产业变革，共创 AI 未来DeepSeek-R1 等模型通过展示思维链（CoT）让用户一窥大模型的「思考过程」，然而，模型展示的思考过程真的代表了模型的内在推理机制吗？在医疗诊断、自动驾驶、法律判决等高风险领域，我们能否真正信任 AI 的决策？本期《智者访谈》邀请到上海交通大学张拳石教授，他在神经网络可解释性研究领域开创了新的理论框架。

3/9/2025 7:41:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

上海交大卢策吾：具身智能与他的首个刮胡子机器人 | 智者访谈

相关资讯

北大王立威：理论视角看大模型，为什么AI既聪明又愚蠢 | 智者访谈

小米语音首席科学家 Daniel Povey：语音识别卷完了，下一个机会在哪里？| 智者访谈

上海交大张拳石：思维链只是表象，DeepSeek凭什么更强 | 智者访谈