苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

苹果要搞人形机器人这事儿现在传得沸沸扬扬。 最近他们确实有新动作——开发了一套机器人感知系统! 系统名为ARMOR,软硬件协同增强机器人的“空间意识”,能动态防碰撞的那种。

苹果要搞人形机器人这事儿现在传得沸沸扬扬。

最近他们确实有新动作——开发了一套机器人感知系统!

系统名为ARMOR,软硬件协同增强机器人的“空间意识”,能动态防碰撞的那种。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

硬件方面,ARMOR通过在机器人手臂上安装小型智能深度传感器,为机器人提供几乎完整的环境视图,解决了传统机器人感知中的盲点和遮挡问题。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

软件方面,苹果开发了一个基于Transformer的AI驱动ARMOR-Policy,能够从人类动作中学习,帮助机器人动态规划行动。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

团队还将ARMOR部署在了傅利叶GR-1机器人上进行实验。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

实验结果显示,与使用四个头戴式和外部安装的深度相机(外心感知)相比,ARMOR系统使碰撞降低了63.7%!

与基于采样的运动规划专家系统cuRobo相比,ARMOR-Policy计算效率提升26倍,确保机器人能够迅速行动。

看到苹果在人形机器人方面的布局,网友直呼这是大势所趋:

他们不可能永远依赖智能手机赚钱。从长远来看,机器人市场将远大于智能手机市场。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

ARMOR系统长啥样?

当前,传统人形机器人通常依赖头部或躯干安装的集中式相机和激光雷达进行环境感知,这种方式虽然易于集成且能提供较好的视野范围,但在手臂和手部区域常常存在严重的遮挡问题。

虽然一些研究尝试在机器人终端执行器上集成触觉传感,但这种方案成本高昂,且难以大规模应用于机器人手臂,同时在策略学习中如何有效利用触觉输入仍待解决。

ARMOR系统,提供了一种硬件和软件整合设计,它由来自卡内基梅隆大学的学者Daehwa Kim在苹果实习期间与苹果团队共同开发。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

在硬件方面,与集中式RGBD相机一次性捕捉密集帧中的全部细节不同,团队选择了SparkFun VL53L5CX飞行时间(ToF)激光雷达作为基础传感单元,将稀疏感知分布在多个传感器上,形成“以自我为中心的感知”。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

这种传感器体积为6.4×3.0×1.5mm,可以以15Hz的频率提供8×8分辨率的深度图像,对角视场为63°,测距范围达4000mm。

研究团队在机器人的每个手臂上布置了20个这样的传感器,共计40个传感器形成分布式感知网络。

每四个传感器连接到一个XIAO ESP微控制器,通过I2C总线进行数据读取,再通过USB传输到机器人的板载计算机(Jetson Xavier NX),最后无线传输到配备NVIDIA GeForce RTX 4090 GPU的Linux主机进行处理,确保整个系统能够维持15Hz的刷新率。

在软件方面,研究团队开发了基于Transformer编码器-解码器架构的ARMOR-Policy,类似于动作分块Transformer(ACT)。

该策略通过模仿学习从无碰撞的人类运动演示中学习。

为了训练这个策略,研究团队使用了AMASS数据集中的311922个人类真实运动序列(约86.6小时),这些数据包含了各种相关的人类姿态,如操作、舞蹈和社交行为等。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

团队将这些人类动作轨迹重定向到机器人的关节配置上,并在轨迹周围生成紧凑的障碍物,确保轨迹本身不发生碰撞。

训练数据的生成采用了三种策略:避障运动、紧急停止和无碰撞运动。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

ARMOR-Policy的网络架构设计考虑到了运动规划可能存在多个有效解的特点。通过引入额外的编码器层来推断潜在变量z,使策略能够通过调整z生成不同的运动轨迹候选。

在推理阶段,系统会并行计算N个候选轨迹,并通过最小化机器人与点云之间的距离来选择最优路径。网络输入包括潜在变量z、当前和目标关节位置(28维向量),以及40个ToF激光雷达传感器的深度图像数据。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

深度图像通过修改后的单通道ResNet18骨干网络处理,提取512维特征。整个网络架构包含约84M参数。

实验验证显示,ARMOR系统在多个方面都优于现有方案。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

与使用四个头戴式和外部安装的深度相机(外部感知)的传统策略相比,ARMOR系统在避障性能上取得了显著提升,碰撞降低63.7%,成功率提升78.7%。

同时,与基于采样的运动规划专家系统cuRobo相比,ARMOR-Policy表现出更好的性能,碰撞减少31.6%,成功率提高16.9%,计算效率更是提升了26倍。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

研究团队还通过在傅利叶GR-1人形机器人上部署28个ToF激光雷达,实际验证了ARMOR系统在真实环境中的应用可行性,系统能够实现15Hz的实时避障轨迹更新。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

“苹果做机器人几乎是必然的”

最近,关于苹果发力人形机器人的爆料频出。

比如彭博社爆料,苹果正在寻找其“下一个重大项目”,机器人正是其关注的领域之一。苹果工程团队正在开发多种家庭机器人设备以及可能增强家庭机器人实用性的AI软件和功能。

而苹果机器人研发活动由硬件工程部门和John Giannandrea领导的AI与机器学习团队共同进行。

更有爆料指出,苹果将优先打造桌面机器人,它将作为“家庭指挥中心”,可用于 FaceTime视频通话以及家庭安全监控。

这一系列举动也引发了网友大量讨论。

有网友分析,苹果在人形机器人赛道的布局,几乎是必然的:

苹果人形机器人?这不仅是可能的,几乎是必然的。凭借他们的设计理念和生态系统整合,他们将为个人机器人设定一个高标准。

随着智能手机的逐渐淘汰,机器人确实有可能成为下一个普遍存在的技术。想象一下,Siri体现在一个时尚的人形助手中,这将是一个游戏规则的改变者!

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

这种分析立马遭到其他网友反驳,揭老底:

苹果之前也吵吵着要做自动驾驶汽车,但最后还是放弃了。虽然苹果有能力开发人形机器人,但会不会真做还是不太清楚。

苹果偏好主导市场,不喜欢面对激烈的竞争,而人形机器人和AI市场将极具竞争性。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

那么,你看好苹果做人形机器人吗?

论文链接:https://arxiv.org/pdf/2412.00396v1。参考链接:https://x.com/Dr_Singularity/status/1873374876867723435。

相关资讯

优必选科技四上春晚,“拓荒牛”机器人展现硬科技创新力量

2月11日,在央视2021牛年春晚的舞台上,优必选科技全新研发的首款大型四足机器人化身“拓荒牛”,与刘德华、王一博、关晓彤等一起呈现了科技感十足的创意表演《牛起来》。它们以拼搏进取的深圳 “拓荒牛”为设计原形,融合祥云及中国红等传统文化元素,以绚丽的灯光及机械结构诠释科技美感,伴随激昂的音乐奔腾向前。从2016年春晚540台Alpha机器人登台齐舞到2018年春晚24台Jimu汪汪组队拜年,再到2019年春晚6台Walker机器人与演员同台表演歌舞《青春畅想》……优必选科技已经四次登上春晚舞台,展示中国人工智能和机

“中原氢城”濮阳与优必选科技达成战略合作,发布全球首款氢动力人形机器人

2022年9月28日,氢生活、AI未来——全球首款氢动力人形机器人发布暨濮阳“两能”融合战略签约仪式在“中原氢城”濮阳举行。在全球首款氢动力人形机器人“一行”发布的同时,濮阳与优必选科技就人工智能与氢能“两能”融合达成战略合作,积极探索和实施以人工智能驱动新能源发展战略,助力实现我国“碳达峰、碳中和”的目标,推动经济绿色高质量发展。领导和嘉宾与全球首款氢动力人形机器人“一行”合影濮阳市委书记杨青玖,人民网党委委员、副总编辑孙海峰,中国产业发展促进会氢能分会副会长兼秘书长张宇,濮阳市长万正峰,濮阳市副市长周锋,濮阳市

类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中

编辑 | 白菜叶人工智能驱动的会话式聊天机器人已经出现在互联网搜索引擎中,例如谷歌的 Bard 和微软的 Bing,看起来也将越来越多地改变科学文献搜索方式。8 月 1 日,荷兰出版巨头 Elsevier 为其 Scopus 数据库的部分用户发布了由 ChatGPT 支持的 AI 界面,而英国公司 Digital Science 则宣布对其 Dimensions 数据库进行 AI 大语言模型 (LLM) 助手的封闭试验。与此同时,美国 Clarivate 公司表示,它也在努力将 LLM 纳入其 Web of Sci