AI在线 AI在线

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

作者:量子位
2025-03-11 01:19
刚刚! 鸽了两年之后,稚晖君罕见更新视频——上线号称史上最复杂项目灵犀X2,能够像人一样灵动地骑自行车。 评论区早已经是听取哇声一片。

刚刚!鸽了两年之后,稚晖君罕见更新视频——

上线号称史上最复杂项目灵犀X2,能够像人一样灵动地骑自行车。

图片

评论区早已经是听取哇声一片。

图片

他自己表示,悄咪咪研发了三个月,视频准备了一个月。嗯,鸽的越久,事情越大!

据介绍,之所以这次如此有人味儿,源于背后集齐了运动、交互、作业三大智能。

于是乎,四年前葡萄缝针的神技,再次在灵犀X2上看到了。

图片

它能像人一样,有着一呼一吸的韵律。

图片

它可以毫秒级交互,帮助你决策一些日常的选择困难。

睡前该喝什么饮料。

图片

除此之外,它还拥有一些其他机器人不具备的抽象能力。

比如脑壳里装手机???

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

还有远程裸眼3D交流。。。

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

着实是非常抽象了。

本体是怎么设计?

整个设计过程也完全公开,与以往的项目一样的硬核。他们此次在本体设计上有很多创新思考。

首先是硬件系统,抽象出了一个个可复用的核心组件。

  • 小脑控制器Xyber-Edge;
  • 域控制器Xyber-DCU;
  • 智能电源管理系统Xyber-BMS;
  • 核心关节模组;

……

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

通过这样模块化的组件设计,就可以像拼无人机航模一样来搭建起各种形态的人形机器人系统。

就比如拿抓完全体,这里他又挖坑了,鸽了两年不知还要再鸽几年。

图片

还有就是在材料选择上,选择了很亲和的柔性材料。他们进行了多种尝试,包括TPU、ETPU、EVA,甚至是美妆蛋???

图片

另外,他们全新设计了核心关节模组,并在原型机全身28个自由度没有使用任何一个并联结构。

这样既能保证惯量上移,又实现了运控算法的完全解耦。

就像这样,跟人一样很Chill的晃腿~

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

更为重要的突破来自运控算法层面——全面从Model-based转向学习驱动的强化学习

通过深度强化学习与模仿学习相结合,让灵犀X2学会了像人一样的运动能力。

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

而且平衡能力不错,随机跑起来或者原地转圈也是轻松拿捏。

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

甚至它还能抓住舞蹈精髓,跟随bgm跳一曲科目三。

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

同时,更考验身体协调性和平衡能力的深蹲动作,灵犀X2举着小杠铃也轻松完成了。

(体重暴露了,灵犀X2重33.8KG,加上身高在一米三左右,嗯,标准身材)

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

此外,它还学会了人类必备技能——偷懒(doge),各种工具用起来也是得心应手。

踩滑板车、平衡车那叫一个6:

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

不过要想要想训练出这样一个灵活的机器人,其实并不容易。他们在过程中也遇到了各种各样神奇的体验(Bug)。

比如偶然习得了一种抽象的走路方式。。。

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

不想动了就直接摆烂,太像人了有没有?!

图片

又或者闹一波情绪,经鉴定该孩子为情绪暴躁型

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

目前灵犀X2还在持续进化运动能力中,按照稚晖君的说法:

通过数据驱动的算法范式,智能体能够从每秒数万次的环境交互和动作数据中,找到突破运动瓶颈的方法。

我们相信人形机器人的运动智能问题,很快会得到彻底解决

让机器人有人味儿了

不过要让机器人真正跟人一样,除了运动智能之外,交互智能、作业智能也必不可少。

首先交互方面,要让机器人不光四肢发达,头脑也不简单,这主要得益于他们开发的一套基于Diffusion的生成式动作引擎

此外,还为灵犀X2训练了定制的多模态交互大模型——硅光动语,以至于灵犀X2被称为“第一台真正具备复杂交互能力的灵动机器人”。

在此基础上,通过边缘侧大脑和端到端模型架构,以及一系列工程优化,灵犀X2具备了毫秒级交互能力

日常坐下来聊聊天(用了稚晖君本人的声音训练):

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

最有意思的是,当问灵犀X2“刚刚提的问有多少是预先写好的”,它骄傲回答道:

完全随机。

与此同时,除了语音和视觉,灵犀X2所使用的模型还集成了动作模态,使它被赋予了生命感

除了开头提到的呼吸韵律,它还有自己的好奇心以及肢体语言

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

当然,情绪价值拉满的同时,灵犀X2还具备了一定的生产能力。

据稚晖君介绍,过去一年里,他们初步找到了一条通往泛化作业智能的路径,而灵犀X2则是集大成者。

结合已开源的数据集和框架,灵犀X2目前已具备简单任务的零样本泛化能力。

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

像前段时间Figure展现出来的多机协作,灵犀X2在某些特定任务中也能实现。

稚晖君机器人“葡萄缝针”神技再现江湖,这次是人形的!骑自行车惊呆众人:又抽象又硬核

而按照规划,最终灵犀X2能够实现作业领域的“机器人吉祥三保”——保安、保姆以及保洁。

相关标签:

相关资讯

让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区 | ICRA 2025

机器人落地复杂场景,社交导航能力一定是避不开的关键一点。 先简单介绍下,社交导航 (SocialNav,Social navigation) 是指在人机共存的环境中,机器人在遵循社会规范的前提下执行导航任务。 就拿下图来说,机器人需导航至目标点,而目标恰好位于两名行人未来轨迹的交汇区域。
4/2/2025 9:50:00 AM
量子位

阿里云通义大模型新技术:MoE模型训练专家平衡的关键细节

本周,在阿里云通义千问 Qwen 团队提交的一篇论文中,研究人员发现了目前最热门的 MoE(混合专家模型)训练中存在的一个普遍关键问题,并提出一种全新的方法——通过轻量的通信将局部均衡放松为全局均衡,使得 MoE 模型的性能和专家特异性都得到了显著的提升。 论文:《Demons in the Detail: On Implementing Load Balancing Loss for Training Specialized Mixture-of-Expert Models》论文链接: 模型训练中的关键问题混合专家模型(MoEs)通过路由机制动态并稀疏地激活模型参数,使得能高效地增大模型参数规模。 基于 TopK 机制的稀疏激活会在训练中会遇到专家激活不均衡的问题:少数被频繁选择的专家会被优化得更多,进一步使得这些专家被更频繁地选择,最终导致只选择少数专家,造成剩余专家的冗余。
1/24/2025 2:19:21 PM
机器之心

快手发布DragAnything,拖动锚点精准控制视频物体和镜头运动,视频运动控制技术革命性更新

快手联合浙江大学、新加坡国立大学发布了DragAnything ,利用实体表示实现对任何物体的运动控制。 该技术可以精确控制物体的运动,包括前景、背景和相机等不同元素。 该项目提供了对实体级别运动控制的新见解,通过实体表示揭示了像素级运动和实体级运动之间的差异。
2/5/2025 10:30:00 AM
AIGC Studio