人类一样的外型,能动能跳还能干家务,人工智能界怎么背着我们偷偷搞科研啊?
科技公司1X最近推出了一款人形机器人NEO Beta,超静音,号称是专为人类家庭设计打造的全能机器人。
而且不需要特定的命令话语,只要直接对NEO说出命令,它就能跟着执行。
NEO甚至还能和你互动玩剪刀石头布。
这样看下来NEO和人类好像也没啥区别,吃瓜网友纷纷表示不敢相信自己的眼睛。
有网友说这肯定是有人穿着套装演出来。
也有人跟着附和表示不信,这就是一个穿着变形服的人,我们技术还没到这个程度呢。如果不是真的人类不然哪有这么流畅的动作?
还有网友跟着开玩笑,没错,我就是那个穿机器人套装的人。
当然,也有很多业内人士表示祝贺。
Jim Fan特地在1X创始人Eric Jang的推特底下发了条评论,恭喜他们做出了这么出色的成果。
帮1X拍视频的摄影师也说话了,不管其他人信不信反正他是信了,而且这个机器人真的巨安静,拍摄的时候一点噪音都没有。
家庭新成员
根据1X官网发布的信息,他们把NEO定位成专为家庭设计的家用通用机器人,要能照顾好家庭成员和他们的生活,既要包揽家务,也要贴心问候,就像真正的人类一样。
你还真别说,穿上衣服的NEO看着和人真没什么区别。
为了这个目标,1X特地给NEO设计了类似肌肉的结构和触感柔软的外型,身高为5.41英尺(约1.65米),重量控制在30公斤,让NEO能够安全地像人类一样在家里四处行走。并且NEO在保证超轻重量的同时还拥有20公斤的携带重物能力,能够举起70公斤的重量,完全可以放心让它去做各种重活。
NEO的行走速度其实比视频里快得多,平常的行走速度是每小时4公里,奔跑速度可以达到每小时12公里。这是什么概念呢?一个普通人的奔跑速度一般是每小时5-7公里,NEO的速度几乎可以媲美专业马拉松选手了。
最重要的是,借助具身人工智能,NEO能够通过通过“感官”和身体的结合,同时理解自然语言和物理空间,在提供服务的过程中一边自主学习,用得越久就越聪明。
有一点可惜的是,轻量化设计的NEO运行时间只能维持在2-4小时之间。不过NEO的功能都这么强大了,只是多充几次电而已,还要什么自行车?
OpenAI看中的1X
在发布NEO之前,作为科技公司的1X在人工智能界看似默默无闻,实际上大有来头。
成立于2014年的1X,在2022年和OpenAI达成合作,引入了语言模型和具身学习模型。2023年3月,1X在OpenAI领投的A2轮融资中筹得2350万美元,OpenAI也顺势成为了1X的大股东。今年1月,1X启动了B轮融资,总计拿到了1亿美元。
1X之前发布的EVE轮式机器人,是为工作环境设计的,主要用于工业、物流、零售和安全领域。现在EVE已经在美国和欧洲地区投入使用了,承担巡逻、搬运、导航等各类工作。
Eric Jang
NEO的推出离不开1X的灵魂人物Eric Jang。
Eric Jang从2016年在布朗大学硕士毕业后就加入了Google,作为高级研究专家研究机器人技术,致力于把丰富的数据 + 简单的学习算法 + 强大的计算资源的原则应用到机器人领域。
2022年,Eric Jang离开Google加入1X,担任副总裁,立下了制造出能以指数级增长的机器的职业目标。
当时,Eric Jang认为1X拥有比其他任何公司都领先5年的人形机器人技术,即使是特斯拉也仍在开发中,而1X的人形机器人已经诞生了,并且在2018年就发布了EVE机器人。
加入1X后,Eric Jang主要负责训练模型来解决移动操作中的问题,同时也在具身人工智能领域为公司制定AGI发展路线图。
NEO主打的静音安全,都离不开Eric Jang的研究设计。Eric Jang最近就发了一篇博文解释其中的关键。
Eric Jang首先做了一个单电机碰撞模拟,假设一个轮子在一直旋转,有一个杠杆臂从轮子上伸出,轮子在碰撞木块后停止旋转。在这个过程中,部分动能以运动的形式守恒,但其余动能则以热量、声音和内部材料变形的形式耗散。很多机器人移动时发出的噪音就是传动效率低下导致的能量浪费造成的。
随后,Eric Jang又设计了带有两个轮子的涉及变速箱的碰撞模拟。右边的轮子保持旋转并和木块相撞,左边的轮子则以更快的速度旋转,通过齿轮机构驱动右边的轮子。通过计算可以发现,这种情况下碰撞时需耗散大量动能,不止是木块,连同齿轮本身也可能被碰撞摧毁。
很多工厂里的机器人就因为依赖于这样僵硬、高度齿轮化的驱动系统存在很大的安全隐患,所以必须被关在安全笼内,在接触任何东西之前都需要减速到爬行速度。
1X使用的是轻质高扭矩的低转速电机,这样就能避开工业机器人刚性、不能反向驱动的齿轮系统带来的高危险和高能耗,最大限度地提高驱动系统的物理安全性。
Eric Jang还对用视频训练机器人提出了新的见解。考虑到机器人内部的各种部件和执行动作时施加力的不同,他给出了一些建议:
使用NEO这样顺从和敏捷的机器人
降低视频速度,但仅适用于静态操作任务
分离运动规划与动态规划,运动规划用于目标位置匹配,而动态规划用于接触力匹配