“一夜变天”,ChatGPT奇迹也将发作在机械人领域

机械之能报道编译:吴昕条条大路通罗马(AGI),虽然方式不同,但我们可以期待非具身 AGI 和具身 AGI 大致同时出现。作为一家炙手可热的人形机械人赛道选手,1X 前阵子秀了一把 EVE 的新成果 。昨天,一直在 X 平台比较活跃的 1X AI 副总裁 Eric Jang  写了一篇文章,公开了其对AI 和机械人手艺发展方向的一些预测。两年前,google高级研讨科学家 Eric Jang 离开 Google Robotics,加入 1X Technologies(原名 Halodi Robotics)负责 AI 工作。

机械之能报道

编译:吴昕

条条大路通罗马(AGI),虽然方式不同,但我们可以期待非具身 AGI 和具身 AGI 大致同时出现。

作为一家炙手可热的人形机械人赛道选手,1X 前阵子秀了一把 EVE 的新成果 。昨天,一直在 X 平台比较活跃的 1X AI 副总裁 Eric Jang  写了一篇文章,公开了其对AI 和机械人手艺发展方向的一些预测。两年前,google高级研讨科学家 Eric Jang 离开 Google Robotics,加入 1X Technologies(原名 Halodi Robotics)负责 AI 工作。从那时起,AI 领域发作了很多事情,他也一直在思考 AI 之路将通往何处。“许多 AI 研讨人员仍然以为通用机械人还需要几十年的时候。但请记住,ChatGPT 的发作几乎就在一夜之间。”他在昨天的文章中写道,“我以为,这也将发作在机械人手艺上。一旦发作这种情况,计算本身将彻底改变。” “最终,任何 AI 软件都会融合起来,看起就像机械人软件。”

“一夜变天”,ChatGPT奇迹也将发作在机械人领域1X 人工智能副总裁 Eric Jang接受播客节目的采访,讨论AI和人形机械人手艺的发展前景,包括为什么现在是投资和建造通用机械人的最佳时机。

文章不算长。Eric Jang 首先谈到 1X AI 团队完成的两项重要工作,这些成就让他“特别很是自豪”。一个是通过端到端的神经网络,实现了人形机械人 EVE 的自主性。在这些视频中,EVE 掌握新技能都不用专业人士写代码,而是直接从数据中进修。这意味着未来扩展机械人能力的门槛大为降低——不用再受雇用专业人士以及他们撰写代码速度的限制。

“一夜变天”,ChatGPT奇迹也将发作在机械人领域

随着时候推移,机械人功能会越来越受数据驱动,同时对专业知识的依赖性越来越低,这种机械人手艺将更容易被更多没有手艺背景的普通用户所接受。

“据我所知,1X 是第一家让数据网络系统自我培训的机械人公司。” Eric Jang 提到第二个让他骄傲的成绩。EVE 机械人透过数据来理解世界,因此,如何网络和管理训练数据比算法模型重要得多。为此,他们将 Meta VR Quest 头显设备变成了机械人的 AI 训练数据采集系统,并投入大量资金和人力提升数据质量。比如,一些没有机械进修背景的人也可以用自己网络的数据微调基础模型,从而领悟如何网络更高质量的数据。

“一夜变天”,ChatGPT奇迹也将发作在机械人领域

“一夜变天”,ChatGPT奇迹也将发作在机械人领域

公司的运维团队(无需专业的机械进修背景)自行教会机械人一些行为。

“这个办法确实缩短了收获良好模型的时候,因为网络数据的人可以特别很是快速地获得反馈,了解他们的数据有多好以及实际需要多少数据来解决机械人任务。”Eric Jang 预测,“这将成为未来网络机械人数据的普遍范式。”

“一夜变天”,ChatGPT奇迹也将发作在机械人领域

“一夜变天”,ChatGPT奇迹也将发作在机械人领域公司的运维团队(无需专业的机械进修背景)自行教会机械人的一些行为。

1X、Figure、特斯拉等公司的手艺路子都是一样的—— 建立完全通用的硬件、软件,应对各种现实案例。当然缺点是从来没有人解决过这个问题,但潜力无穷。这和当今大多数机械人公司提供价值的方式也完全不同。无论是叉车、割草机、扫地机还是焊接、喷涂或者拾取包裹的工业机械臂都是从一个很窄的领域开始,垂直整合硬件和软件,从来没有真正突破自己的利基市场走向通用领域。

现在,Eric Jang 和同事们正雄心勃勃地扩展模型,也发现机械人公司与 LLMs 公司所面对寻衅有很多相似之处。他特别很是赞同一位同行的观点,“任何 AI 软件都将融合到机械人软件中”。或者说,任何 AI 软件最终都会融合起来,看起就像机械人软件。

他谈了一些观察和论据。当和那些思考职业发展的 AI 研讨人员和工程师聊天时,他发现机械人领域往往不是这些人才的首选。原因也不难猜,过去机械人业务的成绩单乏善可陈,公司死亡率居高不下,未来也可能继续如此。更何况,现在有一大把更容易拿到投资的选择,比如聊天机械人、生成式 AI、颠覆搜索、智能助理、重新发明操作界面等等。

Eric 承认,在纯软件环境中部署机械进修更容易,因为比特(数字)世界是可预测的。机械人要和原子构成的物理世界打交道,任何外部信息都是未知的。你不知道你在哪里,其他东西在哪里,如果你接触到什么会发作什么(按下开关,灯是否亮?你甚至根本不知道是否按下了开关)。即使一些特别很是琐碎的事情,比如区分坐电梯下降和乘龙门吊上升都很困难,因为在惯性测量单元( IMU )传感器的眼里,这些力都很相似。区分不了的机械人最终会躺在地板上抽搐,因为它以为自己还有机会保持平衡。

但这种分别不应被过度强调。当 AI 软件开始接触现实世界时(比如用 LLMs 驱动的助手叫 Waymo),面对的寻衅难度并不亚于机械人也很相似——应用程序与熵源交互时候越长,就更难保证程序行为正确性。“即使你没有造一个物理意义上的机械人,但你的代码库最终看起来就像一个现代机械人软件栈。” Eric 写道,还举了一些例子。

比如,他本人花了相当一部分时候在这些 LLMs 也会熟悉的工作上——确保数据加载器、日志管理平台的可扩展性,上传数据时确保可以将这些数据按 transformer 的时候因果序列排序。他还设计了一张表格,列举了机械人和 LLMs 所面对的类似寻衅。

“一夜变天”,ChatGPT奇迹也将发作在机械人领域这张表格列举出了机械人和 LLMs 所面对的类似手艺寻衅

任何这些问题都很棘手,但并非不能解决。“尽管大多数 AI 公司和实验室不必考虑执行器硬件、电磁干扰或快速移动躯体带来的安全隐患,但机械人+研讨过程中的工程技能,将是未来任何软件特别很是不可或缺的一个方面,而不仅仅只有控制机械人才需要。” Eric  写道。如果你接受这样一个前提—— LLMs 和机械人面对类似的工程和基础设施寻衅,“那么,我们也可以期待非具身 AGI 和具身 AGI 大致同时出现。硬件这部分已经准备好了——就在过去 10 年发表的研讨论文中。

“许多 AI 研讨人员仍然以为,通用机械人还需要几十年的时候。但请记住,ChatGPT 似乎是在一夜之间发作的。我以为,这也将发作在机械人手艺上。一旦发作这种情况,计算本身将彻底改变。”

除了 AGI,Eric Jang 正在研讨的主题之一还包括利润——如何将 1000 万美元 GPU 投入转化为 1000 万美元以上的利润。过去两年中筹集了千万甚至上亿美元、从头开始训练自己 LLMs 的首创公司都支付了巨大的成本,而现在基本上每个 AI 首创都能免费获得一些资源。“我以为,绝大多数成功的创业公司都能灵活地驾驭开源的潮流。”

“当然,我并不是说大胆下注训练 AGI 不是一个好主意;我只是以为,最适合这条路子是那些能将计算成本降到最低的公司。”否则的话,还是请严格遵守与能力相关的扩展定律和指标。“许多首创公司都在关注google如何将在 Rankbrain 上投入的几十亿研发成本变成好几倍的利润,但他们也忘记了,这首先需要建立google搜索业务。”

除了 GPU 的昂贵,Eric 也感慨当下人才成本之疯狂。“我曾与博士生交谈过,他们要求 7 位数的薪水。”这个数字让他想起六年前听闻 Open AI 联合创始人 John Schulman 薪水有 275k 时的感觉。

最后,Eric 预测 “ 这一代自动驾驶汽车公司将在未来几个月出现很多变化。同时,没有比现在更好的时机来创办一家全新的自动驾驶公司了。”

参考链接https://evjang.com/2024/03/03/all-roads-robots.html

给TA打赏
共{{data.count}}人
人已打赏
应用

独家|前百度搜索老将赵世奇从华为离职,回归百度

2024-3-6 15:57:00

应用

Stable Diffusion ComfyUI 进阶教程(一):Controlnet 线条预处理器

2024-3-7 7:06:07

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索