机器之能报道
编辑:吴昕
争夺大脑控制权的战争越来越激烈了。又是一家要做机器人“大脑”的公司,虽然官网都没做好,但已拿到7000万美元投资,包括OpenAI的钱。
“字数越少,事情越大” 用来形容这家机器人 AI 公司的初次亮相再合适不过。
新公司名叫 Physical Intelligence(简称 PI,同 π ),打开官网的一瞬还以为自己误入某位程序员的个人博客:
目前公司官网主页的内容,有些寒酸啊
寥寥数句, 雄心立现。“…… 一家将通用 AI 带入物理世界的新公司,……开发基础模型和进修算法,为今天的机器人以及未来的物理设备提供动力。”
又是一家要做机器人 “大脑”的公司。理由也差不多,大家不甘心 AI 的巨大进步仅停留在比特世界,物理世界也要“共同富裕”。为此,他们选择解决其中最难、也最有影响力的问题——智能。也就是说,为物理世界打造一个“基础模型( LLMs )”、“大脑”,但用于控制机器人,教会任何机器人完成各种任务(甚至包括现在还不存在的任务)。
换做别人,如此宏大的愿景可能会被嗤笑,但他们不会。看完接下来的团队成员名单,很多人会认为他们的实力配得上野心。最后一段致谢名单也佐证了这一点。彭博社援引一位熟悉这家公司投资人人士的消息,PI 已经从 Thrive Capital 、Open AI、红杉资本 、Greenoaks Capital Parners 、Lux Captital 和 Khosla Ventures (绝大多数都出现在了致谢名单中)那里筹集了 7000 万美元。
这是一支集合了 Google Brain、Google DeepMind 钻研人员的明星队伍,连google首席科学家 Jeff Dean 也发来贺电。
公司团结创始人兼 CEO Karol Hausman 曾是 Google DeepMind 资深钻研科学家,也是斯坦福大学兼职教授。不在google调试机器人时,他会在斯坦福大学教授深度强化进修课程。
团结创始人兼 CEO Karol Hausman
Hausman 主要钻研兴味是帮助机器人在理想环境中获得通用技能,最近这方面的著名钻研成果 RT-X、RT-2 背后都可以看到他的身影。Hausman 将自己的钻研分为三个部分:深度机器人进修、交互式和主动感知,现在完全专注于第一个。最近,他非常热衷于钻研机器人决策的基础模型。
另一位团结创始人 Sergey Levine 是加州大学伯克利分校电气工程和计算机科学系副教授,斯坦福计算机科学博士。Sergey Levine 曾在google工作,期间见证了 AlphaGo 击败中国顶尖围棋选手柯洁。他的钻研兴味集中在教导机器人“自学成才”,研发算法帮助智能体通过进修不断掌握更为复杂的行为技能,特别是找到一种通用的方法。
团结创始人 Sergey Levine
过去几年,Sergey Levine 和 Hausman 完成了一些开创性的机器人钻研工作。Sergey Levine 说,他们的目标是构建通用机器人模型:就像NLP一样LLMs,但用于机器人控制。这并不容易,为此,他们需要以前所未有的规模收集机器人数据、进行算法改进、训练非常大的模型,并为从机器人控制到大规模 VLM 训练找到创造性的解决方案。
对于来自特斯拉 Optimus、Figure AI 等人形机器人公司,以及其他开发通用机器人软件公司的挑战(比如 Covariant、google),Sergey Levine 在接受彭博社采访时表示,“多年来,我们一直致力于解决机器人 AI 的挑战,并开发出了解决问题的新办法,这些方法已经将对手抛在了身后。”
第三位团结创始人 Chelsea Finn 是斯坦福大学计算机科学和电气工程系的助理教授,也曾是 Google Brain 团队的一员,钻研兴味集中在机器人和其他智能体如何通过进修变得更聪明。
团结创始人 Chelsea Finn
第四位团结创始人 Brian Ichter 也曾是 Google Brain 的钻研科学家,在机器人团队工作,斯坦福大学博士。钻研兴味是帮助移动机器人通过进修增强理想环境中的任务执行能力。
团结创始人 Brian Ichter
知名投资人 Lachy Groom 也是该公司团结创始人之一。他曾是 Stripe 的早期员工。“我认为,人们用人形机器人构建的东西真的很酷,”他在接受彭博社采访时谈到,“但从根本上让人类有趣的是大脑,不是硬件。我们造的是终极通才。”
投资人 Lachy Groom 也是该公司团结创始人之一
其他两名公开的团队成员还有斯坦福大学博士 Suraj Nair 以及目前是加州大学圣地亚哥分校四年级博士生的 Quan Vuong。
Suraj Nair 曾在丰田钻研院、Facebook AI Research、Google Brain 和 GE 工作过,兴味是为机器人构建大脑。公司团结创始人 Chelsea Finn 也是他的博士论文指导教授之一。
Suraj Nair
Quan Vuong 的钻研领域包括深度强化进修、计算机视觉、机器人技术。攻读博士学位期间也在 Google Brain 的机器人团队实习过。
Quan Vuong
过去几年里,钻研人员发表了一系列论文展示了机器人如何从语言和图像 AI 模型中获得新的智力水平。比如,要求机械臂系鞋带,它可以先试着搞清楚鞋子和鞋带是什么,以及系好鞋带的必要信息。这是一个好的开始,但硬件部分还需要一段时间的训练才能真将鞋带系好。这也一直是个挑战 —— 完成任务时间越长,意味着时间和金钱成本越高。
PI 并没有透露如何克服这个问题。该公司团结创始人表示,他们不会制造自己的硬件,而是购买各种不同机器人,并在这些硬件上面训练他们的基础模型。该公司也表示,目标是创建迄今为止最大的机器人数据集。
“理想地说,实现目标需要长期、认真地钻研。” Levine 说,“ 但有足够迹象表明,在理想世界中使用机器人的最大障碍是可以被解决掉的。”
参考链接
https://physicalintelligence.company/
https://www.bloomberg.com/news/articles/2024-03-12/physical-intelligence-is-building-ai-for-robots-backed-by-openai?accessToken=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJzb3VyY2UiOiJTdWJzY3JpYmVyR2lmdGVkQXJ0aWNsZSIsImlhdCI6MTcxMDI3MTYzNywiZXhwIjoxNzEwODc2NDM3LCJhcnRpY2xlSWQiOiJTQTkyMDhUMVVNMFcwMCIsImJjb25uZWN0SWQiOiI5MTM4NzMzNDcyQkY0QjlGQTg0OTI3QTVBRjY1QzBCRiJ9.bJiHdqmbYPTdm-l14qjO66dwNAMQxrzgdItg2sZDBsA