他们提供的技术,或许会彻底改变人工智能行业。
本周一,创业公司 Letta 面世的消息引发了人们的关注,它提供的技术可以帮助 AI 模型记住用户和对话。
Letta 成立于加州大学伯克利分校(UC Berkeley)著名的实验室创业工厂,并已宣布获得了由 Felicis 的 Astasia Myers 领投的 1000 万美元种子资金,本轮估值为 7000 万美元。
Letta 还得到了人工智能领域一系列天使投资人的支持,其中包括谷歌的 Jeff Dean、Hugging Face 的 Clem Delangue、Runway 的 Cristóbal Valenzuela 和 Anyscale 的 Robert Nishihara 等。
这家由伯克利博士生 Sarah Wooders 和 Charles Packer 创立的 AI 初创公司备受期待,它是伯克利 Sky Computing Lab 的子公司,也是广受欢迎的 MemGPT 开源项目的商业实体。
GitHub 链接:https://github.com/cpacker/MemGPT
伯克利的 Sky Computing Lab 由著名教授兼 Databricks 联合创始人 Ion Stoica 领导,是 RISELab 和 AMPLab 的接班人,后两个实验室催生了 Anyscale、Databricks 和 SiFive 等公司。尤其是 Sky Lab,它催生了许多流行的开源大型语言模型(LLM)项目,例如 Gorilla LLM、vLLM 和 LLM 结构化语言 SGLang。
「在不到一年时间里,实验室很快就诞生了大量项目。他们就是坐在我旁边的那些人,」Wooders 描述道。「那真是一段不可思议的时光。」
MemGPT 也是这样一个项目,不过它的热门程度很高,以至于还没宣传就火出圈了。
项目的创建者于 2023 年 10 月 12 日周四发布了一份白皮书,并计划在接下来的星期一将更深入的论文和代码发布到 GitHub 上。但有人偶然发现了这篇论文,并于周日将其发布到 Hacker News 上。Packer 表示,它「在我们有机会正式发布代码、论文或发布推文介绍之前就在 Hacker News 上火了,」他说。
项目主页:https://memgpt.ai/
MemGPT 令人兴奋的原因在于 —— 它的目标是解决大语言模型(LLM)的一个痛点:在其原生形式中,像 GPT-4 这样的模型是无状态的,这意味着它们不会将历史数据存储在长期记忆中。
这对于需要随着时间推移逐渐了解和学习用户的 AI 应用来说是个大问题 —— 从客户支持机器人到医疗保健症状跟踪应用,很多潜在的 AI 应用需要我们让大模型拥有「长期记忆」。而 MemGPT 管理数据和内存,以便大模型 Agent 和聊天机器人能够记住以前的用户和对话。
Packer 回忆说,MemGPT 论文的帖子在 Y Combinator 运营的网站 Hacker News 首页上停留了 48 小时,他花了几天时间在网站上回答问题,同时准备发布代码。MemGPT 项目在 GitHub 上发布后,其链接再次在 Hacker News 上疯传。YouTube 上的采访和教程、Medium 帖子、1.1 万个星标和 1.2K 个 Fork 迅速涌现。
VC Felicis 的 Myers 也在阅读有关 MemGPT 的文章时发现了 Wooders 和 Packer,并立即意识到该技术的商业潜力。
「我在论文发布时就看到了它,」她表示,并立即联系了项目团队。「我们的投资主题是围绕人工智能智能体基础设施,并且意识到其中一个非常重要的组成部分是数据和内存管理,以使这些对话聊天机器人和智能体有效。」
在找到最先看中他们的那家公司之前,MemGPT 团队仍然在 Sand Hill Road 四处游荡,通过 Zoom 与风投公司进行通话。
与此同时,Stoica 还帮助公司结识了 Jeff Dean、Robert Nishihara 和其他知名的硅谷天使投资人。Packer 回忆说,天使投资的过程异常简单:「伯克利的许多教授由于在本地工作,所以人脉很广。他们都很关注这个实验室即将商业化的项目。」
竞争和 OpenAI o1 的威胁
虽然 MemGPT 去年就已投入使用,但 Letta 的商业版本 Letta Cloud 尚未开放。截至周一,Letta 正在接受测试版用户的请求。它将提供托管代理服务,允许开发人员在云平台上部署和运行有状态智能体,可通过 REST API(一种可以维护状态的编程接口)访问。Letta Cloud 将存储这样做所需的长期数据。Letta 还将提供用于构建 AI 智能体的开发人员工具。
Wooders 看到了 MemGPT 的广泛用途。「我们看到的头号用例是高度个性化、非常吸引人的聊天机器人,」她说。但也有前沿用途,如「癌症患者的聊天机器人」,患者上传他们的病史,然后分享持续的症状,这样 AI 就可以学习并随着时间的推移提供指导。
值得注意的是,MemGPT 并不是唯一一家致力于此的公司。LangChain 可能是其最知名的竞争对手,它已经提供了商业选项。大模型的龙头公司也在提供智能体工具,例如 OpenAI 的 Assistants API。
OpenAI 的 o1 新模型可能会让用户不再需要修复状态。由于它是一个多步骤模型,因此它从根本上必须在一定程度上保持状态,以便在回复之前「思考」和核实事实。
但 Wooders、Packer 和 Myers 认为 Letta 提供的产品与 OpenAI 存在一些关键差异。Letta 声称它可以与任何 AI 模型配合使用,并期待其用户使用其中的许多模型:OpenAI、Anthropic、Mistral 以及他们自研的大模型。OpenAI 的技术目前仅适用于其自身。
更重要的是,Letta 正在使用开源 MemGPT 项目,并坚定地站在开源阵营一边,并认为开源是 AI 应用的更好选择。
「我们将自身定位为 OpenAI 的开放替代品,」Packer 说道。「构建最好的 AI 应用是非常困难的事,尤其是当你关心幻觉之类的问题时。」
参考内容:
https://techcrunch.com/2024/09/23/letta-one-of-uc-berkeleys-most-anticipated-ai-startups-has-just-come-out-of-stealth/