为什么在人工智能时代基础设施必须是无服务器的

开发者们正从创建单个应用程序转向编排由 AI 构建的应用程序集群。 译自Why Infrastructure Must Be Serverless in the AI Age,作者 Nikita Shamgunov。 Replit 的新 AI 代理将编写您的代码,然后配置、调配、构建和部署该代码,只需几秒钟。

开发者们正从创建单个应用程序转向编排由 AI 构建的应用程序集群。

译自Why Infrastructure Must Be Serverless in the AI Age,作者 Nikita Shamgunov。

Replit 的新 AI 代理将编写您的代码,然后配置、调配、构建和部署该代码,只需几秒钟。您可以在 VS Code 加载所有扩展程序之前,从自然语言描述到已实现的、可运行的应用程序。

如果一个 AI 代理可以在几秒钟内构建和部署一个应用程序,那么几分钟的时间来启动资源就太长了。如果一个 AI 代理每小时可以启动和关闭数千个这样的应用程序,那么每个数据库 10 美元的成本就变成了极高的开销。突然之间,我们从一个开发人员团队部署单个应用程序变成了单个开发人员部署一组应用程序,所有应用程序都在 AI 代理的指导下工作。

这种方法改变了对开发的看法,并要求对基础设施有新的认识。传统的基础设施对于代理工作流程来说太慢、太永久且太复杂。基础设施的未来需要即时的、无服务器的和简化的工具——这就是必须构建的内容。

AI 代理基础设施的核心需求

AI 代理的运行规模和速度使得传统的基础设施管理在技术上和经济上都不切实际。良好的“代理体验”将强调三个核心特性:

1. 简易性

任何代码和集成都需要简单。这个世界将建立在简单的 API 调用而不是 IAM 策略和多步骤配置之上。考虑启动一个新的 RDS 实例:VPC、安全组、规则、子网组和 IAM 角色。每个步骤都需要多个 API 调用、选项的考虑和故障排除。

DevOps 工程师了解这些依赖关系,并且可以在出现问题时进行调试。AI 代理需要一切第一次和每次都能完美运行。这种复杂性不仅仅是进入的障碍;它是自动化的障碍。这就是在 Neon 上启动数据库所需的:

来自@neondatabase/toolkitSDK 的代码示例来自@neondatabase/toolkitSDK 的代码示例

三行代码即可配置数据库,一次 API 调用,即可立即使用。这不仅仅是更好的开发者体验——这是使 AI 代理能够访问基础设施的唯一方法。这种简易性还有助于两个因素:

  • 成本:更多步骤 = 更多成本。代理进行的每个 API 调用都会消耗令牌,而复杂的基础设施操作可能需要数十次调用。简单的 API 不仅仅是更易于使用;它们从根本上来说在大规模情况下更经济。
  • 安全性:尽管 AWS RDS 设置非常安全,但您不能将您的根密钥交给机器。现代基础设施需要进行沙盒化和自包含,并具有清晰的边界,让代理可以自由地进行实验,而不会危及生产系统。

2. 即时性

上面的代码可以在一秒钟内启动一个新的数据库,供代理使用。

在代理驱动的世界中,传统的基建时间线需要修改。代码创建速度曾经是开发中的速率限制因素,但是当 AWS RDS 实例需要 10 分钟来配置时,该基础设施就变成了速率限制因素。

转向即时性模型与人工智能一样,开启了无限可能。代理驱动开发的核心原则是可处置性。代理可能会创建一个应用程序,对其进行测试,并在几分钟内将其丢弃。基础设施需要匹配此生命周期——在需要时立即启动,并在不需要时同样快速地消失。代理应该能够在传统数据库启动所需的时间内构建和销毁一个一次性应用程序。

短暂性

这也引出了可处置应用程序的关键组成部分——短暂性。传统方法假设应用程序是永久的,因此它需要永久的基础设施。

并非如此。看看开发人员如何使用 Vercel 的v0,这是一个用于从文本提示生成应用程序的开发工具。您无需在线搜索“抵押贷款计算器”,而是可以要求v0为您创建一个:

图片图片

这有效。它不需要基础设施,但这可能是下一步。最重要的是,用户可以在单个会话中使用 AI 构建大量内容。绝大多数内容会被丢弃且不再使用,但有些内容可能会被共享并转化为长期存在的应用程序。这是工具的未来——你使用 AI 和 AI 代理精确构建你想要的东西,并留下一串废弃的替代方案。

这需要一个可以缩放到零的基础设施。当资源未被使用时,其成本应降至零。有了这种能力,一次性应用程序的经济效益将会实现。想象一下,一家公司在使用 AI 构建的过程中每小时启动数十个数据库。谁来删除未使用的数据库?谁来决定哪些数据库未使用?

当基础设施能够真正缩放到零时,它将启用新的开发模式。代理可以自由地尝试不同的方法,并行测试多个解决方案,而无需担心清理或持续成本。这消除了开发过程中的经济限制——你不再需要仔细考虑每个新数据库或服务的成本影响。

结果是一个资源真正可丢弃的开发环境。创建你需要的内容,根据需要使用它,并在完成后让它消失。这不仅仅是更高效——这是使代理驱动的开发在大规模上经济可行的唯一方法。

更简单、更快、更便宜——选择三个

在六个月内,我们已经从Cognition AI 的 Devin AI 程序员的演示发展到 Replit 的 AI 开发人员/DevOps 代理在实际工作中运行。明年这个时候的 SOTA 会是什么样子?

没有人知道,但很清楚什么样的基础设施会让我们到达那里。该基础设施必须从人类开发人员转移到作为构建者的 AI 代理。但创建良好的 AgentEx 也将使我们构建良好的 DevEx,因为更简单、更快和更便宜也适用于循环中的人类。这种良性循环——AI 代理的改进为人类创造了更好的工具,反之亦然——将加速开发人员构建和部署软件的方式的转变。

相关资讯

让天下没有难做的开发和运维,DevOps终于有了专属大模型,蚂蚁和北大联合发布

大语言模型在各类 NLP 下游任务上都取得了显著进展,各种垂直领域大模型更是如雨后春笋般层出不穷。然而在 DevOps 领域,却迟迟没有相关大模型问世。为填补这方面的空白,蚂蚁集团联合北京大学发布了面向中文 DevOps 领域的首个开源大语言模型,即 DevOps-Model 。该大模型旨在帮助开发人员在软件开发和运维的整个生命周期中提高效率,最终目标是实现在 DevOps 流程中面临任何问题时,都可以通过向 DevOps-Model 提问来获取解决方案!当前已经开源了 7B 和 14B 两种规格的 Base 和

首个AI软件工程师Devin完整技术报告出炉,还有人用GPT做出了「复刻版」

从编码、编译到调试、验证,AI 智能体能做的事情更多了。这周三,Cognition AI 团队发布的首个 AI 软件工程师 Devin 引爆了 AI 社区,引发了人们对程序员这个职业未来前景的热议。在对 Devin 的评估中,团队使用了 SWE-bench。这是一个由 GitHub 问题和拉取请求组成的软件工程系统的自动化基准测试。他们认为 SWE-bench 是一个不错的选择,它确定性地评估(通过单元测试)系统解决现实世界代码库问题的能力,并与 HumanEval 等仅限于独立功能的基准测试不同。从结果来看,在

AI 程序员 Devin 独角兽半年估值 20 亿美元?业内曝 AI 泡沫:买卡 500 亿,收入 30 亿

感谢IT之家网友 Diixx 的线索投递!【新智元导读】AI 程序员 Devin 上线几周之后,新一轮融资已经达到 20 亿美元。红杉警告,AI 公司买 GPU 花了 500 亿,产生的收入只有 30 亿……成立不到半年,估值达到 20 亿美元!AI 程序员 Devin 的母公司 Cognition AI 杀疯了。Cognition AI 正式成立于 2023 年底,种子轮融资估值就已经高达 3.5 亿美元!创始团队的 10 枚 IOI 金牌的「含金量」恐怖如斯。而在产品首个版本上线几周之后,他们就火速展开下一轮融