AI智能体结对编程秒杀人类,90分钟神作惊动OpenAI总裁!引全网140万围观

无需人类插手,AI智能体联手AI智能体竟完成了程序开发。 这简直太疯狂了! 最近,AI开发者Lamar将OpenAI Operator和Replit Agent配对后,让其构建应用程序。

无需人类插手,AI智能体联手AI智能体竟完成了程序开发。

这简直太疯狂了!

最近,AI开发者Lamar将OpenAI Operator和Replit Agent配对后,让其构建应用程序。

最不可思议的是,在实现过程中,仅仅用了5个提示,两个AI智能体竟像人类一样,互相合作、交换凭证,并开始测试。

最终,他们在90分钟之内完成了开发。

图片

可以看到,左边OpenAI Operator光速执行搜索的同时,右边Replit Agent也在快速构建代码。

AI智能体结对编程秒杀人类,90分钟神作惊动OpenAI总裁!引全网140万围观

这个帖子瞬间在全网爆火,视频已有140万浏览量。

图片

OpenAI总裁转发后激动表示,「AI智能体互动的初体验」。

图片

开源Brower-Use构建智能体

无独有偶,另一位开发者Shubham Saboo构建了一个自主3D Python游戏可视化智能体团队,仅使用了浏览器和 DeepSeek R1完成。

图片

这个团队由4个AI智能体组成,它们在浏览器中自主合作——编写、运行并可视化游戏。

AI智能体结对编程秒杀人类,90分钟神作惊动OpenAI总裁!引全网140万围观

有网友表示,不知是否有开源模型,能够做这件事。

图片

开发者给推荐了一个Browser Use的项目,这是专为控制AI浏览器打造的。

图片

项目地址:https://github.com/browser-use/browser-use

它能够实现,将自己想要的物品加入购物车,然后结账。

AI智能体结对编程秒杀人类,90分钟神作惊动OpenAI总裁!引全网140万围观

再比如,让它阅读简历并找到机器学习相关的工作,保存到一个文件中,然后在新标签页中开始申请。

,时长00:13

或者,让AI用谷歌邮箱给父亲写一封信,感谢他所做的一切,并将文档保存为PDF。

图片

又或是查找许可证为cc-by-sa-4.0的模特,并按Hugging Face上的最喜欢排序,将前5名保存到文件中。

快速启动

使用pip(Python>=3.11):

复制
pip install browser-use

安装playwright:

复制
playwright install

启动你的智能体:

复制
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()


async def main():
    agent = Agent(
        task="Go to Reddit, search for 'browser-use', click on the first post and return the first comment.",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)


asyncio.run(main())

将你想使用的提供商的API密钥添加到.env文件中。

复制
OPENAI_API_KEY=

使用UI测试

你可以通过一个UI仓库来测试浏览器使用,或者简单地运行gradio示例:

复制
uv pip install gradio
python examples/ui/gradio_demo.py

除了Browser Use,另一位网友还推荐了微软团队开发的OmniParser V2的项目,也是利用AI操控屏幕帮人类完成复杂任务。

这两者开发的主要区别在于,OmniParser V2是图形用户界面自动化和屏幕解析,输入的是UI截图,输出的是大模型的结构化数据。

而Browser Use主要用在debug和代码导航,输入代码或程序执行文本,输出的是debug观点和导航。

两者侧重各有所不同,可依据实际使用场景择优选择。

图片

AI自主开发,震惊全网

2025年,几乎所有科技大厂将赌注压在了智能体之上。

在巴黎AI行动峰会上,图灵奖得主Yann LeCun表示,Meta将在明年推出,带有显示屏和肌电接口的智能眼镜。

完全增强现实眼镜将在几年内问世,届时,我们每个人都会管理一支由人类级智能的AI智能体组成的团队。

图片

奥特曼在通常会议中表示,如果AI智能体只需50美分的计算成本,就能完成5000美元的工作,那么AI带来的经济机会规模将是「瓶装闪电。

学术界,也将智能体的研究作为一个重点。

前段时间,来自斯坦福团队研究人员通过多智能体强化学习(multi-agent RL),训练LLM掌握战略性社交推理,结果发现,使胜率比标准强化学习提升一倍。

图片

论文地址:https://www.alphaxiv.org/abs/2502.06060

1997年:深蓝(Deep Blue)击败卡斯帕罗夫(Kasparov)

2016年:AlphaGo精通围棋

2025年:斯坦福研究人员攻克《Among Us》

图片

另有微软团队开源了OmniParser V2,可以将任何大模型转换为能够使用计算机的智能体。

图片

以上demo中,两个AI分工协作的强大能力,让许多人窥见了另一个未来。

图片

AI研究员David Shapiro表示,这比人们想象的要重要得多。人类发现了「分工」这一概念,改变了人类文明。

从来都不会是一个智能体单打独斗,而是无数智能体协作,「分而治之」去搞定任何任务。

图片

一位教授表示,「这只是未来疯狂场景的一瞥,成百上千的AI智能体协作解决极其复杂的问题,或执行通常需要整个组织的任务——速度和效率是现在的成千上万倍」。

图片

AI智能体时代已经到来!

图片

相关资讯

AI编程L1-L5超全分级来了!GitHub Copilot仅L1,Devin是L4

AI恰似一把神奇的钥匙,悄然开启了编程领域的全新大门。 从代码补全到项目级自动化,AI的角色从「助手」转变为「工程师」,甚至是「开发团队」,极大地改变了软件开发的传统格局。 借鉴自动驾驶的术语,AI编程工具可以划分为L1到L5五个等级。

新增AI Agent,GitHub Copilot重大更新,超强自动化编程

全球最大开源平台之一GitHub在官网宣布,对AI编程助手Copilot进行了重磅更新,增加AI Agent模式,可以自动迭代代码,识别并修复BUG。 GitHub同时还发布了另一个Agent—Project Padawan的预览版,主要协助开发人员自动执行一些重复、繁琐的开发流程,例如,设置开发环境、运行测试、合并代码等。 此外,GitHub在去年10月推出的Copilot.

快上车!吴恩达老师分享自用 AI 辅助编程快速打造软件原型最佳实践

在人工智能时代,如何利用 AI 辅助编程快速构建软件原型? 吴恩达老师在这篇信中分享了他的心得与最佳实践。 他不仅介绍了自己当前使用的技术栈(包括 Python FastAPI、Uvicorn、MongoDB 等),还探讨了如何通过明确选择工具和优化开发流程,大幅提升开发效率文中重点包括:1.