全球首位 AI 软件工程师 Devin 问世:能自学新语言、开发迭代 App、自动 Debug

初创公司 Cognition 近日发布公告,宣布推出全球首个 AI 软件工程师 Devin,并号称会彻底改变人类构建软件的方式。Devin 在 SWE-bench 编码基准测试中取得了突破性的成功,展示了其执行复杂任务的能力,甚至超越了顶尖的人类工程师。*Devin 是在数据集 25% 的随机子集上进行评估的。Devin 是无辅助的,而所有其他模型都是有辅助的(这意味着模型被告知哪些文件需要编辑)。Devin 擅长长期推理能力,可以自主规划和完成软件项目,并在此过程中做出数以千计的准确决策。IT之家附上 Devin

初创公司 Cognition 近日发布公告,宣布推出全球首个 AI 软件工程师 Devin,并号称会彻底改变人类构建软件的方式。

全球首位 AI 软件工程师 Devin 问世:能自学新语言、开发迭代 App、自动 Debug

全球首位 AI 软件工程师 Devin 问世:能自学新语言、开发迭代 App、自动 Debug

Devin 在 SWE-bench 编码基准测试中取得了突破性的成功,展示了其执行复杂任务的能力,甚至超越了顶尖的人类工程师。

全球首位 AI 软件工程师 Devin 问世:能自学新语言、开发迭代 App、自动 Debug

*Devin 是在数据集 25% 的随机子集上进行评估的。Devin 是无辅助的,而所有其他模型都是有辅助的(这意味着模型被告知哪些文件需要编辑)。

Devin 擅长长期推理能力,可以自主规划和完成软件项目,并在此过程中做出数以千计的准确决策。IT之家附上 Devin 所具备的技能如下:

快速掌握新技术:只需阅读文档,Devin 就能快速掌握不熟悉的工具和框架。

开发端到端应用:构建并部署功能齐全的网络应用程序,根据用户反馈逐步增加功能。

自动化查找 BUG:Devin 擅长识别、调试和修复代码问题,同时为开源和生产级软件仓库作出贡献。

AI 培训:从研究资料库中获取指令,建立并微调大型语言模型。

官方对其的描述如下:

Devin 是一位不知疲倦、技术娴熟的队友,随时准备与您并肩作战,或独立完成任务供您审查。

有了 Devin,工程师可以专注于更有趣的问题,工程团队可以努力实现更远大的目标。

相关资讯

Gartner:到 2027 年,生成式 AI 将促使 80% 的软件工程师提升自身技能

市场调查机构 Gartner 于 10 月 3 日发表预测,到 2027 年,生成式 AI 将在软件工程和运维领域催生新的工作岗位,80% 的工程师将需要进行技能提升。Gartner 高级首席分析师 Philip Walsh 表示:“对 AI 潜力的大胆预测引发了人们的猜测,认为 AI 可能减少对人类工程师的需求,甚至完全取代他们。尽管 AI 将重新定义软件工程师的角色,但人类的专业知识和创造力仍然是开发复杂、创新软件的关键。”AI在线从报告获悉,AI 将在如下三阶段影响软件工程师的工作。短期:AI 仍将在一定范围

首个AI软件工程师Devin完整技术报告出炉,还有人用GPT做出了「复刻版」

从编码、编译到调试、验证,AI 智能体能做的事情更多了。这周三,Cognition AI 团队发布的首个 AI 软件工程师 Devin 引爆了 AI 社区,引发了人们对程序员这个职业未来前景的热议。在对 Devin 的评估中,团队使用了 SWE-bench。这是一个由 GitHub 问题和拉取请求组成的软件工程系统的自动化基准测试。他们认为 SWE-bench 是一个不错的选择,它确定性地评估(通过单元测试)系统解决现实世界代码库问题的能力,并与 HumanEval 等仅限于独立功能的基准测试不同。从结果来看,在

Devin 第一手使用体验:完成度很高,开始编码就停不下来,但要替代程序员还很远

【新智元导读】Devin 到底是一个漂亮的 Demo,还是一个已经能替代程序员的智能体,使用体验怎么样,拿到测试资格的网友第一时间分享了自己的体验。由 10 枚 IOI 金牌在手的创业团队 Cognition AI 开发的全球首个 AI 程序员智能体 Devin,一发布就让科技圈坐立不安。在演示中,Devin 几乎已经可以独立完成很多人类程序员需要大量时间才能完成的工作,效果一点不比普通程序员差。但是,产品能力的边界在哪里,实际体验和演示时候有差距,还得看上手实测之后的效果。这位斯坦福的小哥在 Devin 发布的第