始创公司 Cognition 近日发布公告,宣布推出全球首个 AI 软件工程师 Devin,并号称会彻底改变人类建立软件的方式。
Devin 在 SWE-bench 编码基准测试中取得了突破性的成功,展示了其执行复杂恣意的才智,甚至超越了顶尖的人类工程师。
*Devin 是在数据集 25% 的随机子集上进行评估的。Devin 是无帮助的,而所有其他模型都是有帮助的(这意味着模型被告知哪些文件需要编辑)。
Devin 长于长期推理才智,可以自主规划和完毕软件项目,并在此过程中做出数以千计的准确决策。IT之家附上 Devin 所具备的技能以下:
倏地把持新手艺:只需阅读文档,Devin 就能倏地把持不熟悉的工具和框架。
开发端到端应用:建立并部署功能齐全的网络应用程序,根据用户反馈逐步增加功能。
自动化查找 BUG:Devin 长于识别、调试和修复代码问题,同时为开源和生产级软件仓库作出贡献。
AI 培训:从研究资料库中获取指令,建立并微调大型语言模型。
官方对其的描述以下:
Devin 是一位孜孜不倦、手艺娴熟的队友,随时准备与您并肩作战,或独立完毕恣意供您审查。
有了 Devin,工程师可以专注于更有趣的问题,工程团队可以努力实现更宏大的目标。