编程

o3全网震撼实测：AGI真来了？最强氛围编程秒杀人类，却被曝捏造事实

昨夜o3的发布，让人不尽感慨：打了这么久嘴炮的OpenAI，这回终于实实在在拿出了点真东西。史上首次，模型能够用图像思考，视觉推理达到巅峰。许多网友实测后，大感惊艳。

4/17/2025 2:09:52 PM

新智元

Gemini 2.5编程全球霸榜，谷歌重回AI王座！神秘模型曝光，奥特曼迎战

谷歌，彻底打了一场漂亮的翻身仗。 aider多语言编程基准测试显示，Gemini 2.5 Pro近出世半个多月，编程能力已经是全球第一，口碑一众超越Claude 3.7 Sonnet。不仅如此，除了DeepSeek，它的性价比也是最优的，成本低至6美金。

4/15/2025 9:03:00 AM

新智元

AI席卷校园：百万条对话揭秘，Claude是代码救星还是作弊工具？

如今，AI不再只是专业的研究工具，它已成为大学生日常学习的好帮手。随着AI越来越深入地融入教育环境，需要思考一系列关于学习、评估和技能培养的重要问题。目前，大多数相关讨论都基于调查和对照实验，却缺乏学生在真实学习场景中自然融入AI的直接证据。

4/14/2025 9:22:00 AM

新智元

免费的「网页版Cursor」！新版DeepSeek-V3加持，秒秒钟编出一个游戏/APP

借助新版DeepSeek-V3，任何人现在可以一次性创建任何应用或游戏了——而且是一边开发一边看效果的那种。在Hugging Face中，这个名为DeepSite的应用火了。有网友直呼，这不就是网页版“Cursor”！

4/2/2025 9:45:00 AM

量子位

Vibe Agent: Token成本直降90%，会对话就能创造专属本地Agent

刚刚，Local AI 领域的 Libra 团队发布了一段最新技术演示视频，展示了用户通过自然语言交互直接生成 Agent，并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理，最终完成复杂任务。 Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径，实现了从手工 Agent 设计向端到端 In-Context Vibe Agent 生成范式演进。从官网信息来看，Libra 的技术方案直接回应了制约 Agent 技术普及的两大关键瓶颈：一方面，当前热门 Agent 产品如 Cursor、Devin、Manus 等虽功能强大，但运行成本高昂 —— 专业评测显示单次使用 Manus 可消耗约 1000k Token（起步 2 美元）。

4/2/2025 9:19:00 AM

机器之心

Nature：科研人员最爱AI工具大盘点！从推理到编程，哪款才是最佳助手？

几乎每周都有新的、令人影响深刻的AI工具发布，研究人员纷纷踊跃尝试。从复杂的数学问题求解，到医学诊断中的精准分析，再到代码编写与论文创作，AI工具展现了巨大的潜力。但市面上令人眼花缭乱的AI模型，究竟哪一款才是让科研工作者效率起飞的「梦中情模」，能助力科研突破，带来事半功倍的效果呢？

3/25/2025 9:04:55 AM

新智元

宇树机器人侧空翻惊呆网友：“我**想要一个！”

这下特效视频和机器人实拍真的傻傻分不清楚了…前几天机器人卷的还是前后空翻呢，宇树现在连侧空翻都曝出来了。干拔起跳，落地都不带晃的：以上动作，由宇树的Unitree G1呈现，就是身高1米3，售价9.9万起的那个型号。宇树官方是酱婶描述的：这是世界上第一款征服站立侧空翻的人形机器人。

3/20/2025 12:11:42 PM

量子位

Django创造者Simon Willison分享：我如何使用LLM帮我写代码

近段时间，著名 AI 科学家 Andrej Karpathy 提出的氛围编程（vibe coding）是 AI 领域的一大热门话题。简单来说，氛围编程就是鼓励开发者忘掉代码，进入开发的氛围之中。更简单地讲，就是向 LLM 提出需求，然后「全部接受」即可。

3/19/2025 10:19:22 AM

机器之心

AI要取代程序员？吴恩达：别信！现在学编程比以往任何时候都香

AI的爆发式发展，让很多学习编程的人或者在职的软件工程师都很迷茫焦虑，更有甚者，像Anthropic CEO Dario Amodei 前两天说：“未来 3 到 6 个月内，90% 的代码将由人工智能编写；12 个月内，几乎所有代码都可能由人工智能生成”，那么究竟将来还需不要学习编程，吴恩达老师给出了他的看法：学习编程依然非常重要以下是原文中文翻译，分享给大家吴恩达@AndrewYNg如今有些人正在劝退他人学习编程，理由是人工智能将使编程自动化。这种建议将来会被视为史上最糟糕的职业建议之一。我不同意那位图灵奖和诺贝尔奖得主所写的“编程这个职业很可能走向消亡 [...] 而不是变得无所不能。

3/17/2025 9:43:42 AM

AI寒武纪

Anthropic CEO：AI将在未来3到6个月内完成90%编程工作

Anthropic 公司的首席执行官达里奥・阿莫代（Dario Amodei）在美国外 Relations 委员会的一场论坛上表示，他相信，人工智能将在未来3到6个月内完成90% 的编程工作。阿莫代提到，在12个月内，人工智能有可能实现几乎所有代码的编写，这一言论引发了广泛关注。当时，外 Relations 委员会的会长迈克・弗罗曼（Mike Froman）询问了阿莫代关于人工智能未来最佳案例的看法。

3/12/2025 2:43:00 PM

AI在线

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具，看谁更厉害！

先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程，功能虽小，但还是能看出差距的。这两天 Trae 不是推出了国内版吗（），搭载豆包和 DeepSeek 大模型，因为之前 Trae 国际版是支持 Claude Sonnet 的，最开始是 3.5，后来 Claude 升级了 3.7，隔了一天 Trae 就跟进了，而且也是完全免费的。

3/6/2025 12:22:00 AM

风筝

GPT-4.5智商测试94，登上LLM竞技场榜首！网友质疑黑幕，实测结果惊人

GPT-4.5，口碑又意外反转了？经过3千多轮比较，GPT-4.5在全部类别拿下第一，位居LLM竞技场首位！「不看智商看情商」的GPT-4.5，不是推理模型，此前的基准测试中基本都是全班垫底，惨不忍睹。

3/5/2025 9:32:00 AM

新智元

实测字节免费AI编程，还让不让Cursor活了

国内首个原生AI IDE（集成开发环境），来自字节，实测在此：哪怕一点代码都不懂，只要能说出自己的需求，就能靠AI开发出一个功能完备的应用。例如如果你想做一个Flappy Bird游戏，那就用中文跟它说一声就行：生成一个网页版 Flappy Bird游戏并运行。不难看出啊，整个过程真真儿的就是一气呵成。

3/5/2025 8:30:00 AM

量子位

NYU教授震怒警告：孩子不学编程，只会葬送美国未来！

纽约时报最近的一篇文章写得非常精彩，可能成为周末阅读量最高的文章之一。文章认为初级程序员甚至全部软件工程师迟早被AI取代，现在的AI让人动动嘴就能做出个人应用。对此，马库斯怒斥道——这种观点，简直就是在误人子弟！

3/4/2025 9:30:00 AM

新智元

通义灵码上线Qwen2.5-Max推理模型

2025年3月3日，通义灵码宣布上线其最新推理模型Qwen2.5-Max，为开发者带来强大的编程和数学能力支持。 Qwen2.5-Max使用了超过20万亿token的预训练数据，并结合精心设计的后训练方案，展现出卓越的性能。在多项基准测试中，Qwen2.5-Max表现突出。

3/3/2025 9:42:00 PM

AI在线

中国首个AI原生IDE：字节跳动发布AI编程工具Trae国内版

3月3日，字节跳动发布AI编程工具Trae国内版，模型搭载doubao-1.5-pro，支持切换满血版DeepSeek R1&V3。这是国内首个AI原生集成开发环境工具（AI IDE），能充分释放AI的潜力，帮助各阶段开发者与AI流畅协作，更快、更高质量地完成编程工作，提升开发效率。用户可通过Trae中国官网（trae.com.cn）下载体验。

3/3/2025 4:38:00 PM

新闻助手

中国团队首次夺魁！无问芯穹FlightVGM获FPGA'25最佳论文，峰值算力超GPU21倍

国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息，今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM，这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作，同时也是亚太国家团队首次获此殊荣。这项工作首次在 FPGA 上实现了视频生成模型（Video Generation Models, VGMs）的高效推理，也是该团队继去年在 FPGA 上加速大语言模型 FlightLLM（FPGA’24）后的最新系列工作。与 NVIDIA 3090 GPU 相比，FlightVGM 在 AMD V80 FPGA 上实现了 1.30 倍的性能提升与 4.49 倍的能效提升（峰值算力差距超过 21 倍）。

3/3/2025 12:16:48 PM

机器之心

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

公认的编程开发能力第一！ Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首。大幅甩第二名100多分，在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。

2/28/2025 9:00:00 AM

量子位

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练