编程
o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实
昨夜o3的发布,让人不尽感慨:打了这么久嘴炮的OpenAI,这回终于实实在在拿出了点真东西。 史上首次,模型能够用图像思考,视觉推理达到巅峰。 许多网友实测后,大感惊艳。
4/17/2025 2:09:52 PM
新智元
Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战
谷歌,彻底打了一场漂亮的翻身仗。 aider多语言编程基准测试显示,Gemini 2.5 Pro近出世半个多月,编程能力已经是全球第一,口碑一众超越Claude 3.7 Sonnet。 不仅如此,除了DeepSeek,它的性价比也是最优的,成本低至6美金。
4/15/2025 9:03:00 AM
新智元
AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?
如今,AI不再只是专业的研究工具,它已成为大学生日常学习的好帮手。 随着AI越来越深入地融入教育环境,需要思考一系列关于学习、评估和技能培养的重要问题。 目前,大多数相关讨论都基于调查和对照实验,却缺乏学生在真实学习场景中自然融入AI的直接证据。
4/14/2025 9:22:00 AM
新智元
免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出一个游戏/APP
借助新版DeepSeek-V3,任何人现在可以一次性创建任何应用或游戏了——而且是一边开发一边看效果的那种。 在Hugging Face中,这个名为DeepSite的应用火了。 有网友直呼,这不就是网页版“Cursor”!
4/2/2025 9:45:00 AM
量子位
Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent
刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。 Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径,实现了从手工 Agent 设计向端到端 In-Context Vibe Agent 生成范式演进。 从官网信息来看,Libra 的技术方案直接回应了制约 Agent 技术普及的两大关键瓶颈:一方面,当前热门 Agent 产品如 Cursor、Devin、Manus 等虽功能强大,但运行成本高昂 —— 专业评测显示单次使用 Manus 可消耗约 1000k Token(起步 2 美元)。
4/2/2025 9:19:00 AM
机器之心
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
几乎每周都有新的、令人影响深刻的AI工具发布,研究人员纷纷踊跃尝试。 从复杂的数学问题求解,到医学诊断中的精准分析,再到代码编写与论文创作,AI工具展现了巨大的潜力。 但市面上令人眼花缭乱的AI模型,究竟哪一款才是让科研工作者效率起飞的「梦中情模」,能助力科研突破,带来事半功倍的效果呢?
3/25/2025 9:04:55 AM
新智元
宇树机器人侧空翻惊呆网友:“我**想要一个!”
这下特效视频和机器人实拍真的傻傻分不清楚了…前几天机器人卷的还是前后空翻呢,宇树现在连侧空翻都曝出来了。 干拔起跳,落地都不带晃的:以上动作,由宇树的Unitree G1呈现,就是身高1米3,售价9.9万起的那个型号。 宇树官方是酱婶描述的:这是世界上第一款征服站立侧空翻的人形机器人。
3/20/2025 12:11:42 PM
量子位
Django创造者Simon Willison分享:我如何使用LLM帮我写代码
近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领域的一大热门话题。 简单来说,氛围编程就是鼓励开发者忘掉代码,进入开发的氛围之中。 更简单地讲,就是向 LLM 提出需求,然后「全部接受」即可。
3/19/2025 10:19:22 AM
机器之心
AI要取代程序员?吴恩达:别信!现在学编程比以往任何时候都香
AI的爆发式发展,让很多学习编程的人或者在职的软件工程师都很迷茫焦虑,更有甚者,像Anthropic CEO Dario Amodei 前两天说:“未来 3 到 6 个月内,90% 的代码将由人工智能编写;12 个月内,几乎所有代码都可能由人工智能生成”,那么究竟将来还需不要学习编程,吴恩达老师给出了他的看法:学习编程依然非常重要以下是原文中文翻译,分享给大家吴恩达@AndrewYNg如今有些人正在劝退他人学习编程,理由是人工智能将使编程自动化。 这种建议将来会被视为史上最糟糕的职业建议之一。 我不同意那位图灵奖和诺贝尔奖得主所写的“编程这个职业很可能走向消亡 [...] 而不是变得无所不能。
3/17/2025 9:43:42 AM
AI寒武纪
Anthropic CEO:AI将在未来3到6个月内完成90%编程工作
Anthropic 公司的首席执行官达里奥・阿莫代(Dario Amodei)在美国外 Relations 委员会的一场论坛上表示,他相信,人工智能将在未来3到6个月内完成90% 的编程工作。 阿莫代提到,在12个月内,人工智能有可能实现几乎所有代码的编写,这一言论引发了广泛关注。 当时,外 Relations 委员会的会长迈克・弗罗曼(Mike Froman)询问了阿莫代关于人工智能未来最佳案例的看法。
3/12/2025 2:43:00 PM
AI在线
我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具,看谁更厉害!
先给 DeepSeek 泼一盆冷水,DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。 下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程,功能虽小,但还是能看出差距的。 这两天 Trae 不是推出了国内版吗 (), 搭载豆包和 DeepSeek 大模型,因为之前 Trae 国际版是支持 Claude Sonnet 的,最开始是 3.5,后来 Claude 升级了 3.7,隔了一天 Trae 就跟进了,而且也是完全免费的。
3/6/2025 12:22:00 AM
风筝
GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人
GPT-4.5,口碑又意外反转了? 经过3千多轮比较,GPT-4.5在全部类别拿下第一,位居LLM竞技场首位! 「不看智商看情商」的GPT-4.5,不是推理模型,此前的基准测试中基本都是全班垫底,惨不忍睹。
3/5/2025 9:32:00 AM
新智元
实测字节免费AI编程,还让不让Cursor活了
国内首个原生AI IDE(集成开发环境),来自字节,实测在此:哪怕一点代码都不懂,只要能说出自己的需求,就能靠AI开发出一个功能完备的应用。 例如如果你想做一个Flappy Bird游戏,那就用中文跟它说一声就行:生成一个网页版 Flappy Bird游戏并运行。 不难看出啊,整个过程真真儿的就是一气呵成。
3/5/2025 8:30:00 AM
量子位
NYU教授震怒警告:孩子不学编程,只会葬送美国未来!
纽约时报最近的一篇文章写得非常精彩,可能成为周末阅读量最高的文章之一。 文章认为初级程序员甚至全部软件工程师迟早被AI取代,现在的AI让人动动嘴就能做出个人应用。 对此,马库斯怒斥道——这种观点,简直就是在误人子弟!
3/4/2025 9:30:00 AM
新智元
通义灵码上线Qwen2.5-Max推理模型
2025年3月3日,通义灵码宣布上线其最新推理模型Qwen2.5-Max,为开发者带来强大的编程和数学能力支持。 Qwen2.5-Max使用了超过20万亿token的预训练数据,并结合精心设计的后训练方案,展现出卓越的性能。 在多项基准测试中,Qwen2.5-Max表现突出。
3/3/2025 9:42:00 PM
AI在线
中国首个AI原生IDE:字节跳动发布AI编程工具Trae国内版
3月3日,字节跳动发布AI编程工具Trae国内版,模型搭载doubao-1.5-pro,支持切换满血版DeepSeek R1&V3。 这是国内首个AI原生集成开发环境工具(AI IDE),能充分释放AI的潜力,帮助各阶段开发者与AI流畅协作,更快、更高质量地完成编程工作,提升开发效率。 用户可通过Trae中国官网(trae.com.cn)下载体验。
3/3/2025 4:38:00 PM
新闻助手
中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍
国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。 这项工作首次在 FPGA 上实现了视频生成模型(Video Generation Models, VGMs)的高效推理,也是该团队继去年在 FPGA 上加速大语言模型 FlightLLM(FPGA’24)后的最新系列工作。 与 NVIDIA 3090 GPU 相比,FlightVGM 在 AMD V80 FPGA 上实现了 1.30 倍的性能提升与 4.49 倍的能效提升(峰值算力差距超过 21 倍)。
3/3/2025 12:16:48 PM
机器之心
Claude 3.7登顶编程竞技场,大幅领先100分!最新布料模拟实测再惊艳网友
公认的编程开发能力第一! Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首。 大幅甩第二名100多分,在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。
2/28/2025 9:00:00 AM
量子位
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
人形机器人
苹果
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
大型语言模型
训练