资讯列表

分类

标签

想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%

大规模多模态模型（Large Multimodal Models，LMM）在人类反馈下的表现如何？这一问题对于利用LMM开发通用AI助手至关重要，现有的基准测试并未针对LMM与人类的交互智能进行测试。来自新加坡国立大学的华人团队提出了InterFeedback，一个可应用任何LMM和数据集的交互式框架。

3/17/2025 9:35:00 AM

新智元

纽约时报作家被AGI「洗脑」！AI横扫奥数金牌、编写95%代码，人类却毫无准备

一觉醒来，离AGI又近了一步。纽约时报专栏作家Kevin Roose，发帖表示自己被AGI「洗脑」了，现在对AGI深有感触。强人工智能即将到来，但人类尚未做好准备。

3/17/2025 9:32:32 AM

新智元

AI搜索风靡，但高达60%引用出错！付费版甚至更糟

近四分之一的美国人表示他们已经用AI取代了传统搜索引擎。最新研究发现，AI搜索工具在回答问题时，常常出现自信却错误百出的情况。研究对比了8款具有实时搜索功能的AI工具，发现它们在引用新闻方面表现不佳，出错比例高达60%。

3/17/2025 9:30:00 AM

新智元

0行代码打造3D游戏，氛围编码席卷全网！开发30分爆赚28万

用「vide coding」制作3D游戏正在成为一股新风潮。从大V到普通网友，越来越多人加入到了这场狂欢之中。资深软件工程师Grégory D'Angelo上传了一段他vide coding出来的游戏视频。

3/17/2025 9:27:45 AM

新智元

谷歌Gemini 2.0 Flash引发争议：AI轻松去除图片水印引发版权担忧

一场关于AI边界的新争议正在科技圈掀起波澜。谷歌最新推出的人工智能模型Gemini2.0Flash被发现具有令人担忧的能力——它可以轻松去除图片水印，包括来自盖蒂图片社等知名图库的专业水印，这一功能引发了创作者和版权持有者的广泛关注。上周，谷歌扩大了Gemini2.0Flash模型图像生成功能的访问范围，使更多用户能够体验其强大的图像生成和编辑能力。

3/17/2025 9:27:00 AM

AI在线

谷歌重磅推出全新Scaling Law，抢救Transformer！3万亿美元AI面临岔路

测试时计算之后，谷歌三大团队集众人之力，发现了全新的Scaling Law！刚刚，谷歌研究员Zachary Charles宣布：「在越来越大的模型上，分布式训练取得重大突破」。这个核心算法，便是——DiLoCo的Scaling Law。

3/17/2025 9:25:00 AM

新智元

CVPR 2025：无需物理引擎，一个模型搞定图像渲染与分解

无需物理引擎，单个模型也能实现“渲染逆渲染”了！在计算机图形和视觉领域，渲染是指将3D模型变成逼真的2D图片，逆渲染则是从2D图片分析出3D模型的各种属性（如材质、光照等）。现在，从材质分解（逆渲染）——材质编辑——物体渲染的整个流程，都被统一到了一个框架中，且在性能方面达到了新SOTA。

3/17/2025 9:20:00 AM

量子位

ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学：迈向无冲突训练的ConFIG方法

本文由慕尼黑工业大学与北京大学联合团队撰写。第一作者刘强为慕尼黑工业大学博士生。第二作者楚梦渝为北京大学助理教授，专注于物理增强的深度学习算法，以提升数值模拟的灵活性及模型的准确性和泛化性。

3/17/2025 9:15:00 AM

机器之心

图像效果转换技术LBM：一键移除路人甲，还可调整光照

科技界又迎来一位图像处理领域的重量级选手——LBM（Latent Bridge Matching，潜在桥梁匹配）。这款由 gojasper 团队倾力打造的神奇工具，正如其名，仿佛一座无形的桥梁，在图像的潜在空间中巧妙穿梭，实现了令人惊叹的图像效果转换。 LBM 效率惊人，只需“一步到位”，便能达成诸多复杂的图像编辑任务。

3/17/2025 9:13:00 AM

AI在线

Manus带火的MCP，让Claude一句话自动化3D建模，网友：真·AI+应用

一句话提示，Claude自动化打开Blender将2D图片转为3D建模。整个过程行云流水。而且还能只用一次提示词，再基于这个场景搭建可以互动的网页。

3/17/2025 8:55:00 AM

量子位

AI创作提速!可灵AI集成DeepSeek，灵感秒变专业级提示词!

据36氪消息，快手旗下新一代AI创意生产力平台可灵AI宣布已全面接入DeepSeek-R1模型。通过此次集成，用户在使用可灵AI的视频生成、图片生成等功能时，可借助DeepSeek-R1的强大能力辅助生成或优化提示词。这一创新功能旨在帮助用户轻松将创意灵感转化为专业的提示词，从而打造更高质量的AI创意视频内容。

3/17/2025 8:53:00 AM

AI在线

27个大模型混战电商领域，DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果

全面评估大模型电商领域能力，首个聚焦电商基础概念的可扩展问答基准来了！ ChineseEcomQA，来自淘天集团。此前，大模型常因生成事实性错误信息而受限，而传统基准又难以兼顾电商任务的多样性与领域特殊性。

3/17/2025 8:48:00 AM

量子位

港大90后开源，OpenAI 2万刀博士级AI智能体平替！自主研究媲美顶会论文

在AI技术迭代的坐标系中，OpenAI构建的五级演进模型（对话系统→组织协调者）为行业发展提供了战略指引。其中，处于第三至四阶段的自主研究智能体（Autonomous Research Agent）正成为技术突破的焦点。就在最近，来自香港大学HKUDS的3位研究团者开源了一种全新的AI-Researcher系统，正是这一关键领域的重要探索。

3/17/2025 8:40:00 AM

新智元

Nature：你的大脑衰老速度受这64个基因影响

你的大脑衰老速度，原来受这64个基因影响！事情是这样的。根据Nature最新报道，科学家们通过利用AI模型分析大量脑部扫描和遗传数据，确定了64个影响大脑衰老速度的基因，并指出了13种潜在的抗衰老药物。

3/17/2025 8:37:00 AM

量子位

谷歌Gemini突袭ChatGPT，全新升级让AI更懂你！Deep Research人人免费用

Gemini最新功能免费「no cost」！谷歌全新升级Gemini，人人都能免费体验全新功能。谷歌正在为Gemini用户带来新的和升级的功能，包括基于2.0 Flash Thinking的深度研究、Gems功能、应用程序和个性化设置。

3/17/2025 8:30:00 AM

新智元

驯服AI，更懂物理！何恺明团队提出全新DHN「去噪哈密顿网络」

近日，何恺明团队提出了去噪哈密顿网络（Denoising Hamiltonian Network，DHN），就像给物理知识开了挂。传统的机器学习方法虽然能处理一些简单的物理关系，但面对复杂的物理系统时，却显得力不从心。来自MIT、斯坦福、西北大学等的研究者将哈密顿力学算子推广到神经网络中，不仅能捕捉非局部时间关系，还能通过去噪机制减轻数值积分误差。

3/17/2025 8:20:00 AM

新智元

哥大博士经费被砍当场崩溃！全美高校遭史上最大规模裁员，科研圈遭灭顶之灾

早上7点，哥大生物医学工程系的博士研究生Daniella Fodera接到实验室主任的电话，得知自己的项目基金被终止，当场崩溃痛哭。而她的遭遇，只是众多受特朗普政府决策打击的科学家的缩影。美国政府发起的削减拨款，如今已经在全美高校引起了大地震。

3/17/2025 8:10:00 AM

新智元

纽约时报重磅曝料：特朗普任期内将实现AGI，美国政府早知AGI即将降临！

美国政府知道AGI即将到来，而且他们还要率先实现AGI。就在最近，纽约时报刊登了一篇拜登政府AI顾问本·布坎南所接受的访谈，曝出了不少重磅信息。比如：美国政府是如何为AGI做准备的？

3/17/2025 8:00:00 AM

新智元

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 Figma 推 AI 革命：开发智能应用制作器与网站创建工具 Midjourney图像编辑器迎来重大更新：全新UI、图层功能与智能工具上线别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora Anthropic AI for Science 3D AI设计机器学习 GPU 开发者场景华为预测人形机器人伟达 Transformer 百度深度学习苹果 AI视频模态 xAI 字节跳动驾驶文本搜索 Claude 大语言模型具身智能 Copilot 神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊大型语言模型干货合集特斯拉 2024 AGI 训练