资讯列表
想纠正LMM犯错?没用!NUS华人团队:最强o1反馈修正率不到50%
大规模多模态模型(Large Multimodal Models,LMM)在人类反馈下的表现如何? 这一问题对于利用LMM开发通用AI助手至关重要,现有的基准测试并未针对LMM与人类的交互智能进行测试。 来自新加坡国立大学的华人团队提出了InterFeedback,一个可应用任何LMM和数据集的交互式框架。
3/17/2025 9:35:00 AM
新智元
纽约时报作家被AGI「洗脑」!AI横扫奥数金牌、编写95%代码,人类却毫无准备
一觉醒来,离AGI又近了一步。 纽约时报专栏作家Kevin Roose,发帖表示自己被AGI「洗脑」了,现在对AGI深有感触。 强人工智能即将到来,但人类尚未做好准备。
3/17/2025 9:32:32 AM
新智元
AI搜索风靡,但高达60%引用出错!付费版甚至更糟
近四分之一的美国人表示他们已经用AI取代了传统搜索引擎。 最新研究发现,AI搜索工具在回答问题时,常常出现自信却错误百出的情况。 研究对比了8款具有实时搜索功能的AI工具,发现它们在引用新闻方面表现不佳,出错比例高达60%。
3/17/2025 9:30:00 AM
新智元
0行代码打造3D游戏,氛围编码席卷全网!开发30分爆赚28万
用「vide coding」制作3D游戏正在成为一股新风潮。 从大V到普通网友,越来越多人加入到了这场狂欢之中。 资深软件工程师Grégory D'Angelo上传了一段他vide coding出来的游戏视频。
3/17/2025 9:27:45 AM
新智元
谷歌Gemini 2.0 Flash引发争议:AI轻松去除图片水印引发版权担忧
一场关于AI边界的新争议正在科技圈掀起波澜。 谷歌最新推出的人工智能模型Gemini2.0Flash被发现具有令人担忧的能力——它可以轻松去除图片水印,包括来自盖蒂图片社等知名图库的专业水印,这一功能引发了创作者和版权持有者的广泛关注。 上周,谷歌扩大了Gemini2.0Flash模型图像生成功能的访问范围,使更多用户能够体验其强大的图像生成和编辑能力。
3/17/2025 9:27:00 AM
AI在线
谷歌重磅推出全新Scaling Law,抢救Transformer!3万亿美元AI面临岔路
测试时计算之后,谷歌三大团队集众人之力,发现了全新的Scaling Law! 刚刚,谷歌研究员Zachary Charles宣布:「在越来越大的模型上,分布式训练取得重大突破」。 这个核心算法,便是——DiLoCo的Scaling Law。
3/17/2025 9:25:00 AM
新智元
CVPR 2025:无需物理引擎,一个模型搞定图像渲染与分解
无需物理引擎,单个模型也能实现“渲染 逆渲染”了! 在计算机图形和视觉领域,渲染是指将3D模型变成逼真的2D图片,逆渲染则是从2D图片分析出3D模型的各种属性(如材质、光照等)。 现在,从材质分解(逆渲染)——材质编辑——物体渲染的整个流程,都被统一到了一个框架中,且在性能方面达到了新SOTA。
3/17/2025 9:20:00 AM
量子位
ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法
本文由慕尼黑工业大学与北京大学联合团队撰写。 第一作者刘强为慕尼黑工业大学博士生。 第二作者楚梦渝为北京大学助理教授,专注于物理增强的深度学习算法,以提升数值模拟的灵活性及模型的准确性和泛化性。
3/17/2025 9:15:00 AM
机器之心
图像效果转换技术LBM:一键移除路人甲,还可调整光照
科技界又迎来一位图像处理领域的重量级选手——LBM(Latent Bridge Matching,潜在桥梁匹配)。 这款由 gojasper 团队倾力打造的神奇工具,正如其名,仿佛一座无形的桥梁,在图像的潜在空间中巧妙穿梭,实现了令人惊叹的图像效果转换。 LBM 效率惊人,只需“一步到位”,便能达成诸多复杂的图像编辑任务。
3/17/2025 9:13:00 AM
AI在线
Manus带火的MCP,让Claude一句话自动化3D建模,网友:真·AI+应用
一句话提示,Claude自动化打开Blender将2D图片转为3D建模。 整个过程行云流水。 而且还能只用一次提示词,再基于这个场景搭建可以互动的网页。
3/17/2025 8:55:00 AM
量子位
AI创作提速!可灵AI集成DeepSeek,灵感秒变专业级提示词!
据36氪消息,快手旗下新一代AI创意生产力平台可灵AI宣布已全面接入DeepSeek-R1模型。 通过此次集成,用户在使用可灵AI的视频生成、图片生成等功能时,可借助DeepSeek-R1的强大能力辅助生成或优化提示词。 这一创新功能旨在帮助用户轻松将创意灵感转化为专业的提示词,从而打造更高质量的AI创意视频内容。
3/17/2025 8:53:00 AM
AI在线
27个大模型混战电商领域,DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果
全面评估大模型电商领域能力,首个聚焦电商基础概念的可扩展问答基准来了! ChineseEcomQA,来自淘天集团。 此前,大模型常因生成事实性错误信息而受限,而传统基准又难以兼顾电商任务的多样性与领域特殊性。
3/17/2025 8:48:00 AM
量子位
港大90后开源,OpenAI 2万刀博士级AI智能体平替!自主研究媲美顶会论文
在AI技术迭代的坐标系中,OpenAI构建的五级演进模型(对话系统→组织协调者)为行业发展提供了战略指引。 其中,处于第三至四阶段的自主研究智能体(Autonomous Research Agent)正成为技术突破的焦点。 就在最近,来自香港大学HKUDS的3位研究团者开源了一种全新的AI-Researcher系统,正是这一关键领域的重要探索。
3/17/2025 8:40:00 AM
新智元
Nature:你的大脑衰老速度受这64个基因影响
你的大脑衰老速度,原来受这64个基因影响! 事情是这样的。 根据Nature最新报道,科学家们通过利用AI模型分析大量脑部扫描和遗传数据,确定了64个影响大脑衰老速度的基因,并指出了13种潜在的抗衰老药物。
3/17/2025 8:37:00 AM
量子位
谷歌Gemini突袭ChatGPT,全新升级让AI更懂你!Deep Research人人免费用
Gemini最新功能免费「no cost」! 谷歌全新升级Gemini,人人都能免费体验全新功能。 谷歌正在为Gemini用户带来新的和升级的功能,包括基于2.0 Flash Thinking的深度研究、Gems功能、应用程序和个性化设置。
3/17/2025 8:30:00 AM
新智元
驯服AI,更懂物理!何恺明团队提出全新DHN「去噪哈密顿网络」
近日,何恺明团队提出了去噪哈密顿网络(Denoising Hamiltonian Network,DHN),就像给物理知识开了挂。 传统的机器学习方法虽然能处理一些简单的物理关系,但面对复杂的物理系统时,却显得力不从心。 来自MIT、斯坦福、西北大学等的研究者将哈密顿力学算子推广到神经网络中,不仅能捕捉非局部时间关系,还能通过去噪机制减轻数值积分误差。
3/17/2025 8:20:00 AM
新智元
哥大博士经费被砍当场崩溃!全美高校遭史上最大规模裁员,科研圈遭灭顶之灾
早上7点,哥大生物医学工程系的博士研究生Daniella Fodera接到实验室主任的电话,得知自己的项目基金被终止,当场崩溃痛哭。 而她的遭遇,只是众多受特朗普政府决策打击的科学家的缩影。 美国政府发起的削减拨款,如今已经在全美高校引起了大地震。
3/17/2025 8:10:00 AM
新智元
纽约时报重磅曝料:特朗普任期内将实现AGI,美国政府早知AGI即将降临!
美国政府知道AGI即将到来,而且他们还要率先实现AGI。 就在最近,纽约时报刊登了一篇拜登政府AI顾问本·布坎南所接受的访谈,曝出了不少重磅信息。 比如:美国政府是如何为AGI做准备的?
3/17/2025 8:00:00 AM
新智元