AI在线 AI在线

理论

AI+超材料双向突破,浙大综述揭示超材料研究进展,登Nature子刊

编辑 | 2049在电磁波调控的舞台上,超材料曾凭借其人工设计的亚波长结构,打破了自然材料的物理限制,实现了负折射、隐身斗篷等奇异现象。 然而,当工程师试图将这类「魔法材料」应用于动态环境时,却发现传统超材料如同精密的机械手表 —— 虽能精准运行,却无法根据环境变化自主调整。 这种矛盾在自动驾驶、智能通信等实时场景中尤为突出,亟待新的技术范式突破。
2/8/2025 2:25:00 PM
ScienceAI

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

大模型智能体正在迅速发展,能力已不再局限于 API 调用。 诸如OpenAI的Operator和Anthropic的Computer Use等,能够像人类一样直接与界面交互,执行复杂操作。 在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。
2/8/2025 2:10:00 PM
量子位

谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平

谷歌DeepMind最新数学AI,一举解决了2000-2024年IMO竞赛中84%的几何问题。 AlphaGeometry2论文发布,在总共50道题中完成了42道,相比去年的一代多完成了15道。 作为对比,纯语言模型OpenAI o1和Gemini Flash Thinking一道都解决不了。
2/8/2025 2:00:00 PM
量子位

DeepSeek下棋靠忽悠赢了ChatGPT,网友:孙子兵法都用上了

家人们,要笑不活了。 DeepSeek跟ChatGPT下了一把国际象棋,然后……通过忽悠的方式,竟让ChatGPT直接认输! DeepSeek在这场对决中有多离谱呢?
2/8/2025 1:40:00 PM
量子位

超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程

大模型也学会了「空间想象力」? 还可以自己解释自己? 在大语言模型(LLMs)和多模态大语言模型(MLLMs)中,思维链(CoT)在复杂推理方面非常有效。
2/8/2025 1:30:00 PM
新智元

从数字化转型到AI优先:智能革命下的企业转型之道

也许我们一直以来对数字化转型的理解都是错误的,我们没有专注于“转型”的部分,反而做得转型很少,数字化很多,我们没有将数字视为业务的新范式,而是过度关注于将传统模型和流程数字化,以及将现有组织现代化。 结果,大多数企业仍然背负着复杂性、部门隔阂以及陈旧的工作方式。 AI的崛起给了我们所有人第二次机会,我们可以选择利用AI来做同样的事情,但更快、更好,或者,我们可以让正确的事情变得更高效,同时开辟一条新路径,利用这项技术真正转型为AI优先的企业。
2/8/2025 1:14:50 PM
Brian Solis

天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题

时隔6个多月,AlphaGeometry 2直接攻下IMO金牌! 刚刚,谷歌DeepMind一篇28页技术报告,公布了AG2最新突破——在2000-2024年IMO几何题上,解题率从54%飙升至84%。 论文地址:(50道),AG2横扫了42道。
2/8/2025 1:00:00 PM
新智元

苹果把台灯做成机器人!能用动作表达情绪,重新定义机器人交互

苹果首款机器人(试验版),居然是个台灯? ? 前段时间苹果布局机器人的消息频频传出,但究竟要做个什么样式儿的一直没有定论。
2/8/2025 12:45:08 PM

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

大语言模型,到底是学会了解决数学问题,还是只是背下了答案? LLM的「Generalize VS  Memorize」之争,迎来最新进展。 苏黎世联邦理工的研究员Mislav Balunović,在X上公布了一众顶级AI推理模型在AIME 2025 I比赛中的结果。
2/8/2025 11:44:03 AM
新智元

山姆·奥特曼揭秘:Deepseek R1性价比之选!

在当今的人工智能领域,大模型之间的竞争日益激烈。 Deepseek 推出的 R1 模型引起了广泛关注。 山姆·奥特曼评价道:“Deepseek 的 R1 是一个令人印象深刻的模型,尤其是在他们能够以这个价格提供的东西方面。
2/8/2025 11:31:17 AM
AGI

新增AI Agent,GitHub Copilot重大更新,超强自动化编程

全球最大开源平台之一GitHub在官网宣布,对AI编程助手Copilot进行了重磅更新,增加AI Agent模式,可以自动迭代代码,识别并修复BUG。 GitHub同时还发布了另一个Agent—Project Padawan的预览版,主要协助开发人员自动执行一些重复、繁琐的开发流程,例如,设置开发环境、运行测试、合并代码等。 此外,GitHub在去年10月推出的Copilot.
2/8/2025 11:30:00 AM
AIGC开放社区

零样本 | ZAPS:零样本扩散采样,3倍加速逆问题重建,重塑高效影像修复新范式

一、 一眼概览ZAPS(Zero-Shot Approximate Posterior Sampling)是一种针对扩散模型(Diffusion Models, DMs)在逆问题(Inverse Problems)中的高效采样方法。 它利用零样本学习(Zero-Shot Learning)进行自适应超参数优化,使得扩散采样步骤固定,同时提高重建质量并减少推理时间。 二、核心问题当前的扩散模型在解决逆问题(如去模糊、修复、超分辨率)时,存在以下挑战:需要大量的采样步骤,导致推理速度慢;现有的噪声调度策略(Noise Schedule)在逆问题场景下难以直接适用;传统方法使用手动调整的对数似然权重(Log-Likelihood Weights),不够鲁棒,容易导致次优解。
2/8/2025 11:12:34 AM
萍哥学AI

Deepseek本地部署,培养自己的独有的AI伴侣!

目前我们所知道的AI大部分都是在网页或者APP上直接使用,缺少其独特性,deepseek支持将AI部署在我们的本地电脑,只要你得性能够,就可以创造一个独属于你自己的AI伴侣。 废话不多说直接上操作! 一、配置要求1.
2/8/2025 11:07:35 AM
麋鹿vs

同样薪资,该去大厂还是投身 DeepSeek?答案惊人!

这几天,deepseek的招聘刷屏了,贼高的薪资,让太多的人着实羡慕。 图片一、大厂与DeepSeek的核心差异1. 职业发展路径大厂的优势:大厂通常拥有明确的职级体系和晋升机制(如阿里的P序列、腾讯的T序列),员工可以清晰看到从初级到专家的成长路径。
2/8/2025 10:33:33 AM
不才陈某

革新在线购物体验:CatV2TON引领虚拟试穿技术新纪元

本文经AIGC Studio公众号授权转载,转载请联系出处。 在这个数字化飞速发展的时代,图像与视频合成技术正以前所未有的速度重塑着我们的生活,尤其在在线零售领域,一场关于购物体验的革命正在悄然上演。 想象一下,无需亲自试穿,仅凭一张照片或一段视频,就能精准预览任何心仪服装的上身效果——这听起来仿佛科幻电影中的场景,中山大学和新加坡国立大学提出的基于视觉的虚拟试穿(CatV2TON)技术正将其变为现实。
2/8/2025 10:30:00 AM
AIGC Studio

想要开发AI代理?首先,你需要了解这些

出品 | 51CTO技术栈(微信号:blog51cto)如何理解AI代理,它们如何工作? 想象一下开发一个生成式AI时代的API。 这个API将支持自然语言输入,利用大型语言模型的智能,通过与SaaS和企业系统的集成来自动化决策,并通过连接到其他生成式AI支持的API来实现业务流程编排。
2/8/2025 10:29:03 AM

图解系列|DeepSeek-R1的出众推理能力因何而来?

图片DeepSeek-R1 代表了人工智能发展的又一重要里程碑。 对于机器学习领域的研究人员与开发者群体而言,这次发布之所以备受关注,主要有以下两点:首先,这是一款开源权重的模型,并且提供了更小的、经过蒸馏的版本;其次,它公布并深入探讨了训练方法,该方法能够复现类似于 OpenAI O1 的推理模型。 本文将带您了解这一模型的构建过程。
2/8/2025 9:44:11 AM
追求卓越的

李飞飞、DeepSeek为何偏爱这个国产模型?

斯坦福李飞飞团队的一篇论文,近来在AI圈子掀起了一场飓风。 他们仅用1000个样本,在16块H100上监督微调26分钟,训出的新模型s1-32B,竟取得了和OpenAI o1、DeepSeek R1等尖端推理模型相当的数学和编码能力! 团队也再次证明了测试时Scaling的威力。
2/8/2025 9:30:00 AM
新智元