模型

超越Claude 3.5紧追o1！DeepSeek-V3-Base开源，编程能力暴增近31％
理论
- 973
- 0
机器之心3小时前
英特尔至强6独享MRDIMM，内存带宽飙升，加速推理达2.4倍！
之前的文章中，有业者预测至强6性能核处理器每颗计算单元芯片中的内核数量为43，加上每个计算单元有两组双通道内存控制器各占一个网格，那么总共占用43 2=45个网格，可以由5×9的布局构成。但这个假设有一个问题，要构成128核的6980P，三颗芯片只屏蔽1个内核，这良率要求比较高啊。至今还未在公开渠道看到至强6性能核处理器的Die shot或架构图，但英特尔发布了晶圆照片作为宣传素材。
理论
- 971
- 0
admin4小时前
CMU等提出超实用「模型泛化性」指标，分布外准确率提升6% | ICML 2024 Oral
当前许多深度学习分类模型通常在大规模数据中训练以找到足以区分不同类别的特征。然而，这种方式不可避免地学到伪相关特征（Spurious Correlation），导致训练的分类器在分布偏移（Distribution Shift）下往往会失效。因此，如何在衡量一个训练好的模型的泛化性（Generalization）一直是一个关键问题。
理论
- 972
- 0
新智元5小时前
Deepseek新模型意外曝光！编程跑分一举超越Claude 3.5 Sonnet
还没等到官宣，Deepseek-v3竟意外曝光了？据Reddit网友爆料，v3已在API和网页上发布，一些榜单跑分也新鲜出炉。在Aider多语言编程测试排行榜中，Deepseek-v3一举超越Claude 3.5 Sonnet，排在第1位的o1之后。
理论
- 971
- 0
量子位5小时前
港科技最新DrivingRecon：可泛化自动驾驶4D重建新SOTA！
写在前面&笔者的个人理解从这一两年发表的论文数量可以看出，自动驾驶街景的重建与仿真备受关注，由此构建的自动驾驶仿真器对corner case的生成以及端到端模型的闭环评估/测试都非常重要，本次分享的是一篇关于自动驾驶场景4D重建的工作DrivingRecon。论文链接: : ，比较具有代表性的是StreetGaussian，OmniRe这一类借助3D bbox将静态背景和动态物体解耦的框…
理论
- 972
- 0
自动驾驶之心11小时前
ScienceAI 2024 「AI+气象科学&宇宙&物理学」专题年度回顾
编辑丨&过去，我们仰望星空，俯瞰大地，伸手能触及到星河的浩瀚，也能感受到星尘最细微的轨迹。 2024，我们走出了阴霾，再一次向着人类的最终的浪漫前进。近年来出彩的科幻电影，日益令人担忧的自然灾害，暗示着人们需要对于脚下与头顶潜在的可能性保持关注。
理论
- 974
- 0
ScienceAI12月25日
了解世界还是预测未来？一场关于自动驾驶世界模型的祛魅（清华最新综述）！
写在前面 & 笔者的个人理解清华大学最新的综述。由于多模态大语言模型（如GPT-4）和视频生成模型（如Sora）的进步，世界模型的概念受到了极大的关注，这是追求通用人工智能的核心。这项调查对世界模型的文献进行了全面的回顾。
理论
- 975
- 0
自动驾驶之心12月25日
LeCun最新访谈：距离AGI可能不到10年，下一代AI需要情感和视觉训练
头戴Meta爆火智能眼镜，LeCun再次表示人类距离AGI的时间没有那么近，“大约在5-10年”，对语言模型发展的判断更是不乐观。未来在哪？还是得看世界模型。
理论
- 978
- 0
量子位12月24日
OpenAI被曝数据崩溃GPT-5难产，团队抢算力冲突激烈！Ilya预言成真？
OpenAI轰轰烈烈搞出一场12天圣诞特别活动，结果期间发布最轰动成果的，居然是谷歌。谷歌一发发密集的核弹，让OpenAI分成12天的挤牙膏黯然失色，毫无还手之力。原生多模态Gemini 2.0 Flash，demo惊艳的Project Astra，组团出道的AI智能体，效果吊打Sora掀起全网狂潮的Veo 2……显得OpenAI的圣诞活动仿佛是个笑话。
理论
- 975
- 0
新智元12月24日
o3曝智商高达157，比肩爱因斯坦碾压99%人类！陶哲轩水平AI或出现
o3智商竟有157，堪比爱因斯坦？今天，一张OpenAI模型智商图，在全网传遍了。基于编程竞赛Codeforces排名评分图中清晰可见，能够达到o3智商水平的人类大约占比仅有0.0075%。
理论
- 976
- 0
新智元12月24日
近1.4万星，腾讯混元大模型开源成绩单公布，多次登顶开源趋势热榜
记者获悉，腾讯云副总裁，腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示，腾讯将开源协同作为公司的核心技术战略，积极推动内外部技术开源共享。腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源，未来大模型各版本也将进一步开源，与社区开发者一起共同推动技术生态繁荣发展。（腾讯云副总裁，腾讯混元大模型负责人刘煜宏）腾讯混…
应用
- 975
- 0
新闻助手12月24日
Occ预测最新SOTA！清华团队提出基于高斯世界模型的GaussianWorld算法~
写在前面&笔者的个人理解以视觉信息作为输入的3D占用预测任务最近因其在自动驾驶中的关键应用而受到来自工业界和学术界的广泛关注。 3D占用预测任务旨在根据视觉输入估计 3D 环境中每个体素的占用状态和语义标签。该任务提供了更细粒度的场景语义和结构描述，这对于开发安全且强大的自动驾驶系统非常重要。
理论
- 974
- 0
自动驾驶之心12月24日
颠覆GPT！Meta推出大型概念模型LCM: 从“猜词”到“理解”
今天要跟大家分享一个来自Meta AI的重磅消息：他们开发了一种全新的语言模型——大型概念模型（LCM），它有可能会彻底改变我们对语言模型的理解！现在市面上的语言模型，比如大家熟悉的GPT，虽然能写诗、写代码、聊天，但它们本质上还是一个字一个字地“猜”出来的。想象一下，就像一个只会背诵但不懂意思的鹦鹉，虽然能流利地说话，但缺乏真正的理解。
理论
- 978
- 0
AI寒武纪12月24日
时序预测再出新范式！华东师大提出DUET：「双向聚类」新设计，性能刷新SOTA！| KDD 2025
多变量时间序列预测（MTSF）在金融投资、能源管理、天气预测和交通优化等领域具有重要应用。然而，现实中的时间序列通常面临两大挑战：1. 时间模式的异质性，即由于外部因素的影响，真实时间序列往往表现出非平稳性（Temporal Distribution Shift, TDS），导致其分布和模式发生显著变化；2.
理论
- 974
- 0
新智元12月23日
扒一扒o3-mini背后团队：3位华人核心成员，北大清华南开校友在列
比o1 mini性能更强，价格更低，性价比新王o3-mini再次引爆AI圈热议。在官方截图中，中等o3-mini的性能和o1 mini差不多，价格却只有后者的一半，整体延迟也和GPT-4o相当。最主要的，这表明了OpenAI可以在降低成本的同时提高性能。
理论
- 976
- 0
量子位12月23日
LeCun八年前神预言，大模型路线再颠覆？OpenAI宣告：强化学习取得稳定性突破
在2016年的NeurIPS会议上，图灵奖得主Yann LeCun首次提出著名的「蛋糕比喻」：如果智能是一块蛋糕，那么蛋糕中的大部分都是无监督学习，蛋糕上的糖霜（锦上添花）是有监督学习，蛋糕上的樱桃则是强化学习。 If intelligence is a cake, the bulk of the cake is unsupervised learning, the icing on the ca…
理论
- 978
- 0
新智元12月23日
o3并非独门秘技，谷歌已发背后关键机制，方法更简单、成本更低
o1/o3带火的推理计算Scaling，原来谷歌早在今年8月就曾探讨过。当时，来自斯坦福、牛津以及谷歌DeepMind的团队提出通过重复采样来扩展推理计算量——结果在编码任务中将性能最多提高40%。他们发现小模型通过生成多种答案/样本，其任务表现可能比一些大型模型单次尝试还要好。
理论
- 979
- 0
量子位12月23日
剖析BadGPT-40背后的真相：一个从GPT模型中移除护栏的模型
译者 | 晶颜审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）大型语言模型（LLM）风靡全球。从通用的智能助手到代码伙伴，这些模型似乎什么都能做——除了可靠地执行其内置的安全准则。 OpenAI等公司安装的广为人知的“护栏”旨在确保负责任的行为，保护用户免受恶意输出、虚假信息和网络利用企图的影响。
理论
- 977
- 0
晶颜12月23日
素数分布规律又有新发现！赵宇飞学生与牛津教授合作成果
赵宇飞高材生、哥伦比亚大学助理教授Mehtaab Sawhney（索尼），又为数学界贡献了一项重要成果——与牛津大学教授Ben Green（格林）一起，证明了一项关于素数分布的新规律。关键是证明中用到了与Gowers范数相关的技术，而Gowers范数一开始是拿来研究等差数列的，看上去和素数规律风马牛不相及。甚至作者索尼自己也表示，“作为一个‘局外人’，几乎不可能判断出这些事情是相关的”。
理论
- 975
- 0
量子位12月23日
微软Phi-4封神，14B小模型数学击败GPT-4o！合成数据占比40%，36页技术报告出炉
140亿参数，40%合成数据，年度SLM之王诞生！最近，微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上，其数学性能直接碾压GPT-4o、Gemini Pro 1.5。
理论
- 976
- 0
新智元12月23日
Ilya宣判后GPT-5被曝屡训屡败，一次训数月，数据要人工从头构建
GPT-5被曝效果远不达预期。 OpenAI连续12场发布会刚刚结束，大家最想看的GPT-5/4.5影子都没有，于是华尔街日报这边爆料了。 GPT-5已至少完成2轮训练，每次长达数月，但是每次训练后都遇到新问题。
理论
- 973
- 0
量子位12月23日
抽卡效率提升4.8倍！东北大学等开源优化版Stable-Diffusion.cpp：分辨率越高越快，生成质量更好
在AI生成图像领域，Stable Diffusion已经成为一个里程碑式的工具，凭借其强大的图像生成能力，被广泛应用于艺术创作、商业设计等领域。然而，生成高质量图像的过程常常需要付出大量的时间和内存，这对于硬件资源有限的设备来说是一大挑战。为了应对这一问题，北京大学、东北大学、佐治亚大学发布了Stable-Diffusion.cpp（简称Sdcpp）的优化方法，引入了Winograd算法和三个…
理论
- 975
- 0
新智元12月23日
OpenAI o1是真有实力！港大权威AB测试，国家队奥数题照样拿下
国际奥数题手到擒来，OpenAI o1是靠死记硬背还是真的实力超群？近日，来自港大的研究人员对o1进行了严格的AB测试：论文地址：？考两张卷子：一张是有可能提前背题的，另一张是不太可能提前背题的，两张卷子难度一致。
理论
- 972
- 0
新智元12月23日
OpenAI o3震撼觉醒，AGI今夜降临？血洗o1，破解陶哲轩最难数学题
12天最后一天，OpenAI下一代推理模型o3真的出世了！奥特曼、Mark Chen、任泓宇和ARC Prize基金会主席Greg Kamradt为我们做了介绍正如所爆料那样，突如其来的o3成为整场直播的「压轴菜」。奥特曼表示，之所以跳过o2，是因为对伙伴的尊重，以及延续OpenAI一贯「起名特别差」的传统。
理论
- 980
- 0
新智元12月23日