模型

谢赛宁等新作上线，多模态理解生成大一统！思路竟与GPT-4o相似？

在不久之前机器之心报道文章《3D领域DeepSeek「源神」启动！国产明星创业公司，一口气开源八大项目》中，我们曾介绍到，国内专注于构建通用 3D 大模型的创业公司 VAST 将持续开源一系列 3D 生成项目。近日，新的开源项目它来了，包括针对任意三维模型生成完整可编辑部件的 HoloPart 与通用自动绑定框架 UniRig。

4/14/2025 9:38:00 AM

新智元

最强32B中文推理大模型易主：开源免费商用，1/20 DeepSeek-R1参数量SOTA，权重代码数据集全开源

千亿参数内最强推理大模型，刚刚易主了。 32B——DeepSeek-R1的1/20参数量；免费商用；且全面开源——模型权重、训练数据集和完整训练代码，都开源了。这就是刚刚亮相的Skywork-OR1 (Open Reasoner 1)系列模型——通用32B尺寸（Skywork-OR1-32B）完全超越同规模阿里QwQ-32B；代码生成媲美DeepSeek-R1，但性价比更高。

4/14/2025 9:27:00 AM

量子位

吉卜力爆红背后，关键推手另有其人！GPT-4o竟封奥特曼为AGI之王

AI版「三国杀」卡牌来了。 AI初创Nous Research联合创始人兼后训练负责人Teknium，有个好点子：把AI名流做成卡牌游戏怎么样？上周，他用GPT-4o生一堆AI流行人物卡牌，结果非常棒。

4/14/2025 9:25:00 AM

新智元

奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

近了，近了！全网多个流出的代码截图显示，满血版o3、o4-mini，以及o4-mini high，有极大概率在下周发布。不仅如此，在OpenRouter平台上，一款神秘模型Optimus Alpha（ELO得分1387）直接霸榜，据称就是o4-mini。

4/14/2025 9:17:00 AM

新智元

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

第二届人工智能数学奥林匹克竞赛（AIMO2）开奖了！作为大赛顾问委员会的一员，陶哲轩激动地宣布了最新的结果——英伟达团队AI成功破解了34道题（共50题）。这一次，50道测试题保持了与AIMO1相同「数值答案」形式基础上，进一步提升了「抗暴力破解」的难度。

4/14/2025 9:15:00 AM

新智元

人类一生所学不过4GB，加州理工顶刊新研究引热议

24小时不间断学习且不遗忘，一辈子也只有4GB的“知识储量”？科学家们最新研究，计算出了人类学习积累上限，就这么多~~（甚至还不如一块U盘能装）。这是来自Cell旗下神经科学顶刊Neuron上的一项工作，它提出了一个发人深省的悖论：人类信息处理速度仅为每秒10bit，而我们的感官系统却能以每秒10亿bit的速率收集数据。

4/14/2025 9:10:00 AM

量子位

GPT-4.1偷偷开跑？神秘模型上线三天已被玩疯，网友发现大量OpenAI痕迹

上线仅三天的神秘模型，已经鲨疯了！大模型聚合平台OpenRouter新推出的Optimus Alpha，已经处理了772亿Token，平均每天超过200亿。并且这个数字还在上升，日Token处理已超过340亿，排名第二，并在Trending榜单上位列第一。

4/14/2025 9:00:00 AM

量子位

4090玩转大场景几何重建，RGB渲染和几何精度达SOTA｜上海AI Lab&西工大新研究

仅用4090就能实现大规模城市场景重建！高效几何重建新架构CityGS-X来了，通过一种新型并行化混合分层三维表征架构（PH²-3D）的可扩展系统，突破了传统三维重建在算力消耗和几何精度上的限制。算力瓶颈无处不在，当前3D高斯泼溅技术虽取得显著进展，却仍面临三大核心挑战：处理速度缓慢、计算成本高昂、几何精度有限。

4/14/2025 8:40:00 AM

量子位

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军

在大模型争霸的时代，算力与效率的平衡成为决定胜负的关键。端侧部署一直是大模型落地的最后一公里，却因算力瓶颈困难重重。面壁智能和清华走出了一条与MoE不同的路径——神经元级稀疏激活，让模型在保持性能的同时大幅降低资源消耗。

4/14/2025 8:30:00 AM

量子位

Llama 4重测竞技场排名大跳水，网友：社区很难再信任Meta了

Llama 4被曝在大模型竞技场作弊后，重新上架了非特供版模型。但是你很可能没发现它。因为排名一下子从第2掉到了第32，要往下翻好久才能看到。

4/13/2025 5:04:23 PM

量子位

算法不重要，AI的下一个范式突破，「解锁」新数据源才是关键

众所周知，人工智能在过去十五年里取得了令人难以置信的进步，尤其是在最近五年。回顾一下人工智能的「四大发明」吧：深度神经网络→Transformer 语言模型→RLHF→推理，基本概括了 AI 领域发生的一切。我们有了深度神经网络（主要是图像识别系统），然后是文本分类器，然后是聊天机器人，现在我们又有了推理模型。

4/12/2025 3:57:00 PM

机器之心

字节新推理模型逆袭DeepSeek，200B参数战胜671B，豆包史诗级加强？

字节最新深度思考模型，在数学、代码等多项推理任务中超过DeepSeek-R1了？而且参数规模更小。同样是MoE架构，字节新模型Seed-Thinking-v1.5有200B总参数和20B激活参数。

4/11/2025 12:10:33 PM

量子位

预训练还没终结！港中文清华等提出「三位一体」框架，持续自我进化

当前（多模态）大模型正深陷「数据饥渴」困境：其性能高度依赖预训练阶段大量高质量（图文对齐）数据的支撑。然而，现实世界中这类高价值数据资源正在迅速耗尽，传统依赖真实数据驱动模型能力增长的路径已难以为继。在NeurIPS 2024会议上，OpenAI联合创始人Ilya Sutskever明确指出：「Pre-training as we know it will end」，这一判断是对传统预范式极限的清晰警示。

4/11/2025 9:35:34 AM

新智元

Grok-3四档定价揭秘：低至0.3美元/百万token，硬刚谷歌Meta

GenAI竞争，越来越激烈了。据Similar Web统计，在日活跃用户方面，Grok与Gemini展开了激烈竞争。两者都已经超过50万日活跃用户，差距不足5万。

4/11/2025 9:29:15 AM

新智元

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用，而以ChatGPT、GPT-4等为代表的通用大语言模型（LLM）虽然能够生成流畅文本，但经常出现“引用幻觉”（Citation Hallucination），即模型凭空捏造文献引用。这种现象严重影响了学术论文的可信度与专业性。现在，加拿大滑铁卢大学与卡内基梅隆大学的华人研究团队，提出了一种名为 ScholarCopilot 的智能学术写作大模型框架，专门针对学术场景，致力于精准地生成带有准确引用的学术文本。

4/11/2025 9:12:21 AM

量子位

Kimi 16B胜GPT-4o！开源视觉推理模型：MoE架构，推理时仅激活2.8B

刚刚，Kimi团队上新了！开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking，多模态和推理双双拿捏。按照Kimi官方的说法，其关键亮点如下：都是基于MoE架构，总参数为16B，但推理时仅激活2.8B；具备强大的多模态推理能力（媲美参数大10倍的模型）和Agent能力；支持128K上下文窗口；采用相对较为宽松的MIT许可证。

4/11/2025 9:10:00 AM

量子位