模型

视觉自回归生成理解编辑大一统！北大团队多模态新突破，训练数据代码全面开源

最近Google的Gemini Flash和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。这些模型通过整合文本、图像、音频等多种数据形式，实现了更为自然和高效的生成和交互。北京大学团队继VARGPT实现视觉理解与生成任务统一之后，再度推出了VARGPT-v1.1版本。

4/16/2025 2:55:00 AM

今天的智谱，燃炸了！

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）今天的智谱非常了不起，一天内同步发生了三件大事！每一件事都让界内十分提气！第一件事，智谱成为了首家启动IPO的“大模型六小龙”公司；第二件事，改了全球域名：z.ai；第三件事，一口气发布且开源了六款模型。

4/15/2025 7:52:04 PM

云昭

刚刚，智谱一口气开源6款模型，200 tokens/秒解锁商用速度之最 | 免费

就在刚刚，智谱一口气上线并开源了三大类最新的GLM模型：沉思模型GLM-Z1-Rumination推理模型GLM-Z1-Air基座模型GLM-4-Air-0414若是以模型大小（9B和32B）来划分，更是可以细分为六款。首先是两个9B大小的模型：GLM-4-9B-0414：主攻对话，序列长度介于32K到128K之间GLM-Z1-9B-0414：主攻推理，序列长度介于32K到128K之间还有四个32B大小的模型，它们分别是：GLM-4-32B-Base-0414：基座模型，序列长度介于32K到128K之间GLM-4-32B-0414：主攻对话，序列长度介于32K到128K之间GLM-Z1-32B-0414：主攻推理，序列长度介于32K到128K之间GLM-Z1-32B-Rumination-0414：主攻推理，序列长度为128K而随着一系列模型的开源，智谱也解锁了一项行业之最——推理模型GLM-Z1-32B-0414做到了性能与DeepSeek-R1等顶尖模型相媲美的同时，实测推理速度可达200 tokens/秒。如此速度，已然是目前国内商业模型中速度最快，而且它的高性价比版本价格也仅为DeepSeek-R1的1/30。

4/15/2025 12:16:17 PM

AI能看懂图像却算不好距离，上交时间-空间智能基准难倒9大顶尖多模态模型

多模态大语言模型（MLLM）在具身智能和自动驾驶“端到端”方案中的应用日益增多，但它们真的准备好理解复杂的物理世界了吗？上海交通大学联合中国地质大学、南洋理工大学、智源研究院以及斯坦福大学的研究团队推出首个多模态大模型（MLLM）时空智能评测基准STI-Bench（Spatial-Temporal Intelligence Benchmark），向当前最先进的多模态大语言模型发起了关于精确空间时间理解的严峻挑战。结果显示，即便是Gemini-2.5-Pro、GPT-4o、Claude-3.7-Sonnet、Qwen 2.5 VL等当前最强的多模态大模型，在需要定量分析真实世界空间关系和动态变化的任务上，表现并不尽人意。

4/15/2025 12:14:10 PM

量子位

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比关注前沿科技量子位 2025年04月15日 09:44

4.1与4.5孰大？ OpenAI刚刚给出答案：发布GPT-4.1，比GPT-4.5强的那种。新模型系列更新，一共带来三个版本：GPT-4.1，GPT-4.1 mini、GPT-4.1 nano——与通常中杯大杯超大杯的设置不同，这回翻译过来，是中杯、小杯、超小杯。

4/15/2025 9:50:06 AM

量子位

推理AI「脑补」成瘾，废话拉满！马里兰华人学霸揭开内幕

推理模型越来越成为主流了。像GPT-4.5这样没有推理功能的大语言模型则越来越少见，就连OpenAI自身也将重心放到了推理模型o系列上面。原因在于推理模型通过在回答之前先「思考」，从而能够获得更加优秀的效果。

4/15/2025 9:00:00 AM

新智元

DeepSeek公布了推理引擎开源路径，OpenAI也将开始连续一周发布

DeepSeek 默默地在自己的 open-infra-index 库中发布了一份题为「开源 DeepSeek 推理引擎的路径」的文档，宣布将开源自己的内部推理引擎（internal inference engine）并与开源社区建立更广泛的合作。有意思的是，该文档发布之后不久就经历了两次修改，对一些措辞和表述进行了更加中立和宽泛的处理。在其中一次修改中，DeepSeek 提到了与 SGLang 和 vLLM 项目的合作关系，但这两个具体的项目名称在新版本中被替换成了「现有的开源项目」。

4/15/2025 8:50:01 AM

机器之心

AI破解50年未解数学难题！南大校友用OpenAI模型完成首个非平凡数学证明

就在刚刚，AI完成了首个非平凡研究数学证明！完成这项研究的，是美国纽约布鲁克海文国家实验室凝聚态物理与材料科学分部的一位华人学者Weiguo Yin。论文地址：，作者在一维J_1-J_2 q态Potts模型，通过引入最大对称子空间（MSS）方法，对其精确求解。

4/15/2025 8:50:00 AM

新智元

谢赛宁等新作上线，多模态理解生成大一统！思路竟与GPT-4o相似？

在不久之前机器之心报道文章《3D领域DeepSeek「源神」启动！国产明星创业公司，一口气开源八大项目》中，我们曾介绍到，国内专注于构建通用 3D 大模型的创业公司 VAST 将持续开源一系列 3D 生成项目。近日，新的开源项目它来了，包括针对任意三维模型生成完整可编辑部件的 HoloPart 与通用自动绑定框架 UniRig。

4/14/2025 9:38:00 AM

新智元

最强32B中文推理大模型易主：开源免费商用，1/20 DeepSeek-R1参数量SOTA，权重代码数据集全开源

千亿参数内最强推理大模型，刚刚易主了。 32B——DeepSeek-R1的1/20参数量；免费商用；且全面开源——模型权重、训练数据集和完整训练代码，都开源了。这就是刚刚亮相的Skywork-OR1 (Open Reasoner 1)系列模型——通用32B尺寸（Skywork-OR1-32B）完全超越同规模阿里QwQ-32B；代码生成媲美DeepSeek-R1，但性价比更高。

4/14/2025 9:27:00 AM

量子位

吉卜力爆红背后，关键推手另有其人！GPT-4o竟封奥特曼为AGI之王

AI版「三国杀」卡牌来了。 AI初创Nous Research联合创始人兼后训练负责人Teknium，有个好点子：把AI名流做成卡牌游戏怎么样？上周，他用GPT-4o生一堆AI流行人物卡牌，结果非常棒。

4/14/2025 9:25:00 AM

新智元

奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

近了，近了！全网多个流出的代码截图显示，满血版o3、o4-mini，以及o4-mini high，有极大概率在下周发布。不仅如此，在OpenRouter平台上，一款神秘模型Optimus Alpha（ELO得分1387）直接霸榜，据称就是o4-mini。

4/14/2025 9:17:00 AM

新智元

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

第二届人工智能数学奥林匹克竞赛（AIMO2）开奖了！作为大赛顾问委员会的一员，陶哲轩激动地宣布了最新的结果——英伟达团队AI成功破解了34道题（共50题）。这一次，50道测试题保持了与AIMO1相同「数值答案」形式基础上，进一步提升了「抗暴力破解」的难度。

4/14/2025 9:15:00 AM

新智元

人类一生所学不过4GB，加州理工顶刊新研究引热议

24小时不间断学习且不遗忘，一辈子也只有4GB的“知识储量”？科学家们最新研究，计算出了人类学习积累上限，就这么多~~（甚至还不如一块U盘能装）。这是来自Cell旗下神经科学顶刊Neuron上的一项工作，它提出了一个发人深省的悖论：人类信息处理速度仅为每秒10bit，而我们的感官系统却能以每秒10亿bit的速率收集数据。

4/14/2025 9:10:00 AM

量子位

GPT-4.1偷偷开跑？神秘模型上线三天已被玩疯，网友发现大量OpenAI痕迹

上线仅三天的神秘模型，已经鲨疯了！大模型聚合平台OpenRouter新推出的Optimus Alpha，已经处理了772亿Token，平均每天超过200亿。并且这个数字还在上升，日Token处理已超过340亿，排名第二，并在Trending榜单上位列第一。

4/14/2025 9:00:00 AM

量子位

4090玩转大场景几何重建，RGB渲染和几何精度达SOTA｜上海AI Lab&西工大新研究

仅用4090就能实现大规模城市场景重建！高效几何重建新架构CityGS-X来了，通过一种新型并行化混合分层三维表征架构（PH²-3D）的可扩展系统，突破了传统三维重建在算力消耗和几何精度上的限制。算力瓶颈无处不在，当前3D高斯泼溅技术虽取得显著进展，却仍面临三大核心挑战：处理速度缓慢、计算成本高昂、几何精度有限。

4/14/2025 8:40:00 AM

量子位