资讯列表

分类

标签

模态编码器 | 最强CLIP模型EVA-CLIP-18B

来自智源王鑫龙团队的工作，将EVA-CLIP模型参数扩展至18B，简单看下结果，EVA-CLIP-18B性能远超其他模型。项目地址：。首先，随着大型语言模型(LLMs)参数量的增长至千亿级别，与其配套的视觉基础模型却未能同步扩展，这种不对等限制了多模态应用的整体效能。

4/8/2025 3:00:00 AM

Goldma

Meta LLaMA 4：对抗 GPT-4o 与 Claude 的开源王牌

2025 年 4 月，Meta 正式发布了 LLaMA 4 系列的首批两款模型。这两款模型模型分别是：LLaMA 4 Scout 与 LLaMA 4 Maverick，均采用了专家混合架构（Mixture-of-Experts, MoE）。据 Meta 表示，这是首次有 LLaMA 模型实现文字与图像的统一处理能力，具备真正意义上的多模态理解。

4/8/2025 2:26:00 AM

LLM幻觉，竟因知识「以大欺小」！华人团队祭出对数线性定律与CoDA策略

大语言模型（LLMs）已经彻底改变了AI，但「幻觉」问题如影随从，堪称LLM癌症。 LLM会一本正经、义正辞严的捏造事实，「脸不红，心不跳」地说谎。「幻觉」被普遍认为与训练数据相关。

4/8/2025 2:22:00 AM

新智元

比DeepSeek更惊艳，生成式决策如何让机器人拥有创造力？

当传统机器人遇见生成式AI，会擦出什么样的火花？技术的演进从不停滞。如今，我们正处在具身智能发展的关键节点，生成式决策技术正悄然改变着这个领域的游戏规则。

4/8/2025 2:00:00 AM

大数据AI智能圈

改变世界的十大算法

在当今这个数字化时代，算法已经成为推动世界运转的核心力量。它们如同隐藏在幕后的魔术师，用精密的逻辑和数学原理塑造了现代生活的方方面面。从我们每天使用的智能手机，到支撑全球金融体系的复杂网络，算法无处不在。

4/8/2025 1:11:00 AM

大道至简

五年复合增长率达35.2%！2028年中国AI总投资规模将超千亿美元

IDC发布的《全球人工智能和生成式人工智能支出指南》(IDC Worldwide AI and Generative AI Spending Guide)显示，2024年全球人工智能（AI） IT总投资规模为3158亿美元，预计2028年增至8159亿美元，五年复合增长率为32.9%。其中，生成式AI市场五年复合增长率或达63.8%，到2028年其市场规模将达2842亿美元，占AI市场投资总规模的35%。聚焦中国，IDC数据显示，中国将继续引领亚太地区人工智能市场发展，占亚太地区人工智能总支出超五成。

4/8/2025 1:00:00 AM

谷歌研究：合成数据使大模型数学推理能力提升八倍

最近，来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。据专注于人工智能发展的研究机构 Epoch AI 报告显示，目前全球约有 300 万亿个公开可用的高质量文本训练标记。然而，随着类似 ChatGPT 这样的大模型的迅猛发展，对训练数据的需求呈指数级增长，预计到 2026 年之前，这些数据将被耗尽。

4/8/2025 12:40:00 AM

远洋

OpenAI宣布GPT-5推迟数月发布技术整合难度成倍上升

OpenAI 首席执行官萨姆·奥特曼（Sam Altman）近日通过社交媒体宣布，GPT-5 的发布计划将推迟，预计在未来几个月内正式推出。此前，OpenAI 计划在 2025 年初发布 GPT-5，但最终决定延后，以便将该模型做得比预期更好。奥特曼表示，推迟发布的原因是 GPT-5 的能力远超预期，整合所需资源和生态准备超出了当前可控范围。

4/8/2025 12:20:00 AM

中国科学院青藏高原研究所、阿里云联合发布水能粮多模态推理大模型“洛书”

据介绍，“洛书”大模型集成了科学模型“思源”（Hydro Trace）和千问推理模型 QwQ-32B 以及多模态模型 Qwen2.5-VL，可对特定区域在不同时间尺度的来水量和来源进行精准分析和预测，进而助力调节水资源管理中供水、发电与粮食生产需求的动态平衡。

4/7/2025 5:05:22 PM

归泷

Kimi 开放平台模型推理服务降价

Kimi 开放平台今日官宣，基于 Moonshot AI 一年来的技术积累和性能优化，已经在北京时间 2025 年 04 月 07 日 0 点对 Kimi 开放平台提供的模型推理服务进行价格调整。

4/7/2025 3:38:29 PM

汪淼

三年内拿下10%的赛道份额，用AI撬动技术人才招聘的百亿缺口，万码优才做对了什么

“我想我们是在红海里找到了蓝海”。在众多涌入AI赛道逐梦的创客中，周媛绝对是非常特别的一位——创业之前，她在HRBP架构中担任COE，创业后，作为CEO的她，在一片红海的招聘领域中闯出了另一番洞天。三年前，ChatGPT引爆的AI变革山雨欲来，周媛想要做一款AI驱动的招聘产品的念头愈发强烈：“我意识到再不转型可能要被AI替代掉了”。

4/7/2025 1:30:34 PM

李美涵

论文读得慢，可能是工具的锅，一手实测科研专用版「DeepSeek」

「未来，99% 的 attention 将是大模型 attention，而不是人类 attention。」这是 AI 大牛 Andrej Karpathy 前段时间的一个预言。这里的「attention」可以理解为对内容的需求、处理和分析。

4/7/2025 1:30:00 PM

机器之心

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Meta前脚刚发Llama 4，后脚就有大佬请辞了！一亩三分地的爆料贴称，经过反复训练后，Llama 4未能取得SOTA，甚至与顶尖大模型实力悬殊。为了蒙混过关，高层甚至建议：在后训练阶段中，将多个benchmark测试集混入训练数据。

4/7/2025 1:24:52 PM

新智元

反向传播、前向传播都不要，这种无梯度学习方法是Hinton想要的吗？

「我们应该抛弃反向传播并重新开始。」早在几年前，使反向传播成为深度学习核心技术之一的 Geoffrey Hinton 就发表过这样一个观点。而一直对反向传播持怀疑态度的也是 Hinton。

4/7/2025 1:22:00 PM

机器之心

Agent不会在2025爆发

作者 | 云昭大模型已经在聚光灯下狂奔了28个月，时至今日，Agent已经被成为了包括黄仁勋、奥特曼、李彦宏、周鸿祎、吴泳铭等一众科技大佬在内备受期待的2025爆发品。可正如不久前“朱啸虎不太看好机器人赛道”一般，Agent赛道同样也存在着一场泡沫之下的非共识。 1.巨头争相较量，市场异常冷谈我们先从企业内部的Agent来看下。

4/7/2025 1:17:49 PM

云昭

MoCha：开启自动化多轮对话电影生成新时代

本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成。第一作者魏聪为加拿大滑铁卢大学计算机科学系二年级博士生，导师为陈文虎教授，陈文虎教授为通讯作者。近年来，视频生成技术在动作真实性方面取得了显著进展，但在角色驱动的叙事生成这一关键任务上仍存在不足，限制了其在自动化影视制作与动画创作中的应用潜力。

4/7/2025 1:17:00 PM

机器之心

铰链物体的通用世界模型，超越扩散方法，入选CVPR 2025

基于当前观察，预测铰链物体的的运动，尤其是 part-level 级别的运动，是实现世界模型的关键一步。尽管现在基于 diffusion 的方法取得了很多进展，但是这些方法存在处理效率低，同时缺乏三维感知等问题，难以投入真实环境中使用。清华大学联合北京大学提出了第一个基于重建模型的 part-level 运动的建模——PartRM。

4/7/2025 1:10:00 PM

机器之心

Meta Llama 4被疑考试「作弊」：在竞技场刷高分，但实战中频频翻车

Meta 翻车来得猝不及防。上周六，Meta 发布了最新 AI 模型系列 ——Llama 4，并一口气出了三个款，分别是 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。据官方介绍，在大模型竞技场中，它们的排名相当不赖。

4/7/2025 1:03:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 人形机器人百度苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

资讯列表

模态编码器 | 最强CLIP模型EVA-CLIP-18B

Meta LLaMA 4：对抗 GPT-4o 与 Claude 的开源王牌

LLM幻觉，竟因知识「以大欺小」！华人团队祭出对数线性定律与CoDA策略

比DeepSeek更惊艳，生成式决策如何让机器人拥有创造力？

改变世界的十大算法

五年复合增长率达35.2%！2028年中国AI总投资规模将超千亿美元

谷歌研究：合成数据使大模型数学推理能力提升八倍

OpenAI宣布GPT-5推迟数月发布 技术整合难度成倍上升

中国科学院青藏高原研究所、阿里云联合发布水能粮多模态推理大模型“洛书”

Kimi 开放平台模型推理服务降价

三年内拿下10%的赛道份额，用AI撬动技术人才招聘的百亿缺口，万码优才做对了什么

论文读得慢，可能是工具的锅，一手实测科研专用版「DeepSeek」

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

反向传播、前向传播都不要，这种无梯度学习方法是Hinton想要的吗？

Agent不会在2025爆发

MoCha：开启自动化多轮对话电影生成新时代

铰链物体的通用世界模型，超越扩散方法，入选CVPR 2025

Meta Llama 4被疑考试「作弊」：在竞技场刷高分，但实战中频频翻车

OpenAI宣布GPT-5推迟数月发布技术整合难度成倍上升