资讯列表

分类

标签

消息称 Meta CEO 扎克伯格亲自组建 AI 团队，目标实现“超级智能”

据彭博社报道，Meta CEO扎克伯格亲自组建AI团队，目标实现“超级智能”。他对Meta AI进展不满，计划招50人。Meta正与OpenAI等竞争，“超级智能”目标雄心勃勃。#Meta #扎克伯格 #人工智能#

6/11/2025 9:16:43 AM

远洋

AMD MI350 系列 "CDNA 4" AI 加速器提前亮相，单模块功耗可达 1400W

MI350 系列 AI 显卡加速器采用 3nm 制程，配备 288GB HBM3E 内存，引入了对 FP6 和 FP4 的支持，在 FP16、FP8 上的算力可达前代 1.8 倍。

6/11/2025 9:16:41 AM

溯波（实习）

时空压缩！剑桥大学提出注意力机制MTLA：推理加速5倍，显存减至1/8

相邻的 KV 缓存将合并为一个。在生成第一个字符时，KV 缓存长度为 1；生成第二个字符后，新生成的 KV 与前一个被合并，KV 缓存长度仍然保持为 1。这种动态合并机制有效压缩了时间维度上的冗余信息。

6/11/2025 9:15:51 AM

刚刚，OpenAI正式发布o3-pro！奥特曼激动更新博客：温和的奇点

今天凌晨一点，OpenAI 宣布：OpenAI o3-pro today.前沿模型的轮流更新这一次轮到 OpenAI 了。，所有 Pro 订阅用户均可通过 ChatGPT 和 API 使用这款强大的推理模型。 Team 用户也可在模型选择器选择使用它。

6/11/2025 9:13:44 AM

一块4090搞定实时视频生成！Adobe黑科技来了

近年来，视频合成技术已经取得了显著突破。其中，基于双向注意力机制的扩散 Transformer（DiT）可以生成具有复杂时序动态的逼真内容，但其非因果性设计导致无法满足实时流媒体等场景需求。相比之下，另一类自回归（AR）模型虽然具有天然时序因果性优势，却因依赖有损向量量化技术而难以达到顶尖画质。

6/11/2025 9:12:00 AM

SOTA级视频编辑新方法：无需训练一句话编辑视频，背景保持100%

传统的视频编辑工作流，正在被AI彻底重塑。 AI的视频编辑方法总是存在一些问题：例如视频运动不连贯、编辑后的视频产生意外变化等……经过分析，这些问题的产生最终大都指向同一原因——反演-编辑范式。因此，西湖大学AGILab提出了一种全新的无需反演和训练的视频编辑新方法：FlowDirector。

6/11/2025 9:10:00 AM

北大伯克利联手“拷问”大模型：最强Agent也才40分！新基准专治“不听话”的AI分析师

给大模型当老师，让它一步步按你的想法做数据分析，有多难？结果是，连Claude-3.7和Gemini-2.5 Pro这样的顶尖选手，都开始“不听话”了。在一个全新的测试基准中，它们面对多轮、不断演进的指令，最终的任务成功率最高仅有40%。

6/11/2025 9:08:00 AM

让AI自己设计芯片！中国科学院发布「启蒙」，芯片全流程自动设计

芯片设计向来是科技界的「皇冠明珠」，传统设计流程需要顶尖专家团队耗时数月甚至数年攻坚，极具挑战性。芯片设计包含多个关键步骤，硬件设计方面包括逻辑设计、电路设计、物理设计等，基础软件方面包括操作系统内核设计、编译工具链设计、高性能库设计等。中国科学院计算技术研究所处理器芯片全国重点实验室，联合中国科学院软件研究所，基于大模型等AI技术，推出处理器芯片和相关基础软件全自动设计系统——「启蒙」。

6/11/2025 9:07:00 AM

20人团队提前实现DeepSeek构想，AI算力变天？直击大模型算力成本痛点

如果有一种芯片，天生只为大模型而生，能否突破当前AI的算力瓶颈？要知道，如今的芯片算力，强依赖于制程、工艺等非芯片设计因素。这是因为，传统通用型的GPGPU计算架构在应对日益庞大的模型和复杂计算时，其硬件固有的局限性日益凸显。

6/11/2025 9:06:00 AM

英伟达港大联手革新视觉注意力机制！GSPN高分辨率生成加速超84倍

视觉注意力机制，又有新突破，来自香港大学和英伟达。 Transformer的自注意力在NLP和计算机视觉领域表现出色——它能捕捉远距离依赖，构建深度上下文。然而，面对高分辨率图像时，传统自注意力有两个大难题：计算量巨大：O(N²) 的复杂度让处理长上下文变得非常耗时。

6/11/2025 9:06:00 AM

0.5B以小搏大拿下端侧模型新SOTA：4090可跑，长文本处理5倍常规加速丨清华&面壁开源

端侧性价比之王，清华大学和面壁智能团队开源新模型——MiniCPM 4，提供8B、0.5B两种参数规模，仅使用同级别开源模型22%的训练开销，就达到了同级别最优性能。 MiniCPM4-8B是开源首个开源的原生稀疏模型，5%的极高稀疏度加持，让长文本、深思考在端侧真正跑起来。在MMLU、CEval、MATH500、HumanEval等基准测试中，以仅22%的训练开销，性能比肩 Qwen-3-8B，超越Gemma-3-12B。

6/11/2025 9:03:29 AM

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

论文第一作者为何浩然，香港科技大学二年级博士，他的研究方向包括强化学习、生成流模型（GFlowNets）以及具身智能，通讯作者为香港科技大学电子与计算机工程系、计算机科学与工程系助理教授潘玲。测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？

6/11/2025 9:00:00 AM

MCP 很好，但它不是万灵药！真正的技术进步，往往始于祛魅之后的清醒认知

当下AI领域最炙手可热的概念，莫过于MCP。 MCP 指的是Model Context Protocol（模型上下文协议）。令人意外的是，一个协议系统的热度，甚至盖过了OpenAI发布的最新模型，成为行业讨论的焦点。

6/11/2025 9:00:00 AM

腾讯技术工程

不是视频模型“学习”慢，而是LLM走捷径｜18万引大牛Sergey Levine

这是UC伯克利大学计算机副教授Sergey Levine最新提出的灵魂一问。他同时是Google Brain的研究员，参与了Google知名机器人大模型PALM-E、RT1和RT2等项目。 Sergey Levine在谷歌学术的被引用次数高达18万次。

6/11/2025 8:59:21 AM

美国政府正打造自有 AI 平台，剑指 7 月 4 日“独立日”上线

据外媒404 Media 10日披露，根据 GitHub 上的代码和 AI.gov 网站的早期版本，美国政府正推进一个名为“AI.gov”的平台和 API 服务，旨在通过 AI 推动政府创新。

6/11/2025 8:58:22 AM

清源

刚刚，OpenAI最强推理模型o3-pro诞生！碾压Gemini 2.5 Pro击穿底价

毫无一丝防备，o3-pro就这样低调登场了！昨夜，OpenAI连放大招，先把o3价格暴降80%，又官宣上线史上最强推理模型——o3-pro。图片比起o3，o3-pro可要强太多了。

6/11/2025 8:56:54 AM

新智元

OpenAI新模型，被曝秘密训练中！万字硬核长文直指o4核心秘密

OpenAI的o4，已经在训练了？就在最近，SemiAnalysis发表了一篇硬核长文博客，爆料了不少大模型圈的内幕消息。其中，一些最核心的亮点，先一睹为快：OpenAI正在训练一个规模介于GPT-4.1和GPT-4.5之间的新模型下一代推理模型o4将基于GPT-4.1展开RL训练强化学习改变了实验室结构，甚至是大厂未来研究的侧重方向和优先级定义奖励函数难上加难，往往AI钻空子之后，漏洞才能被发现不牺牲LLM任何性能，不用合并权重，RL另一条路——数据混合与预训练不同，RL可持续更新Scaling模型能力，DeepSeek-R1是典例高质量数据是Scaling强化学习的护城河训练小模型，蒸馏效果要比RL更好新一轮预训练已开始首先，让我们看看其中最硬的内容——关于OpenAI的全新模型。

6/11/2025 8:54:52 AM

英伟达黄仁勋盛赞 AI 行业变革速度惊人：过去 10 年进步了 100 万倍

除了更强的 GPU，英伟达、xAI、微软等也在打造远超过去一代的AI系统。

6/11/2025 8:50:17 AM

清源

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测