理论

如何让大模型感知知识图谱知识？蚂蚁联合实验室：利用多词元并行预测给它“上课”

如何让大模型感知知识图谱知识？蚂蚁联合实验室：利用多词元并行预测给它“上课”。大语言模型的飞速发展打破了许多自然语言处理任务间的壁垒。

2/24/2025 2:30:00 PM

量子位

Zero-shot重建物理高斯资产，清华&光轮视觉大模型让机器人理解物理属性｜ICRA 2025

理解物体的物理属性，对机器人执行操作十分重要，但是应该如何实现呢？光轮智能与清华AIR、同济大学等机构联合提出了一种基于3D高斯溅射的方法——PUGS（Zero-shot Physical Understandingwith Gaussian Splatting）无需训练、零样本，它就能够从多视角图像中重建物体，并对各种指定的物理属性进行密集重建。该论文已被ICRA 2025接收。

2/24/2025 2:22:00 PM

量子位

DeepSeek一夜把百度干回20年前，网友：还有这好事？

没完了，刚刚接入DeepSeek的百度，又双叒叕搞事情了。最新消息，“百度一下你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan，回归了。有意思的是，这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。

2/24/2025 2:20:00 PM

量子位

企业RAG落地避坑指南：自主开发 vs 三大框架，核心配置与选型全解析

这个项目原是春节期间在老家给一个企业做 RAG 项目咨询的精简版本，使用 Gradio 构建 Web 界面供大家测试使用。本是希望大家在这个基础上根据个人或者企业需求进行二次开发，但是在小红书、微信收到一些后台私信里，在集中咨询关于自行开发和现有主流 RAG 框架的区别。所以，有了这篇。

2/24/2025 2:16:31 PM

韦东东

在数字化浪潮席卷全球的今天，技术革命的脚步正以指数级速率重构人类社会发展轨迹。而DeepSeek的出现，毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付，从医疗影像的毫厘级诊断到教育资源的跨时空共享，算法与数据的交织已然突破想象力的边界。当下，众多产业正在与人工智能产生"化学反应"，这种由技术创新引发的链式反应，正在三百六十度解构既有行业秩序，催生出"生产力跃迁2.0"时代的全新商业生态。

2/24/2025 2:15:16 PM

科技云报到

当AI更加理解人类语言可能预示提示工程终结

多年来，大型语言模型（LLM）的兴起要求用户学习一种新技能：提示工程。为了得到人工智能有用的回应，人们不得不精心设计他们的查询问题，学习人工智能如何理解语言的细微差别。但这种情况可能正在发生变化。

2/24/2025 2:03:43 PM

AI情报室

如何用AI预测性维护数据中心降低40%故障率

数据中心故障困境：传统维护的力不从心在数字化浪潮汹涌澎湃的当下，数据中心已然成为现代业务运营的中流砥柱。从金融机构的在线交易处理，到电商平台的订单管理与物流追踪；从社交媒体的海量数据存储与实时交互，到医疗行业的患者信息管理与远程诊疗支持，数据中心支撑着各个领域的关键业务流程，其重要性不言而喻。一旦数据中心出现故障，带来的后果将是灾难性的。

2/24/2025 2:00:28 PM

专业

从零到一打造商用 AI Agent（智能体）

Hi，大家好，我叫秋水，当前专注于 AI 智能体和 AI 工作流自动化经常有朋友问我，如何打造一个商用 AI Agent（智能体）？是选择 Coze？还是 LangGraph ？

2/24/2025 1:46:40 PM

秋水

AI时代的头号安全威胁：机器身份

2025年以DeepSeek为代表的生成式AI技术迅猛发展，为企业带来了前所未有的创新机遇，也带来了新的安全风险。其中，非人类身份（Non-Human Identities, NHI）——如API密钥、令牌、加密密钥和服务账户——已成为网络安全的重大盲点。根据OWASP最新发布的《非人类身份十大风险》（NHI Top 10），NHI数量可能比人类身份多出10至50倍，是网络攻击的主要攻击面。

2/24/2025 1:44:35 PM

佚名

单提示生成「主体一致」图像，且无需训练！已斩获ICLR 2025 Spotlight

现在的AI画图工具，比如文图生成模型，已经能根据文字描述创作出高质量的图像了。但是，当我们需要用模型来画故事，并且希望故事中的人物在不同场景下都保持一致时，这些模型就有点犯难了。目前，为了解决人物不一致的问题，通常需要用海量数据进行额外训练，或者对模型本身进行比较复杂的修改。

2/24/2025 1:40:00 PM

新智元

不用GAN不用扩散，无需训练解锁AI生图新境界！判别模型成神秘第三极

判别模型与生成模型长期以来彼此独立，前者专注于分类和识别，后者用于数据生成。最近一项名为「直接上升合成」（Direct Ascent Synthesis，DAS）的独立研究，颠覆了这一传统观念，揭示出判别模型中隐藏着令人惊叹的生成能力。论文链接：。

2/24/2025 1:35:00 PM

新智元

8分钟，Grok 3破解美国本科生最难数赛题！马斯克要用100万GPU反超「星际之门」？

上周，马斯克发布了其号称「地表最强」的Grok 3模型。一经发布便引爆全网，经过网友实测，发现其性能果然强悍！物理学家Luis Batalha在x上表示，2025年的普特南竞赛上，即使是前500名的顶尖选手，也无人能完整攻克下面这道难题。

2/24/2025 1:00:00 PM

新智元

DeepSeek开源周“第一刀”砍向算力！重磅开源FlashMLA，挑战H800算力极限，网友直呼：极致的工程设计！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）上周五，DeepSeek刚刚预告了重磅开源周！周一一早，DeepSeek就履行承诺，开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA！图片根据DeepSeek介绍，FlashMLA内核针对变长序列进行了优化，是已投入生产的核心技术。

2/24/2025 12:52:46 PM

伊风

南大钱超团队攻克百亿晶体管难题，斩获EDA顶会2025最佳论文！AI学院本硕博生联手

据南京大学人工智能学院网站报道，南大LAMDA组钱超教授团队在DATE 2025发表的芯片设计优化论文「Timing-Driven Global Placement by Efficient Critical Path Extraction」获会议最佳论文奖。电子设计自动化（Electronic Design Automation，EDA）是芯片设计的基石产业，被誉为「芯片之母」。欧洲设计自动化与测试会议（Design, Automation and Test in Europe Conference，DATE）是EDA领域的顶级国际学术会议。

2/24/2025 12:33:28 PM

新智元

从理论到实践：学会如何商用 DeepSeek，收藏这一篇就够了

Hi，大家好，我叫秋水，当前专注于 AI Agent 和 AI 工作流自动化。近期 DeepSeek，全球闻名，大家纷纷在讨论，我看过很多文章和视频，很多说的有点夸张，23 年 AI 刚来的那些内容，又重新说了一遍，只是把 AI 两个字母换成了 DeepSeek。在我看来，DeepSeek 出圈的主要原因是能力强、价格低、开源、可以本地部署，这个好处在于企业在 AI 方面的应用会加速落地，我们国内的用户不需要那么麻烦的出海使用 ChatGPT 了。

2/24/2025 12:20:14 PM

秋水

浏览器智能体崛起：Convergence Proxy为何会碾压OpenAI Operator？

一股新的AI浏览器智能体浪潮正改变企业与网络的互动。一股新的AI驱动的浏览器智能体浪潮正在兴起，有望改变企业与网络的互动方式。这些智能体能够自主浏览网站、检索信息，甚至完成交易——但早期测试显示，其承诺的性能与实际表现之间存在显著差距。

2/24/2025 11:57:00 AM

Matt Marshall

DeepSeek开源放大招：FlashMLA让H800算力狂飙！曝光低成本秘笈

就在刚刚，DeepSeek放出了开源周首日的重磅炸弹——FlashMLA。这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核，特别针对变长序列进行了优化，目前已正式投产使用。经实测，FlashMLA在H800 SXM5平台上（CUDA 12.6），在内存受限配置下可达最高3000GB/s，在计算受限配置下可达峰值580 TFLOPS。

2/24/2025 11:32:57 AM

dream

“源神”DeepSeek！突破H800性能上限，FlashMLA重磅开源，算力成本还能降

DeepSeek开源周第一天，降本大法公开——FlashMLA，直接突破H800计算上限。网友：这怎么可能？？

2/24/2025 11:31:33 AM

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星本地部署DeepSeek+DiFy平台构建智能体应用 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

理论