AI在线 AI在线

理论

如何让大模型感知知识图谱知识?蚂蚁联合实验室:利用多词元并行预测给它“上课”

如何让大模型感知知识图谱知识? 蚂蚁联合实验室:利用多词元并行预测给它“上课”。 大语言模型的飞速发展打破了许多自然语言处理任务间的壁垒。
2/24/2025 2:30:00 PM
量子位

Zero-shot重建物理高斯资产,清华&光轮视觉大模型让机器人理解物理属性|ICRA 2025

理解物体的物理属性,对机器人执行操作十分重要,但是应该如何实现呢? 光轮智能与清华AIR、同济大学等机构联合提出了一种基于3D高斯溅射的方法——PUGS(Zero-shot Physical Understandingwith Gaussian Splatting)无需训练、零样本,它就能够从多视角图像中重建物体,并对各种指定的物理属性进行密集重建。 该论文已被ICRA 2025接收。
2/24/2025 2:22:00 PM
量子位

DeepSeek一夜把百度干回20年前,网友:还有这好事?

没完了,刚刚接入DeepSeek的百度,又双叒叕搞事情了。 最新消息,“百度一下 你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan,回归了。 有意思的是,这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。
2/24/2025 2:20:00 PM
量子位

企业RAG落地避坑指南:自主开发 vs 三大框架,核心配置与选型全解析

这个项目原是春节期间在老家给一个企业做 RAG 项目咨询的精简版本,使用 Gradio 构建 Web 界面供大家测试使用。 本是希望大家在这个基础上根据个人或者企业需求进行二次开发,但是在小红书、微信收到一些后台私信里,在集中咨询关于自行开发和现有主流 RAG 框架的区别。 所以,有了这篇。
2/24/2025 2:16:31 PM
韦东东

多行业拥抱DeepSeek,全不顾它身上的“刺”

在数字化浪潮席卷全球的今天,技术革命的脚步正以指数级速率重构人类社会发展轨迹。 而DeepSeek的出现,毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付,从医疗影像的毫厘级诊断到教育资源的跨时空共享,算法与数据的交织已然突破想象力的边界。 当下,众多产业正在与人工智能产生"化学反应",这种由技术创新引发的链式反应,正在三百六十度解构既有行业秩序,催生出"生产力跃迁2.0"时代的全新商业生态。
2/24/2025 2:15:16 PM
科技云报到

当AI更加理解人类语言可能预示提示工程终结

多年来,大型语言模型(LLM)的兴起要求用户学习一种新技能:提示工程。 为了得到人工智能有用的回应,人们不得不精心设计他们的查询问题,学习人工智能如何理解语言的细微差别。 但这种情况可能正在发生变化。
2/24/2025 2:03:43 PM
AI情报室

如何用AI预测性维护数据中心降低40%故障率

数据中心故障困境:传统维护的力不从心在数字化浪潮汹涌澎湃的当下,数据中心已然成为现代业务运营的中流砥柱。 从金融机构的在线交易处理,到电商平台的订单管理与物流追踪;从社交媒体的海量数据存储与实时交互,到医疗行业的患者信息管理与远程诊疗支持,数据中心支撑着各个领域的关键业务流程,其重要性不言而喻。 一旦数据中心出现故障,带来的后果将是灾难性的。
2/24/2025 2:00:28 PM
专业

从零到一打造商用 AI Agent(智能体)

Hi,大家好,我叫秋水,当前专注于 AI 智能体和 AI 工作流自动化经常有朋友问我,如何打造一个商用 AI Agent(智能体)? 是选择 Coze? 还是 LangGraph ?
2/24/2025 1:46:40 PM
秋水

AI时代的头号安全威胁:机器身份

2025年以DeepSeek为代表的生成式AI技术迅猛发展,为企业带来了前所未有的创新机遇,也带来了新的安全风险。 其中,非人类身份(Non-Human Identities, NHI)——如API密钥、令牌、加密密钥和服务账户——已成为网络安全的重大盲点。 根据OWASP最新发布的《非人类身份十大风险》(NHI Top 10),NHI数量可能比人类身份多出10至50倍,是网络攻击的主要攻击面。
2/24/2025 1:44:35 PM
佚名

单提示生成「主体一致」图像,且无需训练!已斩获ICLR 2025 Spotlight

现在的AI画图工具,比如文图生成模型,已经能根据文字描述创作出高质量的图像了。 但是,当我们需要用模型来画故事,并且希望故事中的人物在不同场景下都保持一致时,这些模型就有点犯难了。 目前,为了解决人物不一致的问题,通常需要用海量数据进行额外训练,或者对模型本身进行比较复杂的修改。
2/24/2025 1:40:00 PM
新智元

不用GAN不用扩散,无需训练解锁AI生图新境界!判别模型成神秘第三极

判别模型与生成模型长期以来彼此独立,前者专注于分类和识别,后者用于数据生成。 最近一项名为「直接上升合成」(Direct Ascent Synthesis,DAS)的独立研究,颠覆了这一传统观念,揭示出判别模型中隐藏着令人惊叹的生成能力。 论文链接:。
2/24/2025 1:35:00 PM
新智元

8分钟,Grok 3破解美国本科生最难数赛题!马斯克要用100万GPU反超「星际之门」?

上周,马斯克发布了其号称「地表最强」的Grok 3模型。 一经发布便引爆全网,经过网友实测,发现其性能果然强悍! 物理学家Luis Batalha在x上表示,2025年的普特南竞赛上,即使是前500名的顶尖选手,也无人能完整攻克下面这道难题。
2/24/2025 1:00:00 PM
新智元

DeepSeek开源周“第一刀”砍向算力!重磅开源FlashMLA,挑战H800算力极限,网友直呼:极致的工程设计!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)上周五,DeepSeek刚刚预告了重磅开源周! 周一一早,DeepSeek就履行承诺,开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA! 图片根据DeepSeek介绍,FlashMLA内核针对变长序列进行了优化,是已投入生产的核心技术。
2/24/2025 12:52:46 PM
伊风

南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手

据南京大学人工智能学院网站报道,南大LAMDA组钱超教授团队在DATE 2025发表的芯片设计优化论文「Timing-Driven Global Placement by Efficient Critical Path Extraction」获会议最佳论文奖。 电子设计自动化(Electronic Design Automation,EDA)是芯片设计的基石产业,被誉为「芯片之母」。 欧洲设计自动化与测试会议(Design, Automation and Test in Europe Conference,DATE)是EDA领域的顶级国际学术会议。
2/24/2025 12:33:28 PM
新智元

从理论到实践:学会如何商用 DeepSeek,收藏这一篇就够了

Hi,大家好,我叫秋水,当前专注于 AI Agent 和 AI 工作流自动化。 近期 DeepSeek,全球闻名,大家纷纷在讨论,我看过很多文章和视频,很多说的有点夸张,23 年 AI 刚来的那些内容,又重新说了一遍,只是把 AI 两个字母换成了 DeepSeek。 在我看来,DeepSeek 出圈的主要原因是能力强、价格低、开源、可以本地部署,这个好处在于企业在 AI 方面的应用会加速落地,我们国内的用户不需要那么麻烦的出海使用 ChatGPT 了。
2/24/2025 12:20:14 PM
秋水

浏览器智能体崛起:Convergence Proxy为何会碾压OpenAI Operator?

一股新的AI浏览器智能体浪潮正改变企业与网络的互动。 一股新的AI驱动的浏览器智能体浪潮正在兴起,有望改变企业与网络的互动方式。 这些智能体能够自主浏览网站、检索信息,甚至完成交易——但早期测试显示,其承诺的性能与实际表现之间存在显著差距。
2/24/2025 11:57:00 AM
Matt Marshall

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

就在刚刚,DeepSeek放出了开源周首日的重磅炸弹——FlashMLA。 这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核,特别针对变长序列进行了优化,目前已正式投产使用。 经实测,FlashMLA在H800 SXM5平台上(CUDA 12.6),在内存受限配置下可达最高3000GB/s,在计算受限配置下可达峰值580 TFLOPS。
2/24/2025 11:32:57 AM
dream

“源神”DeepSeek!突破H800性能上限,FlashMLA重磅开源,算力成本还能降

DeepSeek开源周第一天,降本大法公开——FlashMLA,直接突破H800计算上限。 网友:这怎么可能? ?
2/24/2025 11:31:33 AM