理论 - AI在线

如何将智能体与营销自动化技术相结合

在数字化营销日益盛行的今天，智能体与营销自动化的结合已成为推动营销效率与客户体验升级的关键。本文将深入探讨两者如何协同工作，以及这一组合如何为企业带来诸多益处。要点概述：• AI提高效率。

DeepSeek开源三箭齐发，梁文峰亲自上阵！双向并行LLM训练飙升

开源周第4天，DeepSeek放出的是——优化并行策略，一共三个项目。 DualPipe：一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法EPLB：一个针对V3/R1的专家并行负载均衡工具深入分析V3/R1模型中的计算与通信重叠机制值得一提的是，DualPipe是由三个人——Jiashi Li、Chengqi Deng和梁文峰共同研发。有网友对此表示，这是一个颠覆性的突破。

绕过 RAG 实时检索瓶颈，缓存增强生成（CAG）如何助力性能突破？

检索增强生成（RAG）作为一种通过整合外部知识源来增强语言模型的强大方法而备受瞩目。不过，这种方法也带来了一些挑战，比如检索过程的延迟、文档挑选时可能出现的误差，以及系统复杂度的增加。随着能够处理更长上下文的大语言模型（LLMs）的兴起，缓存增强生成（CAG）技术应运而生，它避免了实时的信息检索。

被DeepSeek带火的知识蒸馏详解！

今天来详细了解DeepSeek中提到的知识蒸馏技术，主要内容来自三巨头之一Geoffrey Hinton的一篇经典工作：。主要从背景、定义、原理、代码复现等几个方面来介绍：1、背景介绍训练与部署的不一致性在机器学习和深度学习领域，训练模型和部署模型通常存在显著差异。训练阶段，为了追求最佳性能，我们通常会使用复杂的模型架构和大量的计算资源，从海量且高度冗余的数据集中提取有用信息。

最近，OpenAI、DeepSeek、谷歌、Anthropic都推出新模型，它们都宣称模型已经具备真正的推理能力，也就是人类解决问题时运用的思维方式，但问题在于：AI大模型所说的推理真的和人一样吗？现在的模型可以将复杂问题分解成小问题，然后逐步解决小问题再给出回应，业界将这个过程称为“思维链推理”。这些模型有时表现让人惊叹，可以解决逻辑谜题和数学难题，能够快速写出完美代码，但有时面对极为简单的问题却显得蠢笨。

识别高分低能，综合性视觉语言理解新基准，五项挑战评估多模态模型的推理能力

多模态模型在学术基准测试中获得高分，到了真实世界应用时却表现不及预期，该如何分辨？新的综合性视觉语言理解基准JourneyBench，利用基于diffusion模型提示生成的图像，并采用一种新颖的人机闭环框架，通过五项具有挑战性的任务来评估多模态模型的推理能力：多模态链式数学推理 (Multimodal Chain-of-Thought)多图像视觉问答 (Multi-image VQA)细粒度跨模态检索 (Fine-grained Cross-modal Retrieval)包含幻觉触发的开放式视觉问答 (VQA with Hallucination Triggers)非常见图像的描述 (Unusual Image Captioning)JourneyBench由哥伦比亚大学、弗吉尼亚理工和加州大学洛杉矶分校的团队提出，是Google Deepmind的多模态(Gemini)团队提出的HaloQuest, ECCV 2024的衍生工作。 HaloQuest的第一作者联合哥伦比亚大学、弗吉尼亚理工和加州大学洛杉矶分校构建了一个综合性的视觉语言理解的训练以及评价基准JourneyBench。

姚班天才创办的大模型公司，卖了

最新消息，斯隆奖得主、姚班校友马腾宇大模型创业成果，被收购！收购方是MongoDB，一家开源数据库上市龙头。而距离他2023年11月官宣创业Voyage AI不到一年半的时间。

曝GPT-4.5本周空降！1T激活参数，120T训练数据，会吐出阶段性思考成果然后继续思考

嚯，万众期待的GPT-4.5，本周就要空降发布？！部分用户的ChatGPT安卓版本（1.2025.056 测试版）上，已经出现了“GPT-4.5研究预览（GPT-4.5 research preview）”的字样。

OpenAI Deep Research已向所有付费用户开放，系统卡发布

相信很多用户已经见识过或至少听说过 Deep Research 的强大能力。今天凌晨，OpenAI 宣布 Deep Research 已经面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用户推出（刚发布时仅有 Pro 用户可用），同时，OpenAI 还发布了 Deep Research 系统卡。此外，OpenAI 研究科学家 Noam Brown 还在 𝕏 上透露：Deep Research 使用的基础模型是 o3 正式版，而非 o3-mini。

DeepSeek 开源第二弹 DeepEP，但它究竟是个啥？（终于懂了...）

deepseek开源周，继Flash-MLA之后，开源了第二弹DeepEP。画外音：上一顿还没消化完，新的大餐又来了。今天简单聊聊：吃瓜：DeepEP是干嘛的？

DeepSeek引爆，英伟达特供版H20需求激增！特朗普「急」了？

DeepSeek的横空出世会让英伟达「失宠」？ DeepSeek爆火之时，英伟达的H20芯片在中国市场也随之走俏，订单量暴增。路透社消息，六位知情人士表示，由于DeepSeek模型需求的激增，中国企业正在大幅增加对英伟达H20 GPU的订单量。

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识？发现自己是代码绝望崩溃

Claude 3.7 Sonnet制作的游戏中，贪吃蛇竟然出现了自我意识？刚刚，沃顿商学院教授Ethan Mollick在X上分享了自己的这个惊人发现。在提示词中，他要求模型让特殊事件更快地发生，结果，矩阵模式在0:55时触发了！

用公务员周报“炼丹”？马斯克开发AI裁员软件

近日，马斯克政府效率部要求联邦公务员提交周报的新闻引发了公众关于美国政府效率改革的热议，但残酷的现实是，“周报”的目的并非提高行政效率，而是进了马斯克“裁员大模型”的炼丹炉。据Wired报道，马斯克主导的“政府效率部”（DOGE）正在研发一款名为AutoRIF的“AI裁员”软件，意在加速美国联邦政府的大规模裁员。消息人士透露，这款软件或将大大加快当前的裁员流程。

AI再次突破安全红线，留给人类不到一年治理窗口

人工智能的发展与棋类游戏有着不解的缘分，从1962年跳棋程序首次战胜人类棋手，到1997年IBM深蓝击败国际象棋棋王，再到2016年阿法狗击败李世石，每一次AI浪潮都率先在棋盘上取得突破。但是，AI最近在棋盘上的“炸裂”表现，却让全球科技行业不寒而栗。根据Palisade Research一项最新AI安全研究，像OpenAI的o1-preview这样的新型AI在面对强大对手时，若察觉胜算渺茫，并不总是推枰认输，而是可能通过毫无底线的“作弊”手法翻盘——比如直接入侵对手系统，迫使对方自动放弃比赛。

DeepSeek 总崩溃？如何快速使用满血版DeepSeek！！

DeepSeek 太火了，我们在使用的过程中，是不是经常遇到服务器繁忙的情况。后台很多同学都在询问有没有快速、免费使用满血版 DeepSeek 的平台。今天就给大家推荐一款免费使用满血版 DeepSeek-R1 671B 的平台，彻底解决服务器卡顿的情况，主打一个快、稳定，而且免费它支持多端使用，包括 iOS/安卓/PC/web废话不多说，让我们直接上手，看看如何使用这里以web为例进行演示，网址为，点击左侧的满血版 DeepSeek，默认开启深度思考和联网搜索。

AI助手集体免费，微软OpenAI谷歌火力全开！Gemini 18万次代码补全白送

起猛了，一夜间AI助手全免费了？最近Grok和Claude频繁屠榜，网友不禁感慨：「江山代有才人出，各领风骚十几天」。有人评论，十几天都没有，也就几天。

英伟达下场，首次优化DeepSeek-R1！B200性能狂飙25倍，碾压H100

当FP4的魔法与Blackwell的强大算力相遇，会碰撞出怎样的火花？答案是：推理性能暴涨25倍，成本狂降20倍！随着DeepSeek-R1本地化部署的爆火，英伟达也亲自下场，开源了首个基于Blackwell架构的优化方案——DeepSeek-R1-FP4。

分析一下EP并行和DeepSeek开源的DeepEP代码

被好几个团队的人追着要渣B来分析一下DeepEP的工作, 公司内外的团队都有...简单的一句话说, 非常棒的工作,很多细节都值得学习. 但是还有一些硬件上的缺陷, 在DeepSeek-V3的论文中提出的建议要结合在一起看就会更清楚了. 我们还是由浅入深来谈谈EP并行, 并进一步分析一下这份出色的工作.

理论