RAG

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
在本篇文章中，我们将深入探讨腾讯大语言模型在多个业务场景中的应用，特别是如何通过前沿技术提升模型的智能化与用户体验。首先介绍腾讯大模型的广泛应用场景，如内容生成、智能客服和角色扮演等，并详细解析 RAG（Retrieval-Augmented Generation）技术及其在实际业务中的创新应用，特别是在文档生成和问答系统中的优势。此外，文章还将探讨 GraphRAG 在角色扮演场景中的应用，…
理论
- 989
- 0
赵喜生12月11日
2025年企业对AI的期望
AI驱动的变革即将到来，但2025年将是缓慢而稳步进展的一年。今年，随着更现实的期望占据主导，围绕AI的初步炒作和兴奋已经平息。对于企业部署而言，这一点尤其明显，因为现有模型的能力与许多业务工作流的复杂性相结合，导致进展比许多人预期的要慢。
理论
- 975
- 0
Martin12月10日
自己动手实现一个RAG应用
我们知道 RAG 有两个核心的过程，一个是把信息存放起来的索引过程，一个是利用找到相关信息生成内容的检索生成过程。所以，我们这个 RAG 应用也要分成两个部分：索引和检索生成。 RAG 是为了让大模型知道更多的东西，所以，接下来要实现的 RAG 应用，用来增强的信息就是我们这门课程的内容，我会把开篇词做成一个文件，这样，我们就可以和大模型讨论我们的课程了。
理论
- 973
- 0
greencoatman12月6日
RAG：让大模型知道更多东西
虽然我们说大模型的特点之一是知识丰富，但这里的知识仅限于通用的知识，也就是网上能够很容易找到的知识。对于一些特定的知识，比如你所在业务领域的知识，它就一无所知了。个中缘由，不言而喻，大模型训练时，根本不可能拿到你们公司的数据。
理论
- 974
- 0
greencoatman12月4日
Elasticsearch虽好，但矢量数据库才是未来
作者 | Jiang Chen译者 | 布加迪审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）几十年来，以Elasticsearch为代表的关键词匹配（又称为全文搜索）一直是企业搜索和推荐引擎等信息检索系统的默认选择。随着基于人工智能的搜索技术不断进步，如今企业组织在向语义搜索转变，从而使系统能够理解用户查询背后的含义和意图。嵌入模型和矢量数据库已成为这一转变的核心。
理论
- 974
- 0
布加迪12月2日
一篇大模型RAG最新综述，简报！
今天给大家带来一篇超有料的RAG（检索增强生成）技术综述，这份大作来自卡内基梅隆大学的大佬们。标题就霸气侧漏：《A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions》。引言图片🌟RAG技术到底是啥玩意儿？
理论
- 978
- 0
哎呀AIYA11月29日
【RAG】浅看引入智能信息助理提升大模型处理复杂推理任务的潜力-AssisTRAG
AssisTRAG通过集成一个智能信息助手来提升LLMs处理复杂推理任务的能力。该框架由两个主要组件构成：一个冻结的主语言模型和一个可训练的助手语言模型。 AssisTRAG与之前的RAG对比1.
理论
- 971
- 0
余俊晖11月26日
没有思考过 Embedding，谈何 RAG，更不足以谈 AI大模型
今天，我们来聊聊 AI 大模型，有一个非常重要概念 "Embedding"。你可能听说过它，也可能对它一知半解。如果你没有深入了解过 Embedding，那你就无法真正掌握 RAG 技术，更不能掌握 AI 大模型精髓所在。
理论
- 977
- 0
渔夫11月21日
LLM-R：基于RAG和层次化Agent落地案例解析
在这个由智能设备主导的时代，维护工作的重要性愈发凸显，几乎成了生产活动的守护神。想象一下，当一台精密的机器在深夜突发故障，而维护手册却像天书一样难以理解，这时，交互式电子技术手册（IETMs）就像一束温暖的灯塔，指引着维护人员安全渡过难关。面对从图形用户界面（GUIs）到自然语言用户界面（LUIs）的转变，以及复杂逻辑关系的梳理，传统的IETMs显得有些力不从心。
理论
- 970
- 0
哎呀AIYA11月14日
大模型应用系列：从Ranking到Reranking
每个搜索引擎背后都隐藏着一个至关重要却往往被忽视的组成部分——Reranking（重新排名）。那么，什么是Rerank呢？简而言之，这一过程旨在优化并调整搜索结果的顺序，使之更加精准地匹配用户的查询需求。
理论
- 974
- 0
曹洪伟11月11日
RAG技术落地的两个问题及应对策略
什么是RAG？ RAG的全称是检索增强生成（Retrieval-Augmented Generation，简称RAG），它结合了检索和和生成技术，通过整合检索系统和生成模型的优势，来提升模型生成文本的质量和上下文相关性。这种技术主要是为了解决生成式模型在面对需要具体、实时或领域专业知识时可能产生的准确性不足和上下文不敏感的问题。
理论
- 973
- 0
fxcc11月11日
RAG新突破：块状注意力机制实现超低延迟检索增强
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]
理论
- 6
- 0
机器之心11月3日
谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉
科技媒体 maginative 昨日（9 月 12 日）发布博文，报道谷歌公司基于谷歌数据共享（Data Commons）中的真实世界统计数据，推出了开放权重 Gemma 模型的新版本 DataGemma。语言模型当前面临的一大难题就是幻觉（Hallucinations），尤其是大语言模型（LLMs）在处理数值或统计数据时，这一问题变得尤为棘手，因此精确性至关重要。谷歌的 Data Common…
应用
- 26
- 0
故渊9月13日
延迟交互模型，为什么是下一代RAG的标配？
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]张颖峰：英飞流联合创始人，多年搜索、AI、Infra基础设施开发经历…
工程
- 7
- 0
机器之心8月5日
六位一线 AI 工程师分享自身归纳，公开大模型使用摸爬滚打一年心得
六位一线 AI 工程师和创业者，把在大模型使用开发上摸爬滚打一整年的心得，全！分！享！了！（奇怪的六一儿童节大礼包出现了）这篇干货长文，一时间成为开发者社区热议的话题。有网友评价为，大模型领域少有的“有操作性”的实用见解，非常值得一读。这 6 位作家来自不同背景，比如有大厂工程师，也有独立开发者，还有咨询顾问。但他们的共同之处，是过去一年里一直在大模型之上构建真实使用程序，而不只是炫酷的 Demo…
AI
- 6
- 0
清源6月1日
狂奔一年后的向量数据库，何去何从？｜对话 MyScaleDB
2023 年可以说是大模型元年，借着大模型的东风，向量数据库也迎来了大爆发，被带到了更高的关注度上。一方面，向量数据库和 RAG 得到广泛的关注和认可，是因为他们的确可以解决一些短期内大模型无法攻克的难题，比如模型幻觉题目等。同时，在尝试用向量数据库和 RAG 做场景落地的时候，效果也还不错。不过另一方面，我们也无法回避对他们普遍的困惑与争议，比如向量数据库是否已经凉了，以及如今势头正盛的 RAG…
理论
- 4
- 0
机器之心5月14日
RAG还是微调？微软出了一份一定领域大模型应用建设过程指南
检索加强生成（RAG）和微调（Fine-tuning）是提升大说话模型性能的两种常用步骤，那么到底哪种步骤更好？在建设一定领域的应用时哪种更高效？微软的这篇论文供你选择时举行参考。在构建大说话模型应用程序时通常有两种常见的步骤来整合专有和一定领域的数据：检索加强生成和微调。检索加强生成通过外部数据加强提醒，而微调将额外的知识整合到模型本身中。不过，对这两种步骤的优缺点了解的却不够充分。本文中，来自…
应用
- 6
- 0
机器之心2月16日
低成本快捷定制大模型，这次我们来深度探讨下RAG 和向量数据库
当今人工智能范畴，最受关注的毋庸置疑是大模型。然而，高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下，向量数据库凭借其独特的优势，成为解决低成本快捷定制大模型问题的关键所在。向量数据库是一种专门用于存储和处理高维向量数据的技能。它采用高效的索引和查询算法，兑现了海量数据的快捷检索和分析。如此优秀的性能之外，向量数据库还可以为特定范畴和任务提供定制化的解决方案。…
应用
- 3
- 0
机器之心23年11月13日