没有思考过 Embedding,谈何 RAG,更不足以谈 AI大模型
今天,我们来聊聊 AI 大模型,有一个非常重要概念 "Embedding"。 你可能听说过它,也可能对它一知半解。 如果你没有深入了解过 Embedding,那你就无法真正掌握 RAG 技术,更不能掌握 AI 大模型精髓所在。- 971
- 0
LLM-R:基于RAG和层次化Agent落地案例解析
在这个由智能设备主导的时代,维护工作的重要性愈发凸显,几乎成了生产活动的守护神。 想象一下,当一台精密的机器在深夜突发故障,而维护手册却像天书一样难以理解,这时,交互式电子技术手册(IETMs)就像一束温暖的灯塔,指引着维护人员安全渡过难关。 面对从图形用户界面(GUIs)到自然语言用户界面(LUIs)的转变,以及复杂逻辑关系的梳理,传统的IETMs显得有些力不从心。- 968
- 0
大模型应用系列:从Ranking到Reranking
每个搜索引擎背后都隐藏着一个至关重要却往往被忽视的组成部分——Reranking(重新排名)。 那么,什么是Rerank呢? 简而言之,这一过程旨在优化并调整搜索结果的顺序,使之更加精准地匹配用户的查询需求。- 968
- 0
RAG技术落地的两个问题及应对策略
什么是RAG? RAG的全称是检索增强生成(Retrieval-Augmented Generation,简称RAG),它结合了检索和和生成技术,通过整合检索系统和生成模型的优势,来提升模型生成文本的质量和上下文相关性。 这种技术主要是为了解决生成式模型在面对需要具体、实时或领域专业知识时可能产生的准确性不足和上下文不敏感的问题。- 968
- 0
RAG新突破:块状注意力机制实现超低延迟检索增强
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]- 3
- 0
谷歌推出 DataGemma:基于可信数据源提高 AI 准确度,减少幻觉
科技媒体 maginative 昨日(9 月 12 日)发布博文,报道谷歌公司基于谷歌数据共享(Data Commons)中的真实世界统计数据,推出了开放权重 Gemma 模型的新版本 DataGemma。语言模型当前面临的一大难题就是幻觉(Hallucinations),尤其是大语言模型(LLMs)在处理数值或统计数据时,这一问题变得尤为棘手,因此精确性至关重要。谷歌的 Data Common…- 25
- 0
延迟交互模型,为什么是下一代RAG的标配?
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]张颖峰:英飞流联合创始人,多年搜索、AI、Infra基础设施开发经历…- 5
- 0
六位一线 AI 工程师分享自身归纳,公开大模型使用摸爬滚打一年心得
六位一线 AI 工程师和创业者,把在大模型使用开发上摸爬滚打一整年的心得,全!分!享!了!(奇怪的六一儿童节大礼包出现了)这篇干货长文,一时间成为开发者社区热议的话题。有网友评价为,大模型领域少有的“有操作性”的实用见解,非常值得一读。这 6 位作家来自不同背景,比如有大厂工程师,也有独立开发者,还有咨询顾问。但他们的共同之处,是过去一年里一直在大模型之上构建真实使用程序,而不只是炫酷的 Demo…- 6
- 0
狂奔一年后的向量数据库,何去何从?|对话 MyScaleDB
2023 年可以说是大模型元年,借着大模型的东风,向量数据库也迎来了大爆发,被带到了更高的关注度上。一方面,向量数据库和 RAG 得到广泛的关注和认可,是因为他们的确可以解决一些短期内大模型无法攻克的难题,比如模型幻觉题目等。同时,在尝试用向量数据库和 RAG 做场景落地的时候,效果也还不错。不过另一方面,我们也无法回避对他们普遍的困惑与争议,比如向量数据库是否已经凉了,以及如今势头正盛的 RAG…- 4
- 0
RAG还是微调?微软出了一份一定领域大模型应用建设过程指南
检索加强生成(RAG)和微调(Fine-tuning)是提升大说话模型性能的两种常用步骤,那么到底哪种步骤更好?在建设一定领域的应用时哪种更高效?微软的这篇论文供你选择时举行参考。在构建大说话模型应用程序时通常有两种常见的步骤来整合专有和一定领域的数据:检索加强生成和微调。检索加强生成通过外部数据加强提醒,而微调将额外的知识整合到模型本身中。不过,对这两种步骤的优缺点了解的却不够充分。本文中,来自…- 5
- 0
低成本快捷定制大模型,这次我们来深度探讨下RAG 和向量数据库
当今人工智能范畴,最受关注的毋庸置疑是大模型。然而,高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下,向量数据库凭借其独特的优势,成为解决低成本快捷定制大模型问题的关键所在。向量数据库是一种专门用于存储和处理高维向量数据的技能。它采用高效的索引和查询算法,兑现了海量数据的快捷检索和分析。如此优秀的性能之外,向量数据库还可以为特定范畴和任务提供定制化的解决方案。…- 3
- 0
RAG
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!