RAG技术落地的两个问题及应对策略
什么是RAG? RAG的全称是检索增强生成(Retrieval-Augmented Generation,简称RAG),它结合了检索和和生成技术,通过整合检索系统和生成模型的优势,来提升模型生成文本的质量和上下文相关性。 这种技术主要是为了解决生成式模型在面对需要具体、实时或领域专业知识时可能产生的准确性不足和上下文不敏感的问题。- 968
- 0
两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024
知识图谱(Knowledge Graphs)是一种结构化的,用于展示和管理信息,组织现实世界知识的形式。 其通常被表达为三元组形式(头实体,关系,尾实体)。 KGs 为问答系统、推荐系统和搜索引擎等各种实际应用提供了极其重要支持。- 968
- 0
清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手
最近,我们意外发现,具身智能领域的明星初创公司千寻智能,悄悄完成了工商变更。 根据工商信息显示,本轮融资由柏睿资本独家投资。 至此,千寻智已经在半年多时间里获得了三次大额融资,一跃成为具身智能领域明星公司之一。- 968
- 0
GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程
猛料来了,OpenAI下一代旗舰模型被曝提升不如预期。 消息来自The Information,具体指代号“猎户座”(Orion)的模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。 或许这也是奥特曼曾说,可能不会把新模型命名为GPT-5的原因之一。- 968
- 0
在家中完成LLM微调高效指南(上)
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)LLM在生成文本和理解信息方面非常有效,但它们最终受限于训练数据的语料库。 例如,如果你让一个通用的预训练模型回答与你的业务特定流程或操作有关的问题,最好的结果是它拒绝,最坏的情况是它会信誓旦旦地给出一个看似合理但错误的答案。 当然,你可以通过自己训练一个模型来解决这个问题,但所需的资源往往超出实际可行的范围。- 968
- 0
为了创造商业价值,需要充分利用企业的数据和人工智能
尽管人们生活在一个日益数据驱动的世界,但大多数公司并没有采用数据驱动的商业模式。 推动Alphabet、Meta和亚马逊等企业成功的网络效应良性循环,并不适用于销售传统产品和服务的组织。 然而,从日常业务流程生成的专有数据中获取更多信息的工具正在变得广泛可用,并且可以帮助企业开发竞争优势。- 968
- 0
专家模型不要专家并行!微软开源MoE新路径
继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。 与Phi-3.5同样的个头(16 * 3.8B),却采用了截然不同的训练方法。 这个「不走寻常路」如果写个太长不看版,那就是两句话:1.- 969
- 0
陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年
数学为评估复杂推理提供了一个独特而合适的测试平台。 它需要一定的创造力和精确的逻辑链条——通常涉及复杂的证明,这些证明必须缜密地筹划和执行。 同时,数学还允许对结果进行客观验证。- 968
- 0
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。 SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。 目前,该模型已经在豆包PC端及即梦网页端开启测试。- 970
- 0
六位专家探讨如何平衡IT项目、支出和风险
要构建一个具有韧性的技术体系,高管董事会必须在拥抱新技术的同时管理风险,并使支出与业务目标相一致。 企业技术领导者已从其企业获得了明确的指示:利用最佳技术支持更广泛的业务目标。 为了实现这一目标,CIO需关注两个关键因素:成本和风险。- 968
- 0
Gartner公布2025年十大技术趋势:代理AI、机器人和虚假信息安全
IT研究公司Gartner预测了2025年的十大技术趋势,其中包括代理AI技术的兴起、对虚假信息网络安全解决方案的需求、以及可以遵循人类指令的多功能机器人。 Gartner最大胆的一些预测包括,到2028年至少有15%的日常工作决策将通过代理AI自主做出,而今年这一比例是0%。 AI代理的兴起,将需要AI治理方面的完善和需要新技术以打击虚假信息。- 968
- 0
哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%
近日,来自哈佛医学院等机构的科学家们开发了一种名为CHIEF(Clinical Histopathology Imaging Evaluation Foundation,临床组织病理学成像评估基础)的多功能AI癌症诊断模型。 并于9月4日登上「Nature」。 论文地址:,尽管最近出现了其他用于医学诊断的病理图像基础AI模型,但CHIEF是第一个能够预测患者预后并在多个国际患者群体中验证的模型。- 970
- 0
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
到现在为止,我们仍旧对大模型「幻觉」如何、为何产生,知之甚少。 最近,来自Technion、谷歌和苹果的研究人员发现,LLM「真实性」的信息集中在特定的token,而且并得均匀分布。 正如论文标题所示,「LLM知道的往往要比表现出来的更多」。- 968
- 0
OpenAI奥特曼最新对话:将很快进入智能体阶段;OpenAI最初三个目标一个已失效;智慧和能源可解锁AGI;马斯克比我做更多
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)2025,OpenAI会有哪些动作? Sam Altman定下了哪些目标? 如何看待自“宫斗”后相创始员工离职潮,以及大模型创业公司的壁垒和未来在哪里?- 968
- 0
学生党狂喜,物理图表动起来!受力分析、光学、电路图等全自动交互
在上物理课的时候,大家应该都有过那种「图太抽象了」的体会吧,需要靠空间想象力才能感受到出题人的想法。 而在电子教学时代,物理图可以是动态、可交互的,有助于更深入地理解复杂原理,能够比教科书或视频提供更丰富、更难忘的学习体验,也可以让学生更积极参与到复杂概念的实验中,但是创建交互式模拟既耗时又需要大量的编程工作,所以大部分教学场景只能用已经制作好的模拟图,有时无法完全满足学生对学习材料的特定需求,甚…- 968
- 0
奥特曼专访自曝OpenAI掌握AGI密钥,2025年降临!1人1万块GPU缔造十亿独角兽
1个人 10000个GPU,就能打造价值10亿美元的公司? OpenAI已经掌握了通往AGI的内部路径,我们距ASI只有几千天时间了? 就在最近,OpenAI CEO奥特曼在最新访谈里,再次爆出不少金句。- 968
- 0
多模态模型免微调接入互联网,即插即用新框架,效果超闭源商用方案
一个5月份完成训练的大模型,无法对《黑神话·悟空》游戏内容相关问题给出准确回答。 这是大模型的老毛病了。 因为《黑神话》8月才上市,训练数据里没有它的相关知识。- 969
- 0
腾讯语音合成技术:模型优化与推理加速实践
一、背景-产品展示首先,让我们来看一下腾讯自研的知音语音大模型在语音合成领域的应用展示。 该模型能够提供更自然、韵律丰富且实时性更强的语音合成体验。 其两大显著优点如下:声音复刻:仅需 10 秒音频即可完成声音复刻。- 968
- 0
我为什么离开OpenAI?六年元老发离职长文:AGI将至,我们远没准备好
OpenAI的「员工叛逃」还没有结束。 近日,OpenAI又有一位6年元老、研究主管Miles Brundage发表长文官宣离职,并详细解释了自己为何「出走」。 作为一家年轻的AI独角兽,成立于2015年的OpenAI如今刚刚9岁,因此在公司待了6年之久的Brundage足以被称为「元老」,见证了OpenAI如何一路起伏、筚路蓝缕地走到今天。- 968
- 0
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队! HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。 通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。- 968
- 0
最小化的递归神经网络RNN为Transformer提供了快速高效的替代方案
译者 | 李睿审校 | 重楼Transformer如今已经成为大型语言模型(LLM)和其他序列处理应用程序的主要架构。 然而,它们固有的二次方计算复杂性成为了将Transformer扩展至超长序列时的巨大障碍,显著增加了成本。 这引发了人们对具有线性复杂性和恒定内存需求的架构的兴趣。- 968
- 0
PyTorch 深度学习的十个核心概念
深度学习是当前最热门的技术之一,而 PyTorch 是一个非常受欢迎的深度学习框架。 今天,我们将深入探讨 PyTorch 中的 10 个核心概念,帮助你更好地理解和使用这个强大的工具。 张量(Tensor)张量是 PyTorch 中最基本的数据结构,类似于 NumPy 的数组,但可以在 GPU 上运行,从而加速计算。- 968
- 0
清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分
大模型的记忆限制被打破了,变相实现“无限长”上下文。 最新成果,来自清华、厦大等联合提出的LLMxMapReduce长本文分帧处理技术。 LLMxMapReduce技术通过将长上下文切分为多个片段,可以让模型并行处理多个片段,并从不同片段中提取关键信息,然后汇总成为最终的答案。- 968
- 0
全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大
OpenAI o1风格的推理大模型,有行业垂直版了。 HK-O1aw,是由香港生成式人工智能研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR) 联合北京大学对齐团队(PKU-Alignment Team)推出的全球首个慢思考范式法律推理大模型。 HK-O1aw的推理能力,在多个法律场景的测试中得到证明。- 968
- 0
理论
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!