资讯列表

没有思考过 Embedding,谈何 RAG,更不足以谈 AI大模型

今天,我们来聊聊 AI 大模型,有一个非常重要概念 "Embedding"。 你可能听说过它,也可能对它一知半解。 如果你没有深入了解过 Embedding,那你就无法真正掌握 RAG 技术,更不能掌握 AI 大模型精髓所在。

RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势

受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接外部数据源,检索增强生成(RAG)技术也逐渐获得业内的关注。 但并不是接入外部数据即可万事大吉,有很多用户查询非常难处理,从检索相关数据、准确解释用户意图,再到充分利用LLMs的推理能力都需要进行优化处理,才能得到一个相对满意的RAG系统来执行复杂任务,并不存在一种万能的解决方案。 在实践中,如果RAG效果不佳,通常是由于未能准确识别任务的核心问题,或者是因为该任务本身就需要混合多种技术才能解决,必须将复杂任务拆解开才能获得更好的表现。

世界最大AI Agent生态系统!微软推出全新「自主AI智能体」,10万企业工作流被改变

微软正在悄悄改变企业AI的游戏规则! 现在,微软已经悄悄组建了世界最大的AI智能体生态系统,自推出以来,已经有超过10万家公司,用Copilot Studio创建了自己的AI智能体。 比如,麦肯锡通过自动化的流程分配智能体,将项目受理流程从20天缩短至仅2天;Pets at Home在不到两周内部署了防欺诈智能体,每年节省数百万美元……「这个增长速度远超我们的预期,也远超我们发布的其他任何前沿技术的表现,」微软智能体负责人Charles Lamanna透露道,「仅仅一个季度,就实现了2倍的增长。

微软发布 AI Shell 工具,为命令行插上 AI 翅膀

该工具旨在通过 AI 智能简化编码、排查错误和自动化工作流程,为开发者和 IT 专业人员提供智能化的命令行体验,标志着微软在 AI 集成战略上的又一重大进展。

用AI反制AI诈骗,合合信息获全球AI攻防挑战赛金融场景赛道冠军

11月20日,2024年世界互联网大会乌镇峰会在浙江省桐乡市乌镇开幕,主题为“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”。 会议期间,由中国图象图形学学会、蚂蚁集团、云安全联盟(CSA)大中华区联合主办的AI大模型攻防赛圆满落下帷幕,该赛事联合了清华大学、上海交通大学、浙江大学等高校及多家产学研组织共同发起,直面并解决大模型应用中潜藏风险,助力全球AI产业健康可持续发展。 大赛吸引了来自全球18个国家和地区的3200余名技术精英参与,参赛者来自清华大学、北京大学、交通大学、南洋理工大学等290多所国内外高校,以及字节跳动、理想汽车、腾讯、合合信息等上百家科技企业。

努比亚星云 AI+ 发布,Z70 Ultra 手机搭载中国电信 30 亿端侧星辰大模型

努比亚与中国电信合作,Z70 Ultra 手机搭载全新星辰大模型,包括 30 亿参数端侧大模型 + 千亿参数云侧大模型,组成了自然语言、语音、影像、视觉、性能、多模态等多个大模型矩阵。

微软、Anthropic正在拉满大模型的情绪价值

编辑 | 星璇出品 | 51CTO技术栈(微信号:blog51cto)再过3天,ChatGPT 就要迎来它的第二个生日了,GPT 推出也已经6年了。 到目前为止,大型语言模型 (LLM) 一直在有效发展。 它们真实、敏捷且足智多谋。

宝可梦GO「偷家」李飞飞空间智能?全球最强3D地图诞生,150万亿参数解锁现实边界

李飞飞提出的「空间智能」概念,被宝可梦GO团队抢先实现了? 最近,宝可梦GO团队宣布,构建出了一个大规模地理空间模型LGM,让我们距离空间智能更近了一步。 而这一成果也意味着,人类在空间计算和AR眼镜领域,即将进入崭新的时代。

一个季度净赚近200亿美元!英伟达Q3财报发布,市场反应:更窜天猴一些!黄仁勋回应 Blackwell芯片的问题

出品 | 51CTO技术栈(微信号:blog51cto)昨晚,“AI总龙头”英伟达财报终于出来了! 单单一个季度净利润193亿美元,营收350.8亿美元! 同比增速94%,超出了华尔街预期,分析师预期中值增速为83.5%。

让模型预见数据分布变化,东京大学等提出时态域泛化全新框架

在数据分布持续变化的动态环境中,如何进行连续模型泛化? 东京大学等高校的研究人员提出了名为Koodos的新框架,可以基于在一些随机时间点观测的数据分布,在任意时刻生成当下适用的神经网络。  尽管数据随时间持续发生变化,但是泛化的模型能在连续时间中与数据分布始终保持协调一致。

OpenAI薪酬大曝光!奥特曼身价145亿,年薪只有55万

刚刚,一份新发布的税务申报文件显示,奥特曼去年仅领取了76001美元(约55万人民币)的薪酬。 相比起2022年的73546美元,略有增加。 2022年数据身为OpenAI的CEO,年薪仅为55万。

AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互

人类离电影《黑客帝国》的场景,似乎又近了一步。 因为就在刚刚,一个与电影同名的、首个AI基础世界模拟器——The Matrix问世。 它已经可以实现生成无限长、高保真720p真实场景视频,而且还是可以实时交互的那种!

扣子OpenAPI突进智能语音战场!点满低延时、定制化、随时打断和音色克隆技能(内测开启!)

扣子 Coze OpenAPI 不仅具备低延时、定制化、随时打断和音色克隆等优势,还整合了扣子强大的智能体生态。 基于 AI 的无限游戏最近开始赢得关注,但实际上你现在就可以在自己的电脑上实现类似跑团的无限游戏。 有意思的是,就算你大开脑洞,胡乱游戏,大模型 AI 也能帮你把故事圆起来,让这个游戏无限地继续下去。

推理性能直逼o1,DeepSeek再次出手,重点:即将开源

DeepSeek 又出手了,这次又是重磅炸弹。 昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。 在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型,有三项成绩还领先于 OpenAI o1-preview。

世界最大 AI Agent 生态系统,微软推出全新“自主 AI 智能体”

就在刚刚,微软公布了世界最大 AI Agent 生态系统:现在,已经有十万家企业通过 Copilot Studio 创建智能体了。

诺奖得主哈萨比斯新作登Nature,AlphaQubit解码出更可靠量子计算机

今天凌晨,新晋诺贝尔化学奖得主、DeepMind 创始人哈萨比斯参与撰写的新论文登上了 Nature,主题是如何更准确地识别并纠正量子计算机内部的错误。 我们知道,量子计算机有潜力彻底改变药物发现、材料设计和基础物理学。 不过前提是:我们得让它们可靠地工作。

神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

租用 H100 的钱只需 233 美元。 还记得 Andrej Karpathy 纯 C 语言复现 GPT-2 大模型的项目吗? 今年 4 月,AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」曾经引发机器学习社区的热烈讨论。

NeurIPS 2024 | 水印与高效推理如何两全其美?最新理论:这做不到

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。