AI资讯列表 - AI在线

没有思考过 Embedding，谈何 RAG，更不足以谈 AI大模型

今天，我们来聊聊 AI 大模型，有一个非常重要概念 "Embedding"。你可能听说过它，也可能对它一知半解。如果你没有深入了解过 Embedding，那你就无法真正掌握 RAG 技术，更不能掌握 AI 大模型精髓所在。

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你「LLM+外部数据」的正确使用姿势

受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接外部数据源，检索增强生成（RAG）技术也逐渐获得业内的关注。但并不是接入外部数据即可万事大吉，有很多用户查询非常难处理，从检索相关数据、准确解释用户意图，再到充分利用LLMs的推理能力都需要进行优化处理，才能得到一个相对满意的RAG系统来执行复杂任务，并不存在一种万能的解决方案。在实践中，如果RAG效果不佳，通常是由于未能准确识别任务的核心问题，或者是因为该任务本身就需要混合多种技术才能解决，必须将复杂任务拆解开才能获得更好的表现。

世界最大AI Agent生态系统！微软推出全新「自主AI智能体」，10万企业工作流被改变

微软正在悄悄改变企业AI的游戏规则！现在，微软已经悄悄组建了世界最大的AI智能体生态系统，自推出以来，已经有超过10万家公司，用Copilot Studio创建了自己的AI智能体。比如，麦肯锡通过自动化的流程分配智能体，将项目受理流程从20天缩短至仅2天；Pets at Home在不到两周内部署了防欺诈智能体，每年节省数百万美元……「这个增长速度远超我们的预期，也远超我们发布的其他任何前沿技术的表现，」微软智能体负责人Charles Lamanna透露道，「仅仅一个季度，就实现了2倍的增长。

微软发布 AI Shell 工具，为命令行插上 AI 翅膀

该工具旨在通过 AI 智能简化编码、排查错误和自动化工作流程，为开发者和 IT 专业人员提供智能化的命令行体验，标志着微软在 AI 集成战略上的又一重大进展。

用AI反制AI诈骗，合合信息获全球AI攻防挑战赛金融场景赛道冠军

11月20日，2024年世界互联网大会乌镇峰会在浙江省桐乡市乌镇开幕，主题为“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”。会议期间，由中国图象图形学学会、蚂蚁集团、云安全联盟（CSA）大中华区联合主办的AI大模型攻防赛圆满落下帷幕，该赛事联合了清华大学、上海交通大学、浙江大学等高校及多家产学研组织共同发起，直面并解决大模型应用中潜藏风险，助力全球AI产业健康可持续发展。大赛吸引了来自全球18个国家和地区的3200余名技术精英参与，参赛者来自清华大学、北京大学、交通大学、南洋理工大学等290多所国内外高校，以及字节跳动、理想汽车、腾讯、合合信息等上百家科技企业。

努比亚星云 AI+ 发布，Z70 Ultra 手机搭载中国电信 30 亿端侧星辰大模型

努比亚与中国电信合作，Z70 Ultra 手机搭载全新星辰大模型，包括 30 亿参数端侧大模型 + 千亿参数云侧大模型，组成了自然语言、语音、影像、视觉、性能、多模态等多个大模型矩阵。

微软、Anthropic正在拉满大模型的情绪价值

编辑 | 星璇出品 | 51CTO技术栈（微信号：blog51cto）再过3天，ChatGPT 就要迎来它的第二个生日了，GPT 推出也已经6年了。到目前为止，大型语言模型（LLM）一直在有效发展。它们真实、敏捷且足智多谋。

宝可梦GO「偷家」李飞飞空间智能？全球最强3D地图诞生，150万亿参数解锁现实边界

李飞飞提出的「空间智能」概念，被宝可梦GO团队抢先实现了？最近，宝可梦GO团队宣布，构建出了一个大规模地理空间模型LGM，让我们距离空间智能更近了一步。而这一成果也意味着，人类在空间计算和AR眼镜领域，即将进入崭新的时代。

一个季度净赚近200亿美元！英伟达Q3财报发布，市场反应：更窜天猴一些！黄仁勋回应 Blackwell芯片的问题

出品 | 51CTO技术栈（微信号：blog51cto）昨晚，“AI总龙头”英伟达财报终于出来了！单单一个季度净利润193亿美元，营收350.8亿美元！同比增速94%，超出了华尔街预期，分析师预期中值增速为83.5%。

让模型预见数据分布变化，东京大学等提出时态域泛化全新框架

在数据分布持续变化的动态环境中，如何进行连续模型泛化？东京大学等高校的研究人员提出了名为Koodos的新框架，可以基于在一些随机时间点观测的数据分布，在任意时刻生成当下适用的神经网络。尽管数据随时间持续发生变化，但是泛化的模型能在连续时间中与数据分布始终保持协调一致。

OpenAI薪酬大曝光！奥特曼身价145亿，年薪只有55万

刚刚，一份新发布的税务申报文件显示，奥特曼去年仅领取了76001美元（约55万人民币）的薪酬。相比起2022年的73546美元，略有增加。 2022年数据身为OpenAI的CEO，年薪仅为55万。

AI版《黑客帝国》：无限生成逼真视频，3A画质，还能实时交互

人类离电影《黑客帝国》的场景，似乎又近了一步。因为就在刚刚，一个与电影同名的、首个AI基础世界模拟器——The Matrix问世。它已经可以实现生成无限长、高保真720p真实场景视频，而且还是可以实时交互的那种！

扣子OpenAPI突进智能语音战场！点满低延时、定制化、随时打断和音色克隆技能（内测开启！）

扣子 Coze OpenAPI 不仅具备低延时、定制化、随时打断和音色克隆等优势，还整合了扣子强大的智能体生态。基于 AI 的无限游戏最近开始赢得关注，但实际上你现在就可以在自己的电脑上实现类似跑团的无限游戏。有意思的是，就算你大开脑洞，胡乱游戏，大模型 AI 也能帮你把故事圆起来，让这个游戏无限地继续下去。

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

DeepSeek 又出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型，有三项成绩还领先于 OpenAI o1-preview。

世界最大 AI Agent 生态系统，微软推出全新“自主 AI 智能体”

就在刚刚，微软公布了世界最大 AI Agent 生态系统：现在，已经有十万家企业通过 Copilot Studio 创建智能体了。

诺奖得主哈萨比斯新作登Nature，AlphaQubit解码出更可靠量子计算机

今天凌晨，新晋诺贝尔化学奖得主、DeepMind 创始人哈萨比斯参与撰写的新论文登上了 Nature，主题是如何更准确地识别并纠正量子计算机内部的错误。我们知道，量子计算机有潜力彻底改变药物发现、材料设计和基础物理学。不过前提是：我们得让它们可靠地工作。

神级项目训练GPT-2仅需5分钟，Andrej Karpathy都点赞

租用 H100 的钱只需 233 美元。还记得 Andrej Karpathy 纯 C 语言复现 GPT-2 大模型的项目吗？今年 4 月，AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」曾经引发机器学习社区的热烈讨论。

NeurIPS 2024 | 水印与高效推理如何两全其美？最新理论：这做不到

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。