理论

小模型也能玩转RAG！性能仅降1%，存储省75%，边缘设备轻松跑

检索增强生成（RAG）虽好，但一直面临着资源消耗大、部署复杂等技术壁垒。近日，香港大学黄超教授团队提出MiniRAG，成功将RAG技术的应用门槛降至1.5B参数规模，实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力，更开启了基于小模型轻量级RAG的探索。

1/23/2025 5:00:00 PM

量子位

推理模型规划任务成功率从5%到95%，DeepMind遗传算法新研究火了

瞄准推理时扩展（Inference-time scaling），DeepMind新的进化搜索策略火了！所提出的“Mind Evolution”（思维进化），能够优化大语言模型（LLMs）在规划和推理中的响应。由于提升显著，Reddit/𝕏一时间出现了大量讨论：由于结合了遗传算法，使用Mind Evolution能让Gemini 1.5 Flash任务成功率从原本的5%左右，一下提升90个百分点。

1/23/2025 4:25:23 PM

量子位

FastRAG：半结构化数据的检索增强生成

本文介绍了FastRAG，一种针对半结构化数据的新型RAG方法。 FastRAG采用模式学习和脚本学习来提取和结构化数据，而无需将整个数据源提交给LLM。它将文本搜索与知识图谱（KG）查询相结合，以提高在问答任务中检索上下文丰富信息的准确性。

1/23/2025 4:23:30 PM

OpenAI微软关系现裂痕，奥特曼紧急公关，导火索竟是DeepMind联创

一个5000亿美元的大动作，让微软不再是OpenAI独家云计算供应商了。在OpenAI与甲骨文牵手组建数据中心那一刻起，网友们纷纷看向这个计划之外的微软：他们两个之间的关系约莫是出现裂痕了。结果奥特曼紧急公关，不是你听我解释，这是形势所迫，为算力折腰啊啊。

1/23/2025 4:22:56 PM

量子位

Meta-Chunking: 通过逻辑感知学习高效的文本分段

本文是由人大提出的，旨在解决在检索增强生成（RAG）系统中，文本分段这一关键方面被忽视的问题。具体来说，传统文本分段方法（如基于规则或语义相似性）在捕捉句子间深层语言逻辑联系方面存在不足，导致在知识密集型任务（如开放域问答）中的性能受到影响。本文通过引入Meta-Chunking的概念及其两种实现策略（边际采样分段和困惑度分段），解决了以下几个关键问题：逻辑连贯性问题：问题：传统文本分段方法往往基于规则或语义相似性，难以捕捉句子间的深层逻辑联系（如因果、过渡、并行和渐进关系）。

1/23/2025 4:13:35 PM

DeepSeek新AI模型有多震撼？外媒：相当于30美元iPhone降临

DeepSeek（深度求索）再次推出新版开源AI模型，它的性能与美国最先进的AI模型虽然还有一些差距，但差距极小，成本低很多很多。西方许多人认为，美国限制中国AI发展的企图遇挫，中国正在加速前进，以更高效率打造高端AI模型。去年12月，杭州幻方量化推出DeepSeekV3开源大语言模型，它的性能与OpenAI 40和Anthropic Claude 3.5 .

1/23/2025 3:58:02 PM

小刀

OpenAI新研究：o1增加推理时间就能防攻击，网友：DeepSeek也受益

OpenAI的新Scaling Law，含金量又提高了。像o1这样的推理模型，随着思考时间的延长，面对对抗性攻击会变得更加稳健。图片随着大语言模型被越来越多地赋予Agent能力，执行现实世界的任务，模型被对抗攻击的风险也与日俱增。

1/23/2025 2:53:15 PM

字节要亲手打造AGI了！神秘“Seed Edge”项目被曝光，已设置5大研究方向，探索下一代AI技术，算力不用愁！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）中国大厂开始发力AGI了！据媒体报道，字节跳动 AGI 研究团队浮出水面，揭开了字节AGI的秘密布局！报道称：1 月下旬，字节正式设立代号为“Seed Edge”的研究项目，核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究。

1/23/2025 2:02:14 PM

伊风

字节清华开源力作！UI-TARS原生AI智能体，人人都能拥有“智能助手”

年底国内各个AI玩家杀疯了，前两天完全开源的Deepseek R1 震撼整个AI业界，今天字节又联合清华整活，一个强大的原生的开源 AI Agent UI-TARS震撼上线看了UI-TARS的论文，我给大家划划重点【纯视觉感知】：告别文本依赖，像人眼一样“看”懂GUI！传统的GUI自动化方案，很多都依赖于解析网页代码（HTML）或者软件的API接口。但这种方式有两个致命缺陷：一是平台限制，不同平台、不同软件的底层代码和API都不一样，导致自动化方案难以通用；二是容易失效，一旦网页或软件界面改版，代码或API接口变动，自动化脚本就可能直接崩溃。

1/23/2025 1:05:42 PM

AI寒武纪

刚刚，OpenAI发布o1模型新突破，推理时间增强对抗鲁棒性

今天凌晨2点，OpenAI发布了一项新技术研究，通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。与传统的对抗训练样本方法不同的是，OpenAI提出的新方法不需要对大模型进行专门的对抗训练，也不需要提前了解攻击的具体形式。只需要通过增加推理时间和算力资源，模型就可以更充分地利用其推理能力表现出更强的鲁棒性。

1/23/2025 10:45:52 AM

AIGC开放社区

NVIDIA提出虚拟试衣新方法EARSB，让时尚与科技完美融合！

在数字化浪潮席卷全球的今天，科技正以前所未有的方式融入我们的生活，包括我们追求时尚的方式。想象一下，无需亲临实体店，只需轻点屏幕，就能轻松试穿心仪的衣物，这不再是遥不可及的梦想。 NVIDIA联合波士顿大学提出了 EARSB，该模型能够智能地识别并修正初始试衣图像中的错误区域，能够针对特定错误进行精准修正，显著提升试衣效果的真实感和细节表现。

1/23/2025 10:08:00 AM

AIGC Studio

「AI没有墙超预期」Anthropic CEO达沃斯惊人预测：2027年实现超人类水平的AI

人类水平的AI或超越所有人类的AI将在两三年内到来,从内部来看，AI的发展没有遇到墙反而超预期 --Anthropic CEO Dario Amodei华尔街日报在达沃斯世界经济论坛对 Anthropic 首席执行官 Dario Amodei 的最新采访。采访内容主要围绕 Anthropic 的 AI 模型 Claude 的未来发展方向、AI 技术的进步速度及其对社会和劳动力市场的影响、以及 Anthropic 在行业竞争和政策监管方面的策略以下结合采访内容给大家划个重点Claude 的未来发展方向网络访问 (Web Access): Anthropic 正在积极开发 Claude 的网络访问功能，预计很快推出。尽管企业用户是 Anthropic 的重点，但他们也认识到网络访问对于消费者和高级用户的重要性。

1/23/2025 9:37:00 AM

AI寒武纪

20K合成数据就能让大模型能力飙升！还能实现模型自我迭代，上海AI Lab数据合成新范式

仅使用20K合成数据，就能让Qwen模型能力飙升——模型主观对话能力显著提升，还能实现模型自我迭代。最近，来自上海AI Lab的研究团队针对合成数据技术展开研究，提出了SFT数据合成引擎Condor，通过世界知识树（World Knowledge Tree）和自我反思（Self-Reflection）机制，探索合成海量高质量SFT数据的方案。结果，他们还意外发现，在增大合成数据量的情况下，模型性能持续提升。

1/23/2025 9:15:00 AM

量子位

Anthropic CEO惊人预警：27年AI超越人类！Claude今年更新全剧透

失踪人口终于回归了！在互联网消失一段时间后，Anthropic首席执行官Dario Amodei一上来就接受了WSJ、CNBC两家采访，连曝AI大瓜。他坚定地认为，「2027年之前，AI完全可以超越人类智能！

1/23/2025 9:00:00 AM

新智元

Claude创始人：AI全面超越人类，只剩2-3年

在最新的对话访谈当中，Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。他认为，AI确有可能在短期内替代部分人类的工作，但让AI与人类形成互补才是对生产力最有益的方式。对于当下的年轻人，Amodei也给出了他的建议，鼓励其学会使用AI工具并培养批判思维能力。

1/23/2025 8:40:00 AM

量子位

最壕DeepSeek玩家8台Mac跑R1，10万+元凑496GB显存才能跑4bit量化版

DeepSeek-R1，正在接受全球网友真金白银的检验。花30秒用manim代码制作解释勾股定理的动画，一次完成无错误。为了玩上这样的模型，有人花上10多万元，组7台M4 Pro Mac mini 1台M4 Max Macbook Pro的家用超算。

1/23/2025 8:30:00 AM

量子位

使用 SHAP 使机器学习模型变的可解释！！！

大家好，我是小寒SHAP 是一种用于解释机器学习模型预测结果的方法，它基于博弈论中的 Shapley值。旨在为每个特征分配一个“贡献值”，表明该特征对模型预测结果的影响有多大。 SHAP 为复杂的黑箱模型（如深度学习模型、集成方法等）提供了一种统一且理论上有保障的解释框架，帮助我们理解模型的决策过程，提高模型的透明度和可信度。

1/23/2025 8:23:12 AM

程序员小寒

灵敏度高达94.9%！牛津团队AI多模态ctDNA检测方法，进行癌症早期筛查

编辑 | 2049在癌症诊疗的漫长征程中，早期检测始终是最具挑战性的环节之一，液体活检技术因其无创性和高灵敏度而备受关注。然而，现有的检测方法大多依赖于深度靶向测序，难以同时整合多模态数据，导致检测灵敏度和特异性受限。正是基于这一技术痛点，牛津大学的研究团队开发了一种基于全基因组 TET 辅助吡啶硼烷测序（TAPS）的多模态循环肿瘤 DNA（ctDNA）检测方法。

1/22/2025 6:28:00 PM

ScienceAI

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型