理论

红队必看：生成式AI安全的八大实战教训

随着ChatGPT和DeepSeek应用的野火燎原，生成式AI（GenAI）安全威胁已从理论风险迅速演变为迫在眉睫的全球性威胁。微软AI红队（AIRT）近日分享了其过去六年中对100余个生成式AI产品进行的深度红队测试，覆盖文本、图像、视频多模态模型及Copilot等集成系统。这些实战经验揭示了AI系统在安全与伦理上的共性漏洞，也颠覆了传统攻防思维。

2/6/2025 3:16:19 PM

GoUpSec

OpenAI推出新人工智能代理Deep Research

上个月，DeepSeek改写了人工智能的剧本，这促使整个行业坐下来关注。一些科技巨头被迫重新思考他们的游戏，因为旧的战术可能会在这个快速变化的环境中削弱自己。 OpenAI是人工智能领域的关键参与者，对DeepSeek的挑战做出了回应，承诺“提供更好的模型”并加快产品发布。

2/6/2025 3:07:27 PM

AI情报室

2025年CIO应将AI投资押注于何处

回望2024年，我们或许会发现，这是大型语言模型(LLM)成为主流的一年，每个企业级SaaS都增加了协作助手或虚拟助手功能，许多企业也首次尝到了代理式AI的滋味。 CIO们获得了可观的预算，用于利用GenAI提高生产力、节约成本并增强竞争优势。据沃顿商学院的AI报告显示，2024年企业对GenAI的投资相比2023年增长了2.3倍，但预测未来两到五年的增幅将有所降低。

2/6/2025 2:55:45 PM

Isaac Sacolick

企业如何平衡GenAI采用的成本与机遇

GenAI正在重塑企业的运营方式，为提高效率、简化运营、革新客户服务和增强决策能力提供了前所未有的机遇，然而，伴随着其带来的巨大回报承诺的，还有巨大的成本，以及往往并不明确的投资回报率。对于负责管理IT预算同时推动技术创新的CIO而言，平衡GenAI的成本与收益至关重要。本文将探讨采用GenAI所面临的与成本相关的障碍，包括高昂的实施费用、低效的成本管理以及基础设施需求。

2/6/2025 2:52:41 PM

Mona Liddell

百位专家联名警告：AI或将体验痛苦！Hinton、Bengio掀AI意识大论战

如果AI系统实现意识，可能会遭受痛苦？最近，一百多位AI从业者、实践者和思想家发出了一封公开信。他们呼吁：要对AI意识进行负责任的研究，否则如果AI实现了意识，可能就会「遭受痛苦」。

2/6/2025 2:35:39 PM

新智元

16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

OpenAI o系列模型为何性能如此强大？ OpenAI将他们的方法描述为使用大规模强化学习（RL），暗示使用了大量的数据。最近大火的DeepSeek-R1模型也通过使用数百万个样本和多个训练阶段使用强化学习的方式，成功地达到了o1级别的性能。

2/6/2025 2:28:16 PM

新智元

Nature报导：研究人员如何使用 AI？科学领域利弊调查分析

编辑 | matrix人工智能正在重塑科研领域。根据出版公司 Wiley 最新发布的一项大规模调查显示，研究人员普遍认为在未来两年内，AI 工具将在学术研究和出版领域获得广泛接受。这项调查涵盖了来自 70 多个国家的近 5000 名研究人员，深入探讨了他们对生成式 AI 工具的使用现状和未来展望。

2/6/2025 2:04:00 PM

ScienceAI

【RAG】RAG范式演进及Agentic-RAG总结综述

RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前，系统先从外部数据源（如数据库、API或互联网）动态检索相关上下文，再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。 rag三大组件检索器（Retriever）：从外部数据源（如向量数据库、知识图谱或网页）中搜索与查询相关的信息。

2/6/2025 1:50:06 PM

余俊晖

对标DeepSeek，Gemini 2.0轻量模型开卷“极致性价比”！谷歌守住多模态阵地，油管、地图应用们都要开始做推理了！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）DeepSeek的火热，让Google坐不住了！深夜，Google推出了Gemini 2.0全家桶，一口气推出了三个模型型号：Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。图片看技术报告，2.0系列的三个模型在通用、代码、推理、事实性、多语言等方面指标如下。

2/6/2025 1:13:07 PM

伊风

力压DeepSeek-R1！谷歌Gemini 2.0系列集体上新，全员跻身大模型竞技场前10

终于，谷歌DeepMind坐不住了，出手就是超越DeepSeek-R1！劈柴哥亲自官宣Gemini 2.0家族更新，分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。同时，稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking，已在Gemini App中推出。

2/6/2025 12:10:00 PM

量子位

LLM自主发现发表在Nature上的科学假设？ICLR 2025 论文MOOSE-Chem深度解析

编辑 | ScienceAI人工智能的下一个前沿，不仅是语言、图像，而是科学发现本身。近年来，人工智能（AI）已经在自然语言处理（NLP）、计算机视觉（CV）等领域取得巨大成功。但 AI 是否能够帮助科学家发现新的科学理论？

2/6/2025 11:58:00 AM

ScienceAI

零样本 | ZeroDiff：扩散模型助力零样本学习，打破数据限制，实现高效泛化

一眼概览ZeroDiff 提出了一种基于扩散模型的生成式零样本学习（ZSL）方法，提升数据利用效率，实现类别级和实例级的增强。在多个ZSL基准数据集上，ZeroDiff 取得了显著的性能提升，特别是在数据稀缺情况下仍保持稳健。核心问题零样本学习（ZSL）试图在无训练样本的情况下识别新类别，主要依赖于已知类别的语义信息。

2/6/2025 11:25:50 AM

萍哥学AI

谷歌放弃AI武器禁令——这对AI的未来意味着什么

谷歌已取消其长期以来禁止使用AI制造武器和监控系统的禁令，这标志着谷歌在AI开发方面的道德立场发生了重大转变。前员工和行业专家表示，此举可能会改变硅谷对AI安全性的看法。这一变化于本周悄然实施，消除了谷歌AI原则中明确禁止公司开发用于武器或监控的AI的关键部分。

2/6/2025 11:25:06 AM

D1net编译

英特尔开源RAG Foundry 框架，可增强多种RAG用例

英特尔实验室的研究人员开源了RAG Foundry，这是一个专门用于开发、增强大模型RAG框架。 Foundry很高的灵活性和扩展性，支持设计和实验各种RAG用例，这包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。例如，开发人员通过RAG Foundry可以选择不同的检索算法和工具，以获取与问题相关的外部信息，基本上可以实现一站式开发RAG。

2/6/2025 11:20:00 AM

AIGC开放社区

终结谷歌搜索！OpenAI免费开放ChatGPT搜索，无需注册

今天凌晨3点，OpenAI宣布向所有用户开放ChatGPT搜索功能，无需注册。与谷歌那种传统收录模式的搜索引擎相比，ChatGPT搜索可以更快抓取网络信息，能实现分钟级别的解析，这对于股票、体育、财经等，需要第一时间快速获取新闻内容的行业帮助非常大。同时借助大模型的能力，可以更好地解读用户的搜索想法，并且可以提供搜索结果的源地址。

2/6/2025 11:00:00 AM

AIGC开放社区

充分发挥人工智能代理（AI Agents）的能力，以此实现DevOps和云的无缝衔接

在当今数字化时代，人工智能代理正在成为推动DevOps和云交付成功的关键力量。本文将深入探讨如何在DevOps和云环境中有效运用人工智能技术。随着人工智能的迅猛发展，企业迎来了前所未有的机遇，企业能够以更高效、更具创造力的方式优化业务流程。

2/6/2025 10:45:43 AM

小红书提出新面部视频交换方法DynamicFace，可生成高质量且一致的视频面部图像

DynamicFace是一种新颖的面部视频交换方法，旨在生成高质量且一致的视频面部图像。该方法结合了扩散模型的强大能力和可插拔的时间层，以解决传统面部交换技术面临的两个主要挑战：在保持源面部身份的同时，准确传递目标面部的运动信息。通过引入四种细粒度的面部条件，DynamicFace能够对面部特征进行更精确的控制，从而实现高保真度的面部交换。

2/6/2025 10:45:00 AM

AIGC Studio

Figure与OpenAI解除合作！人形机器人迎来iPhone时刻，AGI已在内部实现？

刚刚，爆火出圈人形机器人Figure与OpenAI终止合作了！创始人Brett Adcock称，我们已经在端到端AI上取得了重大突破，且完全由内部团队独立研发。「未来一个月，我们将会展示前所未有的机器人技术」。

2/6/2025 10:25:00 AM

新智元

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

理论