AI在线 AI在线

理论

红队必看:生成式AI安全的八大实战教训

随着ChatGPT和DeepSeek应用的野火燎原,生成式AI(GenAI)安全威胁已从理论风险迅速演变为迫在眉睫的全球性威胁。 微软AI红队(AIRT)近日分享了其过去六年中对100余个生成式AI产品进行的深度红队测试,覆盖文本、图像、视频多模态模型及Copilot等集成系统。 这些实战经验揭示了AI系统在安全与伦理上的共性漏洞,也颠覆了传统攻防思维。
2/6/2025 3:16:19 PM
GoUpSec

OpenAI推出新人工智能代理Deep Research

上个月,DeepSeek改写了人工智能的剧本,这促使整个行业坐下来关注。 一些科技巨头被迫重新思考他们的游戏,因为旧的战术可能会在这个快速变化的环境中削弱自己。 OpenAI是人工智能领域的关键参与者,对DeepSeek的挑战做出了回应,承诺“提供更好的模型”并加快产品发布。
2/6/2025 3:07:27 PM
AI情报室

2025年CIO应将AI投资押注于何处

回望2024年,我们或许会发现,这是大型语言模型(LLM)成为主流的一年,每个企业级SaaS都增加了协作助手或虚拟助手功能,许多企业也首次尝到了代理式AI的滋味。 CIO们获得了可观的预算,用于利用GenAI提高生产力、节约成本并增强竞争优势。 据沃顿商学院的AI报告显示,2024年企业对GenAI的投资相比2023年增长了2.3倍,但预测未来两到五年的增幅将有所降低。
2/6/2025 2:55:45 PM
Isaac Sacolick

企业如何平衡GenAI采用的成本与机遇

GenAI正在重塑企业的运营方式,为提高效率、简化运营、革新客户服务和增强决策能力提供了前所未有的机遇,然而,伴随着其带来的巨大回报承诺的,还有巨大的成本,以及往往并不明确的投资回报率。 对于负责管理IT预算同时推动技术创新的CIO而言,平衡GenAI的成本与收益至关重要。 本文将探讨采用GenAI所面临的与成本相关的障碍,包括高昂的实施费用、低效的成本管理以及基础设施需求。
2/6/2025 2:52:41 PM
Mona Liddell

百位专家联名警告:AI或将体验痛苦!Hinton、Bengio掀AI意识大论战

如果AI系统实现意识,可能会遭受痛苦? 最近,一百多位AI从业者、实践者和思想家发出了一封公开信。 他们呼吁:要对AI意识进行负责任的研究,否则如果AI实现了意识,可能就会「遭受痛苦」。
2/6/2025 2:35:39 PM
新智元

16张H100训26分钟,超越o1-preview!李飞飞等用1K样本,揭秘测试时Scaling

OpenAI o系列模型为何性能如此强大? OpenAI将他们的方法描述为使用大规模强化学习(RL),暗示使用了大量的数据。 最近大火的DeepSeek-R1模型也通过使用数百万个样本和多个训练阶段使用强化学习的方式,成功地达到了o1级别的性能。
2/6/2025 2:28:16 PM
新智元

Nature报导:研究人员如何使用 AI?科学领域利弊调查分析

编辑 | matrix人工智能正在重塑科研领域。 根据出版公司 Wiley 最新发布的一项大规模调查显示,研究人员普遍认为在未来两年内,AI 工具将在学术研究和出版领域获得广泛接受。 这项调查涵盖了来自 70 多个国家的近 5000 名研究人员,深入探讨了他们对生成式 AI 工具的使用现状和未来展望。
2/6/2025 2:04:00 PM
ScienceAI

【RAG】RAG范式演进及Agentic-RAG总结综述

RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前,系统先从外部数据源(如数据库、API或互联网)动态检索相关上下文,再结合LLM的知识生成更精准、实时的响应。 但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。 rag三大组件检索器(Retriever):从外部数据源(如向量数据库、知识图谱或网页)中搜索与查询相关的信息。
2/6/2025 1:50:06 PM
余俊晖

​对标DeepSeek,Gemini 2.0轻量模型开卷“极致性价比”!谷歌守住多模态阵地,油管、地图应用们都要开始做推理了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek的火热,让Google坐不住了! 深夜,Google推出了Gemini 2.0全家桶,一口气推出了三个模型型号:Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。 图片看技术报告,2.0系列的三个模型在通用、代码、推理、事实性、多语言等方面指标如下。
2/6/2025 1:13:07 PM
伊风

力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10

终于,谷歌DeepMind坐不住了,出手就是超越DeepSeek-R1! 劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。 同时,稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking,已在Gemini App中推出。
2/6/2025 12:10:00 PM
量子位

LLM自主发现发表在Nature上的科学假设?ICLR 2025 论文MOOSE-Chem深度解析

编辑 | ScienceAI人工智能的下一个前沿,不仅是语言、图像,而是科学发现本身。 近年来,人工智能(AI)已经在自然语言处理(NLP)、计算机视觉(CV)等领域取得巨大成功。 但 AI 是否能够帮助科学家发现新的科学理论?
2/6/2025 11:58:00 AM
ScienceAI

零样本 | ZeroDiff:扩散模型助力零样本学习,打破数据限制,实现高效泛化

一眼概览ZeroDiff 提出了一种基于扩散模型的生成式零样本学习(ZSL)方法,提升数据利用效率,实现类别级和实例级的增强。 在多个ZSL基准数据集上,ZeroDiff 取得了显著的性能提升,特别是在数据稀缺情况下仍保持稳健。 核心问题零样本学习(ZSL)试图在无训练样本的情况下识别新类别,主要依赖于已知类别的语义信息。
2/6/2025 11:25:50 AM
萍哥学AI

谷歌放弃AI武器禁令——这对AI的未来意味着什么

谷歌已取消其长期以来禁止使用AI制造武器和监控系统的禁令,这标志着谷歌在AI开发方面的道德立场发生了重大转变。 前员工和行业专家表示,此举可能会改变硅谷对AI安全性的看法。 这一变化于本周悄然实施,消除了谷歌AI原则中明确禁止公司开发用于武器或监控的AI的关键部分。
2/6/2025 11:25:06 AM
D1net编译

英特尔开源RAG Foundry 框架,可增强多种RAG用例

英特尔实验室的研究人员开源了RAG Foundry,这是一个专门用于开发、增强大模型RAG框架。 Foundry很高的灵活性和扩展性,支持设计和实验各种RAG用例,这包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。 例如,开发人员通过RAG Foundry可以选择不同的检索算法和工具,以获取与问题相关的外部信息,基本上可以实现一站式开发RAG。
2/6/2025 11:20:00 AM
AIGC开放社区

终结谷歌搜索!OpenAI免费开放ChatGPT搜索,无需注册

今天凌晨3点,OpenAI宣布向所有用户开放ChatGPT搜索功能,无需注册。 与谷歌那种传统收录模式的搜索引擎相比,ChatGPT搜索可以更快抓取网络信息,能实现分钟级别的解析,这对于股票、体育、财经等,需要第一时间快速获取新闻内容的行业帮助非常大。 同时借助大模型的能力,可以更好地解读用户的搜索想法,并且可以提供搜索结果的源地址。
2/6/2025 11:00:00 AM
AIGC开放社区

充分发挥人工智能代理(AI Agents)的能力,以此实现DevOps和云的无缝衔接​

在当今数字化时代,人工智能代理正在成为推动DevOps和云交付成功的关键力量。 本文将深入探讨如何在DevOps和云环境中有效运用人工智能技术。 随着人工智能的迅猛发展,企业迎来了前所未有的机遇,企业能够以更高效、更具创造力的方式优化业务流程。
2/6/2025 10:45:43 AM

小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像

DynamicFace是一种新颖的面部视频交换方法,旨在生成高质量且一致的视频面部图像。 该方法结合了扩散模型的强大能力和可插拔的时间层,以解决传统面部交换技术面临的两个主要挑战:在保持源面部身份的同时,准确传递目标面部的运动信息。 通过引入四种细粒度的面部条件,DynamicFace能够对面部特征进行更精确的控制,从而实现高保真度的面部交换。
2/6/2025 10:45:00 AM
AIGC Studio

Figure与OpenAI解除合作!人形机器人迎来iPhone时刻,AGI已在内部实现?

刚刚,爆火出圈人形机器人Figure与OpenAI终止合作了! 创始人Brett Adcock称,我们已经在端到端AI上取得了重大突破,且完全由内部团队独立研发。 「未来一个月,我们将会展示前所未有的机器人技术」。
2/6/2025 10:25:00 AM
新智元