理论
Nature报导:研究人员如何使用 AI?科学领域利弊调查分析
编辑 | matrix人工智能正在重塑科研领域。 根据出版公司 Wiley 最新发布的一项大规模调查显示,研究人员普遍认为在未来两年内,AI 工具将在学术研究和出版领域获得广泛接受。 这项调查涵盖了来自 70 多个国家的近 5000 名研究人员,深入探讨了他们对生成式 AI 工具的使用现状和未来展望。
【RAG】RAG范式演进及Agentic-RAG总结综述
RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前,系统先从外部数据源(如数据库、API或互联网)动态检索相关上下文,再结合LLM的知识生成更精准、实时的响应。 但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。 rag三大组件检索器(Retriever):从外部数据源(如向量数据库、知识图谱或网页)中搜索与查询相关的信息。
对标DeepSeek,Gemini 2.0轻量模型开卷“极致性价比”!谷歌守住多模态阵地,油管、地图应用们都要开始做推理了!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek的火热,让Google坐不住了! 深夜,Google推出了Gemini 2.0全家桶,一口气推出了三个模型型号:Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。 图片看技术报告,2.0系列的三个模型在通用、代码、推理、事实性、多语言等方面指标如下。
力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10
终于,谷歌DeepMind坐不住了,出手就是超越DeepSeek-R1! 劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。 同时,稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking,已在Gemini App中推出。
LLM自主发现发表在Nature上的科学假设?ICLR 2025 论文MOOSE-Chem深度解析
编辑 | ScienceAI人工智能的下一个前沿,不仅是语言、图像,而是科学发现本身。 近年来,人工智能(AI)已经在自然语言处理(NLP)、计算机视觉(CV)等领域取得巨大成功。 但 AI 是否能够帮助科学家发现新的科学理论?
零样本 | ZeroDiff:扩散模型助力零样本学习,打破数据限制,实现高效泛化
一眼概览ZeroDiff 提出了一种基于扩散模型的生成式零样本学习(ZSL)方法,提升数据利用效率,实现类别级和实例级的增强。 在多个ZSL基准数据集上,ZeroDiff 取得了显著的性能提升,特别是在数据稀缺情况下仍保持稳健。 核心问题零样本学习(ZSL)试图在无训练样本的情况下识别新类别,主要依赖于已知类别的语义信息。
谷歌放弃AI武器禁令——这对AI的未来意味着什么
谷歌已取消其长期以来禁止使用AI制造武器和监控系统的禁令,这标志着谷歌在AI开发方面的道德立场发生了重大转变。 前员工和行业专家表示,此举可能会改变硅谷对AI安全性的看法。 这一变化于本周悄然实施,消除了谷歌AI原则中明确禁止公司开发用于武器或监控的AI的关键部分。
英特尔开源RAG Foundry 框架,可增强多种RAG用例
英特尔实验室的研究人员开源了RAG Foundry,这是一个专门用于开发、增强大模型RAG框架。 Foundry很高的灵活性和扩展性,支持设计和实验各种RAG用例,这包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。 例如,开发人员通过RAG Foundry可以选择不同的检索算法和工具,以获取与问题相关的外部信息,基本上可以实现一站式开发RAG。
终结谷歌搜索!OpenAI免费开放ChatGPT搜索,无需注册
今天凌晨3点,OpenAI宣布向所有用户开放ChatGPT搜索功能,无需注册。 与谷歌那种传统收录模式的搜索引擎相比,ChatGPT搜索可以更快抓取网络信息,能实现分钟级别的解析,这对于股票、体育、财经等,需要第一时间快速获取新闻内容的行业帮助非常大。 同时借助大模型的能力,可以更好地解读用户的搜索想法,并且可以提供搜索结果的源地址。
充分发挥人工智能代理(AI Agents)的能力,以此实现DevOps和云的无缝衔接
在当今数字化时代,人工智能代理正在成为推动DevOps和云交付成功的关键力量。 本文将深入探讨如何在DevOps和云环境中有效运用人工智能技术。 随着人工智能的迅猛发展,企业迎来了前所未有的机遇,企业能够以更高效、更具创造力的方式优化业务流程。
小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像
DynamicFace是一种新颖的面部视频交换方法,旨在生成高质量且一致的视频面部图像。 该方法结合了扩散模型的强大能力和可插拔的时间层,以解决传统面部交换技术面临的两个主要挑战:在保持源面部身份的同时,准确传递目标面部的运动信息。 通过引入四种细粒度的面部条件,DynamicFace能够对面部特征进行更精确的控制,从而实现高保真度的面部交换。
Figure与OpenAI解除合作!人形机器人迎来iPhone时刻,AGI已在内部实现?
刚刚,爆火出圈人形机器人Figure与OpenAI终止合作了! 创始人Brett Adcock称,我们已经在端到端AI上取得了重大突破,且完全由内部团队独立研发。 「未来一个月,我们将会展示前所未有的机器人技术」。
为什么大语言模型难以处理长上下文?从 Transformer 到 Mamba
OpenAI 在两年前推出 ChatGPT 时,其能够处理的上下文信息仅有 8,192 个 tokens1。 换言之,如果输入的文本超过大约 15 页,它就会“遗忘”最初的上下文内容。 这一限制使得 ChatGPT 在处理任务时的规模和复杂度都受到了影响。
在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)
概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。
AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路
本文作者为北京邮电大学网络空间安全学院硕士研究生倪睿康,指导老师为肖达副教授。 主要研究方向包括自然语言处理、模型可解释性。 该工作为倪睿康在彩云科技实习期间完成。
AI for ADC,ADC for AI,F5 助力企业开启 AI 应用新时代
生成式 AI 技术的迅猛发展正引领着数字世界的变革,AI 原生应用也将随之兴起,为企业和个人带来了前所未有的便捷与高效。 然而,如何保障数据安全、实现应用高效交付以及确保 API 接口的稳定性和安全性成为亟待解决的问题。 在此背景下,F5 凭借其深厚的技术积累和创新精神,提出了“AI for ADC,ADC for AI”战略。
谷歌反击,最强Gemini 2.0全家桶砸场DeepSeek!物理模拟编码惊人Jeff Dean站台
满血版Gemini 2.0终于来了。 刚刚,谷歌一口气连发三款模型:Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite,2.0家族集结完毕。 最强Pro版本支持2M上下文,配备了谷歌搜索、代码执行能力,编码推理性能完全碾压1.5 Pro。
数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明
数学世界充满了无法触及的角落,那里存在着许许多多无法解决的问题。 现在,又一个角落被照亮了。 1900 年,著名数学家大卫・希尔伯特(David Hilbert)公布了一份清单,其中包含 23 个关键问题,并希望以此指导下个世纪的数学研究。