AI

力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10

终于,谷歌DeepMind坐不住了,出手就是超越DeepSeek-R1! 劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。 同时,稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking,已在Gemini App中推出。

谷歌放弃AI武器禁令——这对AI的未来意味着什么

谷歌已取消其长期以来禁止使用AI制造武器和监控系统的禁令,这标志着谷歌在AI开发方面的道德立场发生了重大转变。 前员工和行业专家表示,此举可能会改变硅谷对AI安全性的看法。 这一变化于本周悄然实施,消除了谷歌AI原则中明确禁止公司开发用于武器或监控的AI的关键部分。

英特尔开源RAG Foundry 框架,可增强多种RAG用例

英特尔实验室的研究人员开源了RAG Foundry,这是一个专门用于开发、增强大模型RAG框架。 Foundry很高的灵活性和扩展性,支持设计和实验各种RAG用例,这包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。 例如,开发人员通过RAG Foundry可以选择不同的检索算法和工具,以获取与问题相关的外部信息,基本上可以实现一站式开发RAG。

为什么大语言模型难以处理长上下文?从 Transformer 到 Mamba

OpenAI 在两年前推出 ChatGPT 时,其能够处理的上下文信息仅有 8,192 个 tokens1。 换言之,如果输入的文本超过大约 15 页,它就会“遗忘”最初的上下文内容。 这一限制使得 ChatGPT 在处理任务时的规模和复杂度都受到了影响。

在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)

概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。

AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

本文作者为北京邮电大学网络空间安全学院硕士研究生倪睿康,指导老师为肖达副教授。 主要研究方向包括自然语言处理、模型可解释性。 该工作为倪睿康在彩云科技实习期间完成。

AI for ADC,ADC for AI,F5 助力企业开启 AI 应用新时代​

生成式 AI 技术的迅猛发展正引领着数字世界的变革,AI 原生应用也将随之兴起,为企业和个人带来了前所未有的便捷与高效。 然而,如何保障数据安全、实现应用高效交付以及确保 API 接口的稳定性和安全性成为亟待解决的问题。 在此背景下,F5 凭借其深厚的技术积累和创新精神,提出了“AI for ADC,ADC for AI”战略。

数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明

数学世界充满了无法触及的角落,那里存在着许许多多无法解决的问题。 现在,又一个角落被照亮了。 1900 年,著名数学家大卫・希尔伯特(David Hilbert)公布了一份清单,其中包含 23 个关键问题,并希望以此指导下个世纪的数学研究。

AI编程L1-L5超全分级来了!GitHub Copilot仅L1,Devin是L4

AI恰似一把神奇的钥匙,悄然开启了编程领域的全新大门。 从代码补全到项目级自动化,AI的角色从「助手」转变为「工程师」,甚至是「开发团队」,极大地改变了软件开发的传统格局。 借鉴自动驾驶的术语,AI编程工具可以划分为L1到L5五个等级。

专家:人类智商测试并不适用于 AI

在最近的一次公开活动中,人工智能公司 OpenAI 的首席执行官萨姆・阿尔特曼(Sam Altman)表示,他观察到人工智能的“智商”在过去几年中迅速提升。许多专家认为,智商并不是衡量模型能力的合适指标,甚至具有误导性。

英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首

DeepSeek给美国造成的威胁,还在加剧。 就在昨天,DeepSeek的日活数已经达到ChatGPT的23%,每日应用下载量接近500万! a16z联创Marc Andreessen发文谁能想到,做出DeepSeek关键贡献的人才,本来是可能留在美国的。

训练成本不到 50 美元,研究人员打造出媲美 OpenAI o1 的推理模型

一份上周五发布的研究报告显示,斯坦福大学和华盛顿大学的人工智能研究人员仅花费不到 50 美元(IT之家备注:当前约 364 元人民币)的云计算费用,就成功训练出一个具备“推理”能力的人工智能模型。

Prompt的道与术,Prompt 究竟是如何发挥作用的?它又将引领我们走向何方?

本文深入探讨了提示词的本质、应用及编写技巧。 从将提示词定义为表达,到发现其可作为与存在主体交流的 “宇宙语”,作者分享了诸多独特见解。 通过四象限法则,详细阐述了不同情况下编写提示词的要点。

OpenAI 的最新 Deep Research,知多少?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景最新突破 - 构建高效、灵活的创新的 AI Agent - Deep Research 。 众所周知,以 Google 及 OpenAI 持续引领着人工智能代理的发展,并将其推向新的高度。 AI Agents 作为下一代人工智能工具,具备在数字环境中自主行动的能力,其潜在价值远超我们目前所熟知的问答式聊天机器人。

谷歌 Gemini 2.0 Flash 系列 AI 模型登场,编程和推理性能迈上新台阶

谷歌公司昨日(2 月 5 日)发布博文,邀请所有 Gemini 应用用户,访问最新 Gemini 2.0 Flash 应用模型,并放开 2.0 Flash Thinking 推理实验模型。

光中介层可能在 2025 年开始加速 AI

编辑丨toileter光纤电缆正在逐渐靠近高性能计算机中的处理器,用玻璃取代铜连接。 科技公司希望通过将光学连接从服务器外部移动到主板上,然后让它们与处理器并排放置,从而加速 AI 并降低其能源成本。 现在,科技公司准备在寻求成倍增加处理器潜力的道路上走得更远——通过滑入处理器下面的连接。

Anthropic 推“宪法分类器”,可大幅降低 Claude 越狱率

为解决人工智能工具中存在的滥用自然语言提示问题,OpenAI 的竞争对手 Anthropic 推出了一个名为“宪法分类器(constitutional classifiers)”的新概念,这是一种将一套类似人类价值观(实际上就是一部“宪法”)植入大型语言模型的方法。

Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征

Chirpy3D框架可以将细粒度的2D图像理解提升至3D生成的全新境界。 当前的3D生成方法往往只关注于重构简单的对象,缺乏细致的特征和创造性。 Chirpy3D通过结合多视角扩散模型和连续的部件潜在空间,能够生成全新且合理的3D鸟类模型。