AI
力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10
终于,谷歌DeepMind坐不住了,出手就是超越DeepSeek-R1! 劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。 同时,稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking,已在Gemini App中推出。
谷歌放弃AI武器禁令——这对AI的未来意味着什么
谷歌已取消其长期以来禁止使用AI制造武器和监控系统的禁令,这标志着谷歌在AI开发方面的道德立场发生了重大转变。 前员工和行业专家表示,此举可能会改变硅谷对AI安全性的看法。 这一变化于本周悄然实施,消除了谷歌AI原则中明确禁止公司开发用于武器或监控的AI的关键部分。
英特尔开源RAG Foundry 框架,可增强多种RAG用例
英特尔实验室的研究人员开源了RAG Foundry,这是一个专门用于开发、增强大模型RAG框架。 Foundry很高的灵活性和扩展性,支持设计和实验各种RAG用例,这包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。 例如,开发人员通过RAG Foundry可以选择不同的检索算法和工具,以获取与问题相关的外部信息,基本上可以实现一站式开发RAG。
为什么大语言模型难以处理长上下文?从 Transformer 到 Mamba
OpenAI 在两年前推出 ChatGPT 时,其能够处理的上下文信息仅有 8,192 个 tokens1。 换言之,如果输入的文本超过大约 15 页,它就会“遗忘”最初的上下文内容。 这一限制使得 ChatGPT 在处理任务时的规模和复杂度都受到了影响。
在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)
概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。
AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路
本文作者为北京邮电大学网络空间安全学院硕士研究生倪睿康,指导老师为肖达副教授。 主要研究方向包括自然语言处理、模型可解释性。 该工作为倪睿康在彩云科技实习期间完成。
AI for ADC,ADC for AI,F5 助力企业开启 AI 应用新时代
生成式 AI 技术的迅猛发展正引领着数字世界的变革,AI 原生应用也将随之兴起,为企业和个人带来了前所未有的便捷与高效。 然而,如何保障数据安全、实现应用高效交付以及确保 API 接口的稳定性和安全性成为亟待解决的问题。 在此背景下,F5 凭借其深厚的技术积累和创新精神,提出了“AI for ADC,ADC for AI”战略。
数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明
数学世界充满了无法触及的角落,那里存在着许许多多无法解决的问题。 现在,又一个角落被照亮了。 1900 年,著名数学家大卫・希尔伯特(David Hilbert)公布了一份清单,其中包含 23 个关键问题,并希望以此指导下个世纪的数学研究。
AI编程L1-L5超全分级来了!GitHub Copilot仅L1,Devin是L4
AI恰似一把神奇的钥匙,悄然开启了编程领域的全新大门。 从代码补全到项目级自动化,AI的角色从「助手」转变为「工程师」,甚至是「开发团队」,极大地改变了软件开发的传统格局。 借鉴自动驾驶的术语,AI编程工具可以划分为L1到L5五个等级。
专家:人类智商测试并不适用于 AI
在最近的一次公开活动中,人工智能公司 OpenAI 的首席执行官萨姆・阿尔特曼(Sam Altman)表示,他观察到人工智能的“智商”在过去几年中迅速提升。许多专家认为,智商并不是衡量模型能力的合适指标,甚至具有误导性。
英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首
DeepSeek给美国造成的威胁,还在加剧。 就在昨天,DeepSeek的日活数已经达到ChatGPT的23%,每日应用下载量接近500万! a16z联创Marc Andreessen发文谁能想到,做出DeepSeek关键贡献的人才,本来是可能留在美国的。
训练成本不到 50 美元,研究人员打造出媲美 OpenAI o1 的推理模型
一份上周五发布的研究报告显示,斯坦福大学和华盛顿大学的人工智能研究人员仅花费不到 50 美元(IT之家备注:当前约 364 元人民币)的云计算费用,就成功训练出一个具备“推理”能力的人工智能模型。
Prompt的道与术,Prompt 究竟是如何发挥作用的?它又将引领我们走向何方?
本文深入探讨了提示词的本质、应用及编写技巧。 从将提示词定义为表达,到发现其可作为与存在主体交流的 “宇宙语”,作者分享了诸多独特见解。 通过四象限法则,详细阐述了不同情况下编写提示词的要点。
OpenAI 的最新 Deep Research,知多少?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景最新突破 - 构建高效、灵活的创新的 AI Agent - Deep Research 。 众所周知,以 Google 及 OpenAI 持续引领着人工智能代理的发展,并将其推向新的高度。 AI Agents 作为下一代人工智能工具,具备在数字环境中自主行动的能力,其潜在价值远超我们目前所熟知的问答式聊天机器人。
谷歌 Gemini 2.0 Flash 系列 AI 模型登场,编程和推理性能迈上新台阶
谷歌公司昨日(2 月 5 日)发布博文,邀请所有 Gemini 应用用户,访问最新 Gemini 2.0 Flash 应用模型,并放开 2.0 Flash Thinking 推理实验模型。
光中介层可能在 2025 年开始加速 AI
编辑丨toileter光纤电缆正在逐渐靠近高性能计算机中的处理器,用玻璃取代铜连接。 科技公司希望通过将光学连接从服务器外部移动到主板上,然后让它们与处理器并排放置,从而加速 AI 并降低其能源成本。 现在,科技公司准备在寻求成倍增加处理器潜力的道路上走得更远——通过滑入处理器下面的连接。
Anthropic 推“宪法分类器”,可大幅降低 Claude 越狱率
为解决人工智能工具中存在的滥用自然语言提示问题,OpenAI 的竞争对手 Anthropic 推出了一个名为“宪法分类器(constitutional classifiers)”的新概念,这是一种将一套类似人类价值观(实际上就是一部“宪法”)植入大型语言模型的方法。
Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征
Chirpy3D框架可以将细粒度的2D图像理解提升至3D生成的全新境界。 当前的3D生成方法往往只关注于重构简单的对象,缺乏细致的特征和创造性。 Chirpy3D通过结合多视角扩散模型和连续的部件潜在空间,能够生成全新且合理的3D鸟类模型。