谷歌

一台3090就能跑Gemma 3 27B！谷歌发布Gemma 3全系QAT版模型

谷歌 Gemma 3 上线刚刚过去一个月，现在又出新版本了。该版本经过量化感知训练（Quantization-Aware Training，QAT）优化，能在保持高质量的同时显著降低内存需求。比如经过 QAT 优化后，Gemma 3 27B 的 VRAM 占用量可以从 54GB 大幅降至 14.1GB，使其完全可以在 NVIDIA RTX 3090 等消费级 GPU 上本地运行！

4/20/2025 10:16:00 AM

机器之心

27B 显存需求 54 → 14.1GB：谷歌发布 Gemma 3 QAT AI 模型，RTX 3090 显卡可运行

以 int4 量化为例，Gemma 3 27B 显存需求从 54GB 锐减至 14.1GB，Gemma 3 12B 则从 24GB 降至 6.6GB；Gemma 3 1B 仅需 0.5GB 显存。

4/19/2025 9:52:27 AM

故渊

6周搞定18个月的工作量，爱彼迎不满老工具，暴力循环大模型怒迁代码，效果出奇好，怎么回事？谷歌亚马逊也做过类似的事

编辑 | 云昭Anthropic首席执行官Dario时不时就会出来发声，声称人工智能即将取代人工编码，或者抛出一个惊人的数字，预测在短短6个月内将有90%的编码工作将被AI取代。这种措辞无疑有夸大的成分，但这里想说的是，这并非空穴来风，或许6个月内AI不会取代90%的程序员，但取代90%的编程工作不无可能！因为企业接纳和适配大模型的速度远比我们想象得要快！

4/18/2025 4:05:39 PM

云昭

谷歌的“双子星”，正在围剿一众大模型

编辑 | 云昭继昨天凌晨OpenAI推出满血o3、o4-mini之后，没想到谷歌迈着“LLM王者”的步伐给出了自家的模型SOTA研究Gemini2.5 Flash。如果说o3主打的是“干实事”，那么谷歌这次的新发布则是告诉我们：什么是“成本可控”的极致性价比。这次的发布以后立马引来一众开发者的讨论，不过这次不是负面的，而是全面的好评。

4/18/2025 3:53:03 PM

云昭

谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线：性能成本双优

谷歌公司昨日（4 月 17 日）发布公告，宣布在 Google AI Studio 和 Vertex AI 中，以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。

4/18/2025 2:59:20 PM

故渊

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

4 月 14 日，谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲，主题为「AI 的重要趋势：我们是如何走到今天的，我们现在能做什么，以及我们如何塑造 AI 的未来？」在这场演讲中，Jeff Dean 首先以谷歌多年来的重要研究成果为脉络，展现了 AI 近十五年来的发展轨迹，之后又分享了 Gemini 系列模型的发展历史，最后展望了 AI 将给我们这个世界带来的积极改变。 AI在线将在本文中对 Jeff Dean 的演讲内容进行总结性梳理，其中尤其会关注演讲的第一部分，即谷歌过去这些年对 AI 领域做出的奠基性研究贡献。

4/18/2025 1:14:00 PM

机器之心

谷歌大模型“性价比之王”来了！混合推理模型，思考深度可自由控制，竞技场排名仅次于自家Pro

紧跟o4-mini，谷歌上新了Gemini 2.5 Flash preview版本。作为更注重效率的Flash，在大模型竞技场上排名并列第二，第一是自家的Gemini 2.5 Pro。这样的表现，让Gemini 2.5 Flash的性价比直接拉满。

4/18/2025 10:43:23 AM

谷歌也要“送 AI 进校园”：美国大学生可限时免费订阅 Google One AI Premium 计划

这一订阅方案不仅提供2TB云存储空间，还包含多项 AI 工具，帮助学生“更高效地学习”。其中，Gemini 2.5 Pro 驱动的 Gemini Advanced，是谷歌为对抗 ChatGPT Plus 推出的旗舰级产品。

4/18/2025 7:39:43 AM

清源

谷歌提出Transformer架构中，表示崩塌、过度压缩的五个解决方法

Transformer架构的出现极大推动了生成式AI的发展，在此基础之上开发出了ChatGPT、Copilot、讯飞星火、文心一言、Midjourney等一大批知名产品。但Transformer架构并非完美还存在不少问题，例如，在执行需要计数或复制输入序列元素的任务经常会出错。而这些操作是推理的基本组件，对于解决日常任务至关重要。

4/17/2025 9:53:49 AM

AIGC开放社区

谷歌 Gemini Live 功能全面开放，安卓用户迎来新体验

近日，谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户，通过 Gemini Advanced 订阅才能使用。然而，随着用户对 Gemini Live 功能的积极反馈，谷歌决定改变策略，推动这一功能的普及。

4/17/2025 9:01:05 AM

AI在线

AI“立功”：谷歌去年封停了 3920 万个广告账号，超 2023 年三倍

谷歌表示，借助大语言模型和通过识别诸如商业冒充、非法支付信息等信号，目前公司能够在广告投放前就暂停“大多数”广告账户。

4/17/2025 7:42:28 AM

清源

可实时识别屏幕内容，谷歌 Gemini Live 功能向所有安卓用户免费开放

谷歌宣布Gemini Live功能免费向所有安卓用户开放，可实时识别摄像头和屏幕内容并回应。此前仅限Pixel 9和Galaxy S25用户订阅使用。微软同日也推出类似AI工具Copilot Vision。#谷歌Gemini #AI工具

4/17/2025 6:57:40 AM

远洋

Claude终于能Research了！打通谷歌全家桶，工作效率10倍提升

今天凌晨，Anthropic官方推出了两个重磅新功能：Research以及与Google Workspace集成。 Anthropic称Research功能是与Claude合作的新方式。它能从多个角度分析问题，自动搜索信息，几分钟之内给出答案。

4/16/2025 1:51:29 PM

新智元

英国 AI 版权法规或导致模型偏见与创作者收益减少

近日，政策专家对的 AI 版权法规表示担忧，认为如果不提供全面的文本和数据挖掘豁免，可能会导致 AI 模型质量下降，进而影响创新。专家指出，禁止像 OpenAI、谷歌和 Meta 这样的公司在英国使用版权材料进行 AI 训练，可能会导致模型输出的偏见，从而削弱其有效性。英国政府于2024年12月开启了一项咨询，旨在探索如何在使用创意内容训练 AI 模型时保护艺术家、作家和作曲家的权益。

4/16/2025 11:01:34 AM

AI在线

谷歌 Veo 2 视频生成模型入驻 Gemini，用户可创建 8 秒 720p 视频

谷歌宣布将Veo 2视频生成AI模型引入Gemini Advanced订阅服务，用户可创作8秒720p视频并分享至社交平台。同时，Google Labs整合Veo 2推出Whisk Animate功能，静态图秒变动画。AI视频工具崛起也引发创意行业担忧。#谷歌AI##视频生成#

4/16/2025 7:31:28 AM

远洋

认识谷歌 A2A：将颠覆多智能体 AI 系统的协议

近日谷歌在 Cloud Next 25 大会上开源的 Agent2Agent（A2A）协议，无疑成为了该领域一颗耀眼的新星，引发了广泛关注和热议。这一协议被寄予厚望，有望如同一把神奇的钥匙，开启多智能体 AI 系统高效协作的全新大门，彻底改变当前人工智能应用的格局。多智能体系统协作之困多智能体系统由多个能够感知环境、自主做出决策并相互协作的智能代理构成，宛如一个庞大而复杂的智能网络。

4/16/2025 12:00:00 AM

大模型之路

谷歌发布 DolphinGemma:AI破译海豚语言：Pixel手机变身“翻译器”

谷歌近日发布了一款开创性的人工智能模型——DolphinGemma，旨在深入理解野生大西洋斑点海豚的交流模式。该项目由谷歌与野生海豚项目（WDP）和佐治亚理工学院的研究人员合作开发，利用WDP近40年来在巴哈马群岛积累的庞大海豚音频和视频记录数据库。 DolphinGemma基于这些珍贵数据进行训练，并采用谷歌先进的音频技术SoundStream分词器将海豚的声音转化为数字格式。

4/15/2025 10:01:28 AM

AI在线

海豚语言被谷歌大模型破译！跨物种交流大门打开，哈萨比斯：下一个是狗

神奇！人类和海豚真的能实现跨物种交流了？！

4/15/2025 9:53:52 AM

量子位

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练