AI在线 AI在线

谷歌

一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型

谷歌 Gemma 3 上线刚刚过去一个月,现在又出新版本了。 该版本经过量化感知训练(Quantization-Aware Training,QAT)优化,能在保持高质量的同时显著降低内存需求。 比如经过 QAT 优化后,Gemma 3 27B 的 VRAM 占用量可以从 54GB 大幅降至 14.1GB,使其完全可以在 NVIDIA RTX 3090 等消费级 GPU 上本地运行!
4/20/2025 10:16:00 AM
机器之心

27B 显存需求 54 → 14.1GB:谷歌发布 Gemma 3 QAT AI 模型,RTX 3090 显卡可运行

以 int4 量化为例,Gemma 3 27B 显存需求从 54GB 锐减至 14.1GB,Gemma 3 12B 则从 24GB 降至 6.6GB;Gemma 3 1B 仅需 0.5GB 显存。
4/19/2025 9:52:27 AM
故渊

6周搞定18个月的工作量,爱彼迎不满老工具,暴力循环大模型怒迁代码,效果出奇好,怎么回事?谷歌亚马逊也做过类似的事

编辑 | 云昭Anthropic首席执行官Dario时不时就会出来发声,声称人工智能即将取代人工编码,或者抛出一个惊人的数字,预测在短短6个月内将有90%的编码工作将被AI取代。 这种措辞无疑有夸大的成分,但这里想说的是,这并非空穴来风,或许6个月内AI不会取代90%的程序员,但取代90%的编程工作不无可能! 因为企业接纳和适配大模型的速度远比我们想象得要快!
4/18/2025 4:05:39 PM
云昭

谷歌的“双子星”,正在围剿一众大模型

编辑 | 云昭继昨天凌晨OpenAI推出满血o3、o4-mini之后,没想到谷歌迈着“LLM王者”的步伐给出了自家的模型SOTA研究Gemini2.5 Flash。 如果说o3主打的是“干实事”,那么谷歌这次的新发布则是告诉我们:什么是“成本可控”的极致性价比。 这次的发布以后立马引来一众开发者的讨论,不过这次不是负面的,而是全面的好评。
4/18/2025 3:53:03 PM
云昭

谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线:性能成本双优

谷歌公司昨日(4 月 17 日)发布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。
4/18/2025 2:59:20 PM
故渊

Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌

4 月 14 日,谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲,主题为「AI 的重要趋势:我们是如何走到今天的,我们现在能做什么,以及我们如何塑造 AI 的未来? 」在这场演讲中,Jeff Dean 首先以谷歌多年来的重要研究成果为脉络,展现了 AI 近十五年来的发展轨迹,之后又分享了 Gemini 系列模型的发展历史,最后展望了 AI 将给我们这个世界带来的积极改变。 AI在线将在本文中对 Jeff Dean 的演讲内容进行总结性梳理,其中尤其会关注演讲的第一部分,即谷歌过去这些年对 AI 领域做出的奠基性研究贡献。
4/18/2025 1:14:00 PM
机器之心

谷歌大模型“性价比之王”来了!混合推理模型,思考深度可自由控制,竞技场排名仅次于自家Pro

紧跟o4-mini,谷歌上新了Gemini 2.5 Flash preview版本。 作为更注重效率的Flash,在大模型竞技场上排名并列第二,第一是自家的Gemini 2.5 Pro。 这样的表现,让Gemini 2.5 Flash的性价比直接拉满。
4/18/2025 10:43:23 AM

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗 ChatGPT Plus 推出的旗舰级产品。
4/18/2025 7:39:43 AM
清源

谷歌提出Transformer架构中,表示崩塌、过度压缩的五个解决方法

Transformer架构的出现极大推动了生成式AI的发展,在此基础之上开发出了ChatGPT、Copilot、讯飞星火、文心一言、Midjourney等一大批知名产品。 但Transformer架构并非完美还存在不少问题,例如,在执行需要计数或复制输入序列元素的任务经常会出错。 而这些操作是推理的基本组件,对于解决日常任务至关重要。
4/17/2025 9:53:49 AM
AIGC开放社区

谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验

近日,谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。 这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户,通过 Gemini Advanced 订阅才能使用。 然而,随着用户对 Gemini Live 功能的积极反馈,谷歌决定改变策略,推动这一功能的普及。
4/17/2025 9:01:05 AM
AI在线

AI“立功”:谷歌去年封停了 3920 万个广告账号,超 2023 年三倍

谷歌表示,借助大语言模型和通过识别诸如商业冒充、非法支付信息等信号,目前公司能够在广告投放前就暂停“大多数”广告账户。
4/17/2025 7:42:28 AM
清源

可实时识别屏幕内容,谷歌 Gemini Live 功能向所有安卓用户免费开放

谷歌宣布Gemini Live功能免费向所有安卓用户开放,可实时识别摄像头和屏幕内容并回应。此前仅限Pixel 9和Galaxy S25用户订阅使用。微软同日也推出类似AI工具Copilot Vision。#谷歌Gemini #AI工具
4/17/2025 6:57:40 AM
远洋

Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升

今天凌晨,Anthropic官方推出了两个重磅新功能:Research以及与Google Workspace集成。 Anthropic称Research功能是与Claude合作的新方式。 它能从多个角度分析问题,自动搜索信息,几分钟之内给出答案。
4/16/2025 1:51:29 PM
新智元

英国 AI 版权法规或导致模型偏见与创作者收益减少

近日,政策专家对的 AI 版权法规表示担忧,认为如果不提供全面的文本和数据挖掘豁免,可能会导致 AI 模型质量下降,进而影响创新。 专家指出,禁止像 OpenAI、谷歌和 Meta 这样的公司在英国使用版权材料进行 AI 训练,可能会导致模型输出的偏见,从而削弱其有效性。 英国政府于2024年12月开启了一项咨询,旨在探索如何在使用创意内容训练 AI 模型时保护艺术家、作家和作曲家的权益。
4/16/2025 11:01:34 AM
AI在线

谷歌 Veo 2 视频生成模型入驻 Gemini,用户可创建 8 秒 720p 视频

谷歌宣布将Veo 2视频生成AI模型引入Gemini Advanced订阅服务,用户可创作8秒720p视频并分享至社交平台。同时,Google Labs整合Veo 2推出Whisk Animate功能,静态图秒变动画。AI视频工具崛起也引发创意行业担忧。#谷歌AI##视频生成#
4/16/2025 7:31:28 AM
远洋

认识谷歌 A2A:将颠覆多智能体 AI 系统的协议

近日谷歌在 Cloud Next 25 大会上开源的 Agent2Agent(A2A)协议,无疑成为了该领域一颗耀眼的新星,引发了广泛关注和热议。 这一协议被寄予厚望,有望如同一把神奇的钥匙,开启多智能体 AI 系统高效协作的全新大门,彻底改变当前人工智能应用的格局。 多智能体系统协作之困多智能体系统由多个能够感知环境、自主做出决策并相互协作的智能代理构成,宛如一个庞大而复杂的智能网络。
4/16/2025 12:00:00 AM
大模型之路

谷歌发布 DolphinGemma:AI破译海豚语言:Pixel手机变身“翻译器”

谷歌近日发布了一款开创性的人工智能模型——DolphinGemma,旨在深入理解野生大西洋斑点海豚的交流模式。 该项目由谷歌与野生海豚项目 (WDP) 和佐治亚理工学院的研究人员合作开发,利用WDP近40年来在巴哈马群岛积累的庞大海豚音频和视频记录数据库。 DolphinGemma基于这些珍贵数据进行训练,并采用谷歌先进的音频技术SoundStream分词器将海豚的声音转化为数字格式。
4/15/2025 10:01:28 AM
AI在线

海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗

神奇! 人类和海豚真的能实现跨物种交流了? !
4/15/2025 9:53:52 AM
量子位