谷歌

谷歌最强文生图 AI 模型 Imagen 3 再进化：多样艺术风格、构图更平衡

谷歌公司昨日（12 月 16 日）发布博文，在发布 Veo 2 视频生成模型之外，还增强了 Imagen 3 文生图 AI 模型，为用户带来更多花样的艺术风格。

12/17/2024 10:01:08 AM

故渊

谷歌发布 AI 图像生成新工具 Whisk，支持上传多张图片以图生图

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具，该工具允许用户使用其他图像作为提示来生成图像，而不需要冗长的文本提示。用户只需提供图像，即可指定 AI 生成图像的主题、场景和风格。

12/17/2024 9:16:36 AM

远洋

谷歌 NotebookLM 新功能上线：用户可与 AI 主播进行互动

谷歌也提醒，这仍是一个“实验性功能”，主持人在回答时可能会有“尴尬的停顿”，甚至偶尔出现不准确的回答，所以初期使用体验可能并不完美。

12/14/2024 10:21:18 AM

清源

哈佛大学、谷歌发布 100 万本公共领域书籍，为 AI 训练提供合法数据

早在今年3月，哈佛大学就曾透露其“机构数据计划（IDI）”，并表示这一计划旨在为AI提供“合法数据的可信通道”。直到正式启动后，该计划才确认得到了微软和OpenAI的资金支持。

12/13/2024 9:02:21 AM

清源

谷歌发布多模态直播 API：解锁看、听、说，开启 AI 音视频交互新体验

谷歌昨日在发布 Gemini 2.0 的同时，还发布了全新的多模态直播（Multimodal Live）API，帮助开发人员开发具有实时音频和视频流功能的应用程序。

12/13/2024 8:44:18 AM

故渊

谷歌最强大模型Gemini 2.0被抬上来了，网友：好科幻

能搜网页、写代码，还能教你打游戏。 OpenAI 接连几天的「轰炸」，已经让人审美疲劳。作为应对，周三，谷歌推出新一代至强 AI 大模型 Gemini 2.0 Flash 。

12/12/2024 5:17:00 PM

机器之心

谷歌发布智能体原型 Mariner，能帮用户操作表格、在线购物

美国时间周三，谷歌发布了一款可以自主浏览网站的智能体（A.I. agent）。这种实验性工具能够浏览电子表格、购物网站以及其他在线服务，然后代表用户执行操作。

12/12/2024 3:14:44 PM

辰辰

谷歌量子芯片Willow炸翻了科技圈：攻克30年量子难题，网友：谷歌又行了！

出品 | 51CTO技术栈（微信号：blog51cto）12月10日，谷歌一项发布震惊了整个AI圈，谷歌 CEO 皮查伊激动地宣布，谷歌最新的量子计算芯片 Willow 已经问世！基准测试中，Willow 取得了惊人的成绩：在不到 5 分钟内完成了一项标准计算，而这需要顶尖超算超过 10^25 年——比宇宙年龄还长！消息一出，连马斯克都惊叹：“Wow！

12/12/2024 3:09:26 PM

谷歌Gemini再添猛将！GPA 5.0毕业即DeepMind高级科学家，开挂博士给科研新人7点建议

就在Gemini 2.0发布之前几天，一位新晋华人博士宣布加入Google DeepMind，作为高级研究科学家致力于Gemini预训练和多模态研究。薛复昭，博士毕业于新加坡国立大学师从尤洋教授，2021年以5.0的GPA成绩硕士毕业于南洋理工大学，师从庄永聪教授和孙爱欣教授。在新加坡国立大学攻读博士期间，曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习，并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。

12/12/2024 2:00:00 PM

新智元

OpenAI深夜被狙，谷歌Gemini 2.0掀翻牌桌！最强智能体组团击毙o1

OpenAI Day 5，风头被谷歌再一次抢了。就在刚刚，谷歌CEO劈柴、DeepMind CEO哈萨比斯、DeepMind CTO Kavukcuoglu三位大佬联手官宣：新一代原生多模态模型Gemini 2.0 Flash正式发布！至此，Gemini正式进入2.0时代！

12/12/2024 11:29:51 AM

新智元

谷歌：“AI 概览”功能计划明年面向更多国家、更多语言开放

谷歌首席执行官桑达尔·皮查伊表示，会将Gemini 2.0的高级推理能力融入AI Overviews（AI概览），未来将能够处理“更复杂的主题”以及“多模态”和“多步骤”的搜索，包括高级数学问题和编程问题。

12/12/2024 10:57:08 AM

清源

谷歌推出“深度研究”AI 工具，可一键生成调研报告

谷歌今日推出了一款名为“深度研究”（Deep Research）的全新人工智能工具，该工具能够利用其 Gemini 大型语言模型进行网络信息检索，并为用户生成详细的调研报告。

12/12/2024 9:43:11 AM

远洋

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩

Gemini 2.0 Flash是2.0家族第一个模型，主推原生多模态输入输出 Agent，速度比 1.5 Pro 快两倍，关键性能指标甚至超过了 1.5 Pro！支持原生工具调用、以及实时音视频流输入等新功能谷歌CEO劈柴哥，谷歌DeepMind CEO 诺奖获得者Demis Hassabis，谷歌DeepMind CTO罕见齐下场共同撰文为Gemini 2.0 Flash的推出当啦啦队重点功能：更强性能：速度更快，多模态、文本、代码、视频、空间理解和推理能力全面提升！新能力比如空间理解，视频理解等可以通过Googele AI Studio 的Starter Apps来体验例如1，Gemini 2.0对空间的理解，利用Spatial Understanding，上传一张图片，Gemini快速进行图像中的物体检测（2D和3D形式都可以）和标注，并生成结构化的数据（JSON格式）。

12/12/2024 9:09:24 AM

AI寒武纪

谷歌测试 Gemini AI 游戏助手：实时分析屏幕以提供游戏建议

谷歌今日发布了 Gemini 2.0，并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则，从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示，这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理，并通过实时对话为玩家提供后续操作建议。”他们还提到，这些助手还可以“利用谷歌搜索，将玩家与网络上丰富的游戏知识连接起来。”

12/12/2024 9:02:04 AM

远洋

谷歌推出 AI 代码助手 Jules，可帮助开发者修复代码错误

谷歌今日宣布推出一款名为“Jules”的实验性 AI 代码助手，旨在帮助开发者自动修复代码错误。该工具今日与 Gemini 2.0 一同发布，其使用更新后的谷歌人工智能模型来创建多步骤计划，以解决问题、修改多个文件，并为 GitHub 工作流中的 Python 和 Javascript 编码任务准备拉取请求。

12/12/2024 8:30:42 AM

远洋

谷歌称 Project Astra 将开启测试，部分人员通过智能眼镜体验 AI 助手

在 Gemini 2.0 发布前的媒体简报会上，谷歌 DeepMind 团队的产品经理 Bibo Xu 透露，“一小部分人将通过原型眼镜测试 Project Astra，我们认为这是体验此类 AI 最强大、最直观的方式之一。”这部分测试人员将隶属于谷歌的 Trusted Tester 项目，该项目通常能够接触到这些早期原型，其中许多原型最终并不会公开发布。据悉，部分测试人员将通过安卓手机使用 Astra，而另一部分则通过眼镜进行体验。

12/12/2024 8:19:47 AM

远洋