谷歌

谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。

谷歌 NotebookLM 新功能上线:用户可与 AI 主播进行互动

谷歌也提醒,这仍是一个“实验性功能”,主持人在回答时可能会有“尴尬的停顿”,甚至偶尔出现不准确的回答,所以初期使用体验可能并不完美。

哈佛大学、谷歌发布 100 万本公共领域书籍,为 AI 训练提供合法数据

早在今年3月,哈佛大学就曾透露其“机构数据计划(IDI)”,并表示这一计划旨在为AI提供“合法数据的可信通道”。直到正式启动后,该计划才确认得到了微软和OpenAI的资金支持。

谷歌发布多模态直播 API:解锁看、听、说,开启 AI 音视频交互新体验

谷歌昨日在发布 Gemini 2.0 的同时,还发布了全新的多模态直播(Multimodal Live)API,帮助开发人员开发具有实时音频和视频流功能的应用程序。

谷歌最强大模型Gemini 2.0被抬上来了,网友:好科幻

能搜网页、写代码,还能教你打游戏。 OpenAI 接连几天的「轰炸」,已经让人审美疲劳。 作为应对,周三,谷歌推出新一代至强 AI 大模型 Gemini 2.0 Flash 。

谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物

美国时间周三,谷歌发布了一款可以自主浏览网站的智能体(A.I. agent)。这种实验性工具能够浏览电子表格、购物网站以及其他在线服务,然后代表用户执行操作。

谷歌量子芯片Willow炸翻了科技圈:攻克30年量子难题,网友:谷歌又行了!

出品 | 51CTO技术栈(微信号:blog51cto)12月10日,谷歌一项发布震惊了整个AI圈,谷歌 CEO 皮查伊激动地宣布,谷歌最新的量子计算芯片 Willow 已经问世! 基准测试中,Willow 取得了惊人的成绩:在不到 5 分钟内完成了一项标准计算,而这需要顶尖超算超过 10^25 年——比宇宙年龄还长! 消息一出,连马斯克都惊叹:“Wow!

谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议

就在Gemini 2.0发布之前几天,一位新晋华人博士宣布加入Google DeepMind,作为高级研究科学家致力于Gemini预训练和多模态研究。 薛复昭,博士毕业于新加坡国立大学师从尤洋教授,2021年以5.0的GPA成绩硕士毕业于南洋理工大学,师从庄永聪教授和孙爱欣教授。 在新加坡国立大学攻读博士期间,曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习,并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。

OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1

OpenAI Day 5,风头被谷歌再一次抢了。 就在刚刚,谷歌CEO劈柴、DeepMind CEO哈萨比斯、DeepMind CTO Kavukcuoglu三位大佬联手官宣:新一代原生多模态模型Gemini 2.0 Flash正式发布! 至此,Gemini正式进入2.0时代!

谷歌:“AI 概览”功能计划明年面向更多国家、更多语言开放

谷歌首席执行官桑达尔·皮查伊表示,会将Gemini 2.0的高级推理能力融入AI Overviews(AI概览),未来将能够处理“更复杂的主题”以及“多模态”和“多步骤”的搜索,包括高级数学问题和编程问题。

谷歌推出“深度研究”AI 工具,可一键生成调研报告

谷歌今日推出了一款名为“深度研究”(Deep Research)的全新人工智能工具,该工具能够利用其 Gemini 大型语言模型进行网络信息检索,并为用户生成详细的调研报告。

抢跑OpenAI!谷歌Gemini 2.0震撼登场:全面转向Agent,多模态输入输出,免费随便玩

Gemini 2.0 Flash是2.0家族第一个模型,主推原生多模态输入输出 Agent,速度比 1.5 Pro 快两倍,关键性能指标甚至超过了 1.5 Pro! 支持原生工具调用、以及实时音视频流输入等新功能谷歌CEO劈柴哥,谷歌DeepMind CEO 诺奖获得者Demis Hassabis,谷歌DeepMind CTO罕见齐下场共同撰文为Gemini 2.0 Flash的推出当啦啦队重点功能:更强性能: 速度更快,多模态、文本、代码、视频、空间理解和推理能力全面提升! 新能力比如空间理解,视频理解等可以通过Googele AI Studio 的Starter Apps来体验例如1,Gemini 2.0对空间的理解,利用Spatial Understanding,上传一张图片,Gemini快速进行图像中的物体检测(2D和3D形式都可以)和标注,并生成结构化的数据(JSON格式)。

谷歌测试 Gemini AI 游戏助手:实时分析屏幕以提供游戏建议

谷歌今日发布了 Gemini 2.0,并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则,从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示,这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理,并通过实时对话为玩家提供后续操作建议。”他们还提到,这些助手还可以“利用谷歌搜索,将玩家与网络上丰富的游戏知识连接起来。”

谷歌推出 AI 代码助手 Jules,可帮助开发者修复代码错误

谷歌今日宣布推出一款名为“Jules”的实验性 AI 代码助手,旨在帮助开发者自动修复代码错误。该工具今日与 Gemini 2.0 一同发布,其使用更新后的谷歌人工智能模型来创建多步骤计划,以解决问题、修改多个文件,并为 GitHub 工作流中的 Python 和 Javascript 编码任务准备拉取请求。

谷歌称 Project Astra 将开启测试,部分人员通过智能眼镜体验 AI 助手

在 Gemini 2.0 发布前的媒体简报会上,谷歌 DeepMind 团队的产品经理 Bibo Xu 透露,“一小部分人将通过原型眼镜测试 Project Astra,我们认为这是体验此类 AI 最强大、最直观的方式之一。”这部分测试人员将隶属于谷歌的 Trusted Tester 项目,该项目通常能够接触到这些早期原型,其中许多原型最终并不会公开发布。据悉,部分测试人员将通过安卓手机使用 Astra,而另一部分则通过眼镜进行体验。

谷歌深夜炸场:Gemini 2.0 正式发布,号称迄今智能体时代最有能力的 AI 模型

谷歌正式发布Gemini 2.0,号称迄今为止为智能体时代最有能力的AI模型,带来了增强的性能、更多的多模态性和新的原生工具使用。

YouTube 自动配音功能推广至更多知识类频道,借助 AI 生成视频多语言配音

YouTube当地时间周二宣布,其自动配音功能已开始推广至更多的频道,创作者可为其视频生成多种语言的翻译音频。此前,这项功能仅限于少数创作者进行测试。

谷歌被曝向美国 FTC 施压:要求解除微软云对 OpenAI 技术的独家托管

据The Information援引知情人士消息称,谷歌近期已向美国联邦贸易委员会(IT之家注:简称FTC)施压,要求解除微软在其云服务器上托管OpenAI技术的独家协议。