AI在线 AI在线

谷歌DeepMind计划整合Gemini与Veo,打造智能全能助手

作者:AI在线
2025-04-13 11:01
在人工智能领域不断创新的谷歌,近日宣布了一项激动人心的计划。 谷歌 DeepMind 的首席执行官 Demis Hassabis 在播客节目 Possible 中透露,公司将把其 Gemini AI 模型与 Veo 视频生成模型进行整合。 这一举措旨在提升 Gemini 对物理世界的理解能力,助力开发出一个真正能够在现实生活中为用户提供帮助的通用数字助手。

在人工智能领域不断创新的谷歌,近日宣布了一项激动人心的计划。谷歌 DeepMind 的首席执行官 Demis Hassabis 在播客节目 Possible 中透露,公司将把其 Gemini AI 模型与 Veo 视频生成模型进行整合。这一举措旨在提升 Gemini 对物理世界的理解能力,助力开发出一个真正能够在现实生活中为用户提供帮助的通用数字助手。

Hassabis 指出,从一开始,Gemini 模型就被设计为一个多模态系统,能够处理多种类型的数据和信息。他表示:“我们的愿景是构建一个能够整合各种媒体形式的助手,这样它才能更好地理解和与世界互动。” 目前,Gemini 模型已经能够生成图像、文本和音频,展示出强大的多模态能力。

image.png

值得注意的是,整个 AI 行业正在向 “全能” 模型发展,许多公司都在探索类似的方向。例如,OpenAI 的 ChatGPT 不仅可以处理文本对话,还能生成艺术风格的图像。此外,亚马逊也计划推出一款全新的 “任意到任意” 的模型,旨在实现更高水平的多模态功能。

Hassabis 透露,Veo 模型的训练数据主要来自谷歌旗下的 YouTube 平台。通过分析大量 YouTube 视频,Veo 能够有效学习世界的物理规律。他指出:“Veo2通过观看大量的视频,能够更好地理解现实世界的运作方式。” 这表明,Veo 在训练过程中所使用的数据不仅丰富,而且具有实际应用价值。

谷歌在去年已扩大了其服务条款,以便获取更多的 YouTube 内容用于 AI 模型训练,确保模型的多样性和准确性。这样的数据获取策略无疑将为 Gemini 和 Veo 的结合提供坚实的基础,使得即将推出的智能助手能够更全面、更深刻地理解和响应用户的需求。

随着技术的不断进步,谷歌的这一计划预示着 AI 助手将不再局限于单一任务,而是能够在多个领域提供实用的支持,为用户的生活带来更多的便利。

相关资讯

Gemini AI 助手未来或加入原生广告,谷歌CEO透露盈利计划

谷歌的 Gemini AI 助手目前尚未引入广告,但这一情况可能在未来发生改变。 在 Alphabet 的投资者电话会议上,首席执行官 Sundar Pichai 表示,公司对 Gemini 未来的广告展示方式有“非常好的想法”。 尽管目前用户可以通过免费或付费订阅模式使用 Gemini,但广告可能会成为该产品的一部分。
2/5/2025 10:36:00 AM
AI在线

谷歌Gemini推出 “全局记忆” 功能,让AI记住你的每一次对话

日前,谷歌宣布其旗下的 Gemini AI 正式推出 “全局记忆” 功能。 这一新功能使得 AI 能够记住用户与其之间所有的对话,旨在为用户提供更加个性化和贴心的服务。 根据官方介绍,用户在与 AI 交流时,将不再需要特意回顾过去的对话记录,AI 能够自然地承接上一次的讨论,提升交流的流畅性。
2/14/2025 9:04:00 AM
AI在线

​谷歌Gemini 2.0 Flash去除图片水印功能引版权担忧

近日,社交媒体上的用户发现了谷歌新推出的 Gemini AI 模型的一个有争议的用途:去除图片水印,包括 Getty Images 和其他知名图片库发布的图片上的水印。 上周,谷歌扩大了对 Gemini2.0Flash 模型图像生成功能的访问权限,该功能可以让模型原生地生成和编辑图像内容。 不可否认,这是一项强大的功能,但似乎也缺乏一些限制。
3/17/2025 10:18:00 AM
AI在线