谷歌DeepMind计划整合Gemini与Veo，打造智能全能助手

2025-04-13 11:01

在人工智能领域不断创新的谷歌，近日宣布了一项激动人心的计划。谷歌 DeepMind 的首席执行官 Demis Hassabis 在播客节目 Possible 中透露，公司将把其 Gemini AI 模型与 Veo 视频生成模型进行整合。这一举措旨在提升 Gemini 对物理世界的理解能力，助力开发出一个真正能够在现实生活中为用户提供帮助的通用数字助手。

Hassabis 指出，从一开始，Gemini 模型就被设计为一个多模态系统，能够处理多种类型的数据和信息。他表示:“我们的愿景是构建一个能够整合各种媒体形式的助手，这样它才能更好地理解和与世界互动。” 目前，Gemini 模型已经能够生成图像、文本和音频，展示出强大的多模态能力。

值得注意的是，整个 AI 行业正在向 “全能” 模型发展，许多公司都在探索类似的方向。例如，OpenAI 的 ChatGPT 不仅可以处理文本对话，还能生成艺术风格的图像。此外，亚马逊也计划推出一款全新的 “任意到任意” 的模型，旨在实现更高水平的多模态功能。

Hassabis 透露，Veo 模型的训练数据主要来自谷歌旗下的 YouTube 平台。通过分析大量 YouTube 视频，Veo 能够有效学习世界的物理规律。他指出:“Veo2通过观看大量的视频，能够更好地理解现实世界的运作方式。” 这表明，Veo 在训练过程中所使用的数据不仅丰富，而且具有实际应用价值。

谷歌在去年已扩大了其服务条款，以便获取更多的 YouTube 内容用于 AI 模型训练，确保模型的多样性和准确性。这样的数据获取策略无疑将为 Gemini 和 Veo 的结合提供坚实的基础，使得即将推出的智能助手能够更全面、更深刻地理解和响应用户的需求。

随着技术的不断进步，谷歌的这一计划预示着 AI 助手将不再局限于单一任务，而是能够在多个领域提供实用的支持，为用户的生活带来更多的便利。

Gemini AI 助手未来或加入原生广告，谷歌CEO透露盈利计划

谷歌的 Gemini AI 助手目前尚未引入广告，但这一情况可能在未来发生改变。在 Alphabet 的投资者电话会议上，首席执行官 Sundar Pichai 表示，公司对 Gemini 未来的广告展示方式有“非常好的想法”。尽管目前用户可以通过免费或付费订阅模式使用 Gemini，但广告可能会成为该产品的一部分。

2/5/2025 10:36:00 AM

AI在线

谷歌Gemini推出 “全局记忆” 功能，让AI记住你的每一次对话

日前，谷歌宣布其旗下的 Gemini AI 正式推出 “全局记忆” 功能。这一新功能使得 AI 能够记住用户与其之间所有的对话，旨在为用户提供更加个性化和贴心的服务。根据官方介绍，用户在与 AI 交流时，将不再需要特意回顾过去的对话记录，AI 能够自然地承接上一次的讨论，提升交流的流畅性。

2/14/2025 9:04:00 AM

AI在线

谷歌Gemini 2.0 Flash去除图片水印功能引版权担忧

近日，社交媒体上的用户发现了谷歌新推出的 Gemini AI 模型的一个有争议的用途:去除图片水印，包括 Getty Images 和其他知名图片库发布的图片上的水印。上周，谷歌扩大了对 Gemini2.0Flash 模型图像生成功能的访问权限，该功能可以让模型原生地生成和编辑图像内容。不可否认，这是一项强大的功能，但似乎也缺乏一些限制。

3/17/2025 10:18:00 AM

AI在线

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用全日程揭晓！ICLR 2025论文分享会我们北京见 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本人形机器人 xAI 搜索大语言模型 Copilot 字节跳动神器推荐 LLaMA 具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

谷歌DeepMind计划整合Gemini与Veo，打造智能全能助手

相关资讯

Gemini AI 助手未来或加入原生广告，谷歌CEO透露盈利计划

谷歌Gemini推出 “全局记忆” 功能，让AI记住你的每一次对话

​谷歌Gemini 2.0 Flash去除图片水印功能引版权担忧

谷歌Gemini 2.0 Flash去除图片水印功能引版权担忧