谷歌正在推出 Gemini 实时人工智能视频功能

2025-03-24 08:08

谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实，谷歌已开始向 Gemini Live 推出新的人工智能功能，这些功能使其能够“看到”你的屏幕内容，或者通过你的智能手机摄像头获取画面，并实时回答与之相关的问题。

谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实，谷歌已开始向 Gemini Live 推出新的人工智能功能，这些功能使其能够“看到”你的屏幕内容，或者通过你的智能手机摄像头获取画面，并实时回答与之相关的问题。这些功能是在谷歌首次展示为其提供技术支持的“阿斯特拉项目”（Project Astra）近一年后推出的。

AI在线注意到，谷歌公司在去年 5 月召开的 2024 年 I / O 开发者大会上，曾展示了基于 Gemini 的全新 Project Astra 项目，可以本地运行在 Pixel 手机上，被看作是对标 OpenAI GPT-4o 的最新模型。

谷歌表示 Project Astra 是最新的多模态 AI 项目，用户打开摄像头，该多模态项目可以直接解释用户画面中物品。

ComfyUI 难度骤降一倍！揭秘谷歌Gemini 2.0 Flash的史诗级更新

最近，谷歌一口气对 AI 模型能力做了一次大升级，其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ，这个模型对设计师来说，实用性很强。更多新模型的介绍：. 被低估的谷歌？

3/26/2025 1:55:56 AM

彩云Sky

谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能

谷歌Gemini Live AI推出实时拍摄和识图导购功能，支持Pixel 9和Galaxy S25，可识别物体并比价购物。#谷歌AI##智能手机#

4/8/2025 7:36:23 AM

漾仔

91.1% 准确率，性能远超 GPT-4 系列模型，谷歌推出多模态医学大模型 Med-Gemini

编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战：需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力，为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势，谷歌的研究人员推出了 Med-Gemini，这是一个功能强大的多模态模型系列，专门用于医学，能够无缝使用网络搜索，并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini，在其中 10 项上建立了新的最先进（S

5/7/2024 6:43:00 PM

ScienceAI

资讯热榜

Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 MiniMax MCP Server正式上线，开启多模态AI新纪元 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 AI视频用哪个？6个知名的AI视频工具使用测评报告

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达人形机器人 Transformer 百度 AI视频苹果深度学习模态 xAI 字节跳动驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

谷歌正在推出 Gemini 实时人工智能视频功能

相关资讯

ComfyUI 难度骤降一倍！揭秘谷歌Gemini 2.0 Flash的史诗级更新

谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能

91.1% 准确率，性能远超 GPT-4 系列模型，谷歌推出多模态医学大模型 Med-Gemini