谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

作者：汪淼

2024-12-16 10:49

输入指令“把这辆车改装成敞篷车”，它就能立马将文字指令和图片结合起来，完成一键 P 图。

Gemini 2.0 说说话就能一键 P 图的功能爆火，把玩不了的大伙儿都馋哭了！

比如一辆小车车：

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

输入指令“把这辆车改装成敞篷车”，它就能立马将文字指令和图片结合起来，完成一键 P 图。

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

让我们来找茬儿，发现除了车变成了敞篷的，其它元素木有变化，很好地保持了一致性。

不仅于此，Gemini 2.0 还有点“多模态版 o1”那味儿。

继续输入指令：想象一下，这辆车内装满了海滩用品。接着，将车身颜色改为一种令人联想到夏日的颜色，并在改变过程中进行说明。

然后 Gemini 2.0 就开始图文并茂地一步步推理生成了，先把车变成了明亮的黄色，接着又再车里装满了遮阳伞等海滩用品。

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

这就是 Gemini 2.0 系列的原生图像输出能力。

评论区底下，一水儿都是求具体上线时间的：

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

被谷歌挖走的 OpenAI 大将 Logan Kilpatrick 回应，大伙儿别急，明年年初将更广泛地推出。

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

各种 P 图都是一句话的事儿

除了上面展示的简单 P 图，你甚至可以同时 P 图片中的多个元素，还能把一个物件变成另一个。

比如，把蓬松的夹克变成一个小枕头，并且拿掉毯子：

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

这还没完，结合不同的图来 P 也行。

猫和抱枕结合，就得到了一个很有质感的猫猫抱枕：

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

把猫猫和滑板结合就得到了猫猫代言滑板。

遵从文字指令，Gemini 2.0 成功将猫猫变成了插画贴纸形态。

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

除此之外，Gemini 2.0 P 图时还能更有想象力。

比如一个箱子，把箱子打开就变成了酱婶儿：

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

开头展示的小车车，也能变成“飞车”：

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

另外，还有一种玩法。

在图像中圈出需要 P 的区域，只需“Open this”，Gemini 2.0 可以直接结合文字指令理解图像，知道“this”的指代：

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

不得不说，那些有内测资格的玩家，可算了把大伙儿馋坏了。

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

本文来自微信公众号：量子位（ID：QbitAI），作者：西风，原标题《Gemini 2.0 成 P 图神器，各种 P 图只需一句话的事儿，可把网友馋哭了》

谷歌Gemini用户暴涨至3.5亿！但仍被ChatGPT碾压

最新数据显示，谷歌AI聊天机器人Gemini全球月活跃用户已达3.5亿，展现出惊人的增长势头。这一数据来自谷歌反垄断诉讼中披露的内部文件，揭示了AI助手市场的激烈竞争格局。爆发式增长轨迹-2024年10月:日活仅900万-2025年3月:日活飙升至3500万- 短短5个月:用户规模增长近4倍市场格局对比尽管增长迅猛，Gemini与行业领头羊仍存在明显差距:- ChatGPT:月活约6亿- Meta AI:月活近5亿谷歌的扩张策略为快速占领市场，谷歌采取了多管齐下的推广方式:1.

4/24/2025 9:00:53 AM

AI在线

语言游戏让 AI 自我进化，谷歌 DeepMind 推出苏格拉底式学习

近日，谷歌 DeepMind 的研究人员推出了苏格拉底式学习，在没有外部数据的情况下，让 AI 通过语言游戏不断变强。

12/17/2024 12:54:05 PM

汪淼

谷歌AI概览引用YouTube视频激增25%，医疗行业表现突出

近日，来自企业 SEO 平台 BrightEdge 的一项最新研究显示，自2023年1月1日以来，谷歌 AI 概览中引用 YouTube 的数量增长了25.21%。这一增长在医疗行业尤为显著，引起了业内的广泛关注。研究表明，YouTube 在谷歌 AI 概览中之所以受到青睐，主要是因为其提供了丰富的教学内容、视觉演示、验证示例以及时事新闻。

2/13/2025 2:18:00 PM

AI在线

资讯热榜

AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相腾讯混元3D AI引擎2.5即将揭晓，3D生成技术再升级

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion Gemini 马斯克算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测人形机器人百度伟达苹果 Transformer 深度学习 xAI 模态字节跳动大语言模型 Claude 搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视觉视频生成安全干货合集应用大型语言模型科技亚马逊训练特斯拉 AGI DeepMind

顶部

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

各种 P 图都是一句话的事儿

相关资讯

谷歌Gemini用户暴涨至3.5亿！但仍被ChatGPT碾压

语言游戏让 AI 自我进化，谷歌 DeepMind 推出苏格拉底式学习

​谷歌AI概览引用YouTube视频激增25%，医疗行业表现突出

谷歌AI概览引用YouTube视频激增25%，医疗行业表现突出