谷歌发布 AI 图像生成新工具 Whisk，支持上传多张图片以图生图

2024-12-17 09:16

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具，该工具允许用户使用其他图像作为提示来生成图像，而不需要冗长的文本提示。用户只需提供图像，即可指定 AI 生成图像的主题、场景和风格。

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具，该工具允许用户使用其他图像作为提示来生成图像，而不需要冗长的文本提示。用户只需提供图像，即可指定 AI 生成图像的主题、场景和风格。

使用 Whisk 时，用户可以为主题、场景和风格分别提供多张图像作为提示。（当然，用户仍然可以选择使用文字提示。）如果手头没有合适的图像，用户还可以点击骰子图标，由谷歌自动填充一些图像作为提示（这些图像似乎也是 AI 生成的）。此外，用户还可以在流程的最后阶段在文本框中输入一些文字，以添加关于目标图像的额外细节，但这并非必需步骤。

Whisk 随后会生成图像，并为每张图像生成相应的文本提示。如果用户对生成结果满意，可以选择收藏或下载图像；如果需要进一步调整，则可以通过在文本框中输入更多文字或点击图像并编辑文本提示来进行优化。

谷歌发布 AI 图像生成新工具 Whisk，支持上传多张图片以图生图

AI在线注意到，谷歌在一篇博文中强调，Whisk 的设计初衷是“快速的视觉探索，而非像素级的精细编辑”。该公司还表示，Whisk 可能会出现“偏差”，因此允许用户编辑底层的提示。

据体验者称，在短暂的使用过程中，Whisk 带来了有趣的体验。图像生成需要几秒钟的时间，虽然生成的图像有时会有些奇怪，但所有生成的内容都易于迭代修改。

谷歌表示，Whisk 使用的是其最新一代的 Imagen 3 图像生成模型，该模型也于今日发布。

谷歌发布Whisk Animate预览版：将图像转化为 8 秒动画短片

谷歌在其实验性AI平台Google Labs中推出了Whisk Animate的预览版，这一新功能迅速在社交媒体平台X上引发了热议。根据最新的X帖子，Whisk Animate允许用户利用先进的Veo2模型，将静态的Whisk图像转化为时长8秒的动态视频剪辑，为创意工作者和AI爱好者提供了一个令人兴奋的新工具。 Whisk Animate建立在谷歌此前推出的Whisk实验基础上。

3/6/2025 1:45:00 PM

AI在线

谷歌最高优先级项目曝光：下一代AI搜索，誓要打败ChatGPT

岁末年初，科技公司似乎集体进入了反思阶段。过去一个月里，谷歌创始人拉里・佩奇、谢尔盖・布林与公司高管一直在开会，讨论新型 AI 聊天机器人。

2/2/2023 2:27:00 PM

机器之心

人工智能模型提供支持，谷歌拟在印度提供肺结核、肺癌等疾病筛查服务

谷歌今日官宣了一系列在医疗保健行业部署 AI 模型的计划。根据计划，谷歌研究团队和其拥有的 Fitbit 公司正在开发一系列新的人工智能功能：从腕带中提取数据并指导用户的个人健康，该工具由谷歌人工智能模型 Gemini 提供支持。此外，谷歌还宣布与印度医疗中心 Apollo Radiology International 达成合作，在印度提供 AI 驱动的肺结核、肺癌和乳腺癌筛查服务。详细来看，谷歌宣称开发了一套 AI 系统来解读胸部 X 光扫描，以发现结核病的早期症状。AI 将能够使筛查更广泛地普及，并提供额外的

3/19/2024 11:28:59 PM

清源

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

顶部

谷歌发布 AI 图像生成新工具 Whisk，支持上传多张图片以图生图

相关资讯

谷歌发布Whisk Animate预览版：将图像转化为 8 秒动画短片

谷歌最高优先级项目曝光：下一代AI搜索，誓要打败ChatGPT

人工智能模型提供支持，谷歌拟在印度提供肺结核、肺癌等疾病筛查服务