谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。

谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

使用 Whisk 时,用户可以为主题、场景和风格分别提供多张图像作为提示。(当然,用户仍然可以选择使用文字提示。)如果手头没有合适的图像,用户还可以点击骰子图标,由谷歌自动填充一些图像作为提示(这些图像似乎也是 AI 生成的)。此外,用户还可以在流程的最后阶段在文本框中输入一些文字,以添加关于目标图像的额外细节,但这并非必需步骤。

Whisk 随后会生成图像,并为每张图像生成相应的文本提示。如果用户对生成结果满意,可以选择收藏或下载图像;如果需要进一步调整,则可以通过在文本框中输入更多文字或点击图像并编辑文本提示来进行优化。

谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

AI在线注意到,谷歌在一篇博文中强调,Whisk 的设计初衷是“快速的视觉探索,而非像素级的精细编辑”。该公司还表示,Whisk 可能会出现“偏差”,因此允许用户编辑底层的提示。

据体验者称,在短暂的使用过程中,Whisk 带来了有趣的体验。图像生成需要几秒钟的时间,虽然生成的图像有时会有些奇怪,但所有生成的内容都易于迭代修改。

谷歌表示,Whisk 使用的是其最新一代的 Imagen 3 图像生成模型,该模型也于今日发布。

相关资讯

谷歌最高优先级项目曝光:下一代AI搜索,誓要打败ChatGPT

岁末年初,科技公司似乎集体进入了反思阶段。过去一个月里,谷歌创始人拉里・佩奇、谢尔盖・布林与公司高管一直在开会,讨论新型 AI 聊天机器人。

人工智能模型提供支持,谷歌拟在印度提供肺结核、肺癌等疾病筛查服务

谷歌今日官宣了一系列在医疗保健行业部署 AI 模型的计划。根据计划,谷歌研究团队和其拥有的 Fitbit 公司正在开发一系列新的人工智能功能:从腕带中提取数据并指导用户的个人健康,该工具由谷歌人工智能模型 Gemini 提供支持。此外,谷歌还宣布与印度医疗中心 Apollo Radiology International 达成合作,在印度提供 AI 驱动的肺结核、肺癌和乳腺癌筛查服务。详细来看,谷歌宣称开发了一套 AI 系统来解读胸部 X 光扫描,以发现结核病的早期症状。AI 将能够使筛查更广泛地普及,并提供额外的

DeepMind CEO 称谷歌计算能力优于微软,在 AI 领域的投入将超过千亿美元

DeepMind 首席执行官德米斯-哈萨比斯(Demis Hassabis)周一在温哥华举行的 TED 大会上被问及微软公司和 OpenAI 正在计划建造价值 1000 亿美元(当前约 7250 亿元人民币)的超级计算机 “星际之门”(Stargate),他表示谷歌在人工智能领域的投入未来将超过 1000 亿美元。哈萨比斯回答说:“我们不谈论具体数字,但我认为随着时间的推移,我们的投资会超过这个数字。”他没有透露具体的支出细节。他还表示 Alphabet 公司(IT之家备注:谷歌母公司)的计算能力优于包括微软在内的