谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。

谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

使用 Whisk 时,用户可以为主题、场景和风格分别提供多张图像作为提示。(当然,用户仍然可以选择使用文字提示。)如果手头没有合适的图像,用户还可以点击骰子图标,由谷歌自动填充一些图像作为提示(这些图像似乎也是 AI 生成的)。此外,用户还可以在流程的最后阶段在文本框中输入一些文字,以添加关于目标图像的额外细节,但这并非必需步骤。

Whisk 随后会生成图像,并为每张图像生成相应的文本提示。如果用户对生成结果满意,可以选择收藏或下载图像;如果需要进一步调整,则可以通过在文本框中输入更多文字或点击图像并编辑文本提示来进行优化。

谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

AI在线注意到,谷歌在一篇博文中强调,Whisk 的设计初衷是“快速的视觉探索,而非像素级的精细编辑”。该公司还表示,Whisk 可能会出现“偏差”,因此允许用户编辑底层的提示。

据体验者称,在短暂的使用过程中,Whisk 带来了有趣的体验。图像生成需要几秒钟的时间,虽然生成的图像有时会有些奇怪,但所有生成的内容都易于迭代修改。

谷歌表示,Whisk 使用的是其最新一代的 Imagen 3 图像生成模型,该模型也于今日发布。

相关资讯

谷歌发布Whisk Animate预览版:将图像转化为 8 秒动画短片

谷歌在其实验性AI平台Google Labs中推出了Whisk Animate的预览版,这一新功能迅速在社交媒体平台X上引发了热议。 根据最新的X帖子,Whisk Animate允许用户利用先进的Veo2模型,将静态的Whisk图像转化为时长8秒的动态视频剪辑,为创意工作者和AI爱好者提供了一个令人兴奋的新工具。 Whisk Animate建立在谷歌此前推出的Whisk实验基础上。

谷歌最高优先级项目曝光:下一代AI搜索,誓要打败ChatGPT

岁末年初,科技公司似乎集体进入了反思阶段。过去一个月里,谷歌创始人拉里・佩奇、谢尔盖・布林与公司高管一直在开会,讨论新型 AI 聊天机器人。

人工智能模型提供支持,谷歌拟在印度提供肺结核、肺癌等疾病筛查服务

谷歌今日官宣了一系列在医疗保健行业部署 AI 模型的计划。根据计划,谷歌研究团队和其拥有的 Fitbit 公司正在开发一系列新的人工智能功能:从腕带中提取数据并指导用户的个人健康,该工具由谷歌人工智能模型 Gemini 提供支持。此外,谷歌还宣布与印度医疗中心 Apollo Radiology International 达成合作,在印度提供 AI 驱动的肺结核、肺癌和乳腺癌筛查服务。详细来看,谷歌宣称开发了一套 AI 系统来解读胸部 X 光扫描,以发现结核病的早期症状。AI 将能够使筛查更广泛地普及,并提供额外的