谷歌推出Imagen 3图像生成 API,每张仅需0.03美元

谷歌近日宣布,旗下最新的图像生成模型 ——Imagen3,现已通过 Gemini API 向开发者开放。 这个模型不仅具备强大的图像生成能力,还能根据输入的文本提示创造出多种艺术风格的图像,涵盖从超现实主义到动漫角色的广泛范畴。 Imagen3的使用非常简单,开发者只需通过 API 提交文本描述,模型便会迅速生成高质量图像。

谷歌近日宣布,旗下最新的图像生成模型 ——Imagen3,现已通过 Gemini API 向开发者开放。这个模型不仅具备强大的图像生成能力,还能根据输入的文本提示创造出多种艺术风格的图像,涵盖从超现实主义到动漫角色的广泛范畴。

Imagen3的使用非常简单,开发者只需通过 API 提交文本描述,模型便会迅速生成高质量图像。每张图像的生成成本仅为0.03美元,适合需要批量图像生成的开发者和企业。通过这一合理的定价策略,谷歌旨在降低创意工作的门槛,让更多人能够享受 AI 带来的艺术创作乐趣。

image.png

在生成图像时,Imagen3展现了卓越的能力。无论是细腻的色彩,还是复杂的细节,模型都能精准地实现用户的想法。为了提升用户体验,Imagen3还引入了改进的提示跟踪功能,用户提供的描述越具体,生成的图像越符合预期。例如,描述一只动物的外貌和背景,模型能生成极为贴合的图像,满足用户的创意需求。

此外,Imagen3也考虑到了图像生成的版权和误用问题。每张生成的图像都会附带一个不可见的数字水印,称为 SynthID。这种水印无法被肉眼识别,但可以通过专门的技术进行验证,确保图像是由 AI 生成的,从而有效遏制虚假信息和不当使用的风险。

对于开发者而言,开始使用 Imagen3也非常简单。通过一个简单的 Python 代码示例,用户可以快速与 API 进行交互,生成心仪的图像。随着谷歌计划未来将更多生成模型接入 Gemini API,开发者将能够创建更具互动性的内容,推动创意产品的多样化发展。

谷歌正在积极探索生成式媒体与语言模型的结合,未来的应用场景将更加广泛,开发者能够利用这些技术在内容创作和工具开发上发挥更大的潜力。

文档:https://ai.google.dev/gemini-api/docs/imagen-prompt-guide?hl=zh-cn

相关资讯

谷歌推出Imagen 3 API,价格0.03美元/张

近日,谷歌正式推出其最新的图像生成模型 ——Imagen3,现已在 Gemini API 上可供开发者使用。 该模型在视觉效果上表现出色,能够生成各种风格的高质量图像,包括超现实主义作品、印象派风景、抽象作品以及动漫角色。 Imagen3不仅提升了图像的清晰度和构图能力,还通过简化的文本提示,帮助用户更轻松地将创意转化为图像。

OpenAI新项目Sora内测图像生成器,或将推出DALL-E 4?

近日,OpenAI 发布了一则引人注目的消息:在其内部测试的项目 Sora 中,除了已经推出的视频生成功能外,图像生成功能也在紧锣密鼓地研发中。 这个新功能让用户能够在视频和图像生成之间快速切换,提升创作的灵活性。 根据内部消息,Sora 将会增加一个隐藏的切换按钮,用户只需在提示栏中选择即可在两种模式之间切换。

谷歌AI图像混合工具Google Whisk全球上线,覆盖100多个国家

谷歌近日宣布,其基于人工智能的图像混合工具Google Whisk已在全球100多个国家/地区正式推出。 这款工具最初于去年在美国发布,旨在通过创新的图像混合技术,为用户提供更简单、更具创意的图像生成体验。 与传统的图像生成工具不同,Google Whisk允许用户上传三张图像,分别代表主题、场景和风格。