还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!

机械之能报道编辑:吴昕还记得一周前我们介绍过的那个文生图东西吗?对,让马斯克「穿越」,变身古风大侠的那个。也是让 Blackpink Jennie 「变胖」的那个:当时, Ideogram 官宣成立并公开了测试版 v0.1 。机械之能赶紧排队注册,试用了一下。据说,短短一周内,积累了超过 90,000 名用户,生成了超过 300 万张图象!今天, Ideogram 进一步宣布向地球上的每个人开放 Ideogram !免费的,没有任何限制!(传送门 )官方博客也第一次介绍了 Ideogram v0.1 —— 「它是

机械之能报道

编辑:吴昕

还记得一周前我们介绍过的那个文生图东西吗?对,让马斯克「穿越」,变身古风大侠的那个。

还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!

也是让 Blackpink Jennie 「变胖」的那个:

还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!

当时, Ideogram 官宣成立并公开了测试版 v0.1 。机械之能赶紧排队注册,试用了一下。据说,短短一周内,积累了超过 90,000 名用户,生成了超过 300 万张图象!今天, Ideogram 进一步宣布向地球上的每个人开放 Ideogram !免费的,没有任何限制!(传送门 https://ideogram.ai )官方博客也第一次介绍了 Ideogram v0.1 —— 「它是一种新的基础 AI 模型,可将文本转换为图象。由 Ideogram 团队从头开始构建,解决了现有生成式 AI 东西的主要缺点之一,可以在图象中呈现联贯的文本。」什么意思呢?其实,目前的生成模型技术还是有一个比较大的缺点,就是无法在图象中呈现出可靠的视觉文本。

比如, 在图片中生成联贯文本上,DALL-E 2 就非常不稳定(如下)。最新发布的 Stable Diffusion 直接将「无法呈现可读的文本」列为已知局限性。

还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!上图联贯文本拼写错误,准确的分别是 (1) California: All Dreams Welcome, (2) Canada: For Glowing Hearts, (3) Colorado: It’s Our Nature, (4) St. Louis: All Within Reach.

针对模型的「文盲」问题, Ideogram 的核心成员(还在谷歌时)找到了改善问题的办法,他们魔改一个「文本编码器」,让模型学会了拼写。

除此之外,他们还提出了一个评估文生图模型的新基准,可以更全面地衡量文本到图象模型的文本衬着质量。

正如我们之前体验过的,Ideogram v0.1 的表现比较稳定。还记得这个例子吗?

「An adorable minion holding a sign that says 『It’s over, MidJourney』, spelled exactly, 3d render, typography」(一个可爱的小黄人举着一个牌子,上面写着「结束了,Midjourney」 )。

全部拼写准确。当时推友就表示,虽然系统并不总是能够准确拼写,但成功率还是不错的。

还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!

这个是不是也很厉害?用「poetry」这个词画出乌鸦的轮廓。还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!博客还说了,Ideogram v0.1 还支持许多字体和文本款式,并生成漂亮的排版,这些都是非常耗费时间和精力的工作。「我们的文本衬着功能为许多创造性的应用程序铺平了道路,因为我们的用户已经制作了成千上万的徽标,海报,图形设计和图象,传达了风趣的信息。」还记得那张有关「巴本海默(barbenheimer)」的影戏画报设计吗?

还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!

这是一个关于「暗夜行动( night move )」的影戏海报作品,一名警察走在黑暗的道路上,只有一盏路灯,灯光投向他孤独的背影。

还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!

官博强调说,Ideogram 的关键特征之一是支持多种图象格调的标签,包括插图、排版、海报、照片、3D衬着、时尚、绘画、肖像拍照、影戏、野生动物拍照、动漫和涂鸦,等等。这些款式标签可以以风趣的方式拉拢在一起,帮助用户生成他们想要的内容类型,他们利用人工智能确保这些标签准确地反映在生成的图象中。还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!比如,这张雨中龙猫拉拢了 photo,、poster,、cinematic、painting、 3D render 等很多格调标签。

还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!

这张爱因斯坦(额,头发和手部有些问题)也拉拢了 typography、painting 和 cinematic 格调标签。

还记得让马斯克一键「穿越」的利器吗?现在面向所有人开放!免费!最后,重申一下公司的使命。

Ideogram(发音为 eye-diogram ),翻译过来就是表意文字,希望「通过生成式人工智能帮助人们变得更具创造力」,「让创意表达变得普遍且风趣。」

因为他们坚信,每个人都有一种与生俱来的渴望,创造并分享他们的创作。

现在,游戏才刚刚开始,将来他们会发布更先进的生成 AI 模型。不过,现在你就可以试试这款文生图东西啦。

给TA打赏
共{{data.count}}人
人已打赏
AI

飞秒级化学反应放缓至肉眼可见,首次运用量子计算机将模仿化学反应减慢1000亿倍

2023-8-30 17:20:00

AI

1句指令+5美元+20分钟,就能训练出小型专业模型,Prompt2Model了解一下

2023-8-31 17:10:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索