AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

一、背景最近 AI 创作实质火爆网络，让我们看到 AI 在设想上充满想象力的未来。关于 AI 在设想上应用的探索由来已久，从早几年的智能广告素材，智能 Logo 再到如今的 AIGC，AI 的成长突飞猛进。本文尝试梳理 AI 目前在设想领域应用的最新进展，展望设想行业在 AI 手艺影响下可能发生的变革。更多AI落地干货：二、AI 与设想相关的最新手艺 1. 自动化实质生成（AIGC）从文本-图象、文本-视频、文本-3D 模型到智能字体、智能文本，AI 在各类实质的创造上已经突飞猛进，强大到让人惊叹地步。 ①

一、背景

最近 AI 创作实质火爆网络，让我们看到 AI 在设想上充满想象力的未来。关于 AI 在设想上应用的探索由来已久，从早几年的智能广告素材，智能 Logo 再到如今的 AIGC，AI 的成长突飞猛进。本文尝试梳理 AI 目前在设想领域应用的最新进展，展望设想行业在 AI 手艺影响下可能发生的变革。

更多AI落地干货：

二、AI 与设想相关的最新手艺

1. 自动化实质生成（AIGC）

从文本-图象、文本-视频、文本-3D 模型到智能字体、智能文本，AI 在各类实质的创造上已经突飞猛进，强大到让人惊叹地步。

① 文本-图象手艺

近一两年以来，各大平台推出的 AI 图画东西，用户只要通过简单学习，输出文本，进行关键词调教，即可生产各种气概的画作。关于文本-图象的原理可粗略分为文本理解和图象生成两个部分，目前主流的 AI 图画东西，文本理解部分大多基于 CLIP 模型，图象生成部分大多基于 Diffusion 模型。相较之前的手艺，AI 在关键词理解和生成画作的多元性有了大幅提升。下边简要为大家介绍最受欢迎、动机也最出色的 4 款 AI 图画东西的特色，关于每种东西应用教程以及如何生成高质量作品，大家可以自行研究。

Disco Diffusion

Disco Diffusion 是发布于 Google Colab 平台的一款开源免费的图画东西，可以在 Google Drive 直接运行，也可以部署到本地。Disco Diffusion 在生成图前需要完成一些基本参数设置，好处是可以按定制方式生成图片，缺点是交互不如其他几个东西便捷，操作较为复杂，生成时间也比较长。Disco Diffusion 擅长抽象氛围图，色彩华丽丰富，但在人像生成上动机不太理想。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

描写“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.”

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

图片来源：@x1ao4，关键词 ”ancient Chinese village“

Midjourney

Midjourney 是一款部署在 Discord 上的图画东西，需申请测试资格，在收到邀约邮件后，加入 Discord 频道，即可通过关键词输出完成图画。它的优点在于操作非常简单，用户仅需通过关键词输出即可完成作画，不用设置其他参数。它支持在生成图片后，在已生成图片基础上进行调整。初次加入会赠送免费体验资格，额度用完以后就需要按月/年付费完成图画。

Midjourney 对关键词理解出色，无论出图速度和完整度都优于 Disco Diffusion，而且它对各类艺术气概模仿较为出色，通过设定气概，可以有帮助 AI 更好理解你想要的画作动机。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

来自 Midjourney 的一组对知名艺术家气概模仿的画作

最近发布的 V5 版本在细节上又提升一步，写实动机堪比照片，同时支持更多气概选择，也解决了之前 AI 手部表达错乱问题。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

DALL-E 2

Dall-E2 是由 OpenAI 实验室发布的，目前也处于内测阶段，可在官网上申请体验，但开放体验资格有限。注册后首次会免费获赠生成机会，额度用完后需要按次付费生成。它不仅操作简单，而且可控性比较强，但目前图片比例是固定 1:1 方图。DALL-E2 可以根据描写生成一幅画，如果对图动机不满意，可以针对该图生成 3 张新的图片。而且如果对图片局部不满意，它可以支持选择不满意部分，单独设置关键词后再生成。此外，它还可以根据描写对现有图象进行编辑，以及按给定原图生成同一气概的不同画像。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

按描写“一个宇航员+骑马+超现实气概”生成的画

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

按描写“选一个位置加一只火烈鸟”生成的画

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

根据戴珍珠耳环的少女气概生成的画

Stable Diffusion

Stable Diffusion 是开源免费的，应用起来相当亲民。应用渠道多样，可以在官网、Google Colab、本地部署等方式应用，官网会默认给你点数，生成图消耗点数，消耗完成需要充值应用，但通过 Google Colab 或本地部署基本可以不受数量限制。它可控参数丰富，功能齐全，满足各种个性化需求，因此应用范围最广。而且 Stable Diffusion 支持插件，很多第三方在源代码基础上进行了 2 次开发，比如有的团队就发布程序，让用户可以应用自己提供的图象训练 Stable Diffusion，形成个性化数据模型，生成带有自己气概的图象。Stable Diffusion 在抽象的氛围感上可能不如 Disco 和 Midjourney 出色，但它的想象力和创作力非常丰富，气概多样，人物写实。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

Stable Diffusion 官网示例图

AI 图画东西吸引了大量用户进行尝试，他们形成了各自的社区，彼此分享作品、交流创作过程。虽然很多时候 AI 画作动机不错，但目前仍有一些待解决问题：

生成的结果会有一些随机性，无法按照严格需求的方式生产；
关键词描写对最终动机影响较大，对关键词的描写技巧需要慢慢摸索；
如果对实质一致性要求比较高的话，需要对模型进行训练，有一定的手艺挑战。

② 文本-3D 模型手艺

在 Text-Image 手艺基础上，各大科技巨头都纷纷入局尝试 Text-3D 手艺，目前公开了研究论文和初步动机的手艺主要有：Google 推出的 DreamFusion、NVIDIA 的 GET3D、Meta 的 MAV3D，还有 OpenAI 的 Point-E。这项手艺还处在初期发展阶段，有很多不完善的地方，比如缺乏几何细节、缺乏纹理，在合成过程智能应用神经渲染器，3D 软件没法通用等问题。还有一个普遍的缺点，就是生成速度缓慢，生成单个 3D 模型的常常需要数个小时。而 OpenAI 推出的 Point-E 仅需几秒到几分钟就能产出一个 3D 模型。英伟达的 AI 科学家 Jim Fan 在推特上表示，Point-E 的生成速度约能达到 DreamFusion 的 600 倍。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

OpenAI 生成的 3D 模型

DreamFusion 可以在任意角度、任意光照条件、任意三维环境中基于给定的文本提示生成模型

③ 文本-视频手艺

文本生成视频手艺也是建立在文本图片手艺基础之上，它主要是通过文本图象对和无文本视频来学习，根据文本理解生成几个关键帧。建立插帧模型，基于关键帧补充关键帧之间的图片，提高视频流畅度。最后再进行每帧分辨率的提升，提高整体的视频质量。AI 在文本生成视频的手艺相对较新，Meta/Google 在去年 10 月分别官宣对应的视频生成器 Make-a-video/Imagen Video，目前只公开了研究论文和几个官网示例，但得益于文本图片质量的飞速提升，可以预期很快图片视频手艺也将大幅提升能力。

Google Imagen Video 生成“一个开车的熊猫”

虽然目前通过文本生成视频手艺只能生成简单的变化或动作、无法生成基于文本描写的细节以及多场景复杂故事的视频。但通过 AI 对视频实质进行智能处理手艺，已经有很多让人惊艳动机，这部分在本文第 2 章节详细展开介绍。

④ 智能字体

日本筑波大学开发了一套以人工智能为基础的汉字字型设想系统，可以让原本需要人工设想上万字的流程，缩短为只要完成五个手工汉字的设想，AI 就可以自动生产超过 14,000 个相同字体的汉字。

该系统通过学习大量已有字体，再从这几个手工设想的字体范例中提取特征，通过调整参数值输出为新的字型。而且它应用的是矢量图，可以将其输出为字体文件，让字体制作所需的时间大大缩短。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

2. AI 特效及实质处理

① AI 视频特效

视频气概化

在线视频编辑网站 Runway 于最近发布了 AI 视频处理东西 Gen-2，该东西针对视频处理的能力很强大，不仅可以通过文本、文本+图片、图片生成视频，还可以对视频进行各种气概化处理，比如只需要把你想要叠加的气概用图片或者文字叠加上去，可很快按要求生成气概化的视频。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

原视频通过添加一张驱动图象即可生成气概化视频

智能 CG 角色替换

由《头号玩家》主演 Tye Sheridan 创立公司推出的 Wonder Studio 是一个可以为上传的 CG 模型自动制作动画、HDR 打光、合并到真人场景的 AI 东西。

② AI 图形特效

智能编辑

Adobe 最近发布了 AI 编辑东西 Firefly，虽然目前可体验功能仅有图片生成、文字动机 2 项功能。但根据介绍来看它具有强大的图片编辑能力，包含随手涂鸦作画、上传草图即可生成矢量字体文件、一键修改画面场景、关键词生成设想模板等等能力；

当视频在手机上无法加载，可前往PC查看。

智能生成

NVIDIA Canvas 早于 Adobe 发布了自家的涂鸦出图能力，帮助设想师加快概念图创作探索，并腾出更多时间进行创意表达。用户通过调色板绘制简单的形状和线条，AI 模型会在屏幕上实时呈现出与之相呼应的风景图象。用户可以通过切换材质来自定义图象动机，Canvas 提供 9 种气概的可视化动机和 20 种不同材质，比如将雪地改为草地，图象将呈现从冬日仙境变为热带天堂的视觉感受。

当视频在手机上无法加载，可前往PC查看。

③ AI 辅助 UI 设想

AI 生成 UI 版式

近期已经有团队开始实践在 AI 辅助下的 UI 设想。比如 Habitable 开发的 Figma 插件“AI designer”，在展示视频里，它可以通过一段描写生成复杂的页面。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

AI 生成实质素材

Microsoft Designer 是一款智能生成图文实质的设想东西，搭载 Dall-E2，根据用户输出文字指令，可以为用户自动生成设想素材，如社群贴图、营销 Banner 等高质量的排版。

当视频在手机上无法加载，可前往PC查看。

3. 塑造虚拟人

虚拟人是近年很火的领域，虚拟人应用前景广阔，如虚拟偶像、助手、主持人等等，是未来虚拟世界最重要的存在之一。如何塑造虚拟人的人格化特征，实现虚拟人功能，背后都依托的是 AI 手艺的加持。

在虚幻引擎最新发布会上，发布了 MetaHuman 新功能 Animator。它可以让你应用 iPhone 或立体头戴式摄像机（HMC）在 MetaHuman 角色上以高保真动画的形式重现任何面部表演。有了它，你就能捕捉到演员表演中的个性、真实感和保真度，将每个细节和微妙变化转移到任意 MetaHuman 身上，在虚幻引擎中为他们注入生命力。

当视频在手机上无法加载，可前往PC查看。

三、AI 对设想的价值

1. 助力设想师表达创意

设想师可以将 AI 东西应用在工作中，比如当需要探索视觉概念时，可以应用简单的文本说明生成一些素材供创意师提供灵感和参考；还可以借助 AI 将已有素材尝试其他不同气概元素，探索可能性；再有就是利用一些 AI 图形处理东西，快速生成系列实质比较筛选。

比如，数码艺术家 Karen X Cheng 和时尚杂志《Cosmopolitan》团队一起创造了首个由 AI 生成的艺术封面。虽然渲染这张图片只用了 20 秒，但团队为了达到更满意的动机，将大量时间投入到创意方向的讨论和关键词的挑选与组合上，他们尝试输出了数百次创意关键字组合进行调试，最终找到了想要的动机。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

应用提示词 “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave.”生成的几组图象

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

应用提示词 “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward camera on Mars in an infinite universe, synthwave digital art.” 生成的最终封面动机，

2. 提供更新颖的营销方式

AI 如今也成为广告营销领域必不可少的东西，通过 AIGC 或 AI 实质编辑功能，来实现营销实质的个性化、可互动性等特征，来强化产品吸引力，提升品牌形象。

亨氏 AI 番茄酱

番茄酱品牌亨氏 Heinz 去年借助 AI 自动生成图象的话题制作了趣味性的广告，向广大消费者证明了人工智能更喜欢亨氏番茄酱的事实。广告中，亨氏利用 Dall-E2，输出“蕃茄酱”后，AI 自动生成了一款有亨氏经典外型包装的番茄酱。当继续输出“文艺复兴番茄酱”、“印象派番茄酱”、“外太空番茄酱”等更复杂的文字指令时，生成的图象结果无论在气概上如何变化，所呈现的番茄酱外型和 LOGO 位置都与亨氏番茄酱极为相似，这也印证了广告中的那句话：“连 AI 都认为番茄酱就是亨氏”。同时，亨氏还邀请了世界各地的粉丝参与到用 AI 创作番茄酱的活动中，粉丝们通过输出各种词汇，生成怪异、有趣的番茄酱图象，并发布到网络，亨氏将其中较为出色的案例分享到了官方社交平台，利用 AI 生成视觉动机的热点，成功帮助品牌进行了推广传播。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

QQ 音乐 MUSE AI 具像化歌曲海报

AIGC 已经遍布 QQ 音乐的各处细节中，从听歌体验、视觉呈现、社交分享等多个维度，做了不少有趣的创新尝试。与以往的歌曲专辑封面播放不同，QQ 音乐新上线的 AI 播放器是国内音乐行业首个在 AIGC 领域运用的视觉尝试，其原理是通过在 AI 东西输出关键词，让 AI 算法组合各种元素，生成有创意的播放器气概。现在，QQ 音乐已推出机械装甲、雪山白、积木游戏、工业灰等 6 款供用户选择，据悉还将结合场景，有更多样式可以期待。

当视频在手机上无法加载，可前往PC查看。

3. 扩展品牌语言

设想师可以寻找更具创造性的方式与 AI 合作，比如创作品牌语言。杰西卡·沃尔什 (Jessica Walsh) 应用 AI 为虚拟核能影响者 Isodope 创建品牌语言，将核能重新塑造为一种向善的力量。Isodope 是巴西模特伊莎贝尔·博梅克 (Isabelle Boemeke) 创建的在线角色，目标是利用 Isodope 超凡脱俗的形象和创意气概在 TikTok 上吸引人们的注意力，来改变人们对核能争议的看法，倡导将核能作为解决气候变化和能源紧缺的手段。

Isodope 的品牌元素和排版完全由 AI 打造，Walsh 团队将创意想法通过 DALL-E，创造出一种全息插画气概的品牌语言，通过易于分解的视觉元素和前卫的气概表达来缓解人们对核的恐惧，Walsh 说：“你必须推动这个东西并学习如何与它对话，才能产生更复杂、更有趣、感觉更原始的东西。” DALL·E 还帮助品牌创建了各色贴纸，以便于创建社交资产。借助 AI 使 Isodope 团队围绕核能概念扩展和创造更多的品牌元素。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

4. 打造全新的交互方式

依赖于 AI 支撑的虚拟人和 Chatgpt 能力，未来人们面向虚拟世界的交互模式将由原来的文本、图片、视频等实质升级为拟人化的互动方式。这将大大提升虚拟产品互动的友好性，同时提升用户对虚拟产品的情感链接。

日本便利店巨头罗森(Lawson)在东京开设首家配备虚拟店员的“Green Lawson”门店。接待顾客的为显示屏上的虚拟店员，一项研究数据表明，它通过线上发放优惠券领取率是 10%，通过人发领取率为 70%，而通过虚拟人发领取率为 57%，可见未来这种交互方式在商业领域的广阔前景。

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

四、总结

很多人看到 AI 的发展现状，不免担心 AI 未来会在很多方面取代设想师。事实上大可不必如此看待问题，AI 虽然在图象生成、图象编辑和插图排版等方面有着让人赞叹的动机。但就目前来看，它的实质生成还存在很多问题。即时 AI 在将来实质生成上已经炉火纯青，在情感表达、创意等很多方面，AI 还需要人的调教和指导才能产生很好的价值。

得益于 AI 在设想领域的快速发展，人工智能势必会大大简化设想师的工作，提升设想师处理各种图象的效率。设想师也不必将时间浪费在去除背景等费力、重复的任务上，并且将有机会以最少的努力探索更多创意。学习和研究 AI 在设想上最新的能力，将这种能力找到一个很好的契合点，应用在项目中，必将为为项目带来不一样的亮色。

参考文献：

{{userData.name}}已认证

AI有哪些设想应用场景？来看腾讯高手的7000字超全总结！

一、背景

二、AI 与设想相关的最新手艺

三、AI 对设想的价值

四、总结

计划趋势抢先知！智能对话时代来临：GUI正在向CUI演变

AIGC如何应用到任务中？我做了3个实战案例！

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

2024年AI 编程现在可以做到什么程度？

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩