一句话让图片动起来，苹果发力大模型动画生成，可直接编写结果

苹果最新的 AI 东西可以使用文本描述为图象制作动画。现阶段，大模型惊人的创新能力持续影响着创意领域，尤其是以 Sora 为代表的视频生成技术，更是引领了新一代潮流。当大家都为 Sora 感到震撼的同时，或许苹果的这项钻研也值得大家关注一下。在一篇名为「Keyframer: Empowering Animation Design using Large Language Models 」的钻研中，来自苹果的钻研者发布了一个可以利用 LLM 生成动画的框架 Keyframer，该框架准许用户采用自然语言提醒来创造静

苹果最新的 AI 东西可以使用文本描述为图象制作动画。

现阶段，大模型惊人的创新能力持续影响着创意领域，尤其是以 Sora 为代表的视频生成技术，更是引领了新一代潮流。当大家都为 Sora 感到震撼的同时，或许苹果的这项钻研也值得大家关注一下。

在一篇名为「Keyframer: Empowering Animation Design using Large Language Models 」的钻研中，来自苹果的钻研者发布了一个可以利用 LLM 生成动画的框架 Keyframer，该框架准许用户采用自然语言提醒来创造动态 2D 图象的动画。

一句话让图片动起来，苹果发力大模型动画生成，可直接编写结果

论文地址：https://arxiv.org/pdf/2402.06071.pdf

具体而言，该钻研结合了基于语言提醒设想工件的新兴设想原则和 LLM 的代码生成能力，构建了一个新的 AI 驱动的动画东西 Keyframer。通过 Keyframer，用户可以通过自然语言提醒，从动态 2D 图象创造动画插图。借助 GPT-4，Keyframer 可以生成 CSS 动画代码，使输出的 SVG（Scalable Vector Graphic）动画化。

除此以外，Keyframer 支持用户通过多种编写器类型直接编写生成的动画。

用户还可以通过连续提醒和哀求 LLM 生成的设想变体来迭代他们的设想，以在新的设想方向上进行构思。不过，Keyframer 尚未公开。

之所以做这项钻研，苹果表示 LLM 在动画中的应用尚未得到充分探索，并带来了新的挑战，例如用户如何有效地用自然语言描述运动。现阶段虽然文生图东西如 Dall・E 和 Midjourney 等效果出色，但动画设想需要考虑更复杂的因素，例如时间以及协调性，这些因素很难在单个提醒中全面概括。

至于这项钻研的效果如何，用户只需上传图象，在提醒框中输出「让星星闪烁」之类的内容，然后点击生成即可。

一句话让图片动起来，苹果发力大模型动画生成，可直接编写结果

用户可以在一个批次中生成多个动画设想，并在单独的窗口中调整颜色代码和动画持续时间等属性。无需任何编码经验，因为 Keyframer 会自动将这些更改转换为 CSS，代码本身也是完全可编写的。这种基于描述的方法比其他形式的人工智能生成动画简单得多，后者通常需要多个不同的应用程序和一些编码经验。

Keyframer 介绍

Keyframer 是一款由 LLM 驱动的应用程序，旨在从动态图象创造动画。Keyframer 可以充分利用 LLM 的代码生成能力，以及动态矢量图（SVG）的语义结构，从而根据用户提供的自然语言提醒生成动画。

一句话让图片动起来，苹果发力大模型动画生成，可直接编写结果

输出：该系统提供了一个输出区域，用户可以在其中粘贴他们想要动画化的 SVG 图象代码（SVG 是一种标准且流行的图象格式，在插图中因其可伸缩性及在多个平台上的兼容性而常用）。在 Keyframer 中，SVG 的衬着显示在代码编写器旁边，以便用户可以预览图象的视觉设想，如图 2 所示，土星插图的 SVG 代码包含了如天空、光环等标识符。

一句话让图片动起来，苹果发力大模型动画生成，可直接编写结果