前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

作者：清源

2025-02-26 12:12

现在截图生成代码，已经来到了一个新高度 ——⾸个⾯向现代前端代码⽣成的多模态⼤模型解决⽅案，来了！而且是开源的那种。

现在截图生成代码，已经来到了一个新高度 —— ⾸个⾯向现代前端代码⽣成的多模态⼤模型解决⽅案，来了！而且是开源的那种。

（注：现代前端代码开发具有组件化、状态管理和数据驱动渲染、开发规范严格以及动态交互性强等特点。这些特点相互关联，共同构成了现代前端开发的复杂体系，对代码生成提出了更高要求。如基于 React、Vue 等框架的开发。）

这个模型叫做 Flame，话不多说，直接来看效果。

例如截图让 AI 生成下面这个界面：

前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

Flame 模型在“看”完图片之后，给出来的代码是这样：

前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

不难看出，Flame ⽣成代码明显是符合现代前端开发规范的，包括⽐较清晰的外联样式以及模块化组件结构。

同时在组件的实现中正确定义了组件的各个状态、事件响应、以及基于数据的组件动态渲染。

然而，诚如 GPT-4o 这样顶尖的 SOTA 模型，可能也与现代前端开发的核⼼需求背道⽽驰，因为局限在于端到端复刻设计图的过程中只能产出静态组件。

例如同样的界面，GPT-4o 的解法是这样的：

前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

问题根源在于这类静态代码既⽆法⽀撑模块化架构，也难以⽀撑动态交互。

每个组件都是“⼀次性产物”，任何细微的需求开发和迭代，可能都要开发者开发⼤量定制化代码，甚⾄是推倒重来。

前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

那么 Flame 模型又是如何解决这个问题的呢？

核心问题：数据稀缺

⼤型视觉语⾔模型（LVLM）在⽣成专业前端代码上表现不尽⼈意的根本原因在于数据稀缺。

现代前端开发流程⾮常复杂，⽐如像 React 这样的前端框架，强调组件化、状态管理和数据驱动的渲染⽅式。

这就要求⽣成的代码不仅要能⽤，还要符合开发规范，具备动态性和响应性。

然⽽，开源社区中⽀持前端开发的⾼质量图像-⽂本（代码）数据集极度稀缺。

像 websight 这样的数据集只涉及静态 HTML，不适⽤于现代前端开发。

收集并构建⾼质量的训练数据⾯临许多挑战：

如何从公共代码库中提取有效代码片段？
如何在保持原有代码效果的情况下进行渲染？
如何⽣成符合⼯程师习惯的⼤量、多样化数据？

针对这些问题，Flame 模型的团队给出了解法就是数据合成。

为提升 LVLM 在前端代码⽣成能⼒，我们设计了⼀整套⾃反思的智能体⼯作流，⽤于⽣成前端开发场景下的⾼质量数据。

该⼯作流不仅能⾃动从公共代码库中提取真实数据，还能够⾃主合成数据，⽣成专业、多样化的前端代码。

团队设计并实现了 3 种合成⽅法：

前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

基于进化的数据合成（Evolution-Based Synthesis）

借鉴 WizardLM 的 Evol-Instruct ⽅法，通过随机进化⽣成多样化的代码。它采⽤两种策略：⼴度进化和深度进化。

⼴度进化通过改变代码的功能和视觉⻛格，⽣成新变体；深度进化则通过增加代码的技术复杂度，优化组件处理、状态管理和性能，提升代码的可靠性和可维护性。

通过不断进化，可以得到⼤量覆盖不同需求的前端代码。

基于瀑布模型的数据合成（Waterfall-Model-Based Synthesis）

模拟传统软件开发的瀑布流模型，确保⽣成的代码结构清晰、逻辑⼀致。从需求分析开始，推导出系统功能需求，设计 UI 布局和架构，保证代码符合现代前端开发的模块化和可扩展性要求。

接着，通过多轮迭代，将需求转化为具体的、可复⽤的前端组件和⻚⾯。这种⽅法⽣成的代码逻辑清晰，适合复杂功能的开发任务。

基于增量开发的数据合成（Additive Development Synthesis）

在现有代码基础上，逐步增加功能和复杂性。通过逐步集成状态管理、交互逻辑或 API 等功能模块，⽣成的代码能更好地满⾜实际开发需求。

这种⽅法强调逐步提升代码的功能和复杂度，确保每次扩展都最⼤可能符合最佳实践。

上述的三种⽅法不仅丰富了数据集的规模和多样性，还确保了数据质量与实际应⽤价值。

这些⽅法能够低成本⼤规模合成特定前端框架的图⽂数据，借助上述⽅法，Flame 团队针对 React 框架构建了超过 400k 的多模态数据集。

同时，基于瀑布模型和增量开发的⽅法还⽀持多图场景下的数据合成、视觉思维链的合成，为更复杂场景下的前端代码⽣成提供了更多可能。

Flame：针对前端开发场景的 VLM

Flame 团队⼈⼯构建了⼀套包含 80 道测试题⽬的⾼质量测试集并通过改进后的 Pass@k 来评测多模态模型的前端代码⽣成能⼒。

如果⽣成的代码能够通过编译验证、符合编码规范，并且所渲染出的⻚⾯与输⼊的设计图⾜够相似，则认为该代码符合要求。

评测结果显⽰，当前顶级模型如 GPT-4o，Gemini 1.5 Flash 因其⽣成代码主要为静态代码，严重偏离代码规范，使其最⾼ Pass@1 仅为 11%，⽽ Flame 在相同条件下达到了 52%+，展现出了极⼤的潜⼒。

同时，Flame 仅⽤ 20w 左右的数据量级即取得以上成果，进⼀步验证了上述数据合成⽅法的价值以及⾼质量数据集在多模态模型能⼒提升中的关键作⽤。

前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

△ 左：测试图；右：Flame 效果图

值得一提的是，将训练数据、数据合成流程、模型及测试集已经全⾯开源，感兴趣的小伙伴赶紧去看看吧。

GitHub 地址：

https://github.com/Flame-Code-VLM/Flame-Code-VLM/blob/main/README.md

本文来自微信公众号：量子位（ID：QbitAI），作者：关注前沿科技

2025 开发 AI 应用必备 JS 工具库！

本文来分享开发 AI 应用必备的 js 工具库，帮助你更好地迎接 AI 时代的前端开发浪潮。 UI 组件库Ant Design XAnt Design X 是遵循 Ant Design 设计体系的一个 React UI 库，用于构建由 AI 驱动的界面，一键接入智能对话组件与 API 服务。目前，提供了 13 个用于 AI 应用开发的组件，可以满足很多 AI 场景。

11/26/2024 9:50:18 AM

CUGGZ

根据最近的一项 CIO 报告，企业在人工智能（AI）领域的投资高达2.5亿美元，尽管在证明投资回报率(ROI)方面面临挑战。商业领袖们正努力提高生产力，但新技术的集成往往需要重构现有应用、更新流程并激励员工学习，以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查，以揭示 AI 采用的现实情况，探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。

3/18/2025 10:02:00 AM

AI在线

思谋发布首个工业大模型开发底座大模型开发成本直降40%

6月27日，华南工博会现场，思谋科技宣布行业首个工业大模型开发与应用底座SMoreLrMo正式发布。SMoreLrMo是面向工业场景的大模型开发与应用平台，覆盖了应用层面、算法框架、基础设施服务等开发全场景，涉及算力资源调度管理能力、数据自动标注管理能力、应用开发管理能力、算法服务管理能力等人工智能模型全生命周期。今年以来，大模型的火热点燃了新一轮人工智能发展浪潮，也正在引领新一轮工业革命，帮助企业重塑生产及经营各环节以实现提质降本增效。而SMoreLrMo平台的发布，将为大模型在工业领域的应用提供了基础，进一步降

6/27/2023 3:51:00 PM

新闻助手

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

核心问题：数据稀缺

基于进化的数据合成（Evolution-Based Synthesis）

基于瀑布模型的数据合成（Waterfall-Model-Based Synthesis）

基于增量开发的数据合成（Additive Development Synthesis）

Flame：针对前端开发场景的 VLM

相关资讯

2025 开发 AI 应用必备 JS 工具库！

调查：超72% 的企业选择 AI 工具时最看重易用性

思谋发布首个工业大模型开发底座大模型开发成本直降40%

前端程序员请注意：首个截图就能生成现代前端代码的 AI 开源

核心问题：数据稀缺

基于进化的数据合成（Evolution-Based Synthesis）

基于瀑布模型的数据合成（Waterfall-Model-Based Synthesis）

基于增量开发的数据合成（Additive Development Synthesis）

Flame：针对前端开发场景的 VLM

相关资讯

2025 开发 AI 应用必备 JS 工具库！

调查：超72% 的企业选择 AI 工具时最看重易用性

思谋发布首个工业大模型开发底座 大模型开发成本直降40%

思谋发布首个工业大模型开发底座大模型开发成本直降40%