Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

理论
12月10日
编辑

新智元

消失的Aurora再度回归了！刚刚，xAI发布了首款完全自研图像生成模型Aurora，直接集成到了Grok当中。整个研发过程，耗时6个月。

消失的Aurora再度回归了！

刚刚，xAI发布了首款完全自研图像生成模型Aurora，直接集成到了Grok当中。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

整个研发过程，耗时6个月。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

马斯克：模型选项中已经删除了Aurora名字，选择Grok 2即可无缝体验全新模型

这款从0开始搭建的新模型，是一个自回归模型，采用了MoE架构，在混合文本和图像数据集上完成了训练。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

网友在周末展开的一波疯狂测试，早已见识到了Aurora模型强大生图能力。

如今一大波惊艳的评测，正在刷屏全网。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

左右滑动查看

自研6个月，Grok图像生成功能正式上线

官博中，xAI介绍了Aurora专为提升Grok的图像生成能力而推出。

此前，Grok集成的图像模型，还只是别家的FLUX模型。

如今，自研新模型不论在人物肖像，还是表情包、艺术字体、实物生成方面，取得了极大的一致性。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

如前所述，Aurora是一种自回归混合专家模型（MoE），能够通过混合的文本和图像数据预测下一个 Token。

xAI研究团队在互联网上数十亿个示例数据上训练了模型，赋予其对世界深刻的理解能力。

Aurora的强大体现在多个维度：无论是生成逼真的图像渲染，还是精准执行复杂的文本指令，都展现出卓越的性能。

更令人兴奋地是，它还能原生支持多模态输入，用户可以直接使用图像进行创作和编辑。

这些强大的生图、编辑能力，极大地拓展了AI交互的边界。

目前，Grok全新图像生成功能，现已在𝕏平台的部分国家上线，预计将在一周内向所有用户全面开放。

接下来，一起看一些让人拍案叫绝的demo吧。

图像生成

首先，Grok能够能够在多个领域生成高质量的图像，这些领域通常来说，是图像生成模型的难点。

它可以呈现真实世界实体的精确视觉细节、文本、标志，还能生成逼真的人像。

Entity generation（实体）：

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Artistic text（艺术字）：

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Meme generation（梗图）：

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Realistic portraits（肖像）：

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Celebrities（名人）：

可以看到，其他的AI生图模型在这个场景下，不仅容易触发安全机制拒绝生成，而且即便是生成出来了，效果也不尽人意。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

图像编辑

其次，Grok还将编辑与生成能力合二为一，用户可以直接在生成的图像上进行修改，提供了更大创作自由度和灵活性。

据介绍，这一功能将很快在𝕏平台上正式推出。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

网友大波试用来袭

网友再次惊叹道，Grok在生成真实的人的图像方面，比自己用过的任何模型都要好。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

不久后，AI制作的表情包就会覆盖全网。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Cybertruck正接近木星。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

还有坐在Cybertruck上的小浣熊。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

更多测试案例：

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

团队介绍

xAI团队的执行力，完全以高效著称。

在Aurora还未正式发布之前，联创Greg Yang曾表示，在xAI工作起来太有趣了，不仅高效，还很有趣。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

马斯克称赞道，xAI团队超硬核。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

研究员Ethan Knight分享了这次模型背后是由一个小团队完成。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

四位核心研究人员分别是：

Gabriel Ilharco

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Gabriel Ilharco目前在xAI从事大规模多模态模型的研究工作。

在此之前，他曾在华盛顿大学获得博士学位，师从Ali Farhadi和Hannaneh Hajishirzi教授。在进入华盛顿大学之前，他曾在谷歌研究院担任AI研究员。

Ilharco的研究兴趣广泛，涉及自然语言处理和计算机视觉领域。尤其是，多模态模型、迁移学习、分布鲁棒性和以数据为中心的机器学习。

Eric Zelikman

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Eric Zelikman对算法如何（以及是否能够）学习有意义的表征和推理这个问题非常着迷，并且正在xAI探索这些问题。

入职xAI之前，他曾是斯坦福大学博士候选人，导师是Nick Haber和Noah Goodman。

Haotian Liu

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Haotian Liu是xAI的一名技术人员。他于2024年5月在威斯康星大学麦迪逊分校获得博士学位，师从Yong Jae Lee教授。

在此之前，他曾在浙江大学获得学士学位（荣誉学位）。

Haotian Liu对计算机视觉和机器学习领域非常感兴趣，最近的研究重点是构建可控的大型模型。此前，他还曾参与开发的研究成果包括LLaVA、Grok-1.5V和Grok-2。

Lianmin Zheng（郑怜悯）

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

Lianmin Zheng是xAI的技术人员。他曾在UC伯克利完成了博士学位，导师是Ion Stoica和Joseph E. Gonzalez教授。他本科就读于上海交通大学ACM班。

他曾和团队共同创立了非营利组织LMSYS.org，致力于推进开源大语言模型研究。

他的研究兴趣包括机器学习系统、大型语言模型、编译器和分布式系统。

还有整个产品团队，也在Aurora模型上做出了杰出的贡献，尤其是Greg Yang、Ehsan Ghandhari、Yaroslav Nazarov和Vincent Stark。

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

给TA打赏

共{{data.count}}人

人已打赏

马斯克机器人蒙眼户外溜达，45°斜坡跑着下！网友：只有一点小“脚滑”

2024-12-10 12:56:32

重磅！谷歌Willow量子芯片横空出世：解决量子计算三十年难题，马斯克惊叹，Altman祝贺

2024-12-10 13:50:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
12月16日
TOP2

平安人寿ChatBI：大模型智能化报表的深度实践
12月4日
TOP3

ChatGPT遇到这些人名开始自闭，OpenAI回应了
12月4日
字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片
12月5日
超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~
12月12日
OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发
12月4日
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
12月11日
实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！
12月16日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部