Sora 团队负责人称 Sora“还不是一个产品”,短期不会向公众开放

感谢近日,YouTube 频道 WVFRM Podcast 在其节目中,邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。IT之家注:三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均为 Sora 项目负责人。这三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,“还不是一个产品,短期之内不会向公众开放。”对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但
感谢近日,YouTube 频道 WVFRM Podcast 在其节目中,邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。

IT之家注:三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均为 Sora 项目负责人。

这三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,“还不是一个产品,短期之内不会向公众开放。”

对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但我们应该如何改进它是一个悬而未决的问题。

谈及 Sora 的原理时,负责人表示,其工作原理是分析大量视频数据、学习生成逼真的视频,工作方法融合了 GPT 等大语言模型及 DALL-E 等扩散模型的技术,架构类似于“介于两者之间”—— 架构上更像 GPT,训练方式类似于 DALL-E。

而对于 Sora 的训练数据来源问题,负责人则称不能透露太多细节,仅表示是基于公开可用的数据、OpenAI 授权数据的组合进行训练的。

Sora 团队负责人称 Sora“还不是一个产品”,短期不会向公众开放

据IT之家此前报道,Sora 能够根据文本快速生成相对高质量的视频,但业内人士认为,目前这类 AI 工具仍存在局限性,无法完全取代人类创作者的工作。

“很多人说好莱坞完了,” 电影概念艺术家和插画师 Reid Southen 表示,“但我并不这么认为。好莱坞的制作流程非常复杂,这些视频也存在很多问题,尤其是时间一致性和额外肢体等瑕疵。”

相关资讯

GPT-4写代码,DALL·E 3+MJ搞定画面,AI版「愤怒的南瓜」来袭

这个「愤怒的南瓜」游戏玩起来简单,创建起来却需要一些诀窍。自 GPT 系列对话大模型以及 DALL・E、Midjourney 等文生图大模型兴起以来,基于它们的硬核、有趣二创应用花样频出,让普通人切身地体验到了大模型的魅力。今天又一个这样的游戏项目引起了我们的注意。推特用户 @javilopen 使用 GPT-4、DALL・E 3 和 Midjourney 编写了小游戏「愤怒的南瓜」(PS:如有雷同纯属巧合),其中 GPT-4 负责所有的编码工作,DALL・E 3 和 Midjourney 负责图形部分。游戏画面、

吃了几个原作者才能生成这么逼真的效果?文生图涉嫌视觉「抄袭」

虽然提示词只是要生成「动画版的玩具」,但结果和《玩具总动员》没有区别。不久之前,《纽约时报》指控 OpenAI 涉嫌违规使用其内容用于人工智能开发的事件引起了社区极大的关注与讨论。GPT-4 输出的许多回答中,几乎逐字逐句地抄袭了《纽约时报》的报道:图中红字是 GPT-4 与《纽约时报》报道重复的部分。对此,各个专家分别有不同的看法。机器学习领域权威学者吴恩达对 OpenAI 和微软表示了同情,他怀疑 GPT「存在抄袭」的原因并不只是模型训练集使用了未经授权的文章,而是来自类似于 RAG(检索增强生成)的机制。Ch

超10秒高分辨率,北大Open Sora视频生成更强了,还支持华为芯片

北大团队联合兔展发起的 Sora 复现计划,现在有了新成果。OpenAI 在今年年初扔出一项重大研究,Sora 将视频生成带入一个新的高度,很多人表示,现在的 OpenAI 一出手就是王炸。然而,众多周知的是,OpenAI 一向并不 Open,关于 Sora 的更多细节我们无从得知。谁能率先发布类 Sora 研究成了一个热门话题。今年 3 月初,北大团队联合兔展启动了 Sora 复现计划 ——Open Sora Plan,该项目希望通过开源社区的力量复现 Sora。项目上线一个月,星标量已经达到 6.6k。项目地址