智象大模型 2.0

更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅

一转眼,2024 年已经过半。我们不难发现,AI 尤其是 AIGC 领域出现一个越来越明显的趋势:文生图赛道进入到了稳步推进、加速商业落地的阶段,但同时仅生成静态图像已经无法满足人们对生成式 AI 能力的期待,对动态视频的创作需求前所未有的高涨。 因此,文生视频赛道持续高热,尤其是自年初 OpenAI 发布 Sora 以来,以 Diffusion Transformer(DiT)为底层架构的视频生成模型迎来了井喷期。在这一赛道,国内外视频生成模型厂商们正默默展开着一场技术竞速。在国内,一家成立于去年 3 月、专注于
  • 1