站在年末的时间点上,我们明显可以感知到,2023 年是当之无愧的大模型元年,从文本大模型 ChatGPT,到图片生成模型 Stable Diffusion 和 Midjourney,技能的成长日新月异,大模型正在改变着行业格局。
与此同时,文本生成和图片生成似乎已经不足以满足算法科学家和工程师们的野心。
近几个月来,视频生成和视频编辑畛域的新星频繁登上各大媒体头条。
Runway 宣布了 Gen-2,可以快速生成高质量的短视频;Stability AI 开源了文生视频的扩散模型 Stable Video Diffusion;Meta 宣布了 Emu Video。每一次宣布都带来了明显的技能更新。
图 1 Emu Video 文本到视频生成过程
受到更多关注的,还有 Pika Labs 最新宣布的 Pika 1.0,尽管内测申请还在排队中,但从官方的示范视频来看,似乎文生视频已经开始在新的层级上竞争了。
图 2 Pika 官网上 Pika 1.0 示范视频
Google 最近宣布的 Gemini 多模态大模型,尽管颇受争议,但是从陆续拿到公测名额的用户分享中,也明显感觉到技能之争的格局已然翻天覆地。
与此同时,国内在 AI 畛域大力投入的科研机构和大厂也纷纷宣布视频生成、视频编辑等模型和工具。
清华人工智能研究院、复旦大学、智源研究院、阿里达摩院、字节跳动、百度等机构都已经大力布局视频畛域,一众视频生成模型、工具和多模态大模型呈现出百花齐放、百家争鸣之势。
如果要预测 2024 年人工智能畛域的热点,那么文生视频、图生视频等多模态大模型相关的视频生成能力必然在榜。
AI 视频生成的 iPhone 时刻到底在哪里?它已经出现了?还是会在即将到来的 2024 年呢?
可以坚信的是,视频生成畛域的未来不可低估,值得想象!
视频生成前沿研究与使用
人工智能畛域成长的当下,前沿技能已经来到了视频生成畛域。
就当下的技能成长而言,视频生成相较图像生成来说有更多挑战:视频的流畅性、动作的准确性,更大的 GPU 内存,更多的逻辑问题,逐帧生成还是一起生成的生成方式 ……
在看得见的未来,上面的问题都将找到答案。
而身处当下的我们,更快地跟上技能成长的脚步、先人一步了解和学习视频生成畛域尤为重要!
为了助力广大企业和技能从业者紧跟视频生成技能的成长潮流,全面了解文生视频、图生视频、多模态大模型等前沿技能,机械之心专门策划了以「视频生成前沿研究与使用」为主题的 AI 技能论坛。
论坛将于 2024.01.20 在北京市朝阳区举办,现场汇聚畛域内专家和一线开发者,期待能为视频生成畛域呈现一场高质量、高水平的线下调换举止。
机械之心在此诚邀你共赴这场知识与创新的盛宴,一同推动视频生成技能的成长和使用!
为什么值得参加?
汇聚高校教授及产业界重磅技能专家,掌握最新技能,拓宽技能视野
和技能大牛面对面调换,会后深度链接
覆盖核心技能拆解、明星产品最佳实践、技能未来探讨及展望
加入视频生成高质量技能调换社群,及时跟进行业前沿技能与资讯
全流程助力学习:会前会后学习资料大礼包
机械之心旗下相关付费举止享购票八五折优惠
现在报名可享「75 折早鸟福利」
「视频生成前沿研究与使用」机械之心 AI 技能论坛报名通道正式开启,扫描图中二维码可直达举止页面。
即日起至12月31日23:55时,购票参会即可享受 299 元早鸟特惠门票价格(原价 399 元)。
机械之心 AI 技能论坛前两期的参会者,请单独添加小助手 Alice(15650753618)的微信,直达专属优惠链接。
技能调换社群
为了方便技能调换,我们也特意建立了视频生成技能调换群,欢迎关心视频生成和多模态大模型的技能从业者扫码加入对话,深入调换技能细节和行业观察。
关于本次举止商务合作、团购、发票、内容等相关问题,欢迎添加本场举止小助手 Alice 或通过邮件进行咨询。(微信 15650753618,邮箱 [email protected])