马斯克点赞可灵AI
8月20日,AI插画艺术爱好者Déborah在推特上发布一段时长为五秒钟的视频,内容为女人手捧一朵燃烧的玫瑰,画面表现堪称电影级别的画质与动态效果。而这一视频背后,是由可灵AI完成图生视频过程。没过多久,这条视频获得了埃隆·马斯克(Elon Musk)的关注,并且他在评论区回复「AI Entertainment is happening fast」。
到目前为止,大部分国内初创的文生视频公司并没有拉开太大差距,风头都被国外的Sora、Runway占据之时,可灵AI是国内唯一被马斯克点赞的一个,可以说是十分争气。但其实,在马斯克亲自点赞之前,可灵AI的风早就已有吹遍国内外之势。6月初,快手自研的视频生成大模型可灵AI正式发布。问世之初,在海外社交媒体上就掀起了一波热度,大量海外网友在「求」一个可灵AI的内测机会。
之所以有这么高的热度,是因为可灵AI确实是继Sora后效果最惊艳的文生视频模型,并且能开放公测,让公众看得见摸得着,更增强其可信性。
市场分析机构摩根士丹利公开评论道:可灵AI的表现要比抖音和腾讯过往发布的视频生成模型都更加优秀。其成功发布,将有望使快手的用户规模和活跃度进一步提升,从而长期影响快手在电商和商业化等领域的货币化潜力。
从视频生成效果本身来看,可灵AI不仅能够模拟物理世界特性,还具备了强大的概念组合能力和想象力,生成的视频分辨率高达1080p,时长最高可达2分钟。更有网友表示:可灵AI生成的内容比真实世界世界还好。
甚至,可灵AI的效果引起了美国科技界权威杂志《麻省理工科技评论》的注意,发表题为《我测试了一个令人兴奋的中国新型“文生视频”人工智能模型》的文章,对照了可灵AI与Sora的生成效果以及对物理世界的还原能力。6月21日,可灵AI再度进化,正式推出图生视频功能,支持用任意静态图像生成 5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事 。马斯克点赞的视频,也是出自可灵AI这一核心爆款功能。在海外,快手的图生视频得到了广泛的使用。被点赞视频的作者Déborah也多次用可灵AI制作视频 。
7月6日,在上海举行的2024世界人工智能大会上,正式上线了网页端(https://klingai.kuaishou.com),推出了更加清晰的高画质版,在视频处理的精细度上有了大幅提升。其中,首尾帧控制、镜头控制等新功能也一起上线,并且创作者单次生成的文生视频时长也增加至10秒。
7月底,可灵AI大模型全面开放内测,并正式面向全球上线会员体系,针对不同类别的会员,提供相应的专属功能服务。
可以见得,在如今的AIGC竞争格局中,可灵AI已经取得了自己的身位优势。
百万级用户生成千万+视频 ,快手AIGC的里程碑式突破
在马斯克点赞可灵AI视频的同一天,快手发布2024年第二季度及中期业绩,总营收同比增长11.6%至310亿元。经调整净利润达46.8亿元,超过市场一致预期。
本季度,快手更是在AIGC领域取得了里程碑式的突破。在可灵AI正式面向全球开放会员体系后,截至目前,已有超过百万人使用过可灵AI,并累计生成超千万视频。
在当天晚间举行的业绩电话会上,快手联合创始人、董事长兼CEO程一笑表示,针对可灵AI的商业化,除了加强C端会员付费的全球运营外,也将寻求更多与B 端合作变现的可能性,力争尽快实现可观的商业化变现规模。
除了视频生成大模型,快手的语言大模型和文生图模型也都实现了显著的性能提升:目前,快意语言大模型已经实现了在中文场景下综合性能超过GPT4.0的目标;多模态大语言模型也在视频内容的理解方面,达到了GPT4v的水平。此外,快手的文生图大模型可图经过多个版本的迭代,综合性能已经超越了Midjourney V5,可图也在近期宣布正式开源。
在具体业务场景中的应用层面,快手的大模型矩阵已经可以覆盖内容生产、理解、推荐等多个层面,并深度服务快手的商业生态场景。例如,基于快意大模型构建的视频和直播脚本生成、广告线索客服,叠加数字人技术,可以助力商业化广告主低成本生成高品质的视频和直播内容,提升线索转化效率。数据显示,今年上半年,有近2万商家借助快手大模型实现智能化经营,其中AIGC营销素材在6月的日均消耗已经达到2000万。
程一笑对接下来在大模型上的相关动作及长远规划进行了阐述:
首先,在语言大模型上,快手将侧重研发训练更适配业务场景的专项语言模型,大规模降低模型的整体推理成本;其次,在视觉生成模型方面,可灵AI依旧是重点发力方向,未来,快手将进一步升级可灵AI大模型,带来模型性能的进一步提升,以保持行业的领先地位;最后,也会探索将大模型进一步运用到商业化推荐中,提升算法推荐效率,从而给线上营销服务收入的增长带来更强劲的支撑。
「快手将坚定执行AI战略,在赋能现有业务场景的同时,努力创造新的业务变现模式。」程一笑说道。
自正式推出两个多月的时间以来,无论是在C端用户群体的自发使用还是在影视行业的专业运用,可灵AI都具有较高的参与度。
在前段时间网络中掀起的「AIGC让老照片动起来」、「拥抱小时候的自己」的话题中,有很多网友选择可灵AI作为工具来让照片动起来,连接过去和现在的自己。
除此之外,可灵AI也被媒体和影视行业广泛应用于专业视频制作流程中。在巴黎奥运来临之际,中央广播电视总台推出首部生成式AI微电影《百年前的那次出发》,就是由可灵AI提供技术支持,生动还原了100年前4名网球选手代表中国奔赴巴黎奥运会的历程。
尤其在七月下旬,由可灵AI提供深度技术支持国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》收官。作为星芒短剧暑期档的精选剧集,《山海奇镜之劈波斩浪》在5集的篇幅里,利用可灵AI对奇幻的上古传说进行当代“转码”,将古代的浪漫想象进行赛博复现。
截至7月27日,《山海奇镜之劈波斩浪》正片5集播放量超过5200万,全网话题曝光量超4.3亿,同时还登上全平台热搜21个,德塔文短剧景气指数top1、猫眼短剧热度日榜top2。
近日火爆全网的游戏《黑神话·悟空》,网友们也用可灵AI制作了大量视频,国产AI联动国产3A大作,表现效果甚至同游戏本体不相上下。
无论是网友的创意狂欢还是专业制作者的不断深耕,都让我们看到,未来视频生成大模型赛道的无限可能。