快手可灵上线图生视频与最长 3 分钟的视频续写功能

感谢快手可灵新功能“图生视频”和“视频续写”今日上线。图生视频功能,支持将静态图像转化为 5 秒钟视频,用户可通过提示词文本控制图像中物体的运动;视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频;此外文生视频新增 9:16 和 1:1 视频尺寸选择。 IT之家附快手可灵官方网站:,能够生成大幅度的合理运动,模拟物理世界特性。可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步压缩,
感谢快手可灵新功能“图生视频”和“视频续写”今日上线。

图生视频功能,支持将静态图像转化为 5 秒钟视频,用户可通过提示词文本控制图像中物体的运动;视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频;此外文生视频新增 9:16 和 1:1 视频尺寸选择。

IT之家附快手可灵官方网站:https://kling.kuaishou.com/

快手可灵上线图生视频与最长 3 分钟的视频续写功能

可灵是由快手自研打造的视频生成大模型,能够生成大幅度的合理运动,模拟物理世界特性。

快手可灵上线图生视频与最长 3 分钟的视频续写功能

可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。

在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步压缩,获得了较高的重建质量,在训练性能和效果之间取得了平衡。在时序信息建模上,快手设计了一款全注意力机制作为时空建模模块。

相关资讯

号称效果对标 Sora:快手视频生成大模型“可灵”开放邀测

感谢快手“可灵”视频生成大模型今日正式上线。官方表示,可灵大模型为快手 AI 团队自研,其采用 Sora 相似的技术路线,号称结合多项自研技术创新、效果对标 Sora。 据介绍,可灵大模型具备如下优势:可生成大幅度的合理运动可模拟物理世界特性具备强大概念组合能力、想象力生成视频分辨率为 1080p,时长 2 分钟(帧率 30fps),支持自由调整宽高比IT之家从快手方面获悉,可灵大模型已在快影 App 开放邀测体验。此外,基于“可灵”大模型,未来还将有更多应用方向即将落地,近期将首发“AI 唱跳”新玩法,可以同时驱

快手可灵 AI 网页端上线:所有功能限时免费,单次视频生成时长增至 10 秒

感谢快手今日宣布可灵 AI 网页端正式上线,所有功能限时免费(需自行申请)。“文生视频”开放最长 10 秒生成能力,“图生视频”新增运镜控制、自定义首尾帧等功能。官方演示视频: IT之家实测,可灵 AI 网页端提供 AI 图片、AI 视频以及即将上线的视频编辑三大板块。AI 图片可以登录后直接使用,用户通过文字描述即可获得自动生成的图片,另外还可以添加参考图使用。AI 视频支持最长 3 分钟的高清视频生成,目前需要申请使用,审核结果将通过手机短信通知,想要体验的朋友需要耐心等待一下。在今日举行的世界人工智能大会上

快手可灵 AI 推出会员订阅计划:支持 AI 图片 / 视频,首月 19 元起

感谢快手可灵 AI 推出会员订阅计划,其中连续包月首月最低价 19 元、次月 58 元,可生成约 66 个视频或 3300 张图片,还可享受高表现视频生成、视频延长、大师运镜等多项会员专属功能。与此同时,可灵 AI 针对 B 端同步开启 OpenAPI 企业用户招募,首批加入企业将拥有优先接入和专属技术支持。快手刚发布的 2024 年二季度财报显示,可灵 AI 已有超百万用户,累计生成了超千万视频。快手联合创始人、董事长兼 CEO 程一笑表示,未来将进一步升级可灵大模型,同时力争尽快实现可观的商业化变现规模。可灵大