视频大模型无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 | NeurIPS
把连续相同的图像块合并成一个token,就能让Transformer的视频处理速度大幅提升。 卡内基梅隆大学提出了视频大模型加速方法Run-Length Tokenization(RLT),被NeurIPS 2024选为Spotlight论文。 在精度几乎没有损失的前提下,RLT可以让模型训练和推理速度双双提升。- 969
- 0
即梦AI首发,字节自研视频生成模型Seaweed开放使用
11月8日,字节跳动旗下的AI内容平台即梦AI宣布,即日起,由字节跳动自研的视频生成模型Seaweed面向平台用户正式开放。 用户登陆后,在“视频生成”功能下,视频模型选择“视频S2.0”即可体验。 图说:即梦AI PC端和App端模型使用入口9月底,字节跳动正式宣布向AI视频领域进军,发布豆包模型家族的两款视频生成模型Seaweed和Pixeldance,并通过即梦AI、火山引擎分别面向创作者和…- 3
- 0
类Sora模型到底懂不懂物理?字节完成系统性实验,图灵奖得主杨立昆赞转!
Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。 近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律,做到“举一反三”。 图灵奖得主、Meta首席AI科学家杨立昆点赞并转发了该研究,表示“结论不令人意外,但很高兴终于有…- 3
- 0
手机秒拍动画大片,高级运镜效果惊人!Runway两弹更新,火得一塌糊涂
前几天,Runway宣布更加灵活逼真的AI摄像头控件上线,开始实现3D化! 该功能Gen-3 Alpha Turbo视频生成模型可用。 而就在一个多星期前,10月23日,Runway还宣布了Gen-3 Alpha的新功能Act-One。- 970
- 0
一张显卡“看懂”一部电影:智源联合高校开源 Video-XL,打破长视频理解极限
长视频理解是多模态大模型的核心能力之一,也是迈向通用人工智能(AGI)的关键一步。 然而,现有的多模态大模型在处理 10 分钟以上的超长视频时,仍然面临性能差和效率低的双重挑战。 对此,智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校,推出了小时级的超长视频理解大模型 Video-XL。- 5
- 0
快手可灵 AI 用户已超 360 万,独立 App 即将上架
据 36 氪报道,在今日举行的 2024 中国计算机大会上,快手副总裁、大模型团队负责人张迪介绍,自今年六月发布以来,可灵 AI 已有超过 360 万用户,累计生成 3700 万个视频和超过一亿张图片。 近期可灵 AI 还将上架独立 App,方便用户使用。 据悉,可灵 AI 将内测视频人脸模型功能,基于创新的 ID 保持能力,支持用户自助训练人脸模型,完成训练后,可使用该模型进行 5s / 10s…- 3
- 0
真·赛博菩萨!最大的开源视频模型来了,我们实测:有点东西,但不多
AI好好用报道编辑:杨文目前发布的最大的开源视频生成模型。 Genmo 当了一回「赛博菩萨」。 昨晚,AI 视频生成公司 Genmo 推出了最新的视频生成模型 Mochi 1 ,并且大手一挥,直接给开源了 。- 9
- 0
首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造 AI 开源模型 Hallo2
复旦大学和百度联合开发了一款名为 Hallo2 的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。Ha…- 12
- 0
火山引擎发布大模型训练视频预处理方案,已应用于豆包视频生成模型
10月15日,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案,助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,“基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长…- 5
- 0
快手联合推出 Pyramid Flow 开源文生视频 AI 模型:最高 10 秒 768P@24fps,创新金字塔流匹配让推理 tokens 降至 1/4
由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等,提供更高效、更灵活的视频生成解决方案,目前已经在 Hugging Face 平台上线,并完全开源。 AI在线查询官方介绍,附…- 6
- 0
Meta 推出革命性 AI 视频工具,让广告创意焕然一新
感谢科技媒体 The Verge 于 10 月 8 日发布博文,报道称 Meta 公司在 Advertising Week 活动中,推出了 Image Animation 和 Video Expansion 两款 AI 工具。Image Animation根据 Meta 公司分享的最新动图,用户可以选择一张静态照片,无需在 Instagram Reels 上使用任何现有的视频素材,就能生成创意视频…- 8
- 0
氛围感拉满:微软新专利探索 Copilot AI 应用,匹配视频等生成音乐
科技媒体 Windows Report 昨日(10 月 4 日)发布博文,报道称微软公司获得了一项新的专利,构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。AI在线注:微软该专利名为《Artificial intelligence model for composing audio scores》,主要探讨了基于输入内容,来创建音乐的方法。该…- 9
- 0
Meta 发布 AI 视频生成器 Movie Gen:可自动生成含声音的高清视频
Meta 公司今天宣布了一款新的 AI 视频生成器 Movie Gen,该工具能够生成带有声音的高清视频。几个月前,其竞争对手 OpenAI 也推出了其文本转视频模型 Sora。输入文本 Movie Gen 就能自动生成视频,还可以编辑现有的视频或静止图像。据《纽约时报》报道,添加到视频中的音频也是 AI 生成的,通过环境噪音、音效和背景音乐与视频相匹配,视频支持不同的纵横比。Meta 表示,Mo…- 14
- 0
快手可灵 AI 新增“对口型”功能:生成人物口型与上传音频同步
感谢快手旗下可灵 AI 官方宣布,新增对口型功能,并面向所有用户开放 API 服务。在可灵 AI 生成人物视频后,上传音频,即可让视频人物口型和音频同步。可灵 1.0 及 1.5 模型生成的视频,只要满足视频画面的人脸条件,均支持对口型(目前仅支持人物类角色(真实 / 3D / 2D)进行对口型,动物类角色对口型暂不支持)。AI在线获悉,可灵 AI 正式面向所有用户开放 API 服务,支持在平台自…- 32
- 0
10 倍速度提升,新版 Dream Machineds 可在 20 秒内极速生成高质量 AI 视频
科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 Luma AI 升级推出 1.6 版 Dream Machine,AI 视频生成速度快 10 倍。Luma AI 简介Luma AI 是一家专注于人工智能技术的公司,主要提供视频生成和 3D 捕捉的解决方案。Dream Machine 简介Dream Machine 是一个先进的文本转视频生成器,用户可以通过输入文本来创建…- 25
- 0
字节跳动发布豆包视频生成模型,这效果让我分不清 AI 与现实
9 月 24 日,火山引擎 AI 创新巡展在深圳举办,带来了豆包大模型的最新进展。豆包大模型家族迎来了新成员。具体来说,火山引擎全新推出了豆包・视频生成模型,以及豆包音乐模型、同声传译模型,同时还升级了通用语言模型、文生图模型、语音模型,不断增强各类模态以及规模化的调用量,让豆包大模型“更强模型、更低价格、更易落地”的优势持续凸显。此外,多家行业客户也在会上分享了大模型应用的实践经验。本次豆包带来…- 28
- 0
美图:“奇想大模型”视频生成能力已完成全面升级,可生成 1 分钟视频
美图公司今天宣布,旗下的“奇想大模型”视频生成能力完成全面升级,在实现生成能力、生成效率以及模型性能的三重进阶基础上,结合美图在计算机视觉领域的多项自研技术,实现了视频生成时长、画质、流畅性、真实性及可信度等方面的提升。据悉,美图奇想大模型的单次文生视频时长、单次图生视频时长均达 5 秒,支持生成 1 分钟、24FPS、1080P 的超长视频,升级后的视频生成功能将逐步覆盖美图秀秀、美颜相机、Wi…- 25
- 0
美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶
9月23日,美图公司宣布美图奇想大模型(MiracleVision)视频生成能力完成全面升级,在实现生成能力、生成效率以及模型性能的三重进阶基础上,结合美图在计算机视觉领域的多项自研技术优势,视频生成时长与画质、流畅性、真实性及可信度等方面提升显著。目前,美图奇想大模型(MiracleVision)的单次文生视频时长、单次图生视频时长均达5秒,已支持1分钟、帧率24FPS、分辨率1080P的超长视…- 31
- 0
快手可灵 AI 发布 1.5 模型:新增“运动笔刷”,支持生成 1080p 视频
快手可灵 AI 今日面向全球发布可灵 1.5 模型,新增“运动笔刷”功能。据介绍,“运动笔刷”功能为图片中的元素(人或物体等)指定运动轨迹,还支持额外指定静止区域,提升画面可控性。同时,可灵 AI 的视频画质有所提升,支持生成 1080p 视频,同时构图更美观、动作更合理、文本相关性提升。快手高级副总裁盖坤 9 月 13 日在投资者日上披露,截至目前,已有超过 260 万人使用过快手的视频生成大…- 52
- 0
视频
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!