视频

别急着捧杀谷歌Veo2，毕竟曾被吹上天的Sora也翻了车
AI好好用报道编辑：杨文为了考住Veo2,也是难为人类了。总被 OpenAI 压着打的谷歌，终于扬眉吐气了！最近，谷歌连上几款大模型，个个备受好评。
应用
- 980
- 0
AI好好用12月19日
智驾公司下场搞AI视频生成，模型上线即开源
AI好好用报道编辑：杨文人人免费可用。大洋彼岸，两大巨头 OpenAI 和谷歌轮番炸场。一个发布了那个传说中的 Sora，一个推出了最强视频生成模型 Veo2。
应用
- 976
- 0
AI好好用12月18日
谷歌版Sora升级4K高清！一句话控制镜头运动，跑分叫板可灵海螺
OpenAI直播划水的一天，谷歌版Sora迎来了它的2.0——Veo 2，根据文本或图像生成更为高质量的视频。从官方介绍中看，此次主要有三个方面的升级。比如分辨率能达到4K。
理论
- 971
- 0
量子位12月17日
视频一键拆分PS层！DeepMind新模型效果碾压同级，物体、背景完美分离，还能脑补
视频数据中通常会包含动态世界中的复杂信号，比如相机运动、关节移动、复杂的场景效果以及物体之间的交互。如果能自动化地把视频分解成一组语义上有意义的、半透明的层，分离前景对象和背景的话，类似PS中的图片，就可以极大提升视频的编辑效率和直观性。现有方法在推断对象及其效果之间复杂的时空相关性时，只能处理静态背景或带有精确相机和深度估计数据的视频，并且无法补全被遮挡区域，极大限制了可应用范围。
理论
- 970
- 0
新智元12月17日
ChatGPT「睁眼」了！OpenAI版「Her」满血上线，还有圣诞限定彩蛋
OpenAI直播第六天，可以说是把圣诞氛围拉满了。在高级语音模式中，不仅加入了视频聊天，而且还有限定版圣诞老人语音。这就意味着，通过设备共享摄像头摄取到的内容，我们就可以和「Her」实时视频对话了！
理论
- 979
- 0
新智元12月13日
Sora上线即翻车？知名科技博主一手评测
AI好好用报道编辑：杨文终于识得Sora真面目。 Sora 千呼万唤始出来。 10 日凌晨，OpenAI 直接开放了 Sora 的新版本 ——Sora Turbo，ChatGPT Plus 和 Pro 用户可以直接上手体验。
应用
- 978
- 0
AI好好用12月12日
豆包电脑版上线视频生成功能，部分用户可体验
记者获悉，近日，字节跳动视频生成模型 PixelDance已在豆包电脑版正式开启内测，部分用户已开通体验入口。内测页面显示，用户每日可免费生成十支视频。 PixelDance视频生成模型于9月底首次发布，最早通过即梦AI、火山引擎面向创作者和企业客户小范围邀测，外部对其多镜头组合、运镜切换及人物运动能力评价较好。
应用
- 976
- 0
新闻助手12月11日
全乱套了！华妃骑野猪、曹操唱《APT.》，AI魔改老剧名场面，一个比一个癫
AI好好用报道编辑：杨文AI魔改剧又土又嗨！小作坊下料就是猛。近日，有网友用 AI 爆改国产剧，那画面一个比一个癫。
应用
- 988
- 0
AI好好用12月5日
谷歌领跑 AI 视频生成赛道：抢先 OpenAI Sora 推出 Veo 模型，可生成 1080P 高清视频
谷歌公司昨日（12 月 4 日）发布博文，宣布在 Vertex AI 平台上，以私测预览版的形式，面向企业开放最新的生成式 AI 视频模型 Veo，助力企业内容创作流程。
应用
- 978
- 0
故渊12月5日
经典卡尔曼滤波器改进视频版「分割一切」，网友：好优雅的方法
Meta的视频版分割一切——Segment Anything Model 2（SAM 2），又火了一把。因为这一次，一个全华人团队，仅仅是用了个经典方法，就把它的能力拔到了一个新高度——任你移动再快，AI跟丢不了一点点！例如在电影《1917》这段画面里，主角穿梭在众多士兵之中，原先的SAM 2表现是这样的：嗯，当一大群士兵涌入画面的时候，SAM 2把主角给跟丢了。
理论
- 974
- 0
量子位11月25日
视频大模型无损提速：删除多余token，训练时间减少30%，帧率越高效果越好 | NeurIPS
把连续相同的图像块合并成一个token，就能让Transformer的视频处理速度大幅提升。卡内基梅隆大学提出了视频大模型加速方法Run-Length Tokenization（RLT），被NeurIPS 2024选为Spotlight论文。在精度几乎没有损失的前提下，RLT可以让模型训练和推理速度双双提升。
理论
- 974
- 0
量子位11月18日
2024年10月出海AI网站流量排行榜
AI在线发布 2024年10月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜，并联合哥飞的朋友们出海社群发布出海AI网站流量排行榜！
AI榜单
- 26
- 0
admin11月12日
2024年10月全球AI网站增长排行榜
AI在线发布 2024年10月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜，并联合哥飞的朋友们出海社群发布出海AI网站流量排行榜！
AI榜单
- 14
- 0
admin11月12日
即梦AI首发，字节自研视频生成模型Seaweed开放使用
11月8日，字节跳动旗下的AI内容平台即梦AI宣布，即日起，由字节跳动自研的视频生成模型Seaweed面向平台用户正式开放。用户登陆后，在“视频生成”功能下，视频模型选择“视频S2.0”即可体验。图说：即梦AI PC端和App端模型使用入口9月底，字节跳动正式宣布向AI视频领域进军，发布豆包模型家族的两款视频生成模型Seaweed和Pixeldance，并通过即梦AI、火山引擎分别面向创作者和…
应用
- 14
- 0
新闻助手11月8日
类Sora模型到底懂不懂物理？字节完成系统性实验，图灵奖得主杨立昆赞转!
Sora爆火以来，“视频生成模型到底懂不懂物理规律”受到热议，但业界一直未有研究证实。近日，字节跳动豆包大模型团队公布最新论文，研究历时8个月，围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论：视频生成模型可以记忆训练案例，但暂时还无法真正理解物理规律，做到“举一反三”。图灵奖得主、Meta首席AI科学家杨立昆点赞并转发了该研究，表示“结论不令人意外，但很高兴终于有…
应用
- 9
- 0
新闻助手11月8日
手机秒拍动画大片，高级运镜效果惊人！Runway两弹更新，火得一塌糊涂
前几天，Runway宣布更加灵活逼真的AI摄像头控件上线，开始实现3D化！该功能Gen-3 Alpha Turbo视频生成模型可用。而就在一个多星期前，10月23日，Runway还宣布了Gen-3 Alpha的新功能Act-One。
理论
- 972
- 0
新智元11月5日
一张显卡“看懂”一部电影：智源联合高校开源 Video-XL，打破长视频理解极限
长视频理解是多模态大模型的核心能力之一，也是迈向通用人工智能（AGI）的关键一步。然而，现有的多模态大模型在处理 10 分钟以上的超长视频时，仍然面临性能差和效率低的双重挑战。对此，智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校，推出了小时级的超长视频理解大模型 Video-XL。
应用
- 6
- 0
汪淼10月28日
快手可灵 AI 用户已超 360 万，独立 App 即将上架
据 36 氪报道，在今日举行的 2024 中国计算机大会上，快手副总裁、大模型团队负责人张迪介绍，自今年六月发布以来，可灵 AI 已有超过 360 万用户，累计生成 3700 万个视频和超过一亿张图片。近期可灵 AI 还将上架独立 App，方便用户使用。据悉，可灵 AI 将内测视频人脸模型功能，基于创新的 ID 保持能力，支持用户自助训练人脸模型，完成训练后，可使用该模型进行 5s / 10s…
应用
- 11
- 0
浩渺10月24日
真·赛博菩萨！最大的开源视频模型来了，我们实测：有点东西，但不多
AI好好用报道编辑：杨文目前发布的最大的开源视频生成模型。 Genmo 当了一回「赛博菩萨」。昨晚，AI 视频生成公司 Genmo 推出了最新的视频生成模型 Mochi 1 ，并且大手一挥，直接给开源了。
应用
- 23
- 0
AI好好用10月23日
首发根据音频生成 4K 分辨率 1 小时长视频，复旦、百度联手打造 AI 开源模型 Hallo2
复旦大学和百度联合开发了一款名为 Hallo2 的全新 AI 模型，该模型可以生成长达数小时的 4K 分辨率人物动画，现已在 GitHub 发布开源。Hallo2 模型建立在 latent diffusion models 的基础上，相比上一代 Hallo 模型的效果更好，支持了长视频生成，通过引入数据增强方法如 patch-drop 和高斯噪声，有效提高了长时间视频的视觉一致性和时间连贯性。Ha…
应用
- 15
- 0
汪淼10月21日
火山引擎发布大模型训练视频预处理方案，已应用于豆包视频生成模型
10月15日，火山引擎在视频云技术大会上发布了大模型训练视频预处理方案，助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前，该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示，在AIGC、多模态等技术的共同推动下，用户体验在多个维度上经历着深刻转变，“基于抖音业务实践和与行业客户共创，火山引擎视频云正积极探索AI大模型与视频技术的深度融合，在技术底座、处理链路和业务增长…
应用
- 9
- 0
新闻助手10月15日
快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4
由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等，提供更高效、更灵活的视频生成解决方案，目前已经在 Hugging Face 平台上线，并完全开源。 AI在线查询官方介绍，附…
应用
- 11
- 0
故渊10月12日
Meta 推出革命性 AI 视频工具，让广告创意焕然一新
感谢科技媒体 The Verge 于 10 月 8 日发布博文，报道称 Meta 公司在 Advertising Week 活动中，推出了 Image Animation 和 Video Expansion 两款 AI 工具。Image Animation根据 Meta 公司分享的最新动图，用户可以选择一张静态照片，无需在 Instagram Reels 上使用任何现有的视频素材，就能生成创意视频…
应用
- 13
- 0
故渊10月10日
2024年9月全球AI网站流量排行榜
AI在线发布 2024年9月全球和国内AI网站流量排行榜、全球AI网站增长率排行榜，并联合哥飞的朋友们出海社群发布出海AI网站流量排行榜！
AI榜单
- 26
- 0
admin10月8日