文生视频

字节跳动发布Seaweed-7B视频模型，AI视频生成迈向新高度

人工智能视频生成领域迎来新的里程碑。 AIbase从社交媒体获悉，字节跳动近期发布了其全新视频生成模型Seaweed-7B的论文与演示，展示了一系列突破性功能，包括音视频同步生成、长镜头叙事和实时高分辨率生成。这一发布标志着字节跳动在AI视频技术上的加速布局，以下是AIbase对Seaweed-7B的深度报道，解析其技术亮点与行业影响。

4/15/2025 6:01:49 PM

AI在线

LiblibAI接入阿里通义大模型，赋能2000万创作者的新纪元

在中国 AI 图像创作领域，LiblibAI 平台近日迎来了一个重大升级。该平台正式接入了阿里巴巴的通义系列大模型，进一步拓宽了其在 AI 图像生成与视频创作方面的能力。这一举措不仅是对 AI 技术的一次重大推进，也为广大的创作者群体带来了福音。

3/25/2025 10:57:00 AM

AI在线

LiblibAI接入阿里通义大模型推出10秒AI视频生成功能

近日，国内AI图像创作领域的领军平台LiblibAI宣布一项重大举措——接入阿里通义系列大模型，这一动作显著提升了其AI创作能力，为用户带来了更强大的创作工具。此次接入后，基于万相最新开源模型，LiblibAI推出了文生视频和图生视频功能。用户只需输入文本提示词，或者上传图片，就能快速生成10秒短视频。

3/24/2025 6:00:40 PM

AI在线

快手搜索AI升级:DeepSeek R1全面接入，搜索体验迎来质变!

快手宣布，其搜索功能已全面接入DeepSeek R1大模型能力，此举旨在显著提升搜索效果和用户体验，并进一步推动用户活跃度的增长。同时，快手也着眼于未来，积极探索智能搜索场景的商业化变现潜力。此前，快手的AI内容创作平台“可灵AI”已率先整合DeepSeek R1。

3/21/2025 2:44:00 PM

AI在线

快手可灵AI全面接入DeepSeek-R1，DeepSeek灵感版已上线

近日，快手旗下的可灵AI有了新动作。作为快手推出的新一代AI创意生产力平台，可灵AI自去年发布后，就不断进行迭代升级。其模型能力和生成效果一直处于行业较为领先的位置，还推出了众多创作功能和创意玩法。

3/17/2025 10:12:00 AM

AI在线

AI创作提速!可灵AI集成DeepSeek，灵感秒变专业级提示词!

据36氪消息，快手旗下新一代AI创意生产力平台可灵AI宣布已全面接入DeepSeek-R1模型。通过此次集成，用户在使用可灵AI的视频生成、图片生成等功能时，可借助DeepSeek-R1的强大能力辅助生成或优化提示词。这一创新功能旨在帮助用户轻松将创意灵感转化为专业的提示词，从而打造更高质量的AI创意视频内容。

3/17/2025 8:53:00 AM

AI在线

视频训练LoRA来了！Ostris 用 20 张照片打造惊艳 Wan 2.1 LoRA

2025年3月9日，美国加利福尼亚州——开源模型正让文生视频技术变得越来越有趣。 AI 开发者 Ostris（@ostrisai）近日在 X 平台上分享了他使用自家照片训练的 Wan2.1LoRA 模型成果，仅凭约20张照片和一块家用 RTX4090显卡，便实现了令人惊叹的视频生成效果。这一成果不仅展示了开源技术的潜力，也引发了 X 社区对视频 LoRA 训练工具的热烈讨论。

3/10/2025 9:00:39 AM

AI在线

视频生成平台 Runway 获得新技能：更改视频比例，图片拥有“电影级”运镜

视频生成 AI 创企 RunwayML 今天推出了“Expand Video”新功能。用户可通过输入文本提示，在原始画面基础上生成额外内容，灵活调整视频比例，该系统能够在扩展画面时保持视觉效果的统一性。

11/23/2024 10:50:38 PM

清源

国产文生视频大模型 Vidu 发布 1.5 版本更新：可保证多不同视角下的一致性

国产文生视频大模型厂商Vidu昨日宣布，Vidu 1.5新版本正式上线，其实现了“世界领先水平”的突破——能够理解多样化的输入，突破“一致性”的难题。

11/14/2024 4:27:26 PM

清源

最强卷王3个月进化9次！可灵AI上新1.5模型，国外网友：太疯狂

传说中的 Sora 公测还遥遥无期，「卷王」可灵又又又上新了。要知道，自今年 6 月发布以来，仅三个月，可灵 AI 就迭代了 9 次。这次它还直接把基座模型升级了，推出可灵 1.5 模型。那么，这个新模型到底强在哪儿？举个例子，我们输入同样的 Prompt：一位女生看到一封信后悲伤起来，不停地哭泣。1.0 模型的效果是这样的：1.5 模型的效果则是这样：（视频来源：X 博主 Pierrick Chevallier）一言以蔽之，可灵 1.5 模型不仅显著提升画质，直出 1080p 视频，还让画面主体的动幅更大、质量更

9/21/2024 8:26:00 PM

机器之心

可灵AI还是火到了马斯克那！

马斯克点赞可灵AI8月20日，AI插画艺术爱好者Déborah在推特上发布一段时长为五秒钟的视频，内容为女人手捧一朵燃烧的玫瑰，画面表现堪称电影级别的画质与动态效果。而这一视频背后，是由可灵AI完成图生视频过程。没过多久，这条视频获得了埃隆·马斯克（Elon Musk）的关注，并且他在评论区回复「AI Entertainment is happening fast」。

8/22/2024 12:13:00 PM

王悦

这个AI小玩物，让马斯克、川建国秒变「缺心眼子」粘土人

机器之能报道编辑：杨文五官乱飞的大佬们，原来这么有喜感。简单且有趣的 AI 小应用极容易出圈，比如说曾经风靡一时的妙鸭相机、粘土滤镜。最近，有人做了一个 iPhone app，只需要一张自拍照，就能生成一段挤眉弄眼的卡通视频。例如，眼皮乱耷拉的搞怪版梁龙：视频链接：：实时自定义表情的美女：这个小玩意儿就是 ——Cooraft。目前，Cooraft 这款应用只支持苹果系统，苹果手机和 ipad 用户可在苹果商城下载。今天我们就来体验一下。-1-马斯克、川建国的眉毛要上天Cooraft 提供三种功能，分别是脸部动画、风

7/26/2024 10:10:00 AM

机器之能

超 1.2 万人参加 CVPR 2024，谷歌研究院获得最佳论文

作者：赖文昕马蕊蕾编辑：陈彩娴北京时间今天凌晨，美国西雅图正在召开的计算机视觉盛会 CVPR 2024 正式公布了最佳论文等奖项。今年共有 2 篇论文获得了这份全球最重要的计算机视觉领域的大奖，团队成员分别来自谷歌研究院、加州大学圣地亚哥分校、南加州大学、剑桥大学及布兰迪斯大学。本周（6.17-6.21），第四十一届国际计算机视觉与模式识别会议（CVPR）在美国西雅图拉开帷幕。

6/20/2024 2:40:00 PM

赖文昕

快手「可灵」爆火：海外AI圈巨震，中国版Sora一号难求

短短一年后，AI 生成的「吃面条」已经如此自然流畅？这让全球网友都感受到了亿点点震撼。图源：，都来自快手刚刚推出的文生视频大模型「可灵」（Kling）。不是预发布、不是纯 Demo 合集，而是直接开放测试的产品级应用，人人都能申请。而且，可灵支持生成最长 2 分钟、30fps 的 1080P 视频，主打从头脑风暴到可发布作品的「一键转化」。（官网地址：）最早一批用上的用户已经「真香」：图源：

6/13/2024 11:28:00 AM

机器之心

Open-Sora 全面开源升级：支持单镜头 16s 视频生成和 720p 分辨率

最近，AI 科技评论发现，国产视频生成模型 Open-Sora 在开源社区悄悄更新了！现在单镜头支持长达16秒的视频生成，分辨率最高可达720p，并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。

4/25/2024 4:43:00 PM

我在思考中

Sora 发布两周后，关于 Sora 的一些冷思考

两周前的今天，北京时间 2 月 16 日，OpenAI 、谷歌、Meta、Stability 都在这一时间节点前后发布文生视频模型成果，但只有 OpenAI 的 Sora 在这场角逐中破圈而出，成功抢占全球的注意力。可以说，Sora 打响了文生视频大模型行业 2024 年的第一炮。面对 Sora 着实优异的视频生成效果，短时间内 AIGC 行业内掀起一轮又一轮讨论，一方面，没人想到 OpenAI 的动作如此之快，令人激动兴奋的同时也来不及招架，另一方面，也都在为其 “60秒超长长度”、“单视频多角度镜头”和“世界模型”的等炸裂的效果震惊，并声称会迎来行业洗牌。

3/4/2024 11:48:00 AM

林军

Sora 面世，视频生成的 GPT-3 时刻来了

2月16日凌晨，正值中国春节法定节假日期间，OpenAI 毫无预兆地发布了 AI 视频生成大模型 Sora。看过视频效果后，网友纷纷感叹「现实，不存在了。」不夸张地说，Sora 的技术结果直接碾压了过去世界范围内所有文生视频的探索结果，颠覆了 AI 短视频生成的现状。

2/26/2024 7:05:00 PM

林军

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

文生视频

字节跳动发布Seaweed-7B视频模型，AI视频生成迈向新高度

LiblibAI接入阿里通义大模型，赋能2000万创作者的新纪元

LiblibAI接入阿里通义大模型 推出10秒AI视频生成功能

快手搜索AI升级:DeepSeek R1全面接入，搜索体验迎来质变!

​快手可灵AI全面接入DeepSeek-R1，DeepSeek灵感版已上线

AI创作提速!可灵AI集成DeepSeek，灵感秒变专业级提示词!

视频训练LoRA来了！Ostris 用 20 张照片打造惊艳 Wan 2.1 LoRA

视频生成平台 Runway 获得新技能：更改视频比例，图片拥有“电影级”运镜

国产文生视频大模型 Vidu 发布 1.5 版本更新：可保证多不同视角下的一致性

最新测评！美图大模型提前揭秘，这波风格化美到窒息

最强卷王3个月进化9次！可灵AI上新1.5模型，国外网友：太疯狂

可灵AI还是火到了马斯克那！

这个AI小玩物，让马斯克、川建国秒变「缺心眼子」粘土人

超 1.2 万人参加 CVPR 2024，谷歌研究院获得最佳论文

快手「可灵」爆火：海外AI圈巨震，中国版Sora一号难求

Open-Sora 全面开源升级：支持单镜头 16s 视频生成和 720p 分辨率

Sora 发布两周后，关于 Sora 的一些冷思考

Sora 面世，视频生成的 GPT-3 时刻来了

LiblibAI接入阿里通义大模型推出10秒AI视频生成功能

快手可灵AI全面接入DeepSeek-R1，DeepSeek灵感版已上线