Emu Edit
Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制
生成式 AI 进入视频时代了。提到视频生成,很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚,Meta 宣布,他们的视频生成效果超过了这两家,而且编辑起来还更加灵活。这个「吹小号、跳舞的兔子」是 Meta 发布的最新 demo。从中可以看出,Meta 的技术既支持灵活的图像编辑(例如把「兔子」变成「吹小号的兔子」,再变成「吹彩虹色小号的兔子」),也支持根据文本和图像生成高分辨率视频(例如让「吹小号的兔子」欢快地跳舞)。其实,这其中涉及两项工作。灵活的图像编辑由一个叫「Emu Edit」的模型来完成。
11/18/2023 9:56:00 AM
机器之心
- 1
资讯热榜
使用 VLLM 部署 DeepSeek:基于 Ubuntu 22.04 + RTX 4090 + Docker 的完整指南
RAGFlow自动化脚本套件:自定义解析+回答质量评估+参数自动调优
FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero
生成式 AI 已过时:英伟达黄仁勋首提 Agentic AI,后续是机器人 Physical AI
奥尔特曼预告创意文学模型,称其首次被 AI 作品打动
早报速读!2025年最新AI视频产品评测&优秀案例
清华团队开源 “赤兔 Chitu” 推理引擎,助力国产 AI 生态发展
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
机器人
谷歌
大模型
Midjourney
模型
智能
用户
学习
GPT
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
芯片
Gemini
代码
神经网络
腾讯
计算
研究
Sora
AI设计
3D
英伟达
AI for Science
GPU
开发者
机器学习
场景
预测
华为
伟达
Anthropic
Transformer
模态
百度
深度学习
AI视频
驾驶
文本
苹果
搜索
神器推荐
算力
LLaMA
xAI
Copilot
安全
科技
人形机器人
视频生成
应用
字节跳动
具身智能
干货合集
2024
视觉
大语言模型
AGI
特斯拉
亚马逊
语音
Claude
AI应用场景