AI数字人
阿里通义实验室推出新型数字人生成模型,音视频合成更真实!
阿里通义实验室近日发布了一款名为 “OmniTalker” 的新型数字人视频生成大模型。 这一创新模型的核心在于其能够通过上传一段参考视频,实现对视频中人物的表情、声音和说话风格的精准模仿。 相较于传统的数字人制作流程,OmniTalker 显著降低了制作成本,同时提升了生成内容的真实感和互动体验,满足了广泛的应用需求。
4/15/2025 2:01:38 PM
AI在线
EchoMimic V2:AI 数字人的新里程碑!首次实现身体动作口型全同步!
EchoMimic V2是阿里达摩院开源的一款基于音频驱动的肖像动画生成工具。 这一工具不仅能让虚拟形象开口说话,实现口型同步,还能在音频驱动下添加头部和身体动作,将数字形象的表现力提升到一个全新的高度。 如果你对AI数字人、AI配音、AI动画等制作感兴趣,那么EchoMimic V2绝对是一个不容错过的工具!
12/4/2024 4:08:12 PM
郭 小喵玩AI
5000字爆肝测评!五月 AI 资讯及实用测评合集
前言
想不想了解近期 AI 圈又发生了哪些劲爆大事件?赶紧来看这篇文章 get 第一手 AIGC 资讯和深度测评——没错,我们的AIGC 30天测评又和大家见面了。
如今各类 AIGC 工具平台百花齐放,我们的测评致力于持续追踪最新的 AI 技术进展,将 AI 圈内发生的重大事件与工具进行深度实测并汇总成文,定期发布带给同学们,希望可以帮助大家快速了解最新的 AIGC 趋势,并可以及时地将这些 AI 工具结合到工作、学习与生活中,运用 AIGC 将自己的生活变得更加丰富多彩!
此前,我们已经发布了第一期测评,如有需
6/5/2024 12:44:40 AM
团队新浪MDC
阿里出品!用一篇文章帮你了解AI数字人行业
人工智能(AI)技术的进步不仅改变了我们生活的方方面面,还在各行各业中展现出了巨大的潜力。AI 数字人,作为人工智能技术的一个重要分支,正在逐渐成为众多行业关注的焦点。这些虚拟的数字角色不仅具有逼真的外观和行为,还能够以超乎想象的方式与人类交互,从而提供全新的服务体验和业务机会。本文整理了 AI 数字人相关的基础概念、趋势报告、热点案例、AI 数字人平台和开源项目,以及作为设计师我们能用这些 AI 能力产出哪些有意思的工作。
:一、AI 数字人基础概念
1. 什么是 AI 数字人?
"数字人"是指利用先进的计算机图
3/30/2024 8:46:09 AM
团队阿里健康设计
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
Haisnap横空出世,小白用户也能轻松打造AI应用
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
本地部署DeepSeek+DiFy平台构建智能体应用
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
ChatGPT重磅更新:新增图像库功能,可查看自己用GPT生成的所有图片
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练