数字人

大厂实战案例！百度数字人直播体验改版复盘

前言. 电商直播行业从 2016 年淘宝上线直播历经 8 年增长，供需两端发生变革，越来越多并不擅长直播的商家从幕后走向前台“店播带货”，消费者购买决策因素逐渐增多的同时，也对直播质量要求越来越高，这促使直播服务商们纷纷开辟出组合数字人主播和数智化直播流程的新直播带货解决方案，百度「慧播星平台」就是其中之一。百度「慧播星平台」是全栈式的数字人直播解决方案，依托百度自研视觉模型/StyleSync/音频训练/PicGen/文心一言等 AI 技术，实现商家快速开播，带来用户端 7*24 小时不间断、智能专业的超拟真看播体验。

3/22/2025 1:00:51 AM

团队百度MEUX

行业首个：“中国石化 AI 数字员工”上岗，指导车主自助加油付款

中国石化 1 月 18 日在北京举行数字员工发布仪式，正式推出首位“AI 数字员工”，并在广西南宁新阳站等全国 40 余座加能站同步试点上岗。

1/20/2025 5:31:30 PM

汪淼

3D数字人生成来了！南洋理工提出StructLDM：高质量可控3D生成并支持编辑

三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。传统三维数字人制作往往费时耗力，近年来研究者提出基于三维生成对抗网络（3D GAN）从 2D 图像中学习三维数字人，极大提高了数字人制作效率。这些方法往往在一维隐向量空间建模数字人，而一维隐向量无法表征人体的几何结构和语义信息，因此限制了其生成质量和编辑能力。

1/14/2025 9:24:46 AM

AIGC Studio

日本罗森便利店将雇佣“海外店员”，以虚拟形象服务深夜顾客

据日经1月1日报道，日本便利店连锁品牌罗森将启用“远程海外员工”模式，通过数字化虚拟形象为深夜顾客提供服务，以应对劳动力短缺问题。

1/2/2025 9:31:54 AM

清源

中国移动联合研发 2D 数字人说话驱动系统：可生成 7 种情绪，用于 5G 新通话、AI 客服等

数字人生成技术上实现了端到端的二阶段 30 FPS 实时生成性能，并支持 512*512 人脸区域生成，同时具备高兴、悲伤等 7 种主流情绪控制生成能力。

12/9/2024 1:04:04 PM

汪淼

松下集团以 AI“复活”松下幸之助，借数字人传承创办者经营理念

松下控股株式会社内部直接接受过创始人熏陶的员工日渐减少，该公司因此决定利用生成式 AI 在集团内部探究和启发松下幸之助的理念，并传递给下一代员工。

11/29/2024 4:26:57 PM

溯波（实习）

讯飞星火多模态交互大模型上线，数字人、语音、视觉支持一键调用

“讯飞开放平台”公众号今天傍晚宣布，讯飞星火多模态交互大模型正式上线，其实现从语音交互拓展到音视频流实时多模交互，新增“多模态、超拟人和个性化”能力，实现语音、视觉、数字人交互三合一。

11/14/2024 6:07:54 PM

清源

完蛋，我被数字同事包围了！小冰AI数字员工再升级，零样本定制，即时上岗

「你好，我在咱们公司刚入职。业务上有什么事儿，就请您多多指教啦！」什么，这些同事竟然都是大模型驱动的 “数字人”？只需 30 秒画面，10 秒音频，10 分钟就能极速定制一个这样和真人无异的 “数字同事”。它可以直接和你实时交互，并且有着通信运营商级别的高质量低延迟的音画传输。就像这样：像这样：这是小冰公司最新上线的 “零样本” 数字人（Zero-shot Xiaoice Neural Rendering，Zero-XNR）技术，依托超千亿大模型基座，新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到

7/19/2024 2:59:00 PM

机器之心

与真人无异！Heygen 5.0数字人又来炸圈了

是的，如今不仅是搬砖人，数字人也加入了“内卷”的行列，就问你怕不怕。从上世纪 90 年代至今，数字人一直在默默发展，而近年来，随着 5G、AI 等技术的进步以及算力平台的迭代，数字人领域取得了显著的成果。一觉醒来，Heygen 5.0 的最新升级再次让人发狂，他们推出了一款名为 Avatar in Motion 1.0 的新功能，与之前只能坐着或站着口播，做几个重复简单动作讲述的数字人相比，现在的版本可以让数字人动起来了，走动式口播和演示几乎已经与真人无异了，看不出来是数字人了。当视频在手机上无法加载，可前往PC

4/21/2024 2:55:45 AM

团队58UXD

AI医疗应用又有新进展，支付宝开放“AI就医助理”解决方案

AI在医疗场景的应用又有新进展。 4月2日，支付宝发布“AI就医助理”解决方案，利用AI大模型、数字人等技术，助力医疗机构为患者提供覆盖就医前、中、后的“AI陪伴就诊”服务。据支付宝介绍，“AI就医助理”解决方案为用户提供从诊前、诊中到诊后的全过程智能交互。

4/2/2024 2:16:00 PM

晓楠

全方位盘点！7个常用的数字人 AI 设计神器

数字人 IP 设计是一项复杂而富有挑战性的任务，需要借助各种工具来实现。在这个领域，有许多优秀的工具可供选择，它们可以帮助我们创建出逼真、生动的数字人。本文将介绍一些常用的数字人制作工具，包括 MJ SD、虚幻引擎、Blender/C4D/MAYA、SadTalker、微软 Azure、PIKA 和 runway。这些工具在数字人设计的不同方面都有着独特的优势，我们将逐一探讨它们的功能和特点。通过了解这些工具，你将能够更好地掌握数字人设计的技术，实现你的创意想象。更多数字人干货：一、形象生成工具 1. MJ SD

1/29/2024 12:17:40 AM

团队58UXD

数字人制作神器 HeyGen 实测！听说能让视频制作效率提升10倍？

大家好，这里是和你们一起探索 AI 的花生，今天我要来和大家聊聊数字人制作神器HeyGen。随着数字人技术的出现和发展，相关公司一直都在它的应用边界，德国最近就出现了一个“AI 教堂”，里面主持仪式的不再是现实中的神父，而是屏幕里的“数字人”传教士。活动当日去现场参加的人还不少，不知道未来这种新型礼拜的形式会不会普及。今天要为大家介绍的 HeyGen 就是一款可以制作这种数字人视频的工具。与之前为大家介绍过的 D-ID 相比，它不仅能让数字人说话，还允许用户订制个性化的、符合不同行业需求的视频，并让视频制作的速度

6/14/2023 6:00:52 AM

夏花生

D-ID ！数字人视频制作神器，只需5分钟让照片开口说话

大家好，这是和你们聊设计的花生~ 大家最近在 B 站、抖音等各大视频平台上有没有看到一种新的视频类型——数字人视频，即视频中为出镜大家介绍内容的并不是真人，而是由 AI 生成的虚拟人物，人物说的话也是由 AI 配音的。这种视频用 AI 代替了真人出镜，省去了读稿、录制等多个步骤，能有效提升我们制作视频的效率。今天为大家推荐的 D-ID 就是一款能帮助我们迅速制作出数字人视频的神器，只需在里面上传你的人物照片，输入视频介绍文本，就能在几分钟内让图像开口说话，并且人物口型与音频能精准排匹配，真实感极强。 D-ID 官

6/8/2023 1:00:03 AM

夏花生

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

数字人