微软 Azure AI 语音服务推出虚拟人形象，支持文本转视频

2024-08-23 07:29

微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用，Azure AI 语音服务最新推出了文本到语音虚拟人功能，可以将简单的文本转换为人类自然说话视频。今天，微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080，每秒 25 帧。AI在线附示例如下：Text to Speech Avatar 具有以下功能：将文本转换为由 Azure AI 文本转语音提供支持的人类说话视频，该视频具有自

微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用，Azure AI 语音服务最新推出了文本到语音虚拟人功能，可以将简单的文本转换为人类自然说话视频。

今天，微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080，每秒 25 帧。AI在线附示例如下：

微软 Azure AI 语音服务推出虚拟人形象，支持文本转视频

Text to Speech Avatar 具有以下功能：

将文本转换为由 Azure AI 文本转语音提供支持的人类说话视频，该视频具有自然的声音。

提供不同的人物预设形象。

形象的声音由 Azure AI 文本转语音生成。

使用批量合成 API 异步或实时合成文本到语音人像视频。

在 Speech Studio 中提供内容创建工具，无需编码即可创建视频内容。

通过 Speech Studio 中的实时聊天头像工具启用实时人像对话。

定价方面，文本转视频服务的收费将根据视频输出的长度计算并按秒收费。该服务现已在东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部地区推出。

微软 Azure 新增 9 款逼真 AI 语音，包括美式英语、中文等

2023 年 9 月，微软 Azure 团队宣布推出适用于商业客户的一系列逼真 AI 语音。本周微软表示，9 种更真实的人工智能声音现在普遍可供这些用户使用。根据微软博客文章，这些新语音可用于各种工作和任务，例如商务聊天机器人、语音助手、电子学习以及娱乐和游戏领域。微软表示：“这一扩展扩大了我们在 91 种语言及其变体中表达内容的能力。这一进展凸显了我们对克服语言障碍和促进更具包容性和可访问性的全球通信环境的坚定承诺。”这九款新语音现已在所有 Azure 地区上线，包括：美式英语 - en-US-AvaMultil

3/31/2024 7:24:25 AM

远洋

播客平台 Podcastle 推出AI文本转语音模型：提供 450 种语音

在快速发展的播客领域，Podcastle 平台近日宣布推出其全新的 AI 文本转语音模型 Asyncflow v1.0。这个新模型不仅为用户提供了超过450种不同的 AI 语音，还向开发者开放了 API 接口，以便于他们将这一文本转语音功能直接集成到自己的应用程序中。 Podcastle 的创始人 Arto Yeritsyan 表示，公司一直希望能开发一个文本转语音模型，但由于过去高昂的训练成本和数据需求，这一愿望一直未能实现。

3/4/2025 11:19:00 AM

AI在线

盘点微软Ignite 2024大会上关于Azure AI的五大公告

微软在近日举行的Ignite . 2024大会上公布了一系列进展，标志着向自主AI代理战略的转变，旨在提高各个部门的运营效率和生产力。这项计划的核心，是把Copilot与基于代理的系统进行集成，反映出微软将辅助AI工具转变为能够以最少人为干预执行复杂任务的自主代理。

11/26/2024 3:08:59 PM

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型全能且实用！实战测评谷歌最新模型Gemini 2.5 Pro 大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战 DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI 模态编码器|CLIP详细解读 50组多风格提示词，全面测评Midjourney V7生图效果！斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习 GPT 开源微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习模态苹果 AI视频驾驶文本搜索 xAI 人形机器人 Copilot 神器推荐 LLaMA 大语言模型具身智能字节跳动 Claude 算力安全应用视频生成科技视觉干货合集亚马逊 2024 AGI 特斯拉 DeepMind 架构

顶部

微软 Azure AI 语音服务推出虚拟人形象，支持文本转视频

相关资讯

微软 Azure 新增 9 款逼真 AI 语音，包括美式英语、中文等

播客平台 Podcastle 推出AI文本转语音模型：提供 450 种语音

盘点微软Ignite 2024大会上关于Azure AI的五大公告