微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频

微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频。今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。AI在线附示例如下:Text to Speech Avatar 具有以下功能:将文本转换为由 Azure AI 文本转语音提供支持的人类说话视频,该视频具有自

微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频

微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频

今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。AI在线附示例如下:

微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频

Text to Speech Avatar 具有以下功能:

将文本转换为由 Azure AI 文本转语音提供支持的人类说话视频,该视频具有自然的声音。

提供不同的人物预设形象。

形象的声音由 Azure AI 文本转语音生成。

使用批量合成 API 异步或实时合成文本到语音人像视频。

在 Speech Studio 中提供内容创建工具,无需编码即可创建视频内容。

通过 Speech Studio 中的实时聊天头像工具启用实时人像对话。

定价方面,文本转视频服务的收费将根据视频输出的长度计算并按秒收费。该服务现已在东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部地区推出。

相关资讯

微软 Azure 新增 9 款逼真 AI 语音,包括美式英语、中文等

2023 年 9 月,微软 Azure 团队宣布推出适用于商业客户的一系列逼真 AI 语音。本周微软表示,9 种更真实的人工智能声音现在普遍可供这些用户使用。根据微软博客文章,这些新语音可用于各种工作和任务,例如商务聊天机器人、语音助手、电子学习以及娱乐和游戏领域。微软表示:“这一扩展扩大了我们在 91 种语言及其变体中表达内容的能力。这一进展凸显了我们对克服语言障碍和促进更具包容性和可访问性的全球通信环境的坚定承诺。”这九款新语音现已在所有 Azure 地区上线,包括:美式英语 - en-US-AvaMultil

播客平台 Podcastle 推出AI文本转语音模型:提供 450 种语音

在快速发展的播客领域,Podcastle 平台近日宣布推出其全新的 AI 文本转语音模型 Asyncflow v1.0。 这个新模型不仅为用户提供了超过450种不同的 AI 语音,还向开发者开放了 API 接口,以便于他们将这一文本转语音功能直接集成到自己的应用程序中。 Podcastle 的创始人 Arto Yeritsyan 表示,公司一直希望能开发一个文本转语音模型,但由于过去高昂的训练成本和数据需求,这一愿望一直未能实现。

盘点微软Ignite 2024大会上关于Azure AI的五大公告

微软在近日举行的Ignite . 2024大会上公布了一系列进展,标志着向自主AI代理战略的转变,旨在提高各个部门的运营效率和生产力。 这项计划的核心,是把Copilot与基于代理的系统进行集成,反映出微软将辅助AI工具转变为能够以最少人为干预执行复杂任务的自主代理。