语音克隆技巧引发耽忧,OpenAI 再次解释其文本转语音对象

OpenAI 在几个月内第二次就其文本转语音对象从事解释,并再次强调该对象目前并未大范围开放,且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技巧,让世界各地的人们理解这项技巧的发展方向都非常重要,”OpenAI 公司周五在其网站上发布的一份申明中表现,“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教导,以及我们如何围绕该技巧实施安全措施的原因。”据IT之家了解,去年年底,OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声响频剪辑,即可

OpenAI 在几个月内第二次就其文本转语音对象从事解释,并再次强调该对象目前并未大范围开放,且未来也可能不会。

语音克隆技巧引发耽忧,OpenAI 再次解释其文本转语音对象

图源 Pexels

“无论我们最终是否会大规模部署这项技巧,让世界各地的人们理解这项技巧的发展方向都非常重要,”OpenAI 公司周五在其网站上发布的一份申明中表现,“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教导,以及我们如何围绕该技巧实施安全措施的原因。”

据IT之家了解,去年年底,OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声响频剪辑,即可“生成听起来自然的人声,并与原始说话人非常相似”。该对象可以创建以假乱真的多语言人物声响,当时该公司表现他们选择预览这项技巧而非大规模发布,是为了“增强社会抵御能力”,以应对“越来越逼真的人工智能生成模型”带来的威逼。

作为这些致力的一部分,OpenAI 表现他们在积极淘汰运用语音辨别从事银行账户验证的方式,探索保护个人声响在人工智能中运用的政策,教导公众有关人工智能的风险,并加快开发跟踪视听内容的技巧,以便用户辨别他们是在与真人还是合成内容从事互动。

然而,尽管做出了上述致力,人们对这项技巧的耽忧仍然存在。美国总统拜登的人工智能负责人布鲁斯・里德 (Bruce Reed) 曾表现,声响克隆技巧是他夜不能寐的原因之一。美国联邦贸易委员会 (Federal Trade Commission) 今年 3 月表现,诈骗分子在利用人工智能技巧来提高他们欺诈行为的可信度,他们运用声响克隆对象,使得人们更难区分人工智能生成的声响和人类的声响。

OpenAI 在周五更新的申明中试图缓解这些耽忧,“我们继续与来自政府、媒体、娱乐、教导、民间社会等领域的美国和国际合作伙伴接触,以确保我们在构建过程中纳入他们的反馈。”该公司还指出,一旦“语音引擎”配备了其最新模型 GPT-4o,它也将带来新的威逼。该公司表现,他们内部在积极地“对 GPT-4o 从事‘红队测试’,以辨别和解决来自社会心理学、偏见和公平以及错误信息等领域的已知和未知风险。”

给TA打赏
共{{data.count}}人
人已打赏
AI

OpenAI 旧金山办公室被指秘密兮兮,便衣保安引周边商户担心

2024-6-10 9:33:41

AI

“AI 预计宝宝长相是不是智商税”上热搜,专家:文娱性大于准确性

2024-6-10 16:55:16

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索