这项高级语音功能,大家可是等了好久。
谷歌又被 OpenAI 截胡了。
前脚谷歌刚刚升级完两款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,后脚奥特曼就直接宣布 GPT-4o 今天起正式开放。
「高级语音功能今天推出!(将在本周内完成),希望您的等待值得。」奥特曼表示道,最后还不忘加一个委屈、小桃心的表情。
这次,OpenAI 的高级语音功能将向所有的 Plus 和 Team 用户推出。但免费用户是体验不了了,因为 OpenAI 暂时没有这个计划。
据了解,Plus 用户每月需支付 20 美元,Team 用户每月支付 30 美元并拥有更多的使用次数。OpenAI 将逐步向用户推出访问权限,并从下周开始面向企业和教育推出。所有 Plus 用户将在秋末之前获得访问权限。
如果你是 Plus 或 Team 用户,当访问高级语音功能时,会在应用程序中看到如下通知。
此次推出的高级语音功能还新增了自定义指令、记忆、五种新声音和改进的口音。它还可以用 50 多种语言说「抱歉我迟到了」。
在下面展示的视频中, 用户和模型在流畅的对话,你可以随时打断聊天内容,彷佛和你聊天的不是机器,而是一个真人。这段 Demo 中的对话内容也特别有意思, GPT-4o 用一口流利的中文说「奶奶对不起,我迟到了,我不是故意让您等这么久的……」,仿佛是 OpenAI 在和用户们道歉,要知道,GPT-4o 可是迟到了将近半年的时间才正式推出。
看在 OpenAI 这么诚意的份上,大家纷纷表示接受道歉。
在下面的示例中, OpenAI 项目主管 Charlotte 通过自定义选项向 ChatGPT 提供了自己的信息,比如名字和住址。然后在新对话中询问了周末可以做的有趣的户外活动。ChatGPT 根据 Charlotte 提供的信息,给出了一些可行建议。在另一个视频中,OpenAI 负责模型设计的 Drew 表示,他在工作时,会让 GPT-4o 静静地开着,当不与它交谈时它很安静,等有问题时就会提问,然后围绕这个问题会展开一场长对话。大多数情况下,Drew 会把它当作坐在身边的朋友,能为他提供信息,交流想法。
此前,GPT-4o 发布不久,OpenAI 就因其演示视频中名为 Sky 的女性声音与电影《Her》中饰演 AI 恋人的斯嘉丽・约翰逊的声音相似而受到批评。OpenAI 随后删除了该声音。
现在,最新推出的五种新声音分别被命名为 Arbor、Maple、Sol、Spruce 和 Vale,将在标准和高级语音模式下提供。OpenAI 表示,这些声音是使用来自世界各地的专业配音演员制作的。他们采访了数十位演员,他们的声音温暖、平易近人、具有丰富的质感和语调,一位公司发言人表示。
不过,新功能尚未在欧盟、英国、瑞士、冰岛、挪威或列支敦士登推出。
还在休假的 Greg Brockman 也帮忙宣传了一波:「高级语音的推出,让你可以和 ChatGPT 开启流畅的对话,让你意识到在电脑上打字是多么的不自然。」
除了上新高级语音模式,近日,OpenAI 还发布了一个多语言大规模多任务语言理解 (Multilingual Massive Multitask Language Understanding,MMMLU)数据集,测试集提供了 14 种语言,包括阿拉伯语,德语,西班牙语等,涵盖 57 个不同类别的主题,包括初级知识、法律、物理、历史和计算机科学等高级专业学科。
数据集地址:https://x.com/_philschmid/status/1838230108072476951
参考链接:https://www.technologyreview.com/2024/09/24/1104422/openai-released-its-advanced-voice-mode-to-more-people-heres-how-to-get-it/