消息称苹果研究人员正探索免唤醒词呼叫 Siri,用 AI 聆听取代

感谢据《麻省理工科技评论》报道,当地时间周五(22)日发表的一篇论文显示,苹果公司的研究人员正在探索利用人工智能来检测用户何时在与 iPhone 等设备交谈的可能性,从而消除像“Siri”这样的触发短语的技术需求。在这项上传到 Arxiv 且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来自背景噪音的声学数据,训练了一个大型语言模型,以寻找“可能表明用户需要设备辅助”的模式。论文中称,该模型部分基于 OpenAI 的 GPT-2 构建,因为它相对轻量级,可以在智能手机等设备上运行。论文还描述了用于训练模型
感谢据《麻省理工科技评论》报道,当地时间周五(22)日发表的一篇论文显示,苹果公司的研究人员正在探索利用人工智能来检测用户何时在与 iPhone 等设备交谈的可能性,从而消除像“Siri”这样的触发短语的技术需求。

消息称苹果研究人员正探索免唤醒词呼叫 Siri,用 AI 聆听取代

在这项上传到 Arxiv 且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来自背景噪音的声学数据,训练了一个大型语言模型,以寻找“可能表明用户需要设备辅助”的模式。

论文中称,该模型部分基于 OpenAI 的 GPT-2 构建,因为它相对轻量级,可以在智能手机等设备上运行。论文还描述了用于训练模型的超过 129 小时的数据、额外的文本数据,但没有说明训练集的录音来源。据领英个人资料,七位作者中有六位列出他们的隶属关系为苹果公司,其中三人在苹果 Siri 团队工作。

论文最终得出的结论“令人鼓舞”,声称该模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。

IT之家提醒:目前,Siri 的功能是通过保留少量音频来实现的,听到“嘿,Siri”等触发短语之前,不会开始录制或准备回答用户提示。

斯坦福人类中心人工智能研究所的隐私和数据政策研究员詹・金表示,取消“嘿,Siri”提示可能会增加对设备“始终监听”的担忧。

参考

A Multimodal Approach to Device-Directed Speech Detection with Large Language Models

相关资讯

消息称苹果升级版 Siri 语音助手有望亮相 WWDC 2024,基于生成式 AI 打造

感谢据《纽约时报》报道,知情人士透露苹果公司预计将在下月举行的年度全球开发者大会(WWDC)上展示其人工智能领域的进展,届时该公司将发布改进后的 Siri 语音助手。报道称,Siri 的底层技术将包括一个新的生成式 AI 系统,赋予其聊天功能,而不是一次回答一个问题。知情人士称,苹果并未计划通过发布一款聊天机器人来与 ChatGPT 直接竞争,而是专注于让 Siri 更好地处理其现有任务,包括设置定时器、创建会面日程和向杂货清单添加物品等。报道援引消息人士的话称,改造 Siri 的决定是在去年年初由苹果公司高层做出

自研才是王道:Siri 联合创始人称苹果与 OpenAI 合作只是权宜之计

据报道,苹果公司正与 OpenAI 合作,将生成式人工智能功能引入 Siri。然而,Siri 的联合创始人 Dag Kittlaus 预测,这可能仅仅是权宜之计,苹果正在研发并改进自家的聊天机器人技术。IT之家注意到,彭博社本月初报道了苹果与 OpenAI 的合作。该报道称,苹果正在与 OpenAI 达成协议,将在今年将其部分技术引入 iPhone。通过此项协议,苹果将能够在 iOS 18 的人工智能功能中提供由 ChatGPT 支持的“流行聊天机器人”。据彭博社称,苹果签署这项协议是为了在 iOS 18 更新中快

苹果被曝另起炉灶,独立于 Siri 为桌面机器人开发拟人个性化 AI

彭博社的马克・古尔曼于 8 月 25 日发布博文,表示苹果公司决定另起炉灶,独立于 Siri 之外开发新一代人工智能(AI)技术。苹果已官宣在 iOS 18 系统中引入 Apple Intelligence,通过整合 ChatGPT 或者 Gemini 等 AI 语音助手等,并改造 Siri 带来更智能、更全面的 AI 体验,不过部分功能需要等到 2025 年才会发布。古尔曼表示尽管新诞生的 Siri 前景广阔,但苹果公司已经在开发另一种更个性化的 AI 体验。AI在线翻译其 Power On 部分内容如下:机器人