一位人士表示,Meta 的语音功能开发重点在于让用户与 AI 的对话更接近自然的双向对话,而非传统的问答模式。这意味着用户可以在对话中随时打断,使交互更加灵活。Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)已明确表示,希望将 Meta 打造成“AI 领域的领导者”,并计划通过 AI 技术实现新的收入增长。扎克伯格称,2025 年对其许多人工智能产品来说是成败攸关的一年。
据两位知情人士透露,为了实现这一目标,Meta 正在考虑为其 AI 助手 Meta AI 推出高级订阅服务,用于执行诸如预订餐厅和视频创作等代理任务。此外,公司还在探讨在其 AI 助手的搜索结果中引入付费广告或赞助帖子,以进一步实现商业变现。
扎克伯格今年曾透露打造一个具有中级工程师编程和解决问题能力的人工智能工程代理的计划,他表示这可能有一个“非常大的市场”。
Meta 的产品负责人克里斯・考克斯(Chris Cox)在摩根士丹利科技、媒体和电信会议上表示,Llama 4 将是一个“全能模型”,语音交互将被设计为“原生功能”,而不是将语音转换为文本后再进行处理。
知情人士称,Meta 也一直在讨论最新的 Llama 模型在输出内容方面应该设置哪些限制,以及是否需要放宽这些限制。这一讨论背景是,Meta 的竞争对手们正在不断推出新的 AI 产品,而 Meta 需要在技术与伦理之间找到平衡。
AI在线注意到,Meta 的竞争对手 OpenAI 去年推出了语音模式,并专注于为其赋予不同个性;而埃隆・马斯克(Elon Musk)的 xAI 开发的 Grok 3 模型则在上个月向部分用户推出了语音功能,该模型以较少的限制和“无拘无束模式”为特点。
此外,Meta 的语音交互功能也是其 Ray Ban 智能眼镜的核心卖点之一,该产品近期在市场上取得了巨大成功。Meta 正在加速开发轻量级头戴设备,希望取代智能手机成为消费者的主要计算设备。