准确率可达 70%,科学家利用 AI 解读狗的叫声

研究人员正在尝试使用 AI 来解读狗的叫声是在玩耍还是在生气。与此同时,研究人员还尝试使用 AI 识别狗的年龄、性别和品种。密歇根大学的研究人员与位于普埃布拉的墨西哥国家天体物理、光学和电子研究所(INAOE)合作开展了这一研究,发现最初用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。图源 Pixabay密歇根大学人工智能实验室负责人 Rada Mihalcea 表示,人工智能在理解语音的微妙之处方面有了显著进步,可以区分音调、音调和口音的细微差别,可凭借这些研究基础来理解狗吠。开发这种分析动物发声

研究人员正在尝试使用 AI 来解读狗的叫声是在玩耍还是在生气。与此同时,研究人员还尝试使用 AI 识别狗的年龄、性别和品种。

密歇根大学的研究人员与位于普埃布拉的墨西哥国家天体物理、光学和电子研究所(INAOE)合作开展了这一研究,发现最初用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。

准确率可达 70%,科学家利用 AI 解读狗的叫声

图源 Pixabay

密歇根大学人工智能实验室负责人 Rada Mihalcea 表示,人工智能在理解语音的微妙之处方面有了显著进步,可以区分音调、音调和口音的细微差别,可凭借这些研究基础来理解狗吠。

开发这种分析动物发声 AI 模型的主要障碍之一,是缺乏公开可用的数据。虽然有许多资源和机会来记录人类的语音,但从动物身上收集数据更加困难。

团队尝试使用采集人类语音数据的方式来采集狗的叫声信息,各种情况下收集了 74 只不同品种、年龄和性别狗狗的吠叫、咆哮和呜呜声。

团队将采集到的这些声音信息用于分析人类语音的机器模型中,模型可以很好地理解狗之间的交流,模型在各种测试中准确率达到 70%。

Rada Mihalcea 表示,“来自人类语音的声音和模式可以作为分析和理解其他声音(如动物发声)的声学模式的基础”。团队其他研究人员也表示,更好地了解动物发出各种声音的细微差别,可以改善人类对其情感和身体需求的解释和反应。

据悉实验结果在 2024 年计算语言学、语言资源与评估国际联合会议进行了展示。IT之家附论文链接:

https://arxiv.org/pdf/2404.18739

相关资讯

Meta 发布新 AI 模型:利用 AI 来评估 AI 的能力,无需人类参与

据路透社报道,Meta 当地时间周五宣布,其研究团队推出了一系列新的 AI 模型,其中包括一个名为“自我训练评估器”的工具。该工具有望推动 AI 开发过程中减少对人类干预的依赖。这个工具早前在 8 月的论文中首次亮相,其使用与 OpenAI 新发布的 o1 模型类似的“思维链”技术,让 AI 对模型的输出做出可靠判断。

模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或 AI 反馈的强化学习(RLHF/RLAIF)或者直接偏好优化(DPO),而在模型评估中,由于任务的复杂性且通常没有标准答案,则通常直接以人类标注者或高性能大模型(LLM-as-a-Judge)的偏好标注作为评判标准。尽管上述对偏好数据的应用已经取得了广泛的成效,但对偏好本身则缺乏充足的研究,这很大程度上阻碍了对更可信 AI 系统的构建。为此,上海交通大学生成式

除了缺少点创意,GPT-3写出了及格的大学毕业论文,只需20分钟

GPT-3 写的论文及格了吗?教育资源网站 EduRef 对此进行了一项测试,效果还行,及格水平。