谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群

据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用,AI在线附地址(点此访问)。据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从

据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。

谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用,AI在线附地址(点此访问)。

据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从而成功获得了相关鲸群在特定时间地点的鸣叫规律,还借此发现了鲸群新栖息地。

谷歌还与加拿大渔业及海洋部(DFO)、Rainforest Connection 合作,针对濒临灭绝的南方定居型虎鲸开发了一系列检测模型,并将其应用于水下麦克风监测网络,能够实时报告虎鲸的位置给 DFO 和相关单位。

谷歌公司提到,如今该公司的鲸鱼声音识别模型可以识别座头鲸、虎鲸、蓝鲸、长须鲸、小须鲸、布氏鲸、北大西洋露脊鲸和北太平洋露脊鲸,考虑到鲸鱼声音覆盖频率范围极广(例如蓝鲸发声为 10 Hz 低频、齿鲸发声为 120 kHz 高频),因此该模型在科研层面可谓创举。

谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群

▲ 鲸鱼声音频率,图源谷歌

AI在线获悉,在开发这款鲸鱼声音识别模型时,研究人员首先将原始音频转换为时频谱(Spectrogram)以作为模型识别声音的基础,其中每个时间窗包含 5 秒钟的声音片段。接着,模型利用梅尔刻度法调整这些时频谱的声音频率,并通过压缩和正则化突出声音特征,进而将其分类为不同鲸鱼的鸣叫类别。

由于海中存在各种声音,研究人员还加入了大量背景声音来训练模型,以确保能够准确识别鲸鱼声音并排除噪音。实验结果显示该鲸鱼声音识别模型能够良好地区分不同种类的鲸鱼,特别是小须鲸和布氏鲸的声音。

相关资讯

《语音识别基础:(一)语音是什么》

从最起初的一声巨响,到梵音天籁,到耳旁的窃窃私语,到妈妈喊我回家吃饭,总离不开声音。声音是这个世界存在并运动着的证据。

百度文心一言上线新功能,可快速定制自己的 AI 声音

感谢近日百度文心一言上线了新功能,仅需几秒钟即可定制自己的声音。据IT之家了解,想要体验这一功能,只需打开文心一言 App,点击下方“ ”,然后选择创建智能体。在声音选项里,会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话,只需两秒左右的时间,系统便能捕捉到你的声音特点,为你生成一个独特的“语音助手”。在确认声音质量后,你的专属“语音库”就在瞬间构建完成。今后,在与智能体的每一次对话中,你都可以点击播放键,使用自己合成的音色进行语音播报。此外,还可以点击对话框上的通话按钮,与你自己构建的数字分身实时对话

全国首例 AI 声音侵权案一审宣判,原告配音师获赔 25 万元

感谢据央视新闻消息,北京互联网法院今天上午对全国首例“AI 声音侵权案”进行一审宣判,认定作为配音师的原告,其声音权益及于案涉 AI 声音,被告方使用原告声音、开发案涉 AI 文本转语音产品未获得合法授权,构成侵权,书面赔礼道歉,并赔偿原告各项损失 25 万元。IT之家汇总案件经过如下:本案原告殷某是一名配音师,曾录制多部有声作品。去年其意外发现自己的声音被 AI 化后,在一款名为“魔音工坊”的 App 上以“魔小璇”的名义对外出售。殷某以被告行为侵害其声音权为由,将“魔音工坊”的运营主体北京某智能公司等五被告起诉