谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

2024-09-27 12:51

据谷歌新闻稿，谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型，其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声，并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示，这项技术主要用于海洋学术研究，能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式，目前该模型已公开供学术人员下载使用，AI在线附地址（点此访问）。据悉，谷歌公司自 2018 年以来便与美国国家海洋和大气管理局（NOAA）的太平洋群岛渔业科学中心合作，展开鲸鱼叫声分类的研究。最初，他们针对座头鲸开发了检测模型，成功辨识座头鲸的鸣叫声，从

据谷歌新闻稿，谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型，其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声，并进一步细分其中两种鲸鱼的不同发声类型。

谷歌表示，这项技术主要用于海洋学术研究，能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式，目前该模型已公开供学术人员下载使用，AI在线附地址（点此访问）。

据悉，谷歌公司自 2018 年以来便与美国国家海洋和大气管理局（NOAA）的太平洋群岛渔业科学中心合作，展开鲸鱼叫声分类的研究。最初，他们针对座头鲸开发了检测模型，成功辨识座头鲸的鸣叫声，从而成功获得了相关鲸群在特定时间地点的鸣叫规律，还借此发现了鲸群新栖息地。

谷歌还与加拿大渔业及海洋部（DFO）、Rainforest Connection 合作，针对濒临灭绝的南方定居型虎鲸开发了一系列检测模型，并将其应用于水下麦克风监测网络，能够实时报告虎鲸的位置给 DFO 和相关单位。

谷歌公司提到，如今该公司的鲸鱼声音识别模型可以识别座头鲸、虎鲸、蓝鲸、长须鲸、小须鲸、布氏鲸、北大西洋露脊鲸和北太平洋露脊鲸，考虑到鲸鱼声音覆盖频率范围极广（例如蓝鲸发声为 10 Hz 低频、齿鲸发声为 120 kHz 高频），因此该模型在科研层面可谓创举。

谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

▲ 鲸鱼声音频率，图源谷歌

AI在线获悉，在开发这款鲸鱼声音识别模型时，研究人员首先将原始音频转换为时频谱（Spectrogram）以作为模型识别声音的基础，其中每个时间窗包含 5 秒钟的声音片段。接着，模型利用梅尔刻度法调整这些时频谱的声音频率，并通过压缩和正则化突出声音特征，进而将其分类为不同鲸鱼的鸣叫类别。

由于海中存在各种声音，研究人员还加入了大量背景声音来训练模型，以确保能够准确识别鲸鱼声音并排除噪音。实验结果显示该鲸鱼声音识别模型能够良好地区分不同种类的鲸鱼，特别是小须鲸和布氏鲸的声音。

《语音识别基础：（一）语音是什么》

从最起初的一声巨响，到梵音天籁，到耳旁的窃窃私语，到妈妈喊我回家吃饭，总离不开声音。声音是这个世界存在并运动着的证据。

7/29/2021 6:44:00 PM

语音之家

百度文心一言上线新功能，可快速定制自己的 AI 声音

感谢近日百度文心一言上线了新功能，仅需几秒钟即可定制自己的声音。据IT之家了解，想要体验这一功能，只需打开文心一言 App，点击下方“ ”，然后选择创建智能体。在声音选项里，会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话，只需两秒左右的时间，系统便能捕捉到你的声音特点，为你生成一个独特的“语音助手”。在确认声音质量后，你的专属“语音库”就在瞬间构建完成。今后，在与智能体的每一次对话中，你都可以点击播放键，使用自己合成的音色进行语音播报。此外，还可以点击对话框上的通话按钮，与你自己构建的数字分身实时对话

4/7/2024 3:10:28 PM

远洋

全国首例 AI 声音侵权案一审宣判，原告配音师获赔 25 万元

感谢据央视新闻消息，北京互联网法院今天上午对全国首例“AI 声音侵权案”进行一审宣判，认定作为配音师的原告，其声音权益及于案涉 AI 声音，被告方使用原告声音、开发案涉 AI 文本转语音产品未获得合法授权，构成侵权，书面赔礼道歉，并赔偿原告各项损失 25 万元。IT之家汇总案件经过如下：本案原告殷某是一名配音师，曾录制多部有声作品。去年其意外发现自己的声音被 AI 化后，在一款名为“魔音工坊”的 App 上以“魔小璇”的名义对外出售。殷某以被告行为侵害其声音权为由，将“魔音工坊”的运营主体北京某智能公司等五被告起诉

4/23/2024 11:50:10 AM

清源

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna 纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验 Figma 推 AI 革命：开发智能应用制作器与网站创建工具即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 AI视频资讯早读！7个产品更新+8个案例精选

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测百度人形机器人伟达苹果 Transformer 深度学习模态 xAI 大语言模型字节跳动 Claude 搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊训练特斯拉 AGI 2024

顶部

谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

相关资讯

《语音识别基础：（一）语音是什么》

百度文心一言上线新功能，可快速定制自己的 AI 声音

全国首例 AI 声音侵权案一审宣判，原告配音师获赔 25 万元