谷歌发布 DolphinGemma:AI破译海豚语言：Pixel手机变身“翻译器”

2025-04-15 10:01

谷歌近日发布了一款开创性的人工智能模型——DolphinGemma，旨在深入理解野生大西洋斑点海豚的交流模式。该项目由谷歌与野生海豚项目（WDP）和佐治亚理工学院的研究人员合作开发，利用WDP近40年来在巴哈马群岛积累的庞大海豚音频和视频记录数据库。 DolphinGemma基于这些珍贵数据进行训练，并采用谷歌先进的音频技术SoundStream分词器将海豚的声音转化为数字格式。

谷歌近日发布了一款开创性的人工智能模型——DolphinGemma，旨在深入理解野生大西洋斑点海豚的交流模式。该项目由谷歌与野生海豚项目（WDP）和佐治亚理工学院的研究人员合作开发，利用WDP近40年来在巴哈马群岛积累的庞大海豚音频和视频记录数据库。

DolphinGemma基于这些珍贵数据进行训练，并采用谷歌先进的音频技术SoundStream分词器将海豚的声音转化为数字格式。这款AI模型能够识别、分析甚至生成逼真的海豚典型声音模式序列，包括口哨声、咔哒声和脉冲串声，其功能类似于人类语言模型，可以预测声音序列中的下一个声音。

图源备注:图片由AI生成，图片授权服务商Midjourney

值得一提的是，研究人员正利用谷歌Pixel智能手机将DolphinGemma直接部署到水下，进行实地数据记录和分析。与此同时，团队还采用了CHAT系统（鲸类听觉增强遥测系统），该系统将特制的人工哨声与海藻或游戏服等特定物体关联起来，旨在让海豚学习并使用这些声音与研究人员互动。Pixel智能手机能够实时识别海豚模仿的音调，并通过声音反馈给潜水员，告知他们所请求的物体。

这项创新性的研究计划结合了人工智能、移动技术和长期的实地观察，目标是揭示海豚语言的结构，并最终实现某种形式的人类与海豚之间的交流。谷歌计划于2025年夏季将DolphinGemma作为开放模型发布，供其他研究团队用于分析海洋哺乳动物的交流。

DolphinGemma是谷歌将其人工智能技术应用于动物交流研究（特别是海洋哺乳动物）的更广泛努力的一部分。作为其“AI for Social Good”项目的一部分，谷歌还与美国国家海洋和大气管理局 (NOAA) 合作开发了一款鲸鱼探测人工智能，用于分析自2005年以来在太平洋12个地点记录的海洋哺乳动物叫声的水听器数据。此外，谷歌的一个AI模型最近还帮助识别出一种此前未知的布氏鲸叫声，这种被称为“Biotwang”的声音是通过结合目击和录音确定的。

不仅如此，地球物种项目也在积极致力于创建动物交流的表征，涵盖单个物种以及跨物种的交流，其目标是理解包括蜜蜂舞蹈在内的各种非语言交流形式。

谷歌推出新 AI 模型助力解码海豚 “语言”

谷歌的人工智能研究实验室 Google DeepMind 近日宣布，推出了一款名为 DolphinGemma 的新型 AI 模型，旨在帮助研究人员解读海豚的发声。这一创新成果为人类更好地理解海豚之间的沟通方式提供了有力支持。 DolphinGemma 模型的训练数据来自于 Wild Dolphin Project（WDP），这是一个致力于研究大西洋斑点海豚及其行为的非营利组织。

4/15/2025 10:01:27 AM

AI在线

谷歌 DeepMind 开发 DolphinGemma AI 模型，助力海豚“语言”研究

谷歌DeepMind推出DolphinGemma AI模型，可生成海豚声音序列，助力科学家研究海豚沟通方式。该模型基于Gemma系列构建，训练数据来自Wild Dolphin Project，甚至能在手机上运行。今夏WDP将用Pixel 9搭建平台，进一步提升研究效率。#AI科技# #动物行为研究#

4/15/2025 7:51:50 AM

远洋

Google 推出 DolphinGemma，助力海豚语言研究的新里程碑

近日，Google 宣布推出一款名为 DolphinGemma 的大型语言模型，旨在帮助科学家们更深入地理解海豚的交流方式。这项新技术由 Gemini2.5Pro Experimental 驱动，并与佐治亚理工学院及其野生海豚项目（WDP）紧密合作。 WDP 的目标是通过长时间的非侵入式观察，记录和分析大西洋斑点海豚(Stenella frontalis)的自然行为和社会结构，特别是它们的交流模式。

4/15/2025 10:01:27 AM

AI在线

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发本地部署DeepSeek+DiFy平台构建智能体应用击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

谷歌发布 DolphinGemma:AI破译海豚语言：Pixel手机变身“翻译器”

相关资讯

​谷歌推出新 AI 模型助力解码海豚 “语言”

谷歌 DeepMind 开发 DolphinGemma AI 模型，助力海豚“语言”研究

Google 推出 DolphinGemma，助力海豚语言研究的新里程碑

谷歌推出新 AI 模型助力解码海豚 “语言”