谷歌

谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群

据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用,AI在线附地址(点此访问)。据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从

AI 角力炙烤科技巨头 2030 环保承诺:谷歌退缩、苹果推进

科技媒体 The Information 于 2 天前发布博文,报道称激烈的 AI 竞争加剧能源消耗,也意味着很多科技巨头在品牌竞争力和环保之间,不得不向前者倾斜。谷歌该媒体报道称虽然谷歌官方并未正式改变其气候目标,但首席执行官桑达尔-皮查伊(Sundar Pichai)似乎正在酝酿相关改变。AI在线翻译该媒体部分报道内容如下谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示,人工智能的蓬勃发展对该公司的碳排放目标构成了“挑战”。皮查伊上周在卡内基梅隆大学的一次活动上表示,谷歌承诺到 2030 年使用无

谷歌宣布为全球 AI 教育设立 1.2 亿美元基金

谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)于当地时间 9 月 21 日在联合国未来峰会上发表讲话,将 AI 描述为“迄今为止最具变革性的技术”。皮查伊表示,谷歌正在研究迄今为止最具变革性的技术 —— 人工智能,谷歌还看到了四个最大机遇,其中许多机遇与可持续发展目标相一致:一是帮助人们用自己的语言获取世界信息和知识。仅去年一年,谷歌就利用人工智能在 Google 翻译中添加了 110 种新语言,全球 10 亿人使用这些语言。这使得谷歌的语言总数达到 246 种,并且谷歌正在努力扩展到 1,000 种世

为人工智能赋予机器人躯体的“登月计划”项目,倒在具身智能热潮之前

仿生人会梦见电子羊吗? 或许答案就在现代机器人的世界里。 Google X 前任副总裁、Everyday Robots 前任 CEO Hans Peter Brondmo 说,在 Everyday Robots,机器人整晚都在做梦,它们在模拟世界里学习,一觉“醒来”就能掌握新技能。

门板上做研究的首席科学家:Jeff Dean解密谷歌和Gemini背后的故事

“最开始我就知道谷歌相当有希望,谷歌能发展到现在的规模不过是水到渠成。 ”这位谷歌首席科学家在谷歌度过了近乎一半的人生,对谷歌的喜爱不减反增,到现在还依然坚守着谷歌最初的愿景并为此奋斗:组织全球信息并使其普遍可用和有用Jeff Dean 还记得刚加入谷歌的时候,每到周二的流量高峰期就开始担心系统会不会崩溃,还好后来及时增加了设备,对代码和搜索功能做了更多优化,谷歌搜索这才步入了正轨。 后来吴恩达在谷歌担任顾问,Jeff Dean 和他商定了大型神经网络的研究目标,最终促成了 Google Brain 团队的成立。

谷歌搜索将整合 C2PA 2.1 标准,标注 AI 生成 / 编辑图片

感谢科技媒体 maginative 昨日(9 月 17 日)发布博文,报道称谷歌公司为了提高生成式 AI 内容的透明度,计划在其关键产品中集成最新版内容凭证认证标准。谷歌已加入内容来源与真实性联盟(C2PA)指导委员会,并协助制定了 2.1 版技术标准,新版主要强化了对篡改攻击的防护,确保了更可靠的内容来源数据。谷歌信任与安全副总裁 Laurie Richardson 表示:“我们正致力于开发最新技术,以帮助人们更好地理解某项内容是何时创建的,以及修改了哪些内容”。谷歌宣布将在未来几个月内,在 Google Sea

安卓版谷歌 Gemini Live 免费上线,开启在线 AI 语音畅聊

科技媒体 9to5Google 昨日(9 月 12 日)发布博文,报道谷歌在 1 个月前面向 Advanced 订阅用户推出后,正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎

谷歌联合创始人布林:工程师们用 AI 编程还不够积极

谷歌联合创始人谢尔盖・布林(Sergey Brin)表示,谷歌工程师并没有像他认为的那样经常使用人工智能。图源 Pexels布林本周在洛杉矶举行的“All-In”峰会上与企业家大卫・弗里德伯格(David Friedberg)进行了在线对话时发表了上述言论。布林在峰会现场罕见露面,讨论了 AI 的“令人兴奋”的进步。“作为一名计算机科学家,我从未见过像过去几年所取得的进展一样令人兴奋的事情,”布林说。布林表示,他目前几乎每天都在谷歌。他还称赞了 AI 的多方面能力,特别是在编程方面。布林称:“从头开始编写代码感觉非

谢尔盖布林:谷歌不敢用Transformer,作者全跑路了,现在我每天都在写代码

坐拥世界最大的搜索业务,谷歌一直独步于硅谷。搜索所带来的丰厚广告收入,让两位创始人谢尔盖・布林 (Sergey Brin) 和拉里・(Larry Page)可以退居二线,安心享受生活。                            1997 年 9 月 15 日,谢尔盖・布林和拉里·佩吉注册了一个名为「谷歌」的网站。直到 2022 年底,ChatGPT 火遍全球,原本 AI 浪潮的引领者谷歌似乎才意识到地位发生了翻转。最近一年以来,我们似乎习惯了这家科技巨头作为「追赶者」出现。从去年开始,就有媒体爆料,称谢

谷歌 NotebookLM 新增 Audio Overview 功能:生成 2 位 AI 主播,围绕用户文档展开播客式交流

科技媒体 maginative 昨日(9 月 11 日)报道,谷歌公司升级旗下笔记应用 NotebookLM,新增 Audio Overview 功能,可以围绕着用户上传的文档,生成两位 AI 主持人,并通过播客方式展开讨论。NotebookLM 简介NotebookLM 基于谷歌 Gemini 1.5 Pro AI 模型,是一款个性化人工智能研究助手。用户可以上传 Google Docs、Google Slides、PDF 文件以及网页 URL 地址,该应用能够研究这些文档内容,为用户提供更有洞察力的回答。Aud

任意论文一键变播客,谷歌正式发布Illuminate,它能重构研究者的学习方式吗?

像听书一样「读」论文。‍先来听一段英文播客,内容是不是很熟悉?是的,这俩人就是在聊那篇《Attention is All You Need》。在 4 分半的对话里,他们介绍了论文的核心内容,一问一答,听上去相当自然。播客原址:,播客中对谈的双方都是 AI,生成这段四分钟音频内容的产品是 Illuminate,来自谷歌。Illuminate 是一个将学术论文转化为人工智能生成的音频讨论的项目。已有用户晒出自己的试用结果,效果不错:谷歌实验室在邀请用户尝试「前沿技术」方面有着悠久的历史。Illuminate 最早在今年

谷歌 AI 攻克连衣裙,数百品牌商品任你虚拟试穿

谷歌公司于 9 月 5 日周四发布新闻稿,宣布扩充和增强 AI 虚拟试穿工具,现支持用户虚拟试穿来自 Boden、Maje、Sandro、Simkhai 和 Staud 等数百个品牌的数千件连衣裙。谷歌表示连衣裙是该工具搜索次数最多的服装类别之一,但由于连衣裙相比较其它服装更细致和复杂,现有的 AI 扩散技术难以捕捉花卉或几何图案等印花细节,存在较大的挑战。此外,由于连衣裙通常覆盖身体的大部分,并有不同的长度(如中裙、大裙和迷你裙),给人穿上虚拟连衣裙往往会导致身体细节模糊不清。谷歌公司去年发布 AI 虚拟试穿工具

万人测试 OpenAI 搜索引擎:活动规划等表现出色,存在“幻觉”等不足

华盛顿邮报昨日(9 月 4 日)发布博文,表示从初期 1 万名用户反馈来看,被很多人视为“谷歌杀手”、来自 OpenAI 的 SearchGPT 搜索引擎虽然有很多亮点功能,但要撼动谷歌搜索地位仍有很长的路要走。部分功能非常优秀AI在线注:SearchGPT 并非通过搜索结果列表,而是通过提供简洁、有条理的回答,简化用户的搜索体验。SearchGPT 利用必应和其他来源的数据编制答案,OpenAI 将其视为用户搜索信息的综合资源。SearchGPT 初期用户反馈褒贬不一,在规划活动、编程、总结信息等特定查询方面,S

谷歌升级 Gemini 1.5 Flash 模型,AI 聊天响应速度最高提 50%

谷歌公司于今年推出 Gemini 1.5 Flash AI 模型,官方承诺提供更快的响应速度、能应对更复杂的用户查询。在最新版本更新中,谷歌宣布采用 Gemini 1.5 Flash 的 Gemini 大幅提升响应速度,增幅最高可以达到 50%。AI在线附上谷歌官方支持文档内容如下:Gemini 给出回答的速度大幅提升更新内容:过去几周以来,我们在改善延迟方面取得了重大进步,采用 1.5 Flash 模型的 Gemini 给出回答的速度现在大幅提升,升幅最高达 50%。更新原因:通过让 Gemini 快速给出回答,

扩散模型做游戏引擎,单TPU 20 FPS模拟毁灭战士,谷歌最新GameNGen太博眼球了

GameNGen 是第一个完全由神经模型驱动的游戏引擎。谷歌在人工智能领域又一次取得了重大进展。在最新发表的一篇论文中,研究者创建了一个神经网络,可以在不使用传统游戏引擎的情况下为经典射击游戏《毁灭战士》生成实时游戏画面。这个名为 GameNGen 的系统标志着人工智能领域向前迈出了重要一步,它在一个芯片上以每秒 20 帧的速度生成可玩的游戏画面,每帧画面都由扩散模型进行预测。可以说,这是第一个完全由神经模型驱动的游戏引擎,可以高质量地在长轨迹上与复杂环境进行实时交互。这一成就标志着人工智能首次完全模拟了一款复杂的

谷歌将重新开放 Gemini 生成人物图像功能,此前因“种族描述不当”引争议

感谢北京时间 29(今)日,据彭博社报道,谷歌宣布将恢复 AI 模型 Gemini 生成人物图像的功能,部分消费者将可以重新使用。谷歌表示,将开始向订阅 Gemini Advanced 套餐的英语用户推出生成人物图像功能。企业也将能够使用该工具,该功能将在未来几天内上线。谷歌产品管理高级总监戴夫・西特伦(Dave Citron)表示,该公司在通过 Imagen 3 生成人物描写方面取得了“重大进展”。“我们一直在努力对产品进行技术改进,并改进了评估集、红队练习和明确的产品原则。当然,Gemini 创建的每张图像都不

Jim Gao:曾助谷歌节能40%的AI专家,如今致力打造“虚拟工厂操作员”

只是使用了AI就让工厂能耗降低40%是的,你没有看错,就是降低了整整40%,几乎将能耗砍半! 这是Jim Gao在Google大型数据中心的一次尝试。 这位华人机械工程师巧妙地使用了AI系统辅助控制数据中心的复杂的工业系统,AI在实现了预期系统优化的基础上,还做到了他从没幻想过的超低冷却能耗。

Midjourney 地位不稳?AI 绘图又一黑马出现,附 4 款产品一手实测

AI 圈,再次开卷图像生成。一连串进展扎堆:8 月 21 日,Ideogram 正式推出 2.0 版本,声称文本渲染能力更强。没错,就是那个成立于去年 8 月,由谷歌 AI 绘画 4 大牛集体离职创业的项目,曾获得过一众 AI 大佬投资。此番 Ideogram 还公开叫板 Flux,官方自信表示其人类评估明显优于 Flux Pro。要知道,Flux 由 Stable Diffusion 原班人马打造,最近正在因生成以假乱真的 TED 演讲“照片”而走红各大网络。除此之外,一周前,谷歌正式放出了 Imagen 3,在