谷歌

Layout工程师危，谷歌自动芯片设计AlphaChip问世，开放权重可外部定制

2020 年，谷歌发表了预印本论文《Chip Placement with Deep Reinforcement Learning》，介绍了其设计芯片布局的新型强化学习方法。后来在 2021 年，谷歌又发表在 Nature 上并开源了出来。今天，谷歌发表了这篇 Nature 文章的附录，更详细介绍了该方法及其对芯片设计领域的影响。同时，谷歌也开放了一个在 20 个 TPU 模块上预训练的检查点，分享模型权重并命名为「AlphaChip」。Nature 附录地址：： Jeff Dean 表示，开放预训练 AlphaC

9/27/2024 12:57:00 PM

机器之心

谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

据谷歌新闻稿，谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型，其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声，并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示，这项技术主要用于海洋学术研究，能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式，目前该模型已公开供学术人员下载使用，AI在线附地址（点此访问）。据悉，谷歌公司自 2018 年以来便与美国国家海洋和大气管理局（NOAA）的太平洋群岛渔业科学中心合作，展开鲸鱼叫声分类的研究。最初，他们针对座头鲸开发了检测模型，成功辨识座头鲸的鸣叫声，从

9/27/2024 12:51:33 PM

漾仔

AI 角力炙烤科技巨头 2030 环保承诺：谷歌退缩、苹果推进

科技媒体 The Information 于 2 天前发布博文，报道称激烈的 AI 竞争加剧能源消耗，也意味着很多科技巨头在品牌竞争力和环保之间，不得不向前者倾斜。谷歌该媒体报道称虽然谷歌官方并未正式改变其气候目标，但首席执行官桑达尔-皮查伊（Sundar Pichai）似乎正在酝酿相关改变。AI在线翻译该媒体部分报道内容如下谷歌首席执行官桑达尔・皮查伊（Sundar Pichai）表示，人工智能的蓬勃发展对该公司的碳排放目标构成了“挑战”。皮查伊上周在卡内基梅隆大学的一次活动上表示，谷歌承诺到 2030 年使用无

9/27/2024 7:59:03 AM

故渊

谷歌宣布为全球 AI 教育设立 1.2 亿美元基金

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）于当地时间 9 月 21 日在联合国未来峰会上发表讲话，将 AI 描述为“迄今为止最具变革性的技术”。皮查伊表示，谷歌正在研究迄今为止最具变革性的技术 —— 人工智能，谷歌还看到了四个最大机遇，其中许多机遇与可持续发展目标相一致：一是帮助人们用自己的语言获取世界信息和知识。仅去年一年，谷歌就利用人工智能在 Google 翻译中添加了 110 种新语言，全球 10 亿人使用这些语言。这使得谷歌的语言总数达到 246 种，并且谷歌正在努力扩展到 1,000 种世

9/23/2024 5:48:12 PM

汪淼

为人工智能赋予机器人躯体的“登月计划”项目，倒在具身智能热潮之前

仿生人会梦见电子羊吗？或许答案就在现代机器人的世界里。 Google X 前任副总裁、Everyday Robots 前任 CEO Hans Peter Brondmo 说，在 Everyday Robots，机器人整晚都在做梦，它们在模拟世界里学习，一觉“醒来”就能掌握新技能。

9/23/2024 10:51:00 AM

刘洁

门板上做研究的首席科学家：Jeff Dean解密谷歌和Gemini背后的故事

“最开始我就知道谷歌相当有希望，谷歌能发展到现在的规模不过是水到渠成。 ”这位谷歌首席科学家在谷歌度过了近乎一半的人生，对谷歌的喜爱不减反增，到现在还依然坚守着谷歌最初的愿景并为此奋斗：组织全球信息并使其普遍可用和有用Jeff Dean 还记得刚加入谷歌的时候，每到周二的流量高峰期就开始担心系统会不会崩溃，还好后来及时增加了设备，对代码和搜索功能做了更多优化，谷歌搜索这才步入了正轨。后来吴恩达在谷歌担任顾问，Jeff Dean 和他商定了大型神经网络的研究目标，最终促成了 Google Brain 团队的成立。

9/19/2024 10:38:00 AM

刘洁

谷歌搜索将整合 C2PA 2.1 标准，标注 AI 生成 / 编辑图片

感谢科技媒体 maginative 昨日（9 月 17 日）发布博文，报道称谷歌公司为了提高生成式 AI 内容的透明度，计划在其关键产品中集成最新版内容凭证认证标准。谷歌已加入内容来源与真实性联盟（C2PA）指导委员会，并协助制定了 2.1 版技术标准，新版主要强化了对篡改攻击的防护，确保了更可靠的内容来源数据。谷歌信任与安全副总裁 Laurie Richardson 表示：“我们正致力于开发最新技术，以帮助人们更好地理解某项内容是何时创建的，以及修改了哪些内容”。谷歌宣布将在未来几个月内，在 Google Sea

9/18/2024 9:10:59 AM

故渊

安卓版谷歌 Gemini Live 免费上线，开启在线 AI 语音畅聊

科技媒体 9to5Google 昨日（9 月 12 日）发布博文，报道谷歌在 1 个月前面向 Advanced 订阅用户推出后，正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道，谷歌在 Pixel 9 系列手机发布会上，发布了 Gemini Live，该服务提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎

9/13/2024 8:33:38 AM

故渊

谷歌联合创始人布林：工程师们用 AI 编程还不够积极

谷歌联合创始人谢尔盖・布林（Sergey Brin）表示，谷歌工程师并没有像他认为的那样经常使用人工智能。图源 Pexels布林本周在洛杉矶举行的“All-In”峰会上与企业家大卫・弗里德伯格（David Friedberg）进行了在线对话时发表了上述言论。布林在峰会现场罕见露面，讨论了 AI 的“令人兴奋”的进步。“作为一名计算机科学家，我从未见过像过去几年所取得的进展一样令人兴奋的事情，”布林说。布林表示，他目前几乎每天都在谷歌。他还称赞了 AI 的多方面能力，特别是在编程方面。布林称：“从头开始编写代码感觉非

9/12/2024 9:58:59 PM

远洋

谢尔盖布林：谷歌不敢用Transformer，作者全跑路了，现在我每天都在写代码

坐拥世界最大的搜索业务，谷歌一直独步于硅谷。搜索所带来的丰厚广告收入，让两位创始人谢尔盖・布林 (Sergey Brin) 和拉里・（Larry Page）可以退居二线，安心享受生活。 1997 年 9 月 15 日，谢尔盖・布林和拉里·佩吉注册了一个名为「谷歌」的网站。直到 2022 年底，ChatGPT 火遍全球，原本 AI 浪潮的引领者谷歌似乎才意识到地位发生了翻转。最近一年以来，我们似乎习惯了这家科技巨头作为「追赶者」出现。从去年开始，就有媒体爆料，称谢

9/12/2024 2:39:00 PM

机器之心

谷歌 NotebookLM 新增 Audio Overview 功能：生成 2 位 AI 主播，围绕用户文档展开播客式交流

科技媒体 maginative 昨日（9 月 11 日）报道，谷歌公司升级旗下笔记应用 NotebookLM，新增 Audio Overview 功能，可以围绕着用户上传的文档，生成两位 AI 主持人，并通过播客方式展开讨论。NotebookLM 简介NotebookLM 基于谷歌 Gemini 1.5 Pro AI 模型，是一款个性化人工智能研究助手。用户可以上传 Google Docs、Google Slides、PDF 文件以及网页 URL 地址，该应用能够研究这些文档内容，为用户提供更有洞察力的回答。Aud

9/12/2024 1:41:55 PM

故渊

任意论文一键变播客，谷歌正式发布Illuminate，它能重构研究者的学习方式吗？

像听书一样「读」论文。‍先来听一段英文播客，内容是不是很熟悉？是的，这俩人就是在聊那篇《Attention is All You Need》。在 4 分半的对话里，他们介绍了论文的核心内容，一问一答，听上去相当自然。播客原址：，播客中对谈的双方都是 AI，生成这段四分钟音频内容的产品是 Illuminate，来自谷歌。Illuminate 是一个将学术论文转化为人工智能生成的音频讨论的项目。已有用户晒出自己的试用结果，效果不错：谷歌实验室在邀请用户尝试「前沿技术」方面有着悠久的历史。Illuminate 最早在今年

9/9/2024 2:42:00 PM

机器之心

谷歌 AI 攻克连衣裙，数百品牌商品任你虚拟试穿

谷歌公司于 9 月 5 日周四发布新闻稿，宣布扩充和增强 AI 虚拟试穿工具，现支持用户虚拟试穿来自 Boden、Maje、Sandro、Simkhai 和 Staud 等数百个品牌的数千件连衣裙。谷歌表示连衣裙是该工具搜索次数最多的服装类别之一，但由于连衣裙相比较其它服装更细致和复杂，现有的 AI 扩散技术难以捕捉花卉或几何图案等印花细节，存在较大的挑战。此外，由于连衣裙通常覆盖身体的大部分，并有不同的长度（如中裙、大裙和迷你裙），给人穿上虚拟连衣裙往往会导致身体细节模糊不清。谷歌公司去年发布 AI 虚拟试穿工具

9/7/2024 2:16:27 PM

故渊

万人测试 OpenAI 搜索引擎：活动规划等表现出色，存在“幻觉”等不足

华盛顿邮报昨日（9 月 4 日）发布博文，表示从初期 1 万名用户反馈来看，被很多人视为“谷歌杀手”、来自 OpenAI 的 SearchGPT 搜索引擎虽然有很多亮点功能，但要撼动谷歌搜索地位仍有很长的路要走。部分功能非常优秀AI在线注：SearchGPT 并非通过搜索结果列表，而是通过提供简洁、有条理的回答，简化用户的搜索体验。SearchGPT 利用必应和其他来源的数据编制答案，OpenAI 将其视为用户搜索信息的综合资源。SearchGPT 初期用户反馈褒贬不一，在规划活动、编程、总结信息等特定查询方面，S

9/5/2024 9:13:07 AM

故渊

谷歌升级 Gemini 1.5 Flash 模型，AI 聊天响应速度最高提 50%

谷歌公司于今年推出 Gemini 1.5 Flash AI 模型，官方承诺提供更快的响应速度、能应对更复杂的用户查询。在最新版本更新中，谷歌宣布采用 Gemini 1.5 Flash 的 Gemini 大幅提升响应速度，增幅最高可以达到 50%。AI在线附上谷歌官方支持文档内容如下：Gemini 给出回答的速度大幅提升更新内容：过去几周以来，我们在改善延迟方面取得了重大进步，采用 1.5 Flash 模型的 Gemini 给出回答的速度现在大幅提升，升幅最高达 50%。更新原因：通过让 Gemini 快速给出回答，

9/4/2024 11:41:51 AM

故渊

扩散模型做游戏引擎，单TPU 20 FPS模拟毁灭战士，谷歌最新GameNGen太博眼球了

GameNGen 是第一个完全由神经模型驱动的游戏引擎。谷歌在人工智能领域又一次取得了重大进展。在最新发表的一篇论文中，研究者创建了一个神经网络，可以在不使用传统游戏引擎的情况下为经典射击游戏《毁灭战士》生成实时游戏画面。这个名为 GameNGen 的系统标志着人工智能领域向前迈出了重要一步，它在一个芯片上以每秒 20 帧的速度生成可玩的游戏画面，每帧画面都由扩散模型进行预测。可以说，这是第一个完全由神经模型驱动的游戏引擎，可以高质量地在长轨迹上与复杂环境进行实时交互。这一成就标志着人工智能首次完全模拟了一款复杂的

8/29/2024 11:39:00 AM

机器之心

谷歌将重新开放 Gemini 生成人物图像功能，此前因“种族描述不当”引争议

感谢北京时间 29（今）日，据彭博社报道，谷歌宣布将恢复 AI 模型 Gemini 生成人物图像的功能，部分消费者将可以重新使用。谷歌表示，将开始向订阅 Gemini Advanced 套餐的英语用户推出生成人物图像功能。企业也将能够使用该工具，该功能将在未来几天内上线。谷歌产品管理高级总监戴夫・西特伦（Dave Citron）表示，该公司在通过 Imagen 3 生成人物描写方面取得了“重大进展”。“我们一直在努力对产品进行技术改进，并改进了评估集、红队练习和明确的产品原则。当然，Gemini 创建的每张图像都不

8/29/2024 10:26:42 AM

清源

Jim Gao：曾助谷歌节能40%的AI专家，如今致力打造“虚拟工厂操作员”

只是使用了AI就让工厂能耗降低40%是的，你没有看错，就是降低了整整40%，几乎将能耗砍半！这是Jim Gao在Google大型数据中心的一次尝试。这位华人机械工程师巧妙地使用了AI系统辅助控制数据中心的复杂的工业系统，AI在实现了预期系统优化的基础上，还做到了他从没幻想过的超低冷却能耗。

8/27/2024 11:23:00 AM

刘洁

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练