谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

作者：故渊

2024-12-20 07:58

谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。

谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。

该模型不仅能够解答复杂问题，还能模仿人类逐步推理，展现其“思考”步骤，这一创新功能有望革新 AI 领域，和 OpenAI 的 o1 推理模型展开竞争。AI在线附上相关演示如下：

Google DeepMind 首席科学家 Jeff Dean 演示了该模型如何通过一系列“思考”步骤解决物理问题；而 Google 产品负责人 Logan Kilpatrick 展示了模型如何处理包含图像和文本信息的推理问题。

该模型基于 Gemini 2.0 Flash 的速度和性能构建，在 Chatbot Arena LLM 排行榜上，Gemini 2.0 Flash Thinking 模型在所有类别中均排名第一，较之前的 Gemini-2.0-Flash 模型有显著提升，尤其在“硬提示”和“视觉”两项分别提升了 14 分和 16 分。

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

该模型目前已在 Google AI Studio 和 Vertex AI 平台上线。谷歌表示，这只是推理之旅的第一步，未来这些推理能力可能会集成到 Gemini 2.0 系列的主要模型中。

相关标签：

谷歌 Gemini DeepMind

相关资讯

Gemini 1.5 Pro装进机器人，参观一遍公司就能礼宾、带路

Gemini 1.5 Pro装进机器人，参观一遍公司就能礼宾、带路

长上下文大模型帮助机器人理解世界。最近，谷歌 DeepMind 突然开始炫起了机器人。这个机器人可以轻松听从人类指令、进行视觉导览，用常识推理在三维空间中寻找路径。它使用的是最近谷歌发布的大模型 Gemini 1.5 Pro。在使用传统 AI 模型时，机器人常因上下文长度限制而难以回忆起环境细节，但 Gemini 1.5 Pro 的百万级 token 上下文长度为机器人提供了强大的环境记忆能力。在真实的办公室场景中，工程师引导机器人游览特定区域，并标出了需要回忆的关键地点，例如「刘易斯的办公桌」或「临时办公桌区域」

门板上做研究的首席科学家：Jeff Dean解密谷歌和Gemini背后的故事

门板上做研究的首席科学家：Jeff Dean解密谷歌和Gemini背后的故事

“最开始我就知道谷歌相当有希望，谷歌能发展到现在的规模不过是水到渠成。 ”这位谷歌首席科学家在谷歌度过了近乎一半的人生，对谷歌的喜爱不减反增，到现在还依然坚守着谷歌最初的愿景并为此奋斗：组织全球信息并使其普遍可用和有用Jeff Dean 还记得刚加入谷歌的时候，每到周二的流量高峰期就开始担心系统会不会崩溃，还好后来及时增加了设备，对代码和搜索功能做了更多优化，谷歌搜索这才步入了正轨。后来吴恩达在谷歌担任顾问，Jeff Dean 和他商定了大型神经网络的研究目标，最终促成了 Google Brain 团队的成立。

如虎添翼，谷歌探索 AI + 机器人未来：836 平方米复杂场景下指令成功率高达 90%

如虎添翼，谷歌探索 AI + 机器人未来：836 平方米复杂场景下指令成功率高达 90%

感谢科技媒体 The Verge 昨日报道，谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人，让其能够完成更复杂的任务，且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文，利用 Gemini 1.5 Pro 的上下文窗口（达到 200 万个词元），让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注：上下文窗口（context window）是指语言模型在进行预测或生成文本时，所考虑的前一个词元（token）或文本片段的大小范围。其工作原理是拍摄指定区

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架阿里云与黑芝麻智能完成大模型车载芯片级适配类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手 AI模拟细胞，走向全新虚拟生命，斯坦福团队呼吁是时候走出全新的一步了

标签云