新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

一年一度的google I/O 总是吸引着全球开发者的眼球，今年 AI 技能有重大突破，大家的关注度更高了。

当地时间 5 月 10 日上午，加州山景城的海岸圆形剧场座无虚席，今年的大会正式开幕。

「AI 正在度过忙碌的一年，而google作为人工智能优先公司的旅程已经七年了，我们正处于一个转折点，」google首席执行官桑达尔・皮查伊（Sundar Pichai）说道。「通过生成式 AI 技能，我们正在迈出下一步。」

在 ChatGPT 推出之后，人们都很关心google的「反击策略」。在今天凌晨长达两个小时的演讲中，google从算法、软件讲到硬件，又通篇都在讲人工智能，最新的大模型技能，已经利用在了google产品体系的方方面面。

PaLM 二代模型支持多说话、更强的数学、代码能力

首先，google给出了自己对标 GPT-4 的大模型 PaLM 2。

要说这一波 AI 技能突破的源头，或许可以追溯到 2017 年google提出的 transformer 架构，它已成为绝大多数现代大说话模型的基石。

在过去的几年里，google除了在大模型上不断进步之外，也采用了许多创造性的新技能来建立功效更强大、用途更广的模型。这些技能是新一代说话模型 PaLM 2 的核心。PaLM 基于google Pathways 架构，其第一个版本的模型于 2022 年 4 月发布。

google I/O 大会上，皮查伊宣布推出 PaLM 2 预览版本，改良了数学、代码、推理、多说话翻译和自然说话生成能力，利用google最新的 TPU 算力基础设施提升了训练速度。由于它的建立方式是将计算、优化扩展、改良的数据集混合以及模型架构改良结合在一起，因此服务效率更高，同时整体表现更好。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

会上，google并没有给出有关 PaLM 2 的具体技能细节，只说明了它是建立在google最新 JAX 和 TPU v4 之上。PaLM 2 模型提供了不同尺寸规模的四个版本，从小到大依次为 Gecko、Otter、Bison 和 Unicorn，更易于针对各种用例进行部署。其中轻量级的 Gecko 模型可以在移动设备上运行，速度非常快，不联网也能在设备上运行出色的交互式利用程序。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

皮查伊表示，PaLM 2 模型在常识推理、数学和逻辑领域表现更好。为此，google在大量包含数学表达式的科学论文和网页上进行了训练，可以轻松解决数学难题、推理文本甚至可以输出图表。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

从基准测试上可以看到，对于具有思维链 prompt 或自洽性的 MATH、GSM8K 和 MGSM 基准评估，PaLM 2 的部分结果超越了 GPT-4。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

PaLM 2 是在具有 100 + 说话的语料库上进行训练的，因此它更擅长多说话任务，能够理解、生成和翻译比以往模型更细致多样化的文本（包括习语、诗歌和谜语等）。PaLM 2 通过了「精通」（mastery）级别的高级说话能力考试。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

与此同时，PaLM 2 改良了对代码编写和调试的支持，在 20 种编程说话上进行了训练，包括 Python 和 JavaScript 等流行说话以及 Prolog、Verilog 和 Fortran 等其他更专业的说话。PaLM 2 构成了 Codey 的基础，它是google用于编码和调试的专用模型，作为代码补全和生成服务的一部分推出。

皮查伊现场演示了 PaLM 2 的代码调试功效，输入指令「你能修复这段代码的一个 bug，并添加一行一行的韩文注释吗？」，结果如下动图所示。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

google内部已经有超过 70 个产品团队正在利用 PaLM 2 建立产品，包括分别针对安全知识和医疗知识微调而成的 Sec-PaLM 和 Med-PaLM 2。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

其中 Sec-PaLM 是专注于安全用例的版本，利用 AI 帮助分析和解释具有潜在恶意脚本的行为，并检测哪些脚本对个人或组织构成威胁。Med-PaLM 2 可以检索医学知识、回答问题、生成有用的模板和解码医学术语，甚至还可以从图象中合成患者信息，例如胸部 X 光检查或乳房 X 光检查。值得强调的是，Med-PaLM 2 是首个达到专家水平的大说话模型。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

皮查伊在会上展现了 Med-PaLM 2 的医疗实质生成效果。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

目前，开发者可以通过google的 PaLM API、Firebase 以及 Colab 访问 PaLM 2。皮查伊还表示，PaLM 2 将继续为google最新的 Bard 提供支持。

在皮查伊演讲的同时，google放出了 PaLM 2 的论文，整整 91 页。但令人失望的是，PaLM 2 论文远没初代 PaLM 有诚意，和 GPT-4 一样，是技能报告。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

论文地址：https://ai.google/static/documents/palm2techreport.pdf

另外，在 Google Brain 和 DeepMind 合并之后，新的大模型也在研制过程当中。皮查伊表示现在google的研究重心正在转向 Gemini，这是一种多模态和高效的机器学习东西。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

google并未透露 Gemini 的更多信息，我们只知道该模型是在今年才开始研发的，将具有像 GPT-4 一样的万亿参数。目前 Gemini 仍在训练中，但已经展现出了以往模型中从未见过的多模态能力。一旦经过微调和严格的安全性测试，google同样将提供不同尺寸和功效的 Gemini 版本，以确保部署在不同的产品、利用和设备上。

多模态版 Bard，能用 Adobe Firefly 画图

皮查伊表示，现在的google Bard 已经完全运行在了新一代模型 PaLM 2 上。在 I/O 大会上，ChatGPT 和新必应的竞争对手 Bard 经历了大幅更新，包括图象功效、编码功效和利用程序集成。

「PaLM 2 模型在逻辑和推理方面比以往的模型更加强大，这要归功于对逻辑和推理的广泛训练，」皮查伊表示。「它还接受了跨越 100 多种说话的多说话文本训练。」

Bard 将在回复和你给更复杂提醒后给出更加直观的实质。你可以问它诸如「新奥尔良有哪些必看景点？」之类的问题，除了文本之外，你可以获得更有意义的回复，以及丰富的视觉实质。

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

和 GPT-4 一样，你还可以在自己的要求中附加图象和文本。比如像这样，为这张照片想一个有趣的标题：

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT

Bard 作为生产力东西和搜索引擎之间的东西，最新版的改良有关易用性。首先是加入了引用，现在 AI 生成的回答将通过展现特定代码块的来源（也是链接）来确保代码引用更加准确，这也适用于从网络上引用叙述性实质。

其次是导出按钮。如果 AI 生成的实质接近于实用化，我们肯定会希望能够更快捷地利用这些结果。现在，人们能把实质快速导出到 Colab 和 Replit 上，进一步建立和迭代自己的想法。当然文字也是可以的，如果你让 Bard 写邮件，那么它也可以一键直接用 Gmail 发送，或新建一个 Docs 文件。

未来，google还计划集成的利用还包括 Sheets、Slides、Calendar、Keep、Tasks、Maps、Photos、Messages、Flights、YouTube、YT Music、Google Images、Imagen、OpenTable、Replit，以及 Adobe 的 Firefly。

google表示，Bard 很快就会支持各种第三方扩展，例如 AI 可以自动根据你输入的文本生成图象，利用的还是 Adobe 那个神奇的 Firefly：

新大模型能超GPT-4，Bard全面升级，google反击ChatGPT