就在刚刚,谷歌 DeepMind 发布了 Gemma 2 2B。
该模型从 Gemma 2 27B 中蒸馏而来,虽然参数仅有 2.6B,但在 LMSYS 竞技场上的得分已经超越了 GPT-3.5 和 Mixtral 8x7B!
在 MMLU 和 MBPP 基准测试中,它分别取得了 56.1 和 36.6 的优异成绩,性能比起前代模型 Gemma 1 2B 提升了 10%。
小模型击败了大模型,再次证明了小模型方向的巨大潜力。
Gemma 2 家族新增三位成员
谷歌这次发布了三款新模型:
- Gemma 2 2B:轻量级 2B 模型,性能与效率兼备
- ShieldGemma:基于 Gemma 2 构建的安全内容分类器模型
- Gemma Scope:一种提供模型内部运行机制洞察的可解释性工具
6 月份,27B 和 9B Gemma 2 模型诞生,27B 模型迅速成为开源模型排行榜上的佼佼者。
Gemma 2 2B:即刻在设备上使用
轻量级小模型 Gemma 2 2B,是从大模型中蒸馏而来,性能毫不逊色。
在 LMSYS 竞技场上,新模型取得了 1130 分,与 10 倍参数的模型不相上下。GPT-3.5-Turbo-0613 得分为 1117,Mixtral-8x7b 得分为 1114。
Gemma 2 2B 适用于各种终端设备,包括手机、笔记本,甚至是使用 Vertex AI 和 Google Kubernetes Engine(GKE)强大的云。
有网友在 iPhone 15 Pro 上,让量化后的 Gemma 2 2B 在 MLX Swift 上运行,速度快到惊人。
模型通过 NVIDIA TensorRT-LLM 完成了优化,在 NVIDIA NIM 平台也可使用,适用于数据中心、云、本地工作站、PC 和边缘设备。
Gemma 2 2B 无缝集成了 Keras、JAX、Hugging Face、NVIDIA NeMo、Ollama、Gemma.cpp 等,并将很快与 MediaPipe 集成,实现简化开发。
模型可以在 Google Colab 的免费 T4 GPU 层上运行,降低了开发门槛。
开发者可以从 Kaggle、Hugging Face、Vertex AI Model Garden 下载 Gemma 2 的模型权重,也可在 Google AI Studio 中试用其功能。
仓库地址:https://huggingface.co/collections/google/gemma-2-2b-release-66a20f3796a2ff2a7c76f98f
ShieldGemma:最先进的安全分类器
ShieldGemma 是最先进的安全分类器,确保 AI 输出内容具有吸引力、安全、包容,并能检测和减少有害内容输出。
该模型专门针对四个关键有害领域:
- 仇恨言论
- 骚扰内容
- 露骨内容
- 危险内容
这些开源分类器补充了谷歌现有的负责任 AI 工具包中安全分类器套件。
ShieldGemma 基于 Gemma 2 构建,提供各种模型参数规模,包括 2B、9B、27B,经过英伟达速度优化,可在各种硬件中高效运行。
Gemma Scope:揭示 AI 决策过程
Gemma Scope 是开源稀疏自编码器,通过放大模型中的特定点,使模型的内部工作更易于解释。
Gemma Scope 提供了前所未有的透明度,帮助研究人员和开发者深入了解 Gemma 2 模型的决策过程。
它是数百个适用于 Gemma 2 9B 和 Gemma 2 2B 的免费开放稀疏自动编码器(SAE)的集合。
研究人员和开发者可以通过这些 SAE 获得宝贵的信息,了解 Gemma 2 如何识别模式、处理信息、做出预测。
技术报告:https://storage.googleapis.com/gemma-scope/gemma-scope-report.pdf