谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

谷歌 DeepMind 发布的 Gemma 2 2B 模型,在性能和效率之间实现了最佳平衡,适用于各种终端设备,包括手机、笔记本、数据中心等。

就在刚刚,谷歌 DeepMind 发布了 Gemma 2 2B

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

该模型从 Gemma 2 27B 中蒸馏而来,虽然参数仅有 2.6B,但在 LMSYS 竞技场上的得分已经超越了 GPT-3.5 和 Mixtral 8x7B!

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

在 MMLU 和 MBPP 基准测试中,它分别取得了 56.1 和 36.6 的优异成绩,性能比起前代模型 Gemma 1 2B 提升了 10%。

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

小模型击败了大模型,再次证明了小模型方向的巨大潜力。

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

Gemma 2 家族新增三位成员

谷歌这次发布了三款新模型:

  • Gemma 2 2B:轻量级 2B 模型,性能与效率兼备
  • ShieldGemma:基于 Gemma 2 构建的安全内容分类器模型
  • Gemma Scope:一种提供模型内部运行机制洞察的可解释性工具

6 月份,27B 和 9B Gemma 2 模型诞生,27B 模型迅速成为开源模型排行榜上的佼佼者。

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

Gemma 2 2B:即刻在设备上使用

轻量级小模型 Gemma 2 2B,是从大模型中蒸馏而来,性能毫不逊色。

在 LMSYS 竞技场上,新模型取得了 1130 分,与 10 倍参数的模型不相上下。GPT-3.5-Turbo-0613 得分为 1117,Mixtral-8x7b 得分为 1114。

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

Gemma 2 2B 适用于各种终端设备,包括手机、笔记本,甚至是使用 Vertex AI 和 Google Kubernetes Engine(GKE)强大的云。

有网友在 iPhone 15 Pro 上,让量化后的 Gemma 2 2B 在 MLX Swift 上运行,速度快到惊人。

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

模型通过 NVIDIA TensorRT-LLM 完成了优化,在 NVIDIA NIM 平台也可使用,适用于数据中心、云、本地工作站、PC 和边缘设备。

Gemma 2 2B 无缝集成了 Keras、JAX、Hugging Face、NVIDIA NeMo、Ollama、Gemma.cpp 等,并将很快与 MediaPipe 集成,实现简化开发。

模型可以在 Google Colab 的免费 T4 GPU 层上运行,降低了开发门槛。

开发者可以从 Kaggle、Hugging Face、Vertex AI Model Garden 下载 Gemma 2 的模型权重,也可在 Google AI Studio 中试用其功能。

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

仓库地址:https://huggingface.co/collections/google/gemma-2-2b-release-66a20f3796a2ff2a7c76f98f

ShieldGemma:最先进的安全分类器

ShieldGemma 是最先进的安全分类器,确保 AI 输出内容具有吸引力、安全、包容,并能检测和减少有害内容输出。

该模型专门针对四个关键有害领域:

  • 仇恨言论
  • 骚扰内容
  • 露骨内容
  • 危险内容

这些开源分类器补充了谷歌现有的负责任 AI 工具包中安全分类器套件。

ShieldGemma 基于 Gemma 2 构建,提供各种模型参数规模,包括 2B、9B、27B,经过英伟达速度优化,可在各种硬件中高效运行。

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

Gemma Scope:揭示 AI 决策过程

Gemma Scope 是开源稀疏自编码器,通过放大模型中的特定点,使模型的内部工作更易于解释。

Gemma Scope 提供了前所未有的透明度,帮助研究人员和开发者深入了解 Gemma 2 模型的决策过程。

它是数百个适用于 Gemma 2 9B 和 Gemma 2 2B 的免费开放稀疏自动编码器(SAE)的集合。

研究人员和开发者可以通过这些 SAE 获得宝贵的信息,了解 Gemma 2 如何识别模式、处理信息、做出预测。

技术报告:https://storage.googleapis.com/gemma-scope/gemma-scope-report.pdf

谷歌 DeepMind 推出全新 Gemma 2 2B模型,iPhone 可跑

给TA打赏
共{{data.count}}人
人已打赏
应用

中央企业智能算力规模同比实现翻倍增长,未来可期

2024-8-1 11:19:22

应用

国产开源AI搜索引擎MindSearch:挑战ChatGPT和Perplexity.ai

2024-8-1 14:45:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索