苹果牌“AI”官方详解：Apple Intelligence 当地 30 亿参数模型，云端基于苹果芯片服务器

感谢苹果在昨日的 WWDC24 上重磅公布了 Apple Intelligence（苹果智能），将为 iPhone、Mac 等设施引入一系列 AI 功能。随后，苹果机器学习官网公布了 Apple Intelligence 的详细信息。据苹果官方介绍，Apple Intelligence 拥有两个根本模型：当地模型：设施上约 30 亿参数的说话模型，测试得分高于诸多 70 亿参数的开源模型（Mistral-7B 或 Gemma-7B）；云上模型：可通过私有云计算并在 Apple 芯片服务器上运行的更大云端说话模型。苹

感谢苹果在昨日的 WWDC24 上重磅公布了 Apple Intelligence（苹果智能），将为 iPhone、Mac 等设施引入一系列 AI 功能。

随后，苹果机器学习官网公布了 Apple Intelligence 的详细信息。据苹果官方介绍，Apple Intelligence 拥有两个根本模型：

当地模型：设施上约 30 亿参数的说话模型，测试得分高于诸多 70 亿参数的开源模型（Mistral-7B 或 Gemma-7B）；

云上模型：可通过私有云计算并在 Apple 芯片服务器上运行的更大云端说话模型。

苹果表示，Apple Intelligence 由多个高性能生成模型组成，这些模型专门针对用户的日常任务，并且可以动态适应他们当前的活动。Apple Intelligence 中内置的根本模型针对用户体验进行了微调，例如编写和精炼文本、对通知进行优先级排序和总结、为用户与家人和朋友的对话创建有趣图像，以及采取利用内操作来简化利用之间的交互。

苹果牌“AI”官方详解：Apple Intelligence 当地 30 亿参数模型，云端基于苹果芯片服务器

在预训练方面，苹果的根本模型在 AXLearn 框架上进行训练，这是苹果于 2023 年发布的开源项目。它构建在 JAX 和 XLA 之上，使苹果能够在各种训练硬件和云平台上可扩展地训练模型，包括 TPU 以及云和当地 GPU。

IT之家注意到，苹果承诺在训练根本模型时，该公司从不利用用户的私人个人数据或用户交互，并且会利用过滤器来删除互联网上公开的个人身份信息，例如社会保障和信用卡号码。苹果还过滤了脏话和其他低质量内容，以防止其包含在训练语料库中。除了过滤之外，苹果还执行数据提取、重复数据删除以及利用基于模型的分类器来识别高质量文档。

在优化方面，苹果在设施端模型和服务器端模型都利用了 grouped-query-attention，设施上模型利用 49K 的词大小，而服务器模型利用 100K 的词大小，其中包括额外的说话和技术标记。

通过优化，苹果号称在 iPhone 15 Pro 上，能够实现每个 prompt token 约 0.6 毫秒的首次 token 延迟，以及每秒 30 个 token 的生成速率。

在指令跟踪评估（IFEval）测试中，苹果当地模型性能优于包括 Phi-3-mini、Mistral-7B 和 Gemma-7B 等模型，且与 DBRX-Instruct、Mixtral-8x22B 和 GPT-3.5-Turbo 相比毫不逊色；而云上模型水平基本与 GPT-4-Turbo 持平。

苹果牌“AI”官方详解：Apple Intelligence 当地 30 亿参数模型，云端基于苹果芯片服务器

苹果计划在今年夏天推出的 iOS 18、iPadOS 18 和 macOS Sequoia 测试版中，开放 Apple Intelligence，然后会以测试版的形式，于今年秋季向公众开放，但部分功能、更多说话和平台支持需求等到明年。

Apple Intelligence 可以免费利用，但仅限于装备 A17 Pro 芯片或任何 M 系列芯片的设施。这意味着要利用这些功能，你需求一部 iPhone 15 Pro 或 iPhone 15 Pro Max，即将推出的 iPhone 16 系列也将支持 Apple Intelligence。

在 Mac 方面，你需求一台装备 M1 或更高版本的 Mac，而对于 iPad，你需求一台装备 M1 芯片或更高版本的 iPad Pro 或 iPad Air。

苹果 WWDC24 开发者大会主题演讲专题

{{userData.name}}已认证

苹果牌“AI”官方详解：Apple Intelligence 当地 30 亿参数模型，云端基于苹果芯片服务器

字节跳动相关人士回应“研发 AI 手机”：实为基于手机的大模型软件解决方案

拿下 6 亿欧元融资，“OpenAI 欧洲对手”Mistral 估值飙升至近 60 亿欧元

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

腾讯云 ES：一站式 RAG 方案，开启智能搜索新时代

Deepseek v3正式发布：用557.6万美金超越Claude 3.5 Sonnet的惊人杰作

2024年AI 编程现在可以做到什么程度？

劲爆！理想汽车转做大模型，主持人质疑李想是否跟风：你有理想吗？李想自曝三次创业心得：终极是硅基家人，要做中国第一！

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！