Grok-3四档定价揭秘：低至0.3美元/百万token，硬刚谷歌Meta

作者：新智元

2025-04-11 09:29

GenAI竞争，越来越激烈了。据Similar Web统计，在日活跃用户方面，Grok与Gemini展开了激烈竞争。两者都已经超过50万日活跃用户，差距不足5万。

GenAI竞争，越来越激烈了。

据Similar Web统计，在日活跃用户方面，Grok与Gemini展开了激烈竞争。两者都已经超过50万日活跃用户，差距不足5万。

就在昨天，谷歌面向开发者推出全新套餐体系，其中标准套餐对个人开发者免费开放，可免费使用 Gemini 代码助手。

谈及API价格策略，AI巨头各出奇招：

Grok-3 推出2款模型，支持2种调用模式，衍生出 4 种定价套餐；
Anthropic推出100美元的Max套餐，主打高端服务；
谷歌Gemini 2.5 需付费解锁使用限制，以高性价比吸引用户；
Meta开源Llama 3，成本优势显著，平均每百万token仅需0.36 美元。

Grok-3：4种模型，各取所需

xAI，正式向公众开放了Grok 3系列API！

目前，Grok 3和 Grok 3 Mini均处于Beta测试阶段，支持常规模式与快速模式。

Grok 3 适用于企业应用场景，如数据抽取、编程、文本处理等。其价格为：每输入100万token收费3美元，每输出100万token收费15美元。
Grok 3 MINI属于轻量级模型，适用于对深度领域知识无需求的简单任务。价格为：每输入100万token收费0.3美元，每输出100万token收费 0.5 美元。

Grok-3和Grok-3-fast使用的是相同的基座模型，提供相同的响应质量。

它们的区别在于服务方式：Grok-3-fast运行在更快的基础设施上，响应速度显著高于标准版grok-3，但其输出token的成本也更高。

Grok-3和grok-3-fast指向的是相同的模型。

如果需要低延迟的应用，选择grok-3-fast；
如果想降低成本，可以选择grok-3。

对于grok-3-mini和grok-3-mini-fast也是如此。

它们本质上是相同的模型，唯一的区别是响应延迟。

可用模型列表：

grok-3-beta（标准版）：输入3美元/百万token，输出15美元/百万token
grok-3-fast-beta（标准版，快速响应）：输入5美元/百万token，输出25美元/百万token
grok-3-mini-beta（轻量版）：输入0.3美元/百万token，输出0.5美元/百万token
grok-3-mini-fast-beta（轻量版，快速响应）：输入0.6美元/百万token，输出4美元/百万token

在文档中，xAI展示了几个示例。

比如对话补全，可以流式传输响应，用户向xAI API端点发送请求。

API处理该请求后返回完整的响应。

复制

import osfrom openai import OpenAIclient = OpenAI(    api_key="<YOUR_XAI_API_KEY_HERE>",    base_url="https://api.x.ai/v1",)completion = client.chat.completions.create(    model="grok-3-latest",    messages=[        {"role": "system", "content": "You are a PhD-level mathematician."},        {"role": "user", "content": "What is 2 + 2?"},    ],)print(completion.choices[0].message)

import os
from openai import OpenAI
client = OpenAI(
    api_key="<YOUR_XAI_API_KEY_HERE>",
    base_url="https://api.x.ai/v1",
)
completion = client.chat.completions.create(
    model="grok-3-latest",
    messages=[
        {"role": "system", "content": "You are a PhD-level mathematician."},
        {"role": "user", "content": "What is 2 + 2?"},
    ],
)
print(completion.choices[0].message)

响应：

复制

ChatCompletionMessage(    cnotallow='2 + 2 equals 4.',    refusal=None,    role='assistant',    audio=None,    function_call=None,    tool_calls=None)

ChatCompletionMessage(
    cnotallow='2 + 2 equals 4.',
    refusal=None,
    role='assistant',
    audio=None,
    function_call=None,
    tool_calls=None
)

AI巨头，各显神通

Gemini系列模型推出了免费的Gemini 2.5 Pro、 2.0 Flash等最新模型。

而且除了使用的模型不同，以及部分功能每日请求次数的限制，免费版几乎和付费版没有什么不同

今天，Anthropic推出了Max套餐：最低100美元，专为那些重度使用Claude并且需要更多使用次数，完成重要工作的用户设计。

Llama 4 Maverick 相较于平均水平更为便宜，定价为每百万token为0.36美元。

Llama 4 Maverick输入令牌价格：每百万个令牌0.20美元
Llama 4 Maverick输出令牌价格：每百万个令牌0.82美元

在ARC-AGI的半私有评估中，Llama 4 Maverick非常具有性价比：

- ARC-AGI-1：每个任务只要0.0078美元

- ARC-AGI-2：每个任务只要0.0121美元

此前，o3被爆出在ARC-AGI测试中烧3万美元解决一道题，试错1024次！

谷歌超硬核教科书来了！Jeff Dean带货揭Gemini训练秘籍：在TPU上scaling

由于深度学习的「黑箱」本性，从业者自我调侃道：如果说深度神经网络是现代版的「炼金术」，我们在古代就是「炼金术士」。 2018年5月3日， Science发表新闻，标题直指「炼金术」，强调加强AI的科学基础但这次的谷歌的团队，却有不一样的看法：在许多方面，深度学习仍然带有一定的「炼金术」色彩，但理解和优化模型性能并不一定如此——即使是在大规模环境下！近日，谷歌DeepMind科学家Jacob Austint在X上，发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。

2/21/2025 1:45:00 PM

新智元