AI在线 AI在线

Grok-3四档定价揭秘:低至0.3美元/百万token,硬刚谷歌Meta

作者:新智元
2025-04-11 09:29
GenAI竞争,越来越激烈了。 据Similar  Web统计,在日活跃用户方面,Grok与Gemini展开了激烈竞争。 两者都已经超过50万日活跃用户,差距不足5万。

GenAI竞争,越来越激烈了。

据Similar  Web统计,在日活跃用户方面,Grok与Gemini展开了激烈竞争。两者都已经超过50万日活跃用户,差距不足5万。

图片

就在昨天,谷歌面向开发者推出全新套餐体系,其中标准套餐对个人开发者免费开放,可免费使用 Gemini 代码助手。

图片

谈及API价格策略,AI巨头各出奇招:

  1. Grok-3 推出2款模型,支持2种调用模式,衍生出 4 种定价套餐;
  2. Anthropic推出100美元的Max套餐,主打高端服务;
  3. 谷歌Gemini 2.5 需付费解锁使用限制,以高性价比吸引用户;
  4. Meta开源Llama 3,成本优势显著,平均每百万token仅需0.36 美元 。

Grok-3:4种模型,各取所需

xAI,正式向公众开放了Grok 3系列API!

目前,Grok 3和 Grok 3 Mini均处于Beta测试阶段,支持常规模式与快速模式。

  • Grok 3 适用于企业应用场景,如数据抽取、编程、文本处理等。其价格为:每输入100万token收费3美元,每输出100万token收费15美元。
  • Grok 3 MINI属于轻量级模型,适用于对深度领域知识无需求的简单任务。价格为:每输入100万token收费0.3美元,每输出100万token收费 0.5 美元。

图片

Grok-3Grok-3-fast使用的是相同的基座模型,提供相同的响应质量。

它们的区别在于服务方式:Grok-3-fast运行在更快的基础设施上,响应速度显著高于标准版grok-3,但其输出token的成本也更高。

Grok-3grok-3-fast指向的是相同的模型。

  • 如果需要低延迟的应用,选择grok-3-fast
  • 如果想降低成本,可以选择grok-3

对于grok-3-minigrok-3-mini-fast也是如此。

它们本质上是相同的模型,唯一的区别是响应延迟。

可用模型列表:

  • grok-3-beta(标准版):输入3美元/百万token,输出15美元/百万token
  • grok-3-fast-beta(标准版,快速响应):输入5美元/百万token,输出25美元/百万token
  • grok-3-mini-beta(轻量版):输入0.3美元/百万token,输出0.5美元/百万token
  • grok-3-mini-fast-beta(轻量版,快速响应):输入0.6美元/百万token,输出4美元/百万token

图片

在文档中,xAI展示了几个示例。

比如对话补全,可以流式传输响应,用户向xAI API端点发送请求。

API处理该请求后返回完整的响应。

复制
import osfrom openai import OpenAIclient = OpenAI(    api_key="<YOUR_XAI_API_KEY_HERE>",    base_url="https://api.x.ai/v1",)completion = client.chat.completions.create(    model="grok-3-latest",    messages=[        {"role": "system", "content": "You are a PhD-level mathematician."},        {"role": "user", "content": "What is 2 + 2?"},    ],)print(completion.choices[0].message)

import os
from openai import OpenAI
client = OpenAI(
    api_key="<YOUR_XAI_API_KEY_HERE>",
    base_url="https://api.x.ai/v1",
)
completion = client.chat.completions.create(
    model="grok-3-latest",
    messages=[
        {"role": "system", "content": "You are a PhD-level mathematician."},
        {"role": "user", "content": "What is 2 + 2?"},
    ],
)
print(completion.choices[0].message)

响应:

复制
ChatCompletionMessage(    cnotallow='2 + 2 equals 4.',    refusal=None,    role='assistant',    audio=None,    function_call=None,    tool_calls=None)

ChatCompletionMessage(
    cnotallow='2 + 2 equals 4.',
    refusal=None,
    role='assistant',
    audio=None,
    function_call=None,
    tool_calls=None
)

AI巨头,各显神通

Gemini系列模型推出了免费的Gemini  2.5 Pro、 2.0 Flash等最新模型。

而且除了使用的模型不同,以及部分功能每日请求次数的限制,免费版几乎和付费版没有什么不同

图片

今天,Anthropic推出了Max套餐:最低100美元,专为那些重度使用Claude并且需要更多使用次数,完成重要工作的用户设计。

Llama 4 Maverick 相较于平均水平更为便宜,定价为每百万token为0.36美元。

  • Llama 4 Maverick输入令牌价格:每百万个令牌0.20美元
  • Llama 4 Maverick输出令牌价格:每百万个令牌0.82美元

图片

在ARC-AGI的半私有评估中,Llama 4 Maverick非常具有性价比:

- ARC-AGI-1:每个任务只要0.0078美元

- ARC-AGI-2:每个任务只要0.0121美元

图片

此前,o3被爆出在ARC-AGI测试中烧3万美元解决一道题,试错1024次!

相关标签:

相关资讯

谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

由于深度学习的「黑箱」本性,从业者自我调侃道:如果说深度神经网络是现代版的「炼金术」,我们在古代就是「炼金术士」。 2018年5月3日, Science发表新闻,标题直指「炼金术」,强调加强AI的科学基础但这次的谷歌的团队,却有不一样的看法:在许多方面,深度学习仍然带有一定的「炼金术」色彩,但理解和优化模型性能并不一定如此——即使是在大规模环境下! 近日,谷歌DeepMind科学家Jacob Austint在X上, 发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。
2/21/2025 1:45:00 PM
新智元

谷歌Fellow级大佬出走!17年老将吴永辉加盟字节,亲自操刀大模型研发

谷歌17年老将,正式加入字节跳动。 据报道,吴永辉博士已确认离职谷歌,加盟字节负责AI基础研究领域的工作。 他将在字节担任大模型团队Seed基础研究负责人,专注于大模型基础研究搜索、AI for Science科研工作,直接向CEO梁汝波汇报。
2/24/2025 8:15:00 AM
新智元

谷歌Gemma 3上线!单GPU最强多模态手机可跑,27B完胜o3-mini

谷歌Gemma 3全家桶来了! 刚刚,在巴黎开发者日上,开源Gemma系模型正式迭代到第三代,原生支持多模态,128k上下文。 此次,Gemma 3一共开源了四种参数,1B、4B、12B和27B。
3/13/2025 9:12:35 AM
新智元