豆包大模型公布价格清单，支持国内最高并发标准

2024-05-21 10:55

近期，火山引擎官网更新了豆包大模型的定价详情，全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请求数）均达到国内最高标准。以豆包主力模型 pro-32k 为例，价格比行业低99%，TPM限额则高达同规格模型的2.7倍到8倍。图：豆包系列模型“后付费”定价信息官方信息显示：在按照 Tokens 实际使用量计算费用的“后付费”模式下，豆包通用模型-pro、豆包通用模型-lite的 32k 及以下窗口版本，模型限流为 1

图：豆包系列模型“后付费”定价信息

官方信息显示：在按照 Tokens 实际使用量计算费用的“后付费”模式下，豆包通用模型-pro、豆包通用模型-lite的 32k 及以下窗口版本，模型限流为 10K RPM 和 800K TPM（以 RPM 和 TPM 其中之一到达上限为准）。国内其他主流模型的 TPM 限额大多在 100K 到 300K 之间，RPM则是在60到120区间，轻量级模型的RPM限额相对较高，但仅仅在300到500之间。

按照 10K RPM 限额计算，企业客户平均每秒可以同时调用167次豆包通用模型，从而满足绝大多数业务场景在生产系统的大模型应用需求。这一标准，已经达到 OpenAI 为高级别客户（ Tier4 及 Tier5 等级客户）提供的 RPM 上限。

在算力挑战更大的长文本模型上，豆包通用模型 pro 和 lite 的 128k 版本，模型限流为 1K RPM 和 400K TPM，同样大幅高于国内其他的128k长文本模型。

此外，豆包大模型公布了最新的“预付费”模型单元价格。“预付费”是以调用某个特定模型的 TPM 配额，企业购买后无需再为 Tokens 消耗付费，提前为可以预见的流量波动规划好算力。

豆包大模型公布价格清单，支持国内最高并发标准

图：豆包系列模型“预付费”模型单元价目表

以豆包通用模型 pro-32k为例：

按照 “预付费”模型单元价格计算，10K TPM 的包月价格为2000元。10K*60*24*30=43200K。即 432000K Tokens的价格为2000元，平均价格为 0.0046元/千Tokens。

按照“后付费”模式计算：在模型推理的计算成本中，推理输入通常占绝大部分比例，业界一般认为推理输入是输出的5倍。根据豆包通用模型 pro-32k 推理输入 0.0008元/千Tokens、推理输出 0.002元/千Tokens 计算，模型推理的综合价格为 0.001元/千Tokens。

火山引擎方面表示，豆包大模型为客户提供了灵活、经济的付费模式，“后付费”即可满足绝大多数企业客户的业务需求，助力企业以极低成本使用大模型、加速大模型的应用落地。

“豆包模型的超低定价，来源于我们有信心用技术手段优化成本，而不是补贴或是打价格战争夺市场份额。”火山引擎总裁谭待认为，“羊毛出在猪身上”在企业市场行不通，技术驱动的极致性价比才能真正创造价值。火山引擎与字节跳动豆包大模型团队正在密切合作，将持续优化模型效果和推理成本，为企业和开发者提供更好模型、更低成本和更易落地的平台支持。

附：火山引擎官网的模型服务价格文档https://www.volcengine.com/docs/82379/1099320

火山豆包大模型价格清单公布：支持“预付 / 后付”双模式，号称“国内最高并发标准”

字节跳动在 5 月 15 日的“春季火山引擎 FORCE 原动力大会”中推出了豆包大模型（原名“云雀”），该模型主要面向行业场景，能够提供多种图文音频生成能力，IT之家整理如下：豆包通用模型 pro：字节跳动自研 LLM 模型专业版，支持 128k 长文本，全系列可精调，具备更强的理解、生成、逻辑等综合能力，适配问答、总结、创作、分类等丰富场景；豆包通用模型 lite：字节跳动自研 LLM 模型轻量版，对比专业版提供更低 token 成本、更低延迟，为企业提供灵活经济的模型选择；豆包・角色扮演模型：个性化的角色创作

5/21/2024 10:33:05 AM

漾仔

大模型指标：RPM、TPM…这些“神秘代码”到底是什么？

一、RPM：每分钟能“说多少话”？定义：RPM全称是Requests Per Minute（每分钟请求数），表示大模型每分钟能处理的请求次数。比如，某模型设置RPM=300，就意味着每分钟最多响应300次用户提问。

3/13/2025 8:33:37 AM

若有无

豆包大模型日均Tokens使用量破5000亿，模型家族再升级

7月25日，火山引擎2024“AI创新巡展”首站成都站透露了字节豆包大模型的最新进展：截至7月，豆包大模型日均Tokens使用量已突破5000亿，平均每家企业客户日均Tokens使用量较5月15日模型发布时期增长22倍。豆包大模型由字节跳动自研，原名“云雀”，是国内首批通过算法备案的大模型之一，目前通过字节跳动旗下云服务平台火山引擎面向企业提供服务。自发布之初，豆包大模型便主打使用量大、应用场景丰富。据火山引擎副总裁张鑫介绍，在字节内部，有超过50多个业务在使用豆包大模型，覆盖了协同办公、数据分析、文案创作、辅助编

7/25/2024 3:47:00 PM

新闻助手

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！全日程揭晓！ICLR 2025论文分享会我们北京见 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态驾驶文本人形机器人 xAI 搜索大语言模型 Copilot Claude 字节跳动具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

豆包大模型公布价格清单，支持国内最高并发标准

相关资讯

火山豆包大模型价格清单公布：支持“预付 / 后付”双模式，号称“国内最高并发标准”

大模型指标：RPM、TPM…这些“神秘代码”到底是什么？

豆包大模型日均Tokens使用量破5000亿，模型家族再升级