You need to enable JavaScript to run this app.
导航

模型服务计费

最近更新时间2024.05.17 12:59:00

首次发布时间2023.06.27 23:50:07

计费概述

您可以在 开通管理 页中查看各模型定价与使用限制,开通后使用各模型服务,不同模型的单价不同。其中,大语言模型费用计算方式如下:

费用 = tokens使用量 ✖️ 模型tokens单价

  • Tokens定义说明: 通常1个中文词语、英文单词、数字、符号计为 1 个token,由于不同模型采用的分词器不同,同一段文本可能会分为不同的tokens数量。您可通过管控台中的 在线体验工具 了解tokens定义
    • 在线体验工具入口:开通管理 页面中 定价 标题的提示文案
      • alt
产品价格

模型推理

大语言模型:

后付费(按tokens使用量付费)

按tokens使用量(输入文本+输出文本)计费,每小时出账,按量后付费。

模型提供方模型上下文长度服务类型定价(单位:元/千tokens)计费方式免费额度
智谱AIGLM3-130B8K推理服务免费限量测试
GLM3-130B金融模型8K推理服务免费限量测试
月之暗面Moonshot-v1-8K8K推理服务0.012后付费50万tokens
Moonshot-v1-32K32K推理服务0.024后付费50万tokens
Moonshot-v1-128K128K推理服务0.06后付费50万tokens
字节跳动Doubao-lite-4k
(包括分支版本lite-character)
4K推理服务(输入)0.0003后付费50万tokens
推理服务(输出)0.0006后付费
Doubao-lite-32k32K推理服务(输入)0.0003后付费50万tokens
推理服务(输出)0.0006后付费
Doubao-lite-128k128K推理服务(输入)0.0008后付费50万tokens
推理服务(输出)0.0010后付费
Doubao-pro-4k
(包括分支版本pro-character、pro-functioncall)
4K推理服务(输入)0.0008后付费50万tokens
推理服务(输出)0.0020后付费
Doubao-pro-32k32K推理服务(输入)0.0008后付费50万tokens
推理服务(输出)0.0020后付费
Doubao-pro-128k128K推理服务(输入)0.0050后付费50万tokens
推理服务(输出)0.0090后付费
MetaLlama3-8B(开源)8K推理服务免费限量测试
Llama3-70B(开源)8K推理服务免费限量测试
Mistral AIMistral-7B(开源)32K推理服务免费限量测试
百川智能baichuan-7B(开源)4K推理服务免费限量测试
DatabricksDolly-V2-12B(开源)2K推理服务免费限量测试

预付费(模型单元)

模型单元是调用某个特定模型的 TPM(Tokens Per Minute,每分钟tokens数量)配额。创建推理接入点选择按模型单元付费后,用户可以获得比按 Tokens 付费更大的并发量,且无需再为 Tokens 消耗付费。模型单元付费方式为预付费,详细使用说明请见查看并管理模型接入点

模型提供方模型计费项支持TPM定价(单位:元/个)计费方式
字节跳动Doubao-lite-4k模型单元(包天)10K50预付费
模型单元(包月)10K1200预付费
Doubao-lite-32k模型单元(包天)10K100预付费
模型单元(包月)10K2400预付费
Doubao-lite-128k模型单元(包天)10K200预付费
模型单元(包月)10K4800预付费
Doubao-pro-4k模型单元(包天)10K250预付费
模型单元(包月)10K6000预付费
Doubao-pro-32k模型单元(包天)10K500预付费
模型单元(包月)10K12000预付费
Doubao-pro-128k模型单元(包天)10K1000预付费
模型单元(包月)10K24000预付费

视觉大模型:

Stable-DiffusionStable-Diffusion-XL模型卡片暂未完全公开,如需申请使用,请提交工单联系我们

模型提供方模型计费项支持并发定价(单位:元/个)计费方式
RunwayMLStable-Diffusion-1.5模型单元(包天)详见控制台175预付费
模型单元(包月)详见控制台4200预付费
Stability AIStable-Diffusion-XL模型单元(包天)详见控制台175预付费
模型单元(包月)详见控制台4200预付费

语音大模型:

语音合成声音复刻模型卡片暂未完全公开,如需申请使用,请提交工单联系我们

模型提供方模型服务类型定价(单位:元/万字符)计费方式免费额度
字节跳动语音合成大模型推理服务5后付费5000 字符
声音复刻大模型推理服务8后付费5000 字符

向量模型:

模型提供方模型最长输入长度服务类型定价(单位:元/千tokens)计费方式免费额度
字节跳动Doubao-embedding4K推理服务(输入)0.0005后付费50万tokens

模型精调

大语言模型:

按tokens使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费

模型提供方模型服务类型定价(单位:元/千tokens)计费方式
字节跳动Doubao-lite-4k模型精调(LoRA)0.03后付费
Doubao-lite-32k模型精调(LoRA)0.03后付费
Doubao-lite-128k模型精调(LoRA)0.03后付费
Doubao-pro-4k模型精调(LoRA)0.05后付费
Doubao-pro-32k模型精调(LoRA)0.05后付费
Doubao-pro-128k模型精调(LoRA)0.05后付费

使用限制

模型推理限制

当前对每个模型设置了RPM(Requests Per Minute,每分钟请求数)及TPM(Tokens Per Minute,每分钟tokens数量)的调用限制,每个账号(含主账号下的所有子账号,合并计算)的具体限制可在 开通管理 页中查看。

如需提升,可提交工单联系我们

模型精调限制

每个账号会有最多可同时创建运行中的精调任务数的限制,具体限制请见控制台报错提示,若到达上限的,请耐心等待精调任务完成并释放额度后重试,或在 配额中心 中提交申请更多额度。

账单查询

点击方舟平台右上角 费用 可查看账户总览和账单详情

服务关停
  • 账户余额不足或账户余额小于0被扣为负值即为欠费。

  • 账号欠费后2小时内补缴所有欠费账单的,可正常使用火山方舟模型服务。欠费后2小时仍未能补缴所有欠费账单的,将关停账号下所有火山方舟相关模型服务。