最近更新时间:2024.05.17 12:59:00
首次发布时间:2023.06.27 23:50:07
您可以在 开通管理 页中查看各模型定价与使用限制,开通后使用各模型服务,不同模型的单价不同。其中,大语言模型费用计算方式如下:
费用 = tokens使用量 ✖️ 模型tokens单价
按tokens使用量(输入文本+输出文本)计费,每小时出账,按量后付费。
模型提供方 | 模型 | 上下文长度 | 服务类型 | 定价(单位:元/千tokens) | 计费方式 | 免费额度 |
---|---|---|---|---|---|---|
智谱AI | GLM3-130B | 8K | 推理服务 | 免费限量测试 | ||
GLM3-130B金融模型 | 8K | 推理服务 | 免费限量测试 | |||
月之暗面 | Moonshot-v1-8K | 8K | 推理服务 | 0.012 | 后付费 | 50万tokens |
Moonshot-v1-32K | 32K | 推理服务 | 0.024 | 后付费 | 50万tokens | |
Moonshot-v1-128K | 128K | 推理服务 | 0.06 | 后付费 | 50万tokens | |
字节跳动 | Doubao-lite-4k (包括分支版本lite-character) | 4K | 推理服务(输入) | 0.0003 | 后付费 | 50万tokens |
推理服务(输出) | 0.0006 | 后付费 | ||||
Doubao-lite-32k | 32K | 推理服务(输入) | 0.0003 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0006 | 后付费 | ||||
Doubao-lite-128k | 128K | 推理服务(输入) | 0.0008 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0010 | 后付费 | ||||
Doubao-pro-4k (包括分支版本pro-character、pro-functioncall) | 4K | 推理服务(输入) | 0.0008 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0020 | 后付费 | ||||
Doubao-pro-32k | 32K | 推理服务(输入) | 0.0008 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0020 | 后付费 | ||||
Doubao-pro-128k | 128K | 推理服务(输入) | 0.0050 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0090 | 后付费 | ||||
Meta | Llama3-8B(开源) | 8K | 推理服务 | 免费限量测试 | ||
Llama3-70B(开源) | 8K | 推理服务 | 免费限量测试 | |||
Mistral AI | Mistral-7B(开源) | 32K | 推理服务 | 免费限量测试 | ||
百川智能 | baichuan-7B(开源) | 4K | 推理服务 | 免费限量测试 | ||
Databricks | Dolly-V2-12B(开源) | 2K | 推理服务 | 免费限量测试 |
模型单元是调用某个特定模型的 TPM(Tokens Per Minute,每分钟tokens数量)配额。创建推理接入点选择按模型单元付费后,用户可以获得比按 Tokens 付费更大的并发量,且无需再为 Tokens 消耗付费。模型单元付费方式为预付费,详细使用说明请见查看并管理模型接入点
模型提供方 | 模型 | 计费项 | 支持TPM | 定价(单位:元/个) | 计费方式 |
---|---|---|---|---|---|
字节跳动 | Doubao-lite-4k | 模型单元(包天) | 10K | 50 | 预付费 |
模型单元(包月) | 10K | 1200 | 预付费 | ||
Doubao-lite-32k | 模型单元(包天) | 10K | 100 | 预付费 | |
模型单元(包月) | 10K | 2400 | 预付费 | ||
Doubao-lite-128k | 模型单元(包天) | 10K | 200 | 预付费 | |
模型单元(包月) | 10K | 4800 | 预付费 | ||
Doubao-pro-4k | 模型单元(包天) | 10K | 250 | 预付费 | |
模型单元(包月) | 10K | 6000 | 预付费 | ||
Doubao-pro-32k | 模型单元(包天) | 10K | 500 | 预付费 | |
模型单元(包月) | 10K | 12000 | 预付费 | ||
Doubao-pro-128k | 模型单元(包天) | 10K | 1000 | 预付费 | |
模型单元(包月) | 10K | 24000 | 预付费 |
Stable-Diffusion和Stable-Diffusion-XL模型卡片暂未完全公开,如需申请使用,请提交工单联系我们
模型提供方 | 模型 | 计费项 | 支持并发 | 定价(单位:元/个) | 计费方式 |
---|---|---|---|---|---|
RunwayML | Stable-Diffusion-1.5 | 模型单元(包天) | 详见控制台 | 175 | 预付费 |
模型单元(包月) | 详见控制台 | 4200 | 预付费 | ||
Stability AI | Stable-Diffusion-XL | 模型单元(包天) | 详见控制台 | 175 | 预付费 |
模型单元(包月) | 详见控制台 | 4200 | 预付费 |
语音合成和声音复刻模型卡片暂未完全公开,如需申请使用,请提交工单联系我们
模型提供方 | 模型 | 服务类型 | 定价(单位:元/万字符) | 计费方式 | 免费额度 |
---|---|---|---|---|---|
字节跳动 | 语音合成大模型 | 推理服务 | 5 | 后付费 | 5000 字符 |
声音复刻大模型 | 推理服务 | 8 | 后付费 | 5000 字符 |
模型提供方 | 模型 | 最长输入长度 | 服务类型 | 定价(单位:元/千tokens) | 计费方式 | 免费额度 |
---|---|---|---|---|---|---|
字节跳动 | Doubao-embedding | 4K | 推理服务(输入) | 0.0005 | 后付费 | 50万tokens |
按tokens使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费
模型提供方 | 模型 | 服务类型 | 定价(单位:元/千tokens) | 计费方式 |
---|---|---|---|---|
字节跳动 | Doubao-lite-4k | 模型精调(LoRA) | 0.03 | 后付费 |
Doubao-lite-32k | 模型精调(LoRA) | 0.03 | 后付费 | |
Doubao-lite-128k | 模型精调(LoRA) | 0.03 | 后付费 | |
Doubao-pro-4k | 模型精调(LoRA) | 0.05 | 后付费 | |
Doubao-pro-32k | 模型精调(LoRA) | 0.05 | 后付费 | |
Doubao-pro-128k | 模型精调(LoRA) | 0.05 | 后付费 |
当前对每个模型设置了RPM(Requests Per Minute,每分钟请求数)及TPM(Tokens Per Minute,每分钟tokens数量)的调用限制,每个账号(含主账号下的所有子账号,合并计算)的具体限制可在 开通管理 页中查看。
如需提升,可提交工单联系我们
每个账号会有最多可同时创建运行中的精调任务数的限制,具体限制请见控制台报错提示,若到达上限的,请耐心等待精调任务完成并释放额度后重试,或在 配额中心 中提交申请更多额度。
点击方舟平台右上角 费用 可查看账户总览和账单详情
账户余额不足或账户余额小于0被扣为负值即为欠费。
账号欠费后2小时内补缴所有欠费账单的,可正常使用火山方舟模型服务。欠费后2小时仍未能补缴所有欠费账单的,将关停账号下所有火山方舟相关模型服务。