倍率设置
了解 Code Router 的倍率体系如何把模型调用换算为配额消耗,以及如何配置模型倍率、补全倍率与分组倍率。
倍率设置是 Code Router 计费与配额核算体系的核心配置。通过为不同模型和用户组设置倍率,你可以灵活控制各模型的计费权重、组织内部成本分摊与预算控制。
本页中出现的所有倍率数值、价格、配额换算比例及示例金额均为占位示意,并非 Code Router 的正式定价。Code Router 目前为全新演示项目,正式费率与计费规则尚未确定(费率/价格待补,TBD)。请以你部署实例中控制台的实际配置为准。
倍率系统概述
Code Router 采用三层倍率体系来计算用户的配额消耗:
- 模型倍率(ModelRatio) —— 定义不同 AI 模型的基础计费权重。
- 补全倍率(CompletionRatio) —— 对输出 token 进行额外的计费调整。
- 分组倍率(GroupRatio) —— 为不同用户组设置差异化的计费权重。
三者相乘后,决定了一次调用最终扣减多少配额。
配额与倍率的关系
在 Code Router 中,配额是系统内部统一的计费单位,所有 API 调用最终都会折算为配额点数进行扣减。倍率正是把"模型用量"换算成"配额消耗"的关键参数。
配额单位的换算关系(如配额点数与货币金额之间的比例)由部署方在控制台中自行设定。
配额单位与货币金额的换算比例待定(换算比例待补,TBD)。本页示例中如出现"1 货币单位 = N 配额点数"之类的数字,仅用于说明计算流程,不代表实际比例。
配额计算公式
按量计费模型(基于 Token 消耗)
配额消耗 = (输入 token 数 + 输出 token 数 × 补全倍率) × 模型倍率 × 分组倍率按次计费模型(固定价格)
配额消耗 = 模型固定价格 × 分组倍率 × 配额换算单位音频 / 多模态模型(特殊处理,由网关内部自动计算)
配额消耗 = (文本输入 token + 文本输出 token × 补全倍率
+ 音频输入 token × 音频倍率
+ 音频输出 token × 音频倍率 × 音频补全倍率)
× 模型倍率 × 分组倍率预扣与结算机制
Code Router 采用"预扣 + 结算"的双阶段计费机制:
- 预扣阶段:API 调用前,根据预估 token 数计算配额消耗并预先冻结。
- 结算阶段:API 调用完成后,根据实际 token 数重新计算配额消耗。
- 差额调整:若实际消耗与预扣不一致,系统自动多退少补,调整用户配额余额。
预扣配额 = 预估 token 数 × 模型倍率 × 分组倍率
实际配额 = 实际 token 数 × 模型倍率 × 分组倍率
配额调整 = 实际配额 − 预扣配额模型倍率设置
模型倍率定义了不同 AI 模型的基础计费权重,用于反映各模型之间的成本差异。倍率越高,单位用量消耗的配额越多。
进入控制台「设置 → 倍率设置 → 模型倍率」,可通过两种方式配置:
- JSON 配置:直接编辑模型倍率的 JSON 文本,适合批量维护。
- 可视化编辑器:通过图形界面逐项设置,适合少量调整。
模型倍率 JSON 的结构示意(数值为占位,价格/倍率待补):
{
"<model-a>": 0,
"<model-b>": 0
}上方模型名称与倍率均为占位示例。各模型的具体倍率应根据上游渠道的实际成本与你的计费策略确定(模型倍率待补,TBD)。
补全倍率设置
补全倍率用于单独调整输出 token 的计费,主要用来平衡部分模型"输出成本远高于输入成本"的差异。
- 补全倍率为 1:输出 token 与输入 token 计费相同。
- 补全倍率 大于 1:输出 token 计费更高。
- 补全倍率 小于 1:输出 token 计费更低。
补全倍率 JSON 的结构示意(数值为占位,待补):
{
"<model-a>": 0,
"<model-b>": 0
}具体某个模型的补全倍率应参考其上游公开/授权的输入与输出价格比例来设定(补全倍率待补,TBD)。
分组倍率设置
分组倍率允许为不同用户组设置差异化计费权重,可用于组织内部成本分摊、预算控制或不同等级客户的账务区分。
分组倍率 JSON 的结构示意(数值为占位,待补):
{
"<group-default>": 0,
"<group-internal>": 0
}倍率优先级
当一次调用涉及多层倍率时,系统按以下优先级确定生效的分组倍率:
- 用户专属倍率:为特定用户单独设置的倍率。
- 分组倍率:用户所属分组的倍率。
- 默认倍率:系统默认值。
最终用户实际倍率 = 模型倍率 × 分组倍率(及补全倍率对输出部分的调整)。
可视化倍率设置
可视化编辑器提供直观的倍率管理界面,通常支持:
- 批量编辑模型倍率;
- 实时预览倍率配置;
- 配置冲突检测与提示;
- 从已授权上游一键同步价格/模型元数据。
(界面截图待补,TBD)
未配置倍率的模型
对于尚未配置倍率的模型,系统行为取决于计费模式:
- 自用模式:使用一个统一的默认倍率(默认倍率数值待补,TBD)。
- 计费模式:拒绝调用并提示"倍率或价格未配置"错误,避免误计费。
- 自动检测:在管理界面中标出未配置倍率的模型,便于补全。
上游倍率同步
Code Router 支持从已授权的上游渠道同步倍率/价格元数据:
- 仅同步上游公开或已授权可用的价格、模型元数据;
- 批量更新本地倍率配置;
- 保持与上游价格的一致性;
- 支持在同步后手动调整与覆盖。
请确保仅同步你有权使用的上游价格数据,并对同步结果二次确认,避免将不适用的倍率直接应用到计费环境。
配额计算示例
以下示例仅用于演示计算流程,其中的 token 数、倍率、配额点数与换算比例全部为占位数值,不代表 Code Router 的真实定价(价格/费率待补,TBD)。
示例一:按量计费
设输入 token = I,输出 token = O,模型倍率 = M,补全倍率 = C,分组倍率 = G:
配额消耗 = (I + O × C) × M × G将实际数值代入即可得到本次调用扣减的配额点数;再按部署方设定的换算比例即可折算为货币金额。
示例二:按次计费
设模型固定价格 = P,分组倍率 = G,配额换算单位 = U:
配额消耗 = P × G × U常见问题
如对计费/倍率规则有疑问或建议,欢迎在源码仓库提交 Issue 反馈:https://github.com/ssgzy/Router-new-api。
OpenAI 兼容调用的接入地址示例:https://ai.sammier.com/v1。
这篇文档对您有帮助吗?
最后更新于