倍率设置

了解 AI Router 的倍率体系如何把模型调用换算为配额消耗，以及如何配置模型倍率、补全倍率与分组倍率。

倍率设置是 AI Router 计费与配额核算体系的核心配置。通过为不同模型和用户组设置倍率，你可以灵活控制各模型的计费权重、组织内部成本分摊与预算控制。

本页中出现的所有倍率数值、价格、配额换算比例及示例金额均为占位示意，并非 AI Router 的正式定价。AI Router 目前为全新演示项目，正式费率与计费规则尚未确定（费率/价格待补，TBD）。请以你部署实例中控制台的实际配置为准。

倍率系统概述

AI Router 采用三层倍率体系来计算用户的配额消耗：

模型倍率（ModelRatio） —— 定义不同 AI 模型的基础计费权重。
补全倍率（CompletionRatio） —— 对输出 token 进行额外的计费调整。
分组倍率（GroupRatio） —— 为不同用户组设置差异化的计费权重。

三者相乘后，决定了一次调用最终扣减多少配额。

配额与倍率的关系

在 AI Router 中，配额是系统内部统一的计费单位，所有 API 调用最终都会折算为配额点数进行扣减。倍率正是把"模型用量"换算成"配额消耗"的关键参数。

配额单位的换算关系（如配额点数与货币金额之间的比例）由部署方在控制台中自行设定。

配额单位与货币金额的换算比例待定（换算比例待补，TBD）。本页示例中如出现"1 货币单位 = N 配额点数"之类的数字，仅用于说明计算流程，不代表实际比例。

配额计算公式

按量计费模型（基于 Token 消耗）

配额消耗 = (输入 token 数 + 输出 token 数 × 补全倍率) × 模型倍率 × 分组倍率

按次计费模型（固定价格）

配额消耗 = 模型固定价格 × 分组倍率 × 配额换算单位

音频 / 多模态模型（特殊处理，由网关内部自动计算）

配额消耗 = (文本输入 token + 文本输出 token × 补全倍率
          + 音频输入 token × 音频倍率
          + 音频输出 token × 音频倍率 × 音频补全倍率)
          × 模型倍率 × 分组倍率

预扣与结算机制

AI Router 采用"预扣 + 结算"的双阶段计费机制：

预扣阶段：API 调用前，根据预估 token 数计算配额消耗并预先冻结。
结算阶段：API 调用完成后，根据实际 token 数重新计算配额消耗。
差额调整：若实际消耗与预扣不一致，系统自动多退少补，调整用户配额余额。

预扣配额 = 预估 token 数 × 模型倍率 × 分组倍率
实际配额 = 实际 token 数 × 模型倍率 × 分组倍率
配额调整 = 实际配额 − 预扣配额

模型倍率设置

模型倍率定义了不同 AI 模型的基础计费权重，用于反映各模型之间的成本差异。倍率越高，单位用量消耗的配额越多。

进入控制台「设置 → 倍率设置 → 模型倍率」，可通过两种方式配置：

JSON 配置：直接编辑模型倍率的 JSON 文本，适合批量维护。
可视化编辑器：通过图形界面逐项设置，适合少量调整。

模型倍率 JSON 的结构示意（数值为占位，价格/倍率待补）：

{
  "<model-a>": 0,
  "<model-b>": 0
}

上方模型名称与倍率均为占位示例。各模型的具体倍率应根据上游渠道的实际成本与你的计费策略确定（模型倍率待补，TBD）。

补全倍率设置

补全倍率用于单独调整输出 token 的计费，主要用来平衡部分模型"输出成本远高于输入成本"的差异。

补全倍率为 1：输出 token 与输入 token 计费相同。
补全倍率 大于 1：输出 token 计费更高。
补全倍率 小于 1：输出 token 计费更低。

补全倍率 JSON 的结构示意（数值为占位，待补）：

{
  "<model-a>": 0,
  "<model-b>": 0
}

具体某个模型的补全倍率应参考其上游公开/授权的输入与输出价格比例来设定（补全倍率待补，TBD）。

分组倍率设置

分组倍率允许为不同用户组设置差异化计费权重，可用于组织内部成本分摊、预算控制或不同等级客户的账务区分。

分组倍率 JSON 的结构示意（数值为占位，待补）：

{
  "<group-default>": 0,
  "<group-internal>": 0
}

倍率优先级

当一次调用涉及多层倍率时，系统按以下优先级确定生效的分组倍率：

用户专属倍率：为特定用户单独设置的倍率。
分组倍率：用户所属分组的倍率。
默认倍率：系统默认值。

最终用户实际倍率 = 模型倍率 × 分组倍率（及补全倍率对输出部分的调整）。

可视化倍率设置

可视化编辑器提供直观的倍率管理界面，通常支持：

批量编辑模型倍率；
实时预览倍率配置；
配置冲突检测与提示；
从已授权上游一键同步价格/模型元数据。

（界面截图待补，TBD）

未配置倍率的模型

对于尚未配置倍率的模型，系统行为取决于计费模式：

自用模式：使用一个统一的默认倍率（默认倍率数值待补，TBD）。
计费模式：拒绝调用并提示"倍率或价格未配置"错误，避免误计费。
自动检测：在管理界面中标出未配置倍率的模型，便于补全。

上游倍率同步

AI Router 支持从已授权的上游渠道同步倍率/价格元数据：

仅同步上游公开或已授权可用的价格、模型元数据；
批量更新本地倍率配置；
保持与上游价格的一致性；
支持在同步后手动调整与覆盖。

请确保仅同步你有权使用的上游价格数据，并对同步结果二次确认，避免将不适用的倍率直接应用到计费环境。

配额计算示例

以下示例仅用于演示计算流程，其中的 token 数、倍率、配额点数与换算比例全部为占位数值，不代表 AI Router 的真实定价（价格/费率待补，TBD）。

示例一：按量计费

设输入 token = I，输出 token = O，模型倍率 = M，补全倍率 = C，分组倍率 = G：

配额消耗 = (I + O × C) × M × G

将实际数值代入即可得到本次调用扣减的配额点数；再按部署方设定的换算比例即可折算为货币金额。

示例二：按次计费

设模型固定价格 = P，分组倍率 = G，配额换算单位 = U：

配额消耗 = P × G × U

常见问题

如对计费/倍率规则有疑问或建议，欢迎在源码仓库提交 Issue 反馈：https://github.com/ssgzy/Router-new-api。

OpenAI 兼容调用的接入地址示例：https://ai.sammier.com/v1。

如何为新模型设置倍率？

分组倍率如何生效？

补全倍率的作用是什么？

如何批量设置相似模型的倍率？

目录