TOKI
指南

速率限制

了解 TOKI 的速率限制策略以及如何处理。

概述

TOKI 会根据账号、API Key、模型、套餐和系统负载实施请求限制,以保障服务稳定性。具体限制可能会随套餐、模型或运营策略变化,请以控制台和服务端返回为准。

如何确认限制

建议通过以下方式确认当前可用能力:

  • 查看商品中心或套餐说明中的限制规则。
  • 查看 API Key 是否设置了额度上限或有效期。
  • 在调用失败时读取错误响应中的 error.message
  • 如需更高并发或企业级额度,联系 TOKI 商务或运营支持。

处理限制响应

当请求过于频繁或额度不足时,API 可能返回错误响应。常见情况包括:

{
  "error": {
    "code": "rate_limit_exceeded",
    "message": "您已超出速率限制,请在 30 秒后重试。"
  }
}

是否返回速率限制响应头、响应头名称以及错误码细节,以当前服务端实现为准。客户端应优先根据 HTTP 状态码和错误体进行处理。

推荐的重试策略

实现带抖动的指数退避:

async function requestWithRetry(fn: () => Promise<Response>, maxRetries = 3) {
  for (let i = 0; i < maxRetries; i++) {
    const response = await fn();

    if (response.status !== 429) return response;

    const baseDelay = Math.pow(2, i) * 1000;
    const jitter = Math.random() * 1000;
    await new Promise((r) => setTimeout(r, baseDelay + jitter));
  }

  throw new Error('超出最大重试次数');
}

需要更高限额时,请联系 TOKI 商务或运营支持。

On this page