教程 搜索 / 原生 Mac IDE / 查看用量与速率限制
📝 文字 ● 初级 更新于 2026-05-13

查看用量与速率限制

用量仪表盘是"我是否快要触碰限制"这一问题的答案。Token 使用量、速率限制余量、距离重置还有多久——一个面板,涵盖所有已配置的 Provider,数据来自三个不同来源,力求尽可能准确。

在任务进行到一半时触碰速率限制,是一种格外糟糕的失败方式。Agent 本来运行良好,还有三轮就能完成;结果它突然停下,返回一个 429,你就只能等上一个小时。代价不仅是这次失败本身,更是状态的丢失——你已经为启动这个任务付出了认知成本,现在却不得不要么等待,要么换一个 Provider 重新开始。无论哪种方式,进行中的工作都会就此中断。

避免这种情况的方法,是在限制成为问题之前就了解自己的余量。大多数 Provider 会在每次请求的响应头中公布当前状态——"本小时内还剩 N 个 Token,在 T 时间重置。"LingCode 会读取这些信息并展示出来。仪表盘并不试图做任何复杂的预测,它只是把 Provider 已经告诉你的内容,汇总在一处,覆盖你正在使用的每一个 Provider。

让仪表盘稍微复杂一点的地方在于,各 Provider 公布的数据并不完全一致,即便公布了,这些数字也来自三个不同的来源,各有不同的时效性。本教程主要讲的是如何正确解读仪表盘:哪个数字更可信、它何时会更新,以及当它告诉你快到上限时该怎么办。

你将学到什么

第 1 步:打开仪表盘

1

从状态栏进入

在 LingCode 窗口底部,状态栏会显示一个简洁的摘要——当前 Provider、本次会话已用 Token 数,以及占每日配额的百分比。点击状态栏即可展开完整的仪表盘面板。

仪表盘列出了你配置的所有 Provider(无论今天是否使用过),每个 Provider 都显示:今日已用 Token、本次会话已用 Token、当前速率限制余量,以及"还有 N 时间重置"——即下一个配额窗口开放前的剩余时间。

第 2 步:读懂三个数据来源

2

每个数字背后的来源,按优先级排列

LingCode 从三个来源收集速率限制状态,按权威性由高到低排列:

  1. Provider 速率限制事件。部分 Provider(尤其是通过 SDK 接入的 Anthropic)会在你的剩余配额发生变化时实时推送事件。当这些事件正在流入时,仪表盘基本上是实时的——你看到的数字,就是此刻向 Provider 查询会得到的结果。
  2. HTTP 响应头。每次流式 Agent 调用都会捕获 Provider 的 x-ratelimit-*(OpenAI 格式)或 anthropic-ratelimit-*(Anthropic 格式)响应头。每次请求后更新,以最后一次调用为准。
  3. 本地启发式估算。如果以上两者都不可用——比如你今天只使用过某个 Provider 一次——LingCode 会退回到本地计数,以午夜重置为锚点。这只是粗略估算,目的是让仪表盘不显示空白,而非精确数值。

你不需要手动选择数据来源;仪表盘会自动合并并显示最优可用数据。但了解某个数字来自哪个来源,有助于你正确解读它。来自本地启发式估算的数字只是大概;来自 SDK 事件流的数字才是真实情况。

如果你新添加了一个 Provider:第一次请求会填充 HTTP 响应头来源。在此之前,仪表盘显示的是本地启发式估算——大致相当于"看起来很充裕"。如果一个全新的 Provider 显示余量充足,不必担心;第一次调用后,数字就会更新为真实值。

第 3 步:"还有 N 时间重置"倒计时的特性

3

它不会自动走动

"还有 N 时间重置"计时器显示当前速率限制窗口还有多久结束。重要提示:它不会自动走动。这个数字是在面板渲染时计算的。如果你打开仪表盘看到"还有 3h 12m 重置",那是打开那一刻的时间。把面板一直开着,三小时后它依然会显示"3h 12m"。

要获取最新数字,关闭并重新打开仪表盘,或发起任何请求(这会触发刷新)。这是一个有意为之的设计选择——该面板不是时钟,而是快照。

第 4 步:该在意什么样的余量百分比

4

各 Provider 的经验法则

真正重要的问题不是"我是否超过了 80%",而是"我接下来要做的事情,余量够用吗"。大多数 Agent 任务消耗的 Token 在 5K 到 50K 之间。因此:

  • 余量 50% 以上——对任何单个任务都绰绰有余。
  • 余量 20%–50%——短轮次没问题;长 Agent 循环有风险。超过几轮的任务,建议考虑切换 Provider。
  • 余量低于 20%——只启动你做好放弃准备的任务。更明智的做法是切换 Provider,或者停下来等待窗口重置。

这些不是硬性规则——你的任务可能比平均情况长或短。但它们是实用的默认参考。

第 5 步:快到限制时该怎么办

5

三个好选项,一个坏选项

如果仪表盘显示你快到限制,而你还有工作要做:

  • 切换 Provider——通常是最佳选择。参见在对话中切换 Provider。可以将上下文带到一个全新的配额中继续。
  • 在同一 Provider 上切换模型——同一 Provider 的低层级模型通常有独立的配额。如果你有包含 Opus 和 Sonnet 配额的付费层级,这个方法很有用。
  • 等待重置——如果"还有 N 时间"很短(分钟级别,而非小时级别),而且任务不紧急,直接等待即可。这是成本(金钱和认知)最低的方案。
  • 坏选项:一直做到触碰限制。429 会在工具调用中途到来,往往让 Agent 处于半完成状态。不要这样做。
仪表盘统计的是 Provider 侧的用量,而非单个应用的用量。如果你在其他工具中使用了同一个 Provider(CLI、网站的 /try 试用页,或其他 IDE),那些调用同样计入同一配额。仪表盘无法显示其他工具的使用情况——只显示 LingCode 的用量。如果余量莫名其妙地低于预期,检查一下是否有其他工具在调用同一个 API 密钥。

接下来