用量仪表盘是"我是否快要触碰限制"这一问题的答案。Token 使用量、速率限制余量、距离重置还有多久——一个面板,涵盖所有已配置的 Provider,数据来自三个不同来源,力求尽可能准确。
在任务进行到一半时触碰速率限制,是一种格外糟糕的失败方式。Agent 本来运行良好,还有三轮就能完成;结果它突然停下,返回一个 429,你就只能等上一个小时。代价不仅是这次失败本身,更是状态的丢失——你已经为启动这个任务付出了认知成本,现在却不得不要么等待,要么换一个 Provider 重新开始。无论哪种方式,进行中的工作都会就此中断。
避免这种情况的方法,是在限制成为问题之前就了解自己的余量。大多数 Provider 会在每次请求的响应头中公布当前状态——"本小时内还剩 N 个 Token,在 T 时间重置。"LingCode 会读取这些信息并展示出来。仪表盘并不试图做任何复杂的预测,它只是把 Provider 已经告诉你的内容,汇总在一处,覆盖你正在使用的每一个 Provider。
让仪表盘稍微复杂一点的地方在于,各 Provider 公布的数据并不完全一致,即便公布了,这些数字也来自三个不同的来源,各有不同的时效性。本教程主要讲的是如何正确解读仪表盘:哪个数字更可信、它何时会更新,以及当它告诉你快到上限时该怎么办。
在 LingCode 窗口底部,状态栏会显示一个简洁的摘要——当前 Provider、本次会话已用 Token 数,以及占每日配额的百分比。点击状态栏即可展开完整的仪表盘面板。
仪表盘列出了你配置的所有 Provider(无论今天是否使用过),每个 Provider 都显示:今日已用 Token、本次会话已用 Token、当前速率限制余量,以及"还有 N 时间重置"——即下一个配额窗口开放前的剩余时间。
LingCode 从三个来源收集速率限制状态,按权威性由高到低排列:
x-ratelimit-*(OpenAI 格式)或 anthropic-ratelimit-*(Anthropic 格式)响应头。每次请求后更新,以最后一次调用为准。你不需要手动选择数据来源;仪表盘会自动合并并显示最优可用数据。但了解某个数字来自哪个来源,有助于你正确解读它。来自本地启发式估算的数字只是大概;来自 SDK 事件流的数字才是真实情况。
"还有 N 时间重置"计时器显示当前速率限制窗口还有多久结束。重要提示:它不会自动走动。这个数字是在面板渲染时计算的。如果你打开仪表盘看到"还有 3h 12m 重置",那是打开那一刻的时间。把面板一直开着,三小时后它依然会显示"3h 12m"。
要获取最新数字,关闭并重新打开仪表盘,或发起任何请求(这会触发刷新)。这是一个有意为之的设计选择——该面板不是时钟,而是快照。
真正重要的问题不是"我是否超过了 80%",而是"我接下来要做的事情,余量够用吗"。大多数 Agent 任务消耗的 Token 在 5K 到 50K 之间。因此:
这些不是硬性规则——你的任务可能比平均情况长或短。但它们是实用的默认参考。
如果仪表盘显示你快到限制,而你还有工作要做: