/ratelimit (alias /limits) mostra o estado atual dos limites de taxa do seu provider de LLM, sem fazer nenhuma chamada extra: o ChatCLI lê os headers x-ratelimit-* que o provider já devolve em cada resposta e mantém um snapshot por provider.
A captura é passiva e central: um observer no caminho de autenticação intercepta as respostas HTTP de todos os provedores que enviam a família de headers
x-ratelimit-* (OpenAI, OpenRouter, endpoints Anthropic-compatíveis, etc.). Nenhuma variável de ambiente é necessária.Uso
O que é mostrado
Para cada provider que reportou limites, o ChatCLI mostra até dois buckets:| Bucket | Campos |
|---|---|
requests | restantes / limite, % usado, reseta em N s |
tokens | restantes / limite, % usado, reseta em N s |
Veja também
- Fallback de Provedores — troca automática quando um provider falha/satura
- Custo da Sessão —
/cost - Referência de Comandos