Rastreie custos de token e estimativas de preco por sessao em todos os modos
O Cost Tracking do ChatCLI monitora o consumo de tokens e estima custos em tempo real durante suas sessoes. Você pode acompanhar quanto cada conversa está custando e tomar decisoes informadas sobre uso de modelos e compactacao de historico.
Os custos são estimativas baseadas nos precos publicados dos provedores. O custo real pode variar dependendo de descontos, tiers de uso e cache de prompt aplicado pelo provedor.
Os precos são atualizados periodicamente nas releases do ChatCLI. Para modelos não listados ou provedores custom (via OpenAI-compatible), o custo aparece como “N/A”.
O ChatCLI otimiza custos usando cache de prompt quando o provedor suporta:
Cache Savings: System prompt cached: 38.1K tokens Savings this session: $0.09 (38% reduction) Cache hit rate: 92%
A economia de cache e calculada com base na diferenca entre o preco de input normal e o preco de cache read. Veja Bootstrap e Memoria para detalhes sobre a otimizacao de contexto.