Recuperacao de Context Overflow
Quando a API retorna um erro de “context too long”, o ChatCLI aplica ate 3 niveis de recuperacao antes de desistir:- Nivel 1: Orcamento Agressivo
- Nivel 2: Truncamento de Emergencia
- Nivel 3: Truncamento Nuclear
Primeira tentativa: reduz os limites de orcamento pela metade e limpa desalinhamentos.Acoes:
- Repara pareamento de tool results (remove orfaos, injeta sinteticos)
- Reduz
DefaultTurnBudgetCharseDefaultPerResultMaxCharspara 50% dos valores originais - Aplica enforcement de orcamento com limites reduzidos
- Trunca mensagens longas do assistente para 5.000 chars
Os limites originais sao restaurados apos a aplicacao. Apenas o historico atual e afetado pela reducao.
Deteccao de Erro
O sistema reconhece multiplas formas de erro de overflow:| Mensagem de Erro | Provedor |
|---|---|
context length exceeded | Anthropic |
prompt is too long | OpenAI |
request too large | Varios |
max_tokens exceed | Varios |
input too long | |
token limit | Generico |
Escalacao de Max Output Tokens
Quando o modelo para de gerar por atingir o limite demax_tokens, o ChatCLI pode escalar automaticamente:
| Tentativa | Acao |
|---|---|
| 1a | Dobra o max_tokens atual (ate o cap do provedor) |
| 2a | Dobra novamente (ate o cap do provedor) |
| 3a+ | Para de escalar, retorna conteudo parcial |
Mensagem de Continuacao
Quando o modelo e interrompido por limite de tokens, o ChatCLI injeta uma mensagem de continuacao:Configuracao
| Variavel de Ambiente | Descricao | Default |
|---|---|---|
CHATCLI_MAX_RECOVERY_ATTEMPTS | Tentativas maximas de recuperacao de contexto | 3 |
CHATCLI_MAX_TOKEN_ESCALATIONS | Escalacoes maximas de max_tokens | 2 |
CHATCLI_EMERGENCY_KEEP_MESSAGES | Mensagens mantidas no truncamento de emergencia | 10 |
Ratio de Orcamento Agressivo
No nivel 1, os limites de orcamento de tool results sao multiplicados por0.5 (50%). Isso significa:
| Parametro | Normal | Nivel 1 Recuperacao |
|---|---|---|
| Budget por turno | 200.000 chars | 100.000 chars |
| Max por resultado | 20.000 chars | 10.000 chars |
Fluxo de Recuperacao
Interacao com Outros Sistemas
A recuperacao de contexto trabalha em conjunto com:Tool Result Budget
O orcamento de resultados e a primeira linha de defesa. A recuperacao ativa quando o orcamento nao foi suficiente.
Microcompactacao
A compactacao progressiva reduz o crescimento do contexto ao longo do tempo.
Controle de Conversa
O comando
/compact e a forma proativa de prevenir overflow.Cost Tracking
Monitore o uso de contexto para antecipar quando /compact sera necessario.