Pular para o conteúdo principal
O ChatCLI implementa sete padrões de agente LLM trabalhando em conjunto como um pipeline de qualidade que envolve o dispatcher ReAct existente. Cada padrão tem propósito específico, pode ser ligado/desligado por sessão ou /config, e compõe com os demais sem regressão de performance no caminho padrão.
Premissa de design: opt-in por padrão. Com CHATCLI_QUALITY_* sem configuração, o pipeline roda com zero post-hooks — Pipeline.Run degenera em uma chamada direta a agent.Execute. Você só paga pelos padrões que ativar.

Os sete padrões

#1 — ReAct

Reason → Act → Observe. O loop base que todo worker executa. Já estava presente; agora emite eventos estruturados e auto-atacha effort hints.

#2 — Plan-and-Solve / ReWOO

PlannerAgent emite JSON estruturado; PlanRunner executa passos em ordem topológica com placeholders #E1.head=200.

#3 — Reflexion

Detecta erro, alucinação ou qualidade baixa; destila uma Lesson via LLM e persiste em memory.Fact para retrieval futuro via RAG.

#4 — RAG + HyDE

Hypothesis-based keyword expansion (3a) + busca por cosseno em vetores (3b — Voyage/OpenAI, backend pure-Go).

#5 — Self-Refine

RefinerAgent crítica o rascunho e reescreve. Multi-pass com convergência por EpsilonChars.

#6 — Chain-of-Verification

VerifierAgent gera perguntas de verificação independentes, responde cada uma e reescreve se houver discrepância.

#7 — Reasoning Backbone

Abstração cross-provider: thinking_budget na Anthropic, reasoning_effort na OpenAI. Auto-attach para agents críticos.

Configuração

Env vars CHATCLI_QUALITY_*, /config quality, e os cinco slash commands: /thinking, /plan, /refine, /verify, /reflect.

Como os padrões se conectam

                 ┌──────────────────────────────────────┐
                 │   /agent ou /coder <tarefa>          │
                 └──────────────────┬───────────────────┘

  (#4 RAG+HyDE) ────────────────────▼───────────────
  memory.Retriever expande hints com a hipótese gerada
  pelo LLM (HyDE-3a) e opcionalmente busca no vector
  store (HyDE-3b) antes de montar o system prompt.

  (#2 Plan-and-Solve) ──────────────▼───────────────
  Quando disparado (auto-score ou /plan), o planner
  emite um plano JSON, o PlanRunner executa cada
  passo resolvendo placeholders #E1, e o relatório
  determinístico é injetado na history.

                    ┌───────────────▼───────────────┐
                    │   Loop ReAct (workers)        │
                    │   (#1, sempre ativo)          │
                    └───────────────┬───────────────┘

                    ┌───────────────▼───────────────┐
                    │   QualityPipeline (por call)  │
                    │   - Pre:  applyAutoReasoning  │ (#7)
                    │   - Execute worker            │
                    │   - Post: RefineHook          │ (#5)
                    │   - Post: VerifyHook          │ (#6)
                    │   - Post: ReflexionHook       │ (#3)
                    └───────────────┬───────────────┘

  Lições geradas pela Reflexion são persistidas em
  memory.Fact e ressurgem via #4 em tarefas similares
  futuras — fechando o loop sem retreinamento.
Princípio arquitetural: todos os padrões novos se ligam ao dispatcher ou ao context builder — o loop ReAct interno (worker_react.go) não muda. Padrões não se substituem, se compõem.

Tabela de disparo

PadrãoSlashEnv varDefaultGatilho automático
#1 ReActsempre onsempre
#2 Plan-First/plan [task]CHATCLI_QUALITY_PLAN_FIRST_MODEautocomplexity ≥ 6
#3 Reflexion/reflect <lição>CHATCLI_QUALITY_REFLEXION_ENABLEDonerro, CoVe flagou, refine baixo
#4 HyDE— (transparente)CHATCLI_QUALITY_HYDE_ENABLEDofftoda retrieval
#5 Refine/refine on|offCHATCLI_QUALITY_REFINE_ENABLEDoffpós-worker
#6 CoVe/verify on|offCHATCLI_QUALITY_VERIFY_ENABLEDoffpós-worker
#7 Reasoning/thinking on|offCHATCLI_QUALITY_REASONING_MODEautopara AutoAgents

Prioridade de overrides

Para um dado turno, o effort hint é resolvido nesta ordem (último ganha):
1

Skill frontmatter

effort: high no frontmatter da skill ativada.
2

Agent default

Ex: PlannerAgent tem effort="high" embutido.
3

CHATCLI_QUALITY_REASONING_*

Auto-enable para agents em AutoAgents.
4

/thinking session override

Ganha de tudo acima para o próximo turno.
Para hooks de Refine / Verify / Reflexion:
1

/config quality (env)

CHATCLI_QUALITY_REFINE_ENABLED, etc.
2

/refine e /verify session toggles

*bool override que mora em cli.qualityOverrides; sobrescreve o env para a sessão.
Para Plan-First:
1

Flag one-shot /plan

cli.pendingPlanFirst = true consumido na próxima dispatch.
2

CHATCLI_QUALITY_PLAN_FIRST_MODE + complexidade

always ignora score; auto dispara quando ComplexityScore(task) >= threshold.

Custo e latência

Defaults foram calibrados para steady-state idêntico ao chatcli pré-pipeline. Padrões caros (Refine, Verify, HyDE) iniciam desligados; você opt-in quando o contexto justifica.
PadrãoChamadas LLM extras por turnObservações
ReAct0 (já parte do loop)
Plan-First (auto)+1 (planner) quando disparadoPassos reutilizam o dispatcher
Reflexion+1 (lesson gen), em backgroundNunca bloqueia o turn
HyDE 3a+1 (hipótese), baratoBudget de 200 tokens
HyDE 3b+1 (query embed) + backfill lazyembedding API ~$0.00002/1k tokens
Self-Refine+N (um por pass, default 1)Convergência corta cedo
CoVe+1 (verifier) por ponto de usoInternamente N=3 perguntas
Reasoning auto0 calls extras; +tokens na thinking hospedadaAnthropic budget = 8k default

Observabilidade

Todo padrão ativo aparece em /config quality:
✨ Pipeline de Qualidade do Agente ──────────────
  CHATCLI_QUALITY_ENABLED         : enabled
  Hooks registrados              : pre=0, post=3

  ── Self-Refine (#5)
  CHATCLI_QUALITY_REFINE_ENABLED  : enabled
  CHATCLI_QUALITY_REFINE_MAX_PASSES: 1
  ...

  ── RAG + HyDE (#4)
  CHATCLI_QUALITY_HYDE_ENABLED    : enabled
  CHATCLI_QUALITY_HYDE_USE_VECTORS: enabled
  CHATCLI_EMBED_PROVIDER          : voyage
  Provedor de vetores            : voyage:voyage-3
  Entradas vetoriais             : 127

Próximos passos

Tutorial: Plan-and-Solve

Comece pelo padrão com maior impacto em tarefas multi-step.

Configurar HyDE com vetores

Ative embeddings (Voyage ou OpenAI) para retrieval semântico.

Referência de slashes

/thinking, /plan, /refine, /verify, /reflect.

Lista completa de env vars

Todos os CHATCLI_QUALITY_* e CHATCLI_EMBED_*.