Pipeline de Qualidade do Agente

O ChatCLI implementa sete padrões de agente LLM trabalhando em conjunto como um pipeline de qualidade que envolve o dispatcher ReAct existente. Cada padrão tem propósito específico, pode ser ligado/desligado por sessão ou /config, e compõe com os demais sem regressão de performance no caminho padrão.

Premissa de design: opt-in por padrão. Com CHATCLI_QUALITY_* sem configuração, o pipeline roda com zero post-hooks — Pipeline.Run degenera em uma chamada direta a agent.Execute. Você só paga pelos padrões que ativar.

Os sete padrões

#1 — ReAct

Reason → Act → Observe. O loop base que todo worker executa. Já estava presente; agora emite eventos estruturados e auto-atacha effort hints.

#2 — Plan-and-Solve / ReWOO

PlannerAgent emite JSON estruturado; PlanRunner executa passos em ordem topológica com placeholders #E1.head=200.

#3 — Reflexion

Detecta erro, alucinação ou qualidade baixa; destila uma Lesson via LLM e persiste em memory.Fact para retrieval futuro via RAG.

#4 — RAG + HyDE

Hypothesis-based keyword expansion (3a) + busca por cosseno em vetores (3b — Voyage/OpenAI, backend pure-Go).

#5 — Self-Refine

RefinerAgent crítica o rascunho e reescreve. Multi-pass com convergência por EpsilonChars.

#6 — Chain-of-Verification

VerifierAgent gera perguntas de verificação independentes, responde cada uma e reescreve se houver discrepância.

#7 — Reasoning Backbone

Abstração cross-provider: thinking_budget na Anthropic, reasoning_effort na OpenAI. Auto-attach para agents críticos.

Configuração

Env vars CHATCLI_QUALITY_*, /config quality, e os cinco slash commands: /thinking, /plan, /refine, /verify, /reflect.

Como os padrões se conectam

                 ┌──────────────────────────────────────┐
                 │   /agent ou /coder <tarefa>          │
                 └──────────────────┬───────────────────┘
                                    │
  (#4 RAG+HyDE) ────────────────────▼───────────────
  memory.Retriever expande hints com a hipótese gerada
  pelo LLM (HyDE-3a) e opcionalmente busca no vector
  store (HyDE-3b) antes de montar o system prompt.
                                    │
  (#2 Plan-and-Solve) ──────────────▼───────────────
  Quando disparado (auto-score ou /plan), o planner
  emite um plano JSON, o PlanRunner executa cada
  passo resolvendo placeholders #E1, e o relatório
  determinístico é injetado na history.
                                    │
                    ┌───────────────▼───────────────┐
                    │   Loop ReAct (workers)        │
                    │   (#1, sempre ativo)          │
                    └───────────────┬───────────────┘
                                    │
                    ┌───────────────▼───────────────┐
                    │   QualityPipeline (por call)  │
                    │   - Pre:  applyAutoReasoning  │ (#7)
                    │   - Execute worker            │
                    │   - Post: RefineHook          │ (#5)
                    │   - Post: VerifyHook          │ (#6)
                    │   - Post: ReflexionHook       │ (#3)
                    └───────────────┬───────────────┘
                                    │
  Lições geradas pela Reflexion são persistidas em
  memory.Fact e ressurgem via #4 em tarefas similares
  futuras — fechando o loop sem retreinamento.

Princípio arquitetural: todos os padrões novos se ligam ao dispatcher ou ao context builder — o loop ReAct interno (worker_react.go) não muda. Padrões não se substituem, se compõem.

Tabela de disparo

Padrão	Slash	Env var	Default	Gatilho automático
#1 ReAct	—	—	sempre on	sempre
#2 Plan-First	`/plan [task]`	`CHATCLI_QUALITY_PLAN_FIRST_MODE`	`auto`	complexity ≥ 6
#3 Reflexion	`/reflect <lição>`	`CHATCLI_QUALITY_REFLEXION_ENABLED`	`on`	erro, CoVe flagou, refine baixo
#4 HyDE	— (transparente)	`CHATCLI_QUALITY_HYDE_ENABLED`	`off`	toda retrieval
#5 Refine	`/refine on\|off`	`CHATCLI_QUALITY_REFINE_ENABLED`	`off`	pós-worker
#6 CoVe	`/verify on\|off`	`CHATCLI_QUALITY_VERIFY_ENABLED`	`off`	pós-worker
#7 Reasoning	`/thinking on\|off`	`CHATCLI_QUALITY_REASONING_MODE`	`auto`	para AutoAgents

Prioridade de overrides

Para um dado turno, o effort hint é resolvido nesta ordem (último ganha):

Skill frontmatter

effort: high no frontmatter da skill ativada.

Agent default

Ex: PlannerAgent tem effort="high" embutido.

CHATCLI_QUALITY_REASONING_*

Auto-enable para agents em AutoAgents.

/thinking session override

Ganha de tudo acima para o próximo turno.

Para hooks de Refine / Verify / Reflexion:

/config quality (env)

CHATCLI_QUALITY_REFINE_ENABLED, etc.

/refine e /verify session toggles

*bool override que mora em cli.qualityOverrides; sobrescreve o env para a sessão.

Para Plan-First:

Flag one-shot /plan

cli.pendingPlanFirst = true consumido na próxima dispatch.

CHATCLI_QUALITY_PLAN_FIRST_MODE + complexidade

always ignora score; auto dispara quando ComplexityScore(task) >= threshold.

Custo e latência

Defaults foram calibrados para steady-state idêntico ao chatcli pré-pipeline. Padrões caros (Refine, Verify, HyDE) iniciam desligados; você opt-in quando o contexto justifica.

Padrão	Chamadas LLM extras por turn	Observações
ReAct	0 (já parte do loop)	—
Plan-First (auto)	+1 (planner) quando disparado	Passos reutilizam o dispatcher
Reflexion	+1 (lesson gen), em background	Nunca bloqueia o turn
HyDE 3a	+1 (hipótese), barato	Budget de 200 tokens
HyDE 3b	+1 (query embed) + backfill lazy	embedding API ~$0.00002/1k tokens
Self-Refine	+N (um por pass, default 1)	Convergência corta cedo
CoVe	+1 (verifier) por ponto de uso	Internamente N=3 perguntas
Reasoning auto	0 calls extras; +tokens na thinking hospedada	Anthropic budget = 8k default

Observabilidade

Todo padrão ativo aparece em /config quality:

✨ Pipeline de Qualidade do Agente ──────────────
  CHATCLI_QUALITY_ENABLED         : enabled
  Hooks registrados              : pre=0, post=3

  ── Self-Refine (#5)
  CHATCLI_QUALITY_REFINE_ENABLED  : enabled
  CHATCLI_QUALITY_REFINE_MAX_PASSES: 1
  ...

  ── RAG + HyDE (#4)
  CHATCLI_QUALITY_HYDE_ENABLED    : enabled
  CHATCLI_QUALITY_HYDE_USE_VECTORS: enabled
  CHATCLI_EMBED_PROVIDER          : voyage
  Provedor de vetores            : voyage:voyage-3
  Entradas vetoriais             : 127

Próximos passos

Tutorial: Plan-and-Solve

Comece pelo padrão com maior impacto em tarefas multi-step.

Configurar HyDE com vetores

Ative embeddings (Voyage ou OpenAI) para retrieval semântico.

Referência de slashes

/thinking, /plan, /refine, /verify, /reflect.

Lista completa de env vars

Todos os CHATCLI_QUALITY_* e CHATCLI_EMBED_*.

Início

Primeiros Passos

Conceitos Fundamentais

Funcionalidades

Segurança

Suporte

Pipeline de Qualidade do Agente

Os sete padrões

#1 — ReAct

#2 — Plan-and-Solve / ReWOO

#3 — Reflexion

#4 — RAG + HyDE

#5 — Self-Refine

#6 — Chain-of-Verification

#7 — Reasoning Backbone

Configuração

Como os padrões se conectam

Tabela de disparo

Prioridade de overrides

Custo e latência

Observabilidade

Próximos passos

Tutorial: Plan-and-Solve

Configurar HyDE com vetores

Referência de slashes

Lista completa de env vars

Início

Primeiros Passos

Conceitos Fundamentais

Funcionalidades

Segurança

Suporte

​Os sete padrões

#1 — ReAct

#2 — Plan-and-Solve / ReWOO

#3 — Reflexion

#4 — RAG + HyDE

#5 — Self-Refine

#6 — Chain-of-Verification

#7 — Reasoning Backbone

Configuração

​Como os padrões se conectam

​Tabela de disparo

​Prioridade de overrides

​Custo e latência

​Observabilidade

​Próximos passos

Tutorial: Plan-and-Solve

Configurar HyDE com vetores

Referência de slashes

Lista completa de env vars

Os sete padrões

Como os padrões se conectam

Tabela de disparo

Prioridade de overrides

Custo e latência

Observabilidade

Próximos passos