chatcli connect transforma seu terminal local em um cliente que se conecta a um servidor ChatCLI remoto. Toda a experiência interativa (sessões, contextos, agente, coder) funciona transparentemente, como se o LLM estivesse rodando localmente.
Conexão Básica
Todas as Flags
| Flag | Descrição | Env Var |
|---|---|---|
--addr <host:port> | Endereço do servidor | CHATCLI_REMOTE_ADDR |
--token <string> | Token de autenticação | CHATCLI_REMOTE_TOKEN |
--provider <nome> | Sobrescreve o provedor LLM do servidor | |
--model <nome> | Sobrescreve o modelo LLM do servidor | |
--llm-key <string> | Sua própria API key (enviada ao servidor) | CHATCLI_CLIENT_API_KEY |
--use-local-auth | Usa credenciais OAuth do auth store local | |
--tls | Habilita conexão TLS | |
--ca-cert <path> | Certificado CA para verificação TLS | |
-p <prompt> | Modo one-shot: envia prompt e sai | |
--raw | Saída crua (sem formatação Markdown/ANSI) | |
--max-tokens <int> | Máximo de tokens na resposta |
Flags StackSpot
| Flag | Descrição |
|---|---|
--client-id | StackSpot Client ID |
--client-key | StackSpot Client Key |
--realm | StackSpot Realm/Tenant |
--agent-id | StackSpot Agent ID |
Flags Ollama
| Flag | Descrição |
|---|---|
--ollama-url | URL base do Ollama (ex: http://gpu:11434) |
Modos de Credencial
Você pode escolher como autenticar com o provedor de LLM:- Credenciais do Servidor
- Sua Própria API Key
- OAuth Local
- StackSpot
- Ollama
Não envie nenhuma flag de credencial. O servidor usa suas próprias API keys:
Modo One-Shot via Connect
Envie um único prompt ao servidor remoto e receba a resposta:Modo Interativo
Sem a flag-p, o ChatCLI inicia o modo interativo completo:
- Sessões:
/session save,/session load,/session list - Agente:
/agent <tarefa>ou/run <tarefa> - Coder:
/coder <tarefa> - Contexto:
@file,@git,@command,@env,@history - Persistência:
/context create,/context attach - Switch:
/switchpara trocar provedor/modelo - Watcher:
/watch statuspara ver status do K8s Watcher
Descoberta de Recursos Remotos
Ao conectar, o client descobre automaticamente plugins, agents e skills disponíveis no servidor:- Plugins Remotos
- Agents e Skills Remotos
Plugins do servidor aparecem em
/plugin list com a tag [remote]. Eles são executados no servidor — o client envia o comando via gRPC e recebe o resultado:Modo Híbrido
- Plugins locais e remotos coexistem; o prefixo
[remote]indica a origem - Agents locais e remotos são listados juntos; ao carregar, a resolução é transparente
- Ao desconectar (
/disconnect), recursos remotos são removidos automaticamente
Verificar Status do K8s Watcher
Se o servidor tem um K8s Watcher ativo, você pode consultar o status remotamente:Variáveis de Ambiente
Configure valores padrão via variáveis de ambiente para evitar digitar flags toda vez:TLS e Segurança
Para um guia completo de segurança (autenticação, hardening de containers, RBAC, etc.), veja a documentação de segurança.
Balanceamento com Múltiplas Réplicas
Quando o servidor ChatCLI roda com múltiplas réplicas no Kubernetes, o client distribui automaticamente as conexões entre os pods disponíveis:- O client usa round-robin client-side via resolver
dns:///do gRPC - Requer um Service headless (
ClusterIP: None) no Kubernetes - Keepalive integrado (ping a cada 10s) detecta pods inativos e reconecta rapidamente
- No Helm chart, habilite
service.headless: truequandoreplicaCount > 1 - No Operator, o headless é ativado automaticamente quando
spec.replicas > 1