Módulo 4.7 — Agentes Autônomos e Multi-Agent

📡 O espectro: autocomplete → agente → multi-agent

O desenvolvimento com IA evoluiu rapidamente de autocomplete de linha para agentes autônomos que executam tarefas complexas. Entender onde cada ferramenta se encaixa neste espectro é essencial para escolher o nível certo de automação para cada tarefa.

⌨️

Autocomplete

Sugere próxima linha

→

🤝

Assistente

Chat + edição guiada

→

🤖

Agente

Planeja e executa

→

🌐

Multi-Agent

Orquestra paralela

📊 Comparativo por Nível de Autonomia

Nível	Autonomia	Envolvimento Humano	Casos de Uso
Autocomplete	Mínima	Aprovação linha a linha	Boilerplate, importações
Assistente	Baixa	Humano dirige, IA executa	Funções, componentes
Agente	Alta	Define objetivo, revisa resultado	Features completas, refactoring
Multi-Agent	Máxima	Diretor estratégico	Projetos, produtos inteiros

💡 A Escolha do Nível Certo

Não use multi-agent para um bugfix de 3 linhas. Não use autocomplete para refatorar um módulo inteiro. O erro mais comum é subutilizar o nível de autonomia disponível — por medo ou por hábito. Em 2026, a vantagem competitiva está em usar o nível correto para cada contexto.

🤖 Devin em 2025-2026 — 67% de PRs mergeados

Devin (Cognition AI) é o agente de software autônomo mais avançado disponível comercialmente. Em 2026, passou de experimento a ferramenta de produção usada por empresas Fortune 500. Os números são significativamente melhores do que o esperado.

📊 Métricas do Devin em Produção (2026)

67%

PRs mergeados sem modificação humana

mais rápido que desenvolvimento humano médio

$500

custo mensal vs. $8K de dev junior

24/7

disponibilidade sem fadiga

🏢 Cases de Adoção Enterprise

Goldman Sachs

Automação de análise de código legado COBOL e geração de testes para sistemas críticos. Reduziu de 6 meses para 3 semanas a migração de módulos de risco.

Nubank

Criação de microsserviços internos e automação de conformidade regulatória com o Banco Central. 40% de redução no tempo de entrega de compliance features.

Stripe

Geração e manutenção de SDKs para 14 linguagens de programação usando agentes autônomos. Ciclo de atualização de semanas para horas.

🔍 Devin vs. Claude Code vs. OpenHands

Critério	Devin	Claude Code	OpenHands
Preço	$500+/mês	Por token (API)	Gratuito (open-source)
Privacidade	Nuvem Cognition	Nuvem Anthropic	Infraestrutura própria
Integração	GitHub nativo, Slack	Terminal, CI/CD	Docker, qualquer API
Melhor para	Enterprise, projetos complexos	Devs individuais, times	Pesquisa, compliance rígido

⚠️ Quando NÃO usar agentes autônomos

✗Código de segurança crítico sem revisão humana rigorosa — agentes introduzem vulnerabilidades sutis
✗Tarefas com requisitos ambíguos — o agente vai tomar decisões que você vai precisar desfazer
✗Sistemas com estado compartilhado sem rollback fácil — falhas são difíceis de reverter
✗Quando o custo de um erro supera o custo de fazer manualmente

💻 Claude Code como agente autônomo

Claude Code é o agente mais acessível para desenvolvedores individuais e times pequenos. Com suporte a sessões longas, CLAUDE.md como memória de projeto e capacidade de executar comandos, criar arquivos e fazer commits, é um agente completo de desenvolvimento acessível via terminal.

📄 CLAUDE.md para Sessões Autônomas

# Projeto: Plataforma de Relatórios (CLAUDE.md)

## Modo Autônomo — Regras de Operação
- Faça commits incrementais após cada módulo funcional
- Execute npm run test após CADA mudança de lógica
- NUNCA faça push para main — sempre crie uma branch
- Se encontrar decisão arquitetural não coberta: PARE e reporte
- Documente cada decisão tomada em docs/decisions/

## Stack (não alterar sem aprovação)
- Node.js 22 + TypeScript strict
- Fastify 4.x — nunca Express
- PostgreSQL via Prisma 5.x
- Redis para cache e filas (BullMQ)

## Definição de Done para cada módulo
- Testes unitários com cobertura > 80%
- Tipos TypeScript sem 'any'
- Sem warnings de lint
- Endpoint documentado no OpenAPI spec

## Acesso proibido em modo autônomo
- NUNCA modificar src/migrations/
- NUNCA alterar configurações de autenticação
- NUNCA fazer deploy ou alterar infraestrutura

Tarefas que Claude Code gerencia bem

•Implementar módulo completo a partir de spec detalhada
•Escrever suite de testes para codebase existente
•Migrar base de código entre frameworks
•Gerar documentação OpenAPI a partir do código
•Refatorar para novos padrões arquiteturais

Padrão de Prompt Autônomo Eficaz

Implemente o módulo de relatórios
conforme @docs/reports-spec.md.

Contexto: @src/reports/, @CLAUDE.md

Definição de Done:
- Todos os endpoints da spec
- Testes com cobertura > 80%
- Sem erros de TypeScript
- Commit separado por endpoint

Pare e me consulte se:
- Encontrar conflito de arquitetura
- Spec tiver ambiguidade crítica
- Teste falhar por razão desconhecida

Comece: mostre o plano antes
de implementar.

💡 MCP amplia o poder do agente

Com MCP configurado, Claude Code não trabalha apenas com arquivos de texto — ele pode consultar o banco de dados real, criar PRs no GitHub, verificar erros no Sentry e executar migrações. O MCP transforma o agente de um editor de código em um operador real do ambiente de desenvolvimento.

🔗 Arquitetura multi-agent — orquestra de especialistas

Em vez de um agente tentando fazer tudo, a arquitetura multi-agent distribui responsabilidades entre agentes especializados que trabalham em paralelo. O resultado é maior qualidade, maior velocidade e menor custo — porque cada agente usa o modelo mais adequado para sua tarefa específica.

🏗️ Diagrama de Arquitetura Multi-Agent

HUMANO / ORQUESTRADOR

Define objetivo e valida resultado final

AGENTE DE PLANEJAMENTO · Claude Opus

Decompõe objetivo → subtarefas com dependências

AGENTE BACKEND · Sonnet

Endpoints, lógica de negócio, queries

AGENTE FRONTEND · Sonnet

Componentes, estados, integração API

AGENTE DE TESTES · Haiku

Unitários, integração, E2E

AGENTE REVISOR · Claude Opus

Segurança, consistência, qualidade → PR para humano

Responsabilidades por agente

Orquestrador (humano): define o objetivo de alto nível e critérios de aceitação
Planejador (Opus): decompõe, prioriza, atribui subtarefas e resolve dependências
Implementadores (Sonnet): executam as subtarefas em paralelo, maximizando velocidade
Testador (Haiku): valida cada output de implementador com cobertura automática
Revisor (Opus): revisão final por segurança e consistência antes de entregar ao humano

Quando usar arquitetura multi-agent

✓Features que envolvem backend + frontend + testes em paralelo
✓Migrações de sistemas grandes que podem ser particionadas
✓Geração de documentação + testes em paralelo com implementação
✗Tarefas pequenas e interdependentes — overhead não compensa
✗Quando o contexto precisa ser compartilhado continuamente

🔌 MCP na prática — conectando agentes ao mundo real

MCP é o que dá aos agentes acesso ao ambiente real de produção. Sem MCP, o agente trabalha com código em texto. Com MCP, ele pode interagir com banco de dados, APIs, infraestrutura e ferramentas externas como se fosse um desenvolvedor humano.

⚙️ Configuração mcp.json para um time

// .claude/mcp.json (na raiz do projeto)
{
  "mcpServers": {
    "filesystem": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-filesystem",
               "./src", "./docs", "./tests"]
    },
    "database": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-postgres"],
      "env": {
        "POSTGRES_CONNECTION_STRING": "${DB_STAGING_URL}"
      }
    },
    "github": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-github"],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "${GH_TOKEN}"
      }
    },
    "sentry": {
      "command": "npx",
      "args": ["-y", "mcp-server-sentry"],
      "env": {
        "SENTRY_AUTH_TOKEN": "${SENTRY_TOKEN}",
        "SENTRY_ORG": "minha-empresa"
      }
    }
  }
}

O que MCP habilita

•Queries no banco: "Qual é a estrutura da tabela users? Quantos usuários ativos temos?"
•Operações em arquivos: leitura e escrita com contexto real do projeto
•Chamadas de API: criar PRs, comentar em issues, checar status de CI
•Erros de produção: ler Sentry e corrigir os 3 bugs mais frequentes

Servidores MCP mais úteis

Servidor	Para
server-filesystem	Leitura/escrita de arquivos
server-postgres	Banco de dados direto
server-github	PRs, issues, CI/CD
server-browser	Automação web, scraping
mcp-server-sentry	Erros de produção

✓ Boas práticas de segurança no MCP

✓Credenciais sempre em variáveis de ambiente, nunca no JSON
✓Permissões mínimas: agente de dev não precisa de write em produção
✓Use banco de staging, nunca produção para operações de escrita
✓Audite quais ferramentas o agente pode executar sem confirmação

✗ Erros comuns de segurança no MCP

✗Hardcodar secrets no mcp.json (que vai para o git)
✗Dar acesso de write ao banco de produção para agentes de dev
✗Não limitar quais diretórios o agente pode acessar via filesystem
✗Usar token com permissões de admin no GitHub MCP

🔬 OpenHands/OpenDevin — alternativa open-source

OpenHands (anteriormente OpenDevin) é o projeto open-source mais avançado de agente de software autônomo. Permite rodar localmente ou em sua própria infraestrutura — sem enviar código para serviços externos. Ideal para experimentação e para compliance que não permite código em nuvem.

🔬 Setup Conceitual do OpenHands Local

Pré-requisito: Docker instalado e rodando na máquina local ou servidor

API Key: Configure sua chave da Anthropic (Claude), OpenAI ou qualquer LLM compatível

Docker run: Pull da imagem e inicialização com acesso ao filesystem via volume mount

Interface web: Acesse localhost:3000 — interface visual para delegar tarefas ao agente

Código 100% local: o agente executa no container Docker, nunca envia código para a nuvem

# Diferença crucial vs. Devin: OpenHands roda no seu ambiente.
# Seus dados nunca saem da sua infraestrutura.
# Você controla qual LLM usa — troque Claude por GPT-4 a qualquer hora.

⚖️ Comparativo: OpenHands vs. Devin vs. Claude Code

Caso de Uso	OpenHands	Devin	Claude Code
Compliance rigoroso	Ideal	Problemático	Depende
Projetos enterprise	Possível	Ideal	Bom
Uso individual	Complexo de configurar	Caro	Ideal
Experimentação / pesquisa	Ideal	Custo alto	Bom
Custo	Apenas LLM API	$500+/mês	Por token

💡 Vantagens do Open-Source

Com OpenHands, você pode customizar o comportamento do agente, contribuir para melhorias, auditar o código que processa suas informações e integrar com qualquer LLM — incluindo modelos rodando localmente com Ollama. Para organizações com dados altamente sensíveis, essa soberania de dados é essencial.

👑 Você como orquestrador — o novo papel do engenheiro sênior

Karpathy declarou em fevereiro de 2026 que o próximo passo após vibe coding é "Agentic Engineering". O papel do engenheiro sênior está evoluindo de implementador para arquiteto de sistemas de agentes. As habilidades mudam, mas a necessidade de expertise técnica sólida permanece — e se torna ainda mais crítica.