15 Seções + 150 Subseções de IA aplicada a DevOps, SRE e Platform Engineering
Entenda o problema real e os fundamentos de IA para DevOps
E Por Que Você Precisa Liderar Ela
1.1 3 da Manhã. 47 Alertas.
1.2 O DevOps como Cola Humana
1.3 Por Que IA Falha Sem Padronização
1.4 Veja a Transformação
1.5 O Que Torna Este Guia Diferente
1.6 Os Pontos Críticos de Dor
1.7 O Que Você Vai Construir
1.8 A Jornada Começa
LLMs, Claude, MCP e Frameworks de Agentes
2.1 O Que São Large Language Models (LLMs)
2.2 Claude, GPT e Outros Modelos: Quando Usar Cada Um
2.3 Limitações Críticas Que Você Precisa Conhecer
2.4 Model Context Protocol (MCP): A Ponte Entre LLM e Ferramentas
2.5 Frameworks de Agentes: LangChain, CrewAI e AutoGen
2.6 Decisões Arquiteturais Deste Guia
VS Code, Claude Code CLI e Configuração do Ambiente
3.1 A IDE como Central de Comando DevOps
3.2 VS Code + Claude Code: O Setup Recomendado
3.3 Extensões Essenciais para DevOps
3.4 Arquivos de Configuração: .cursorrules, CLAUDE.md
3.5 Iniciando Seu Ambiente: claude init
3.6 Copilotos, Chat e Agentes na IDE
3.7 MCP: O Protocolo de Contexto para Modelos
3.8 Anti-Padrões Comuns no Uso de IA na IDE
3.9 Agente em Ação - Setup Inicial na IDE
3.10 Claude Skills: Guia Completo
3.11 Construindo Seu Próprio MCP Server
3.12 Context7: Documentação em Tempo Real via MCP
3.13 Opus 4.7: Adaptive Thinking, Task Budgets e xhigh Effort
3.14 Hooks: Automação e Guardrails no Claude Code
3.15 AWS MCP Servers — Do Ecossistema ao Canônico
› 3.15.1 AWS MCP Server (GA, Maio 2026) — O Novo Entry Point Canônico
› 3.15.2 O Ecossistema awslabs — Specialized Servers que Continuam Valendo a Pena
› 3.15.3 Árvore de Decisão — Quando Usar Cada Um
› 3.15.4 Novos Padrões Destravados pelo GA
3.16 GCP MCP Servers — A Abordagem Remota do Google
Do Conceito à Prática com Subagentes Especializados
4.1 O que é (e o que não é) um Agente de IA
4.2 Diferença Prática: Prompt, Script, Copilot e Agente
4.3 Anatomia de um Agente DevOps
4.4 Tipos de Agentes no Mundo DevOps
4.5 MCP Aplicado a Agentes
4.6 Guardrails Mínimos para Produção
4.7 Quando NÃO Usar Agentes
4.8 Anatomia de Uma Execução de Agente
4.9 Anti-Padrões: Onde Agentes Falham
4.10 Debugging: Quando o Agente Erra
4.11 Métricas: Como Medir ROI de Agentes
4.12 Agente em Ação — Configurando o Agente
4.13 Subagentes Especializados: Criando um Time de IA
4.14 Agent Teams: Múltiplos Agentes em Paralelo
4.15 Managed Agents API — A Alternativa Stateful da Anthropic
4.16 Spec-Driven Agents: De Vibe Coding à Disciplina de Engenharia
› 4.16.1 O Problema do Vibe Coding
› 4.16.2 Os Três Pilares: Contracts, Agents, Runtime
› 4.16.3 O Workflow Canônico
› 4.16.4 Implementando em Claude Code
› 4.16.5 Panorama: Kiro vs Spec Kit vs Native Claude Code
› 4.16.6 Quando NÃO Usar Spec-Driven
4.17 Claude Code Headless — Do CLI ao SDK em Orquestradores Externos
› 4.17.1 O Padrão Claude Code como Biblioteca
› 4.17.2 A Rota do CLI — claude -p (Print Mode)
› 4.17.3 A Rota do SDK — Agent SDK (Python + TypeScript)
› 4.17.4 Três Padrões de Orquestrador — Exemplos do Mundo Real
› 4.17.5 Autenticação em CI e Cost Guardrails
› 4.17.6 Quando NÃO Usar Modo Headless
Terraform e Kubernetes com IA na prática
Infraestrutura Inteligente na Prática
5.1 Terraform no Mundo Real (A Dor Silenciosa)
5.2 Onde a IA Ajuda de Verdade no Terraform
5.3 MCP Aplicado ao Terraform: Escolhendo Sua Arquitetura
5.4 Guia de Instalação: VS Code, Cursor e CLI
5.5 Instalando os MCPs Certos
5.6 Configuração de Guardrails: Protegendo Produção
5.7 O Fluxo "End-to-End" (Supervisionado)
5.8 Walkthrough Prático: do Zero ao Primeiro Módulo (Genérico, Multi-Cloud)
5.9 Workspace Safety: IA como Guardião
› 5.9.5 Hard Guardrail IAM Plan-Only
5.10 FinOps: IA como Analista de Custos
5.11 Agente em Ação - Arquiteto de Infraestrutura
5.12 Troubleshooting do Terraform MCP
5.13 Subagente: terraform-reviewer
5.14 Agent Teams: Refatoração Multi-Módulo
5.15 Além do Terraform — CloudFormation e CDK
› 5.15.6 Quando usar call_aws vs servidores awslabs especializados
5.16 IaC Spec-Driven: Do Requisito de Negócio ao Módulo Terraform
› 5.16.1 Por que IaC é a Killer App do Spec-Driven
› 5.16.2 Os Três Pilares Aplicados ao Terraform
› 5.16.3 Walkthrough: VPC Multi-AZ para Ambiente PCI
› 5.16.4 Drift Detection como Validação de Spec
› 5.16.5 Tooling: IBM iac-spec-kit e Native Claude Code
5.17 From Monolith to Composable: Refatorando CLAUDE.md em Skills e Subagentes
› 5.17.1 Diagnóstico: Por Que Refatorar
› 5.17.2 A Regra de Partição: Always-On vs On-Demand
› 5.17.3 Walkthrough: Migrando 3 Patterns Concretos
› 5.17.4 O CLAUDE.md Final (~80 linhas)
› 5.17.5 Estrutura Final do Diretório
› 5.17.6 Quando NÃO Refatorar
MCP Server, IAM Hard Guardrail, CFN/CDK, Bedrock e Least-Privilege
6.1 AWS MCP Server (deep dive)
6.2 Hard Guardrail Plan-Only IAM (duplicado de 5.9.5)
6.3 CloudFormation e CDK com AWS MCP
6.4 Claude Code on Bedrock
6.5 Least-Privilege IAM para AWS MCP
6.6 Encerramento ... GCP e Azure futuros
Operação, Políticas e Escala Inteligente
7.1 Kubernetes: O Sistema Operacional Distribuído
7.2 K8sGPT: Do CLI ao Monitoramento Contínuo
7.3 MCP para Kubernetes: Dando "Olhos" ao Agente
7.4 Verificação da Instalação do MCP
7.5 Caso Real End-to-End: Payment Service Down
7.6 Políticas como Código: Kyverno + IA
7.7 Autoscaling Inteligente: KEDA + IA
7.8 HPA/VPA Inteligente: Configuração Guiada por IA
7.9 Estratégias de Deployment: Canary e Blue-Green
7.10 Subagente: k8s-troubleshoot
7.12 Hospedando MCP Servers no Kubernetes/EKS
7.13 Upgrade de EKS/Kubernetes Assistido por IA
7.14 Agent Teams: Validação de Upgrade EKS
7.15 Karpenter + IA: Node Scaling Inteligente
7.16 GKE vs EKS — Quando Cada Um Faz Sentido
7.17 GKE MCP em Ação — As 27 Tools no Fluxo Real
7.18 Agent Team — Provisionamento GKE Multi-Região
7.19 Spec-Driven Kubernetes: De Requisitos a Manifests + Policy
› 6.19.1 O Problema dos Manifests sem Intent
› 6.19.2 Os Três Pilares Aplicados a Kubernetes
› 6.19.3 Walkthrough Real: Deploy do payment-service
› 6.19.4 O Spec como Contrato Dev ↔ Plataforma
7.11 Conclusão do Capítulo
CI/CD, Observabilidade e Troubleshooting
Pipelines como Produto
8.1 Pipelines como Produto
8.2 Seleção Inteligente de Testes
8.3 Auto-Triage de Falhas de Pipeline
8.4 Supply Chain Security
8.5 Flakiness: Testes Instáveis
8.6 Geração de Pipelines com IA
8.7 Segurança de Pipelines
8.8 Quando NÃO Usar IA em CI/CD
8.9 ROI de IA em CI/CD
8.10 Subagente: ci-security-analyst
8.11 Configuração Final
8.12 Cenário Prático End-to-End
8.13 GitHub Actions com Claude Code
8.14 Claude Code SDK — Automação Programática
8.15 Conclusão
Do Excesso de Sinal à Ação Inteligente
9.1 O Problema do Excesso de Sinal
9.2 Correlação de Logs, Métricas e Traces
9.3 IA no Apoio ao On-Call
9.4 Redução de MTTR com Decisão Assistida
9.5 Forecasting de Recursos com Prophet
9.6 Caso Prático de Incidente Real
9.7 Arquitetura do Agente de Incidentes
9.8 Configuração da Persona e Subagente
9.9 Limitações e Quando NÃO Usar IA
9.10 Agent Teams: War Room Automatizado P1
9.11 CloudWatch MCP Server — AWS Nativa
9.12 Cost Explorer MCP — FinOps com IA
9.13 Grafana MCP + OpenTelemetry
9.14 Conclusão do Capítulo
9.15 SLOs como Specs: Geração Automática de Alertas e Dashboards
› 8.15.1 O Gap do Documento de SLO
› 8.15.2 Os Três Pilares Aplicados a Observabilidade
› 8.15.3 Walkthrough Real: SLO do payment-service
› 8.15.4 O Efeito Composto: Mudanças no SLO Viram Regeneráveis
Segurança, FinOps e RAG de Runbooks
Triagem Inteligente de Vulnerabilidades
10.1 O Problema da Segurança em Escala
10.2 Triagem Inteligente de Vulnerabilidades
10.3 Arquitetura do Sistema de Triagem
10.4 Priorização Automatizada: Da Detecção à Ação
10.5 Secrets Management com IA
10.6 Subagente: security-auditor
10.7 Configuração do Agente (.cursorrules)
10.8 Limitações e Quando NÃO Usar IA
10.9 Conclusão do Capítulo
Redução Inteligente de Gastos em Cloud
11.1 O Problema Estrutural de FinOps
11.2 Arquitetura de FinOps Inteligente
11.3 Implementação: Componentes Essenciais
11.4 ROI de FinOps com IA
11.5 Conclusão
Conhecimento Operacional Acessível Instantaneamente
12.1 O Problema de Documentação Distribuída
12.2 Fundamentos: RAG, BM25 e Embeddings
12.3 Escolha de Stack: Comparação Detalhada
12.4 Implementação com Qdrant + LlamaIndex
12.5 Integrando Múltiplas Fontes
12.6 Criando Agente/MCP com RAG (Anti-Alucinação)
12.7 Integração com Slack para Acesso Rápido
12.8 Métricas e Avaliação de RAG
12.9 Limitações e Troubleshooting
12.10 Conclusão e Checklist de Implementação
Segurança, GitOps e Adoção Organizacional
Human-in-the-Loop e Responsabilidade
13.1 Por que IA sem Limites Vira Risco
13.2 Human-in-the-Loop na Prática
13.3 Guardrails Simples que Funcionam
13.4 Responsabilidade Continua Sendo Humana
13.5 Checklist de Segurança
13.6 Claude Code no Amazon Bedrock: Deploy Enterprise para Indústrias Reguladas
13.6.1 O Bloqueio de Compliance
13.6.2 Arquitetura: Inferência Nativa no Bedrock
13.6.3 Setup Sênior: Do Zero à Produção
13.6.4 O Endpoint Mantle
13.6.5 Caso Real: Q2 Code (Banking)
13.6.6 O Que Isso Significa Para Sua Carreira
13.7 AWS MCP Server: IAM Least-Privilege e Guardrails Operacionais
13.7.1 O Problema do Raio de Explosão
13.7.2 Três Tiers de Deployment
13.7.3 Templates IAM Prontos para Usar
13.7.4 Defense in Depth: Cinco Camadas
13.7.5 Agent vs Humano: Condition Keys IAM
13.7.6 CloudTrail e Alarmes em Tempo Real
13.7.7 Hook Anti-Destrutivo no Próprio Claude Code
ArgoCD, Flux e Automação Inteligente
14.1 O que é GitOps (Recap)
14.2 Onde IA Agrega Valor no Fluxo GitOps
14.3 PR Review Automatizado de IaC
14.4 Geração de Manifests com Claude
14.5 Detecção e Correção de Drift
14.6 Integração com ArgoCD e Flux
14.7 Prompts Production-Ready
14.8 Onde Colocar Prompts e Como Automatizar
14.9 Guardrails: O que NÃO Automatizar
Como Escalar IA em DevOps na Empresa
15.1 O Problema da Adoção Descoordenada
15.2 Arquitetura de Governança: Repositórios e Estrutura
15.3 CLAUDE.md: A Fonte Única de Verdade
15.4 Arquitetura de Adoção: Pessoas e Processos
O que vem pela frente e como se preparar
Visão de Futuro e Seu Plano de Ação
16.0 O Que Você Viu Neste Guia
16.1 O Que Mudou (e o Que Não Mudou)
16.2 O Que Vem nos Próximos 2-3 Anos
16.3 Como Se Preparar (Ações Práticas)
16.4 Os Riscos Reais (Não o Hype)
16.5 A Verdade Inconveniente
16.6 Seu Plano de 6 Meses
16.7 O Princípio Final
16.8 Você Está Pronto. Comece Amanhã.
+300 paginas de conteudo tecnico aplicado a producao real
Garantia de 14 dias | Acesso vitalicio | Atualizacoes inclusas