Episode 57: OpenClaw 2026.5.22, Claude Code 2.1.149

OpenClaw v2026.5.22 e Claude Code 2.1.149 estão na frente do EP057. O OpenClaw aperta o gateway, plugins, captura de notas de reunião, callbacks do Discord, fallbacks de mídia/provider, comportamento de subagentes, reutilização de busca xAI/Grok, navegação de sessão de chat e integridade de pacote. O Claude Code adiciona melhor contabilidade de uso, navegação de diffs, renderização de lista de tarefas, controles de MCP em nuvem e correções de shell/sandbox. Então o episódio avança para notícias de IA que importam para o stack: agentes gerenciados do Gemini, trabalho remoto do Codex e ambientes híbridos, aquisição de SDK/MCP da Anthropic, scanning de segurança de IA e projetos hospedados no GitHub que podem melhorar fluxos de trabalho de agentes.

[00:00] Abertura: correções de release, notícias de IA e radar de projetos reais Este episódio começa com OpenClaw v2026.5.22 e Claude Code 2.1.149 porque ambos os releases mudaram a maquinaria da qual os stacks de agentes dependem: inicialização do gateway, metadados de plugins, notas de reunião, callbacks do Discord, comportamento de fallback de provider, política do conector MCP em nuvem, contabilidade de uso, diffs e segurança do shell. Então a faixa de notícias de IA cobre Google, OpenAI e Anthropic porque cada um moveu uma superfície concreta de infraestrutura de agentes: sandboxes remotas gerenciadas, sessões do Codex supervisionadas por celular, deploy híbrido/on-prem do Codex, geração de SDK/MCP e scanning de segurança de modelos de fronteira. A faixa de projetos permanece focada em ferramentas hospedadas no GitHub em torno de contexto semântico de código, documentação atual, roteamento de modelos, construção de MCP, agentes locais, role packs e scanners de segurança.

[02:00] Leitura de releases do OpenClaw v2026.5.22 e Claude Code 2.1.149 A atualização do OpenClaw é ampla, mas o tema útil é confiabilidade e capacidade nos lugares onde os stacks de agentes geralmente travam. O gateway se apoia em leituras de catálogo de canais estáveis por processo e reutilização de snapshot de metadados de plugins, tornando inicialização e trabalho de status menos desperdiçadores. O trabalho de plugins em idle na inicialização está mais preguiçoso, probes irrelevantes de PATH do Linuxbrew são pulados, e manipuladores de métodos principais do gateway junto com mapas de alias de superfície pública tornam o caminho do gateway mais consistente. As notas de reunião recebem uma atualização real: plugins externos e provedores de código agora têm um contrato mais limpo, a captura pode iniciar automaticamente via config, imports manuais são suportados, existe acesso CLI somente leitura, e voz do Discord é tratada como uma fonte ao vivo primeira em vez de um caminho secundário.

As superfícies de agente e plugin também se movem. O OpenClaw corta o bootstrap de subagente padrão para os arquivos que mais importam, adiciona correções de transferência de completion nativo de subagentes, adiciona helpers genéricos de envio de poll de mensagens de canal e fluxo de trabalho de sessão no SDK de plugins, e clarifica contratos de capacidade de provedor de embedding. A superfície de controle de chat ganha busca e paginação de Load More no seletor de sessão, o que importa assim que um gateway tem um backlog real. Callbacks de componentes do Discord agora têm um TTL limitado, reduzindo o risco de botões de revisão antigos ou callbacks de UI estagnados permaneçam ativos além de sua vida útil. O manuseio de providers fica mais limpo: OAuth do xAI pode ser reutilizado para web_search do Grok, aliases de modelo e timeouts de operação melhoram, Antigravity CLI se torna um fallback de imagem/vídeo de menor prioridade depois das APIs de provider configuradas, e geração de imagem com chave de API do Codex usa a API nativa de Imagens do OpenAI. Some a atualização de dependências, protobufjs 8.4.0, trabalho de dependências bloqueadas, poda de catálogo, limpeza de write-lock de sessão, turnos tool-free do vLLM strict, correções de tópico do Telegram, correções de bypass de proxy local do Chrome/Ollama, e isto é um release real de manutenção e capacidade.

A atualização 2.1.149 do Claude Code é menor, mas atinge o uso diário. /usage pode mostrar uso de limite por categoria, incluindo skills, subagentes, plugins e custo por servidor MCP. A view de detalhe do /diff suporta rolagem por teclado. A renderização de saída Markdown mostra checkboxes de task-list no estilo GitHub. Admins de empresa obtêm uma configuração gerenciada allowAllClaudeAiMcps para carregar conectores MCP em nuvem do claude.ai junto com config MCP gerenciado. As correções são a história da segurança: bypasses de permissão PowerShell através de funções internas de mudança de diretório, allowlists de escrita de sandbox que acidentalmente cobriam muito de um worktree git, bugs de regra de prefixo/wildcard do PowerShell, rastreamento de variáveis stale em torno de PWD/OLDPWD/DIRSTACK, uma falha do find no macOS que poderia esgotar tabelas de arquivos em diretórios grandes, e várias correções de session remota, configurações gerenciadas, helper de telemetria, transcrição e UI. A versão 2.1.150 é infraestrutura interna apenas, então o delta facing ao usuário é 2.1.149 mesmo quando o pacote instalado é mais novo.

[10:00] Gemini 3.5 Flash e Agentes Gerenciados da API Gemini O anúncio do Gemini 3.5 Flash do Google vale a pena tratar como notícia de infraestrutura de agentes, não apenas marketing de modelo. O Google diz que o 3.5 Flash é construído para fluxos de trabalho agentic e codificação, com afirmações mais fortes de Terminal-Bench, GDPval-AA, MCP Atlas, multimodal, velocidade e tarefas de longo horizonte. A pergunta importante não é se um benchmark ganha a semana. É se um modelo rápido pode permanecer bom o suficiente através de longos loops pesados de ferramentas onde latência e supervisão importam.

O lançamento de Agentes Gerenciados da API Gemini torna isso concreto. Uma única chamada pode girar um agente alimentado por Antigravity em um ambiente Linux isolado e efêmero. O agente pode raciocinar, chamar ferramentas, executar código, gerenciar arquivos e navegar na web. Chamadas de follow-up podem reutilizar um ambiente, então o estado pode continuar em vez de cada.request se tornando um prompt stateless fresco. Desenvolvedores podem definir agentes customizados com instruções, skills e dados em arquivos estilo AGENTS.md e SKILL.md. Isso é diretamente relevante para o pensamento de OpenClaw e Hermes local: o que deve permanecer local porque toca credenciais ou código privado, e o que pode se mover com segurança para um sandbox gerenciado porque o ambiente é controlado, descartável e mais fácil de escalar?

[17:00] Supervisão remota do Codex, tokens de acesso e ambientes híbridos A direção do Codex da OpenAI é sobre supervisão e formato de deploy. O Codex no app mobile do ChatGPT permite que um usuário se conecte ao trabalho ativo rodando em um Mac ou ambiente remoto, veja estado do projeto ao vivo, aprove comandos, revise saída de terminal, screenshots, resultados de testes e diffs, então redirija a tarefa sem estar na máquina host. Isso importa porque agentes de codificação de longa execução não falham apenas por falta de inteligência. Eles falham porque reach um ponto de decisão e esperam, ou eles tomam o caminho errado porque um humano não estava lá para dar um pouquinho de julgamento.

O lado enterprise é igualmente importante. SSH remoto é generalmente disponível, Codex pode trabalhar dentro de ambientes remotos gerenciados, hooks podem escanear prompts em busca de secrets ou rodar validadores, e tokens de acesso programáticos dão a workflows não-interativos uma identidade de workspace com escopo. A parceria com a Dell aponta para ambientes híbridos e on-prem onde código, dados, políticas e computação aprovada já existem. Essa é a história séria do Codex: um agente de codificação que pode ser supervisionado de qualquer lugar enquanto ainda roda perto dos arquivos, credenciais e controles de que precisa.

[24:00] Anthropic Stainless e Project Glasswing A aquisição do Stainless pela Anthropic é uma história de conectividade de agentes. O Stainless transforma specs de API em SDKs, CLIs e servidores MCP através de linguagens, e a Anthropic diz que o Stainless gerou SDKs oficiais da Anthropic desde o início da API do Claude. Para agentes, isso importa porque um agente é tão útil quanto os sistemas que ele pode alcançar de forma segura e correta. SDKs, CLIs e servidores MCP limpos não são trabalho wrapper chato; eles são os handles que agentes usam para agir.

O Project Glasswing é o lado mais sombrio dessa mesma aceleração. A Anthropic diz que o Claude Mythos Preview foi usado com parceiros para escanear mais de mil projetos open-source e identificar grandes números de vulnerabilidades de severidade alta ou crítica. O gargalo muda de encontrar issues para verificar, divulgar e corrigir elas. Para um stack de agentes, a lição não é "solte todo modelo em todo repo." É escopo, evidência, verificação e fluxo de reparo. IA pode aumentar o throughput de segurança, mas o processo humano e do mantenedor tem que absorver os achados sem causar caos.

[32:00] Projetos GitHub: inteligência de codebase para Claude Code, Codex e Hermes A melhor faixa de projetos GitHub para este stack começa com inteligência de codebase. Serena traz ferramentas de recuperação semântica baseada em MCP, edição, refatoração e debugging. Claude Context dá ao Claude Code e outros agentes busca semântica de código sobre grandes repos. Sourcebot auto-hospeda busca de código, navegação, exploração de arquivos e Q&A de repo com citações. Understand-Anything transforma codebases em grafos interativos que humanos e agentes podem fazer perguntas. Chunkhound e Code Review Graph empurram inteligência de código local-first e mapas persistentes.

O teste prático é simples: escolha um repo grande e peça a um agente para planejar uma mudança duas vezes. Primeiro, deixe-o usar apenas busca built-in e contexto de transcript. Então dê a ele um mapa semântico ou ferramenta MCP de inteligência de código e veja se o plano toca menos arquivos errados, faz melhores perguntas e evita bloat de contexto. Se a resposta for sim, o upgrade do stack não é um prompt maior. É um mapa melhor.

[39:00] Projetos GitHub: documentação atual, roteamento de modelos, construtores de MCP, agentes locais e scanners de segurança O segundo grupo de projetos muda operação em vez de contexto. Claude Code Router roteia requisições através de providers e modelos, o que é útil quando trabalho em background, trabalho barato, trabalho de longo contexto e trabalho de alto raciocínio não devem todos bater no mesmo modelo. mcp-use ajuda a construir e inspecionar servidores e apps MCP em TypeScript ou Python. goose é um agente local desktop/CLI/API com suporte multi-provider e extensão MCP. gstack empacota roles e fluxos de trabalho do Claude Code para review, QA, release, segurança e planejamento. deepsec usa agentes de codificação para scanning de vulnerabilidade. Ferramentas context-mode e setup-sync tentam reduzir ruído de saída e manter setups multi-harness consistentes entre Claude Code, Codex, OpenCode, Gemini CLI e agentes adjacentes.

Context7 pertence a este grupo porque documentação de library atual é uma das formas mais rápidas de reduzir alucinações de API stale. Claude Code Router é útil apenas quando a escolha de provider permanece visível. mcp-use é mais forte quando a primeira superfície de ferramentas é estreita e inspecionável. goose vale a pena acompanhar como ponto de comparação de agente local. gstack é útil se seus roles produzem evidência concreta de review em vez de cerimônia polida. deepsec pertence a trabalho de segurança com escopo onde achados podem ser verificados. Estes projetos são interessantes porque ficam entre o modelo, o repo, as ferramentas e o loop de decisão humano.

[46:00] Encerramento A fila do EP057 é direta. OpenClaw v2026.5.22 torna o gateway, plugins, fontes de notas de reunião, fallbacks de provider, navegação de sessão e controles do Discord mais sólidos. Claude Code 2.1.149 melhora visibilidade de uso, review de diff, renderização de task-list, política de conector MCP em nuvem gerenciado e segurança de shell/sandbox. Agentes Gerenciados do Gemini mostram que sandboxes de agentes remotos estão sendo productizadas. Codex está se movendo em direção a execução híbrida supervisionada por mobile, com escopo de token, governada por hooks. O trabalho de Stainless e Glasswing da Anthropic mostra geração de SDK/MCP e scanning de segurança de IA convergindo. O radar do GitHub é a camada prática: mapas de código, documentação atual, roteadores, construtores de MCP, agentes locais, role packs, scanners e ferramentas de setup que ganham seu lugar apenas quando tornam o trabalho de agentes mais concreto e verificável.