Episode 58: OpenClaw 2026.5.27, Codex 0.134, Claude Code

OpenClaw v2026.5.27 e v2026.5.26, Codex rust-v0.134.0, Claude Code 2.1.153 e Hermes v2026.5.16 definem o contexto dos lançamentos. OpenClaw restringe limites de conteúdo, verificações de exposição sem autenticação, recuperação do servidor de aplicações Codex, catálogos de provedores, provedores de embedding, Pixverse, parâmetros de thinking do VLLM, sobreposições OAuth do Claude, entrega por canais, caches de metadados, verificações de pacotes e caminhos de prova de CI. Codex adiciona busca local no histórico de conversas, configuração por perfil-primeiro, melhor configuração de MCP, OAuth HTTP streamable, concorrência de MCP somente leitura, preservação de schema de conectores, contexto mais rico para hooks e extensões, e correções de confiabilidade remota. Claude Code adiciona modo de correção de code-review, restrições de ferramentas de skills, hooks de recarregamento de skills, hooks de exibição de mensagens, sugestões do marketplace, continuidade de modelo fallback, visibilidade de atualização/doctor, tratamento mais rígido de política MCP de subagentes, correções de credenciais do gateway OAuth e reparos de sessão em segundo plano. Depois o episódio entra nas histórias da stack atual: gateways MCP governados, ferramentas de grafo de código local, memória compartilhada de agente local, pontes de controle mobile, roteadores de modelo local, e DGX Spark mais LM Studio como servidor de modelo privado.

[00:00] Abertura: a stack fica mais restritiva e mais local As atualizações mais úteis da stack de agentes desta semana não são demonstrações barulhentas de modelos. São as partes que decidem se um agente pode agir com segurança, recuperar-se de forma limpa, escolher o provedor certo e encontrar o código certo antes de editar. O novo release do OpenClaw é sobre limites de conteúdo mais precisos, menos rotatividade no gateway, verificações de exposição mais seguras, comportamento mais estável do servidor de aplicações Codex, melhores provedores e entrega mais confiável. A atualização do Codex torna histórico local, perfis, configuração de MCP, manipulação de schemas e confiabilidade remota mais sérios. As últimas mudanças do Claude Code tornam review, skills, hooks, modelos fallback, política MCP, estado de atualização e sessões em segundo plano mais fáceis de confiar.

[03:00] OpenClaw v2026.5.27, Codex 0.134 e Claude Code 2.1.153 O release do OpenClaw tem uma linha de segurança clara. O texto do prompt de grupo fica fora do system prompt. Hostnames com pontos repetidos são normalizados. Wrappers de comandos com side-effects e substituições inseguras de ambiente de runtime Node são bloqueados. Exposição Tailscale sem autenticação é rejeitada. Aprovações de Node e device-role requerem autoridade de admin. Isso importa porque stacks de agentes estão cada vez mais conectadas a canais reais, máquinas locais e redes privadas; o gateway tem que rejeitar formas estranhas de autoridade antes que elas cheguem ao modelo.

O trabalho específico do Codex no OpenClaw importa tanto quanto. Modelos de runtime resolvem primeiro, memória do workspace roteia através de ferramentas, clientes compartilhados do servidor de aplicações sobrevivem a falhas de startup e de helpers gerados, gerações de relay de hooks sobrevivem a reinicializações, e chaves de runtime live falsas são evitadas. O gateway também faz menos rediscover em caminhos quentes: leituras de sessão, fingerprints de metadados de plugins, snapshots de auth, config de plugins, catálogos de busca de ferramentas e caches de metadados estáveis são todos reutilizados de forma mais inteligente. A cobertura de provedores expande com provedores core de embedding compatíveis com OpenAI, navegação completa de modelos DeepInfra com consciência de credenciais, geração de vídeo Pixverse e seleção de região, parâmetros de thinking do VLLM, sobreposições OAuth do Claude CLI para perfis de PI, e IDs de modelo Anthropic diretos.

Codex 0.134 é um release CLI prático. Busca local no histórico de conversas significa que trabalho antigo é pesquisável por conteúdo com previews. Configuração profile-first faz do --profile a forma principal de selecionar permissões e comportamento de sandbox. Configuração de MCP melhora com targeting de ambiente por servidor e opções OAuth para servidores HTTP streamable. Schemas de ferramentas de conectores preservam referências e definições locais melhor, schemas excessivamente grandes compactam antes da exposição, e ferramentas MCP somente leitura podem rodar concorrentemente quando anunciam a hint certa. Contexto de extensões e hooks também fica mais rico, incluindo histórico de conversas para ferramentas de extensão e identidade de subagente em inputs de hooks.

A última linha do Claude Code é dividida entre trabalho de features e limpeza. O release de features adiciona /code-review --fix, permite que /simplify invoque esse caminho de correção, permite que skills e comandos slash removam ferramentas com disallowed-tools, adiciona /reload-skills, permite que hooks de SessionStart recarreguem skills e definam títulos, adiciona hooks de MessageDisplay, e introduz marketplaces de sugestão de plugins gerenciados. Também muda para um modelo fallback configurado para o resto de uma sessão quando o modelo primário está indisponível. O release de acompanhamento adiciona opções de skip de LFS para fontes de marketplace de plugins, visibilidade de atualização em /doctor, avisos combinados de autenticação MCP, continuidade de permissão de background-agent no macOS, tratamento mais rígido de política MCP de subagentes, uma correção para gateways de API customizados recebendo a credencial OAuth errada, e muitos reparos de sessão em segundo plano.

[12:00] Gateways MCP se tornam infraestrutura governada IBM ContextForge e Jarvis Registry são o tipo de projeto GitHub que faz o MCP parecer menos uma pilha de demos de conectores e mais infraestrutura. ContextForge federa APIs MCP, A2A, REST e gRPC atrás de um registry e proxy com governança, descoberta, observabilidade, plugins, OpenTelemetry, federação com backend Redis e deploy Kubernetes. Seu último release completa uma reescrita do React Admin UI, melhora migrations de banco de dados, fortalece fluxos OAuth e melhora comportamento de deploy multi-réplica.

Jarvis Registry está mirando no mesmo problema de governança de ferramentas de um ângulo de workflow. Ele dá a copilotos e agentes autônomos um gateway único seguro de MCP e A2A com identidade, controle de acesso, descoberta semântica, logs de auditoria e métricas. Seu último release adiciona um motor de execução de workflow com estado de execução com backend MongoDB, dispatch para agentes A2A e servidores MCP, APIs de pause/resume/cancel/retry, endpoints de workflow persistidos, rotação de refresh-token OAuth, negociação de escopo de access-token e descoberta A2A através de busca e ferramentas de gateway.

A pergunta prática é simples: quando um agente de codificação pede uma ferramenta, onde a descoberta acontece, onde a identidade vive e onde está o trace depois da chamada? Se a resposta é "dentro de uma dúzia de configs separados", um gateway ou registry vale testar.

[19:00] Ferramentas de grafo de código dão aos agentes melhor visão local Codanna e Roam Code são dois exemplos úteis de inteligência de código local se tornando legível por agentes. Codanna é um servidor MCP em Rust e CLI para busca de código, símbolos, chamadas e documentos. Seu último release melhora resolução de chamadas de método: chamadas estáticas desambiguam por tipo de receiver, chamadas de instância inferem tipos de receiver de parâmetros do caller, e PHP ganha resolução com consciência de herança. A breaking change é do tipo certo e conservadora: uma chamada que previamente resolvia para um método de mesmo nome errado agora retorna como não resolvido.

Roam Code é mais uma camada de preflight e evidência para agentes. Ele constrói um grafo de código SQLite local entre muitas linguagens, expõe uma grande superfície CLI e MCP, roda local por padrão, limpa secrets de respostas MCP e empacota evidências de mudança para que uma edição assistida por IA possa responder: que autoridade existia, que contexto foi lido, o que mudou, o que poderia quebrar, que política se aplicou, o que verificou e quem aceitou o risco. Seu formato preflight é especialmente útil antes de uma edição arriscada: raio de impacto, testes afetados, complexidade, acoplamento e convenções antes do agente mudar arquivos.

A melhoria da stack não é abstrata. Antes de um agente de codificação mexer em um repo grande, ele deveria perguntar a um grafo de código local que símbolo está editando, quem chama, que testes poderiam importar e que caminho de dependência poderia quebrar. Isso é melhor do que pedir ao modelo para inferir arquitetura de um sprint de grep.

[26:00] Memória local compartilhada e estado de tarefas reduzem colisões de agentes paralelos O projeto Agent Guild mira um ponto de dor diferente: vários agentes trabalhando em torno do mesmo projeto mas perdendo estado entre sessões. É um binário Go único com um servidor MCP, SQLite local, recuperação BM25 mais semântica e claims atômicos de tarefas. Claude Code, Codex, Cursor ou outro cliente MCP pode ler o mesmo contexto de projeto, claimar trabalho, registrar resultados e deixar handovers. Seu último release restringe permissões de arquivos locais, valida tipos de catálogo antecipadamente, torna ordenação de eventos determinística sob escritas concorrentes e estabiliza leituras de mesmo timestamp.

Isso importa porque memória de agente é frequentemente tratada como um caderno pessoal para uma sessão de modelo. A versão mais útil é estado de projeto local compartilhado: decisões, trabalho ativo, tarefas reclamadas, tarefas bloqueadas e notas de handover que sobrevivem à compactação e podem ser lidas por mais de uma superfície de agente. O primeiro teste deve ser pequeno: um store de estado de projeto, dois clientes, um claim de tarefa, um handover e nenhuma colisão.

[31:00] Pontes de controle mobile mantêm execução local mas movem a superfície de aprovação Lucarne é uma resposta leve para o problema de babysitting. Ela observa sessões de agentes de codificação locais e envia aprovações, pedidos de clarificação, falhas e progresso para Telegram ou WeChat. Ela faz isso sem adicionar hooks, skills, MCP ou mudanças de projeto. Claude, Codex, Gemini, Copilot e Pi permanecem no computador local; o celular se torna a superfície de atenção.

Essa distinção importa. Agentes remotos hospedados movem tanto execução quanto supervisão para fora da máquina local. Uma ponte de controle mantém arquivos, credenciais e ferramentas locais, depois roteia os momentos de atenção humana através de um canal de mensagens existente. A coisa para verificar não é se uma notificação chega uma vez. Verifique que ela chega no ponto de decisão certo, roteia a resposta de volta para o workspace e sessão certos, e não adiciona uma nova superfície de autoridade ampla.

[36:00] Roteadores de modelo local se tornam conscientes de hardware SmarterRouter é um roteador compatível com OpenAI para Ollama, llama.cpp e endpoints estilo OpenAI. Ele perfila modelos, rastreia metadados de capability, estima VRAM, suporta cache semântico e roteia prompts por tarefa e hardware local. Seu último release adiciona extração dinâmica de metadados de modelo, suporte a Gemma 4, detecção automatizada de capability do Ollama, estimativa de VRAM com consciência de MoE e dimensionamento com consciência de quantização.

Isso se alinha com o release do OpenClaw porque stacks de modelo local precisam de mais do que uma lista de URLs de endpoint. Embeddings, tool calling, visão, contexto longo, parâmetros de thinking, quantização, parâmetros ativos de MoE e limites de VRAM todos afetam qual modelo deveria handle uma tarefa. Um roteador local deveria saber que um modelo local pequeno pode resumir logs, um modelo local maior pode inspecionar código, um endpoint de embedding deveria ser separado, e um modelo de nuvem assinado deveria ser reservado para trabalho onde ele muda o resultado.

[41:00] DGX Spark mais LM Studio parece um appliance de modelo privado O guia da NVIDIA de LM Studio no DGX Spark é um padrão concreto de servir local. Rode LM Studio em um dispositivo Spark, sirva um modelo localmente com aceleração GPU e use de um laptop. Com LM Link, o modelo hospedado no Spark pode aparecer para outra máquina através de um link encriptado sem setup de mesma LAN ou abertura de um serviço público.

Isso é relevante porque o resto da stack está se tornando mais amigável para provedores compatíveis com OpenAI, provedores de embedding local, roteadores de modelo e execução híbrida. Um DGX Spark nesse padrão não é apenas um desktop rápido. É um appliance de modelo privado: local o suficiente para manter dados e inferência próximos, shapeado como serviço o suficiente para que laptops e gateways de agente possam usar, e isolado o suficiente para ser tratado como um limite real.

[46:00] Encerramento A fila do EP058 está definida. Atualizar o OpenClaw para limites de conteúdo, cobertura de provedores, resiliência do app-server Codex e limpeza do hot-path do gateway. Atualizar o Codex para busca de histórico local, perfis, configuração de MCP, preservação de schema e concorrência de ferramentas somente leitura. Atualizar o Claude Code para correções de revisão, habilidades restritas a ferramentas, recargas de habilidades, hooks de exibição de mensagens, modelos fallback, visibilidade de atualizações e política de MCP mais rígida para subagentes. Então escolha um experimento de infraestrutura: um gateway MCP governado, um grafo de código local, um armazenamento de estado compartilhado, uma ponte de controle mobile, um roteador de modelos local ou um caminho de serving privado com DGX Spark / LM Studio. O tema é prático: mais capacidade de agente só ajuda se a stack conseguir governar ferramentas, ver código com precisão, compartilhar estado, alcançar o humano no momento certo e rotear modelos de acordo com o que o hardware realmente pode fazer.