Episode 53: OpenClaw 2026.5.18, Codex 0.131.0, Copilot

[00:00] Gancho — começamos com o host e a CLI

OpenClaw v2026.5.18 é a primeira atualização a ser analisada, pois ela altera as superfícies das quais um host de agente depende no dia a dia: ferramentas de plugins, automação de navegador, inicialização do gateway, roteamento de proxy, voz mobile, entrega de canais, segurança de mídia e comportamento do app-server do Codex. O Codex rust-v0.131.0 chega junto como uma versão CLI e app-server: status mais visível no TUI, busca de menções mais ampla, comandos do marketplace de plugins, infraestrutura de controle remoto, ambientes remotos configurados, um SDK Python e diagnósticos que tornam os casos de suporte menos incertos.

A leitura prática é simples. Se o OpenClaw é o host, a v2026.5.18 melhora como os agentes se conectam a plugins, navegadores, canais, sessões de voz mobile e runtimes apoiados pelo Codex. Se o Codex é a superfície de codificação, a 0.131.0 torna a CLI mais fácil de operar em sessões longas e dá aos fluxos de trabalho remotos e SDK contratos mais explícitos. Após o bloco de release, o episódio aborda as mudanças do agente Copilot do GitHub em 18 de maio e a atualização da API da Anthropic para resultados de busca mais ricos em filings da SEC.

[02:30] Leitura do release do agent-stack — OpenClaw v2026.5.18

O OpenClaw v2026.5.18 é um release amplo do host, mas a primeira mudança voltada para builders é a forma dos plugins. O release adiciona defineToolPlugin junto com openclaw plugins init, openclaw plugins build e openclaw plugins validate para plugins de ferramentas simples tipados com metadados de manifesto gerados, declarações opcionais e factories de contexto. Isso torna o trabalho com plugins pequenos menos dependente de cola de manifesto escrita manualmente. Também importa para deprecação: o release marca APIs mais antigas de produtor de mensagens ricas, como caminhoslegados de diretivas interativas e Slack, como obsoletas enquanto adiciona limites de capacidade de apresentação de canais, então autores de plugins obtêm um contrato mais claro sobre o que um renderer pode realmente mostrar.

As mudanças no navegador são pequenas, mas importantes para a confiabilidade da automação. Snapshots agora expõem diálogos modais pendentes e recentemente tratados, ações podem retornar blockedByDialog quando um modal abre, e browser dialog --dialog-id pode responder a um diálogo pendente. Isso muda um modo de falha comum em agentes de navegador: em vez de um clique falhar silenciosamente porque um alerta ou diálogo de confirmação assumiu a página, a camada de automação pode representar o diálogo como estado e dar ao agente uma próxima ação explícita.

A inicialização do gateway e o comportamento do proxy também avançam. O log de inicialização e a inicialização do serviço de plugins agora sobrepõem com sidecars de canais enquanto preservam o gateamento de sidecar /readyz, e traces de reinicialização atribuem custos de probe, config, runtime e contagem de recursos sem mudar a semântica de readiness. Para operadores, a parte útil não é apenas o tempo de ready mais rápido; é uma melhor evidência quando uma reinicialização é lenta. O release também adiciona endpoints de forward-proxy HTTPS gerenciados e confiança scoped proxy.tls.caFile, o que dá às implantações uma forma mais limpa de rotear através de caminhos com proxy TLS-inspecionado ou privado sem transformar a configuração de proxy em uma decisão de confiança global.

O trabalho do QA-Lab é inesperadamente importante. O OpenClaw adiciona cenários de paridade de runtime de 20 turnos na primeira hora e opcionais de 100 turnos, openclaw qa suite --runtime-parity-tier, cobertura de fixtures de ferramentas através de openclaw qa coverage --tools, artefatos de eficiência de token de runtime ao vivo, e um gate rígido para drift de ferramenta de runtime dinâmico do OpenClaw requerido no tier padrão Codex-vs-Pi. Em termos simples: o projeto está adicionando verificações de release que comparam comportamento de runtime, vocabulário de ferramentas, uso de token e cobertura de ferramentas em vez de tratar um smoke test como suficiente. Essa é a direção certa para hosts de agentes, onde regressões frequentemente aparecem como "o agente usou a ferramenta errada" em vez de "o processo travou."

O Android Talk Mode também recebe uma grande mudança de runtime. O app Android muda o Talk Mode para sessões de voz relay realtime do Gateway com input de microfone streaming, playback de áudio realtime, bridging de resultados de ferramentas e transcrições na tela. Isso transforma a voz mobile de um wrapper simples de input/output em uma sessão ativa que pode carregar resultados de ferramentas de volta através do Gateway. O risco a testar é interrupção e latência: sessões de voz em streaming precisam de cancelamento limpo, alinhamento de transcrição e temporização de resultados de ferramentas que não deixe o usuário ouvindo output obsoleto.

As correções são onde muitos upgrades de produção sentirão o release. Completions de mídia gerados agora retornam a tópicos de fórum do Telegram preservando IDs de tópico através do handoff requester-agent. O probing de metadados de imagem evita invocar delegates de decodificador externos em bytes não reconhecidos, e o Sharp é instalado com fallbacks para ferramentas de imagem nativas, ImageMagick, GraphicsMagick ou ffmpeg. Sessões de voz do Discord continuam ouvindo turnos de acompanhamento com OpenAI realtime e prebuffer de playback do assistente para reduzir começos travados. Diretivas de Message/TTS são aplicadas antes que mensagens de ferramenta alcancem caminhos de entrega, então salas opt-in obtêm notas de voz em vez de tags brutas.

As correções do app-server do Codex do OpenClaw são especialmente relevantes para agent-stacks mistos. Anexos de imagem inbound atuais hidratam antes de runs enfileirados para que agentes alimentados por Responses recebam imagens de canal como input de visão nativo. O modo de código nativo permanece disponível sem forçar código-modo-only, o que permite que voltas de ferramenta dinâmica do OpenClaw completem através da ponte do app-server. O acesso à rede é preservado para voltas de código-modo sandbox do Codex quando o sandbox do OpenClaw permite egress outbound. A config de código-modo por agente é honrada em schema, ativação de catálogo de runtime e filtragem de payload de modelo. Política restrita de chat ou sender agora falha fechado desabilitando superfícies MCP nativas de código, app, ambiente e usuário para voltas restritas. O padrão é claro: a integração do Codex está sendo apertada em torno de política, mídia, sandboxing e seleção de modelo/runtime.

Notas de migração para OpenClaw v2026.5.18 são concretas. A linha mínima suportada do Node.js 22 sobe para 22.19, pacotes Pi movem para 0.75.1, e builds Docker/Podman devem preferir OPENCLAW_IMAGE_APT_PACKAGES enquanto OPENCLAW_DOCKER_APT_PACKAGES permanece como fallback legacy. A skill do Obsidian agora tem como alvo a CLI oficial obsidian em vez da CLI de terceiros obsidian-cli. A skill e helper de closeout review do Codex repo-local são renomeados para autoreview. Autores de canais/plugins devem inspecionar superfícies de produtor de mensagens legadas e limites de capacidade de apresentação antes de assumir que controles legados de mensagem rica renderizam da mesma forma em todos os lugares.

[17:30] Leitura do release do agent-stack — Codex rust-v0.131.0

O Codex rust-v0.131.0 é o release correspondente do lado CLI. O TUI agora expõe comandos de tier de serviço data-driven, uso de token misturado, permissões e modo de aprovação, raízes de workspace efetivas e tabelas Markdown responsivas. Isso parece trabalho de interface, mas muda operações do dia a dia: durante uma execução longa, o operador pode ver qual envelope de permissão e aprovação o agente está realmente usando e quais raízes de workspace estão ativas, em vez de reconstruir esses fatos a partir de arquivos de configuração e memória.

As menções ficam mais amplas. A busca com @ agora cobre arquivos, diretórios, plugins e skills em um picker, apoiada por metadados de plugin do app-server. Isso torna o modelo de interação mais próximo de como builders realmente pensam: a coisa para trazer ao contexto pode ser um arquivo, um diretório, uma skill ou um plugin, e a superfície do agente não deveria fazer desses caminhos de descoberta separados. O risco é inchaço de contexto, então a recomendação prática é usar o picker para anexar o artefato útil menor em vez de tratá-lo como uma ferramenta de importação em massa.

Fluxos de trabalho de plugins também avançam. O Codex adiciona comandos CLI de marketplace, compartilhamento com consciência de versão, checkout de compartilhamento, buckets de workspace compartilhado mais claros e hooks de plugin habilitados por padrão. Isso é um passo em direção a plugins se comportando como artefatos de desenvolvimento gerenciados em vez de pastas locais soltas. O item de atenção para migração é confiança e escopo de hooks: hooks habilitados por padrão são poderosos, então proveniência de plugins, compartilhamento de workspace e portões de versão importam mais à medida que o fluxo de trabalho se torna mais suave.

Trabalho remoto é uma parte majoritária da 0.131.0. O release adiciona codex remote-control gerenciado por daemon, APIs de enable e disable de runtime, leituras de status, ambientes remotos registry-backed e configurados, e contratos de app-server/API para ambientes remotos e namespaces de config de propriedade desktop. Para usuários, a capacidade é trabalho de agente remoto que pode ser iniciado, monitorado ou gerenciado fora do terminal imediato. Para builders integrando o Codex, os contratos de API importam porque ambientes remotos precisam de identidade durável, ciclo de vida, status e limites de configuração em vez de um processo shell best-effort.

O SDK Python agora é openai-codex / openai_codex, com tipos gerados em runtime pinned, roteamento de turno concorrente, modos de aprovação e cobertura de integração. Isso dá às aplicações Python uma forma mais limpa de dirigir voltas do Codex e receber notificações por ID em vez de tratar a CLI como um subprocesso apenas texto. O mecanismo importante é o roteamento de turnos: trabalho de agente concorrente precisa de IDs e eventos estruturados para que aprovações, atividade de ferramentas e outputs não se cruzem.

O Codex também adiciona codex doctor para diagnósticos em runtime, auth, terminal, rede, config e estado local. Este é o tipo de comando que se paga durante upgrades falhados. Em vez de perguntar se a falha é um problema de terminal, um token de auth obsoleto, uma política de rede ou um problema de banco de dados de estado local, a CLI pode reunir evidências prontas para suporte em um só lugar. O release também torna a inicialização do app-server e estado local mais segura preservando dados SQLite, falhando fechado quando o estado não pode abrir, adicionando caminhos de recuperação e suavizando falhas de sync de metadados opcionais.

O bloco de correções de bugs fortalece modos de falha reais. O comportamento de sandbox do Windows melhora em torno de regras de deny-read, raízes de escrita scoped, política de firewall ineficiente e edge cases de PowerShell. Restrições de leitura gerenciadas sobrevivem à escalação de permissão, e a resolução de perfil de permissão de raiz de workspace é limpa. A confiabilidade de Git e auth melhora através de hooks de worktree raiz, ignorando config de hook e fsmonitor do repo em comandos helper, binding de callbacks OAuth MCP locais e revogando tokens de login substituídos. Cleanup remoto e Windows obtêm timeouts de transporte de exec-server mais longos, taskkill mais silencioso e leituras de plugin não-enfileiradas. O release é menos sobre uma capacidade chamativa e mais sobre tornar sessões longas de CLI e sessões remotas observáveis, recuperáveis e mais seguras.

[29:30] Agentes GitHub Copilot — steering remoto, modelos mais baratos e reparo de Actions

As atualizações do Copilot do GitHub em 18 de maio são um snapshot útil de para onde agentes de codificação hospedados estão indo. O controle remoto para sessões Copilot CLI agora está geralmente disponível no GitHub Mobile, github.com, VS Code e JetBrains. A mecânica é explícita: comece com copilot --remote, habilite dentro de uma sessão com /remote on, ou configure remoteSessions no arquivo de settings do Copilot. Uma vez anexado, a superfície remota pode streamar atividade da sessão, aceitar input enfileirado, responder prompts de permissão, parar uma sessão e deixar o usuário direcionar o trabalho para longe do terminal original.

Isso muda a forma do trabalho de agente CLI. Um terminal local ainda é a âncora de execução, mas a superfície de supervisão pode se mover. A máquina precisa permanecer online, e os docs do GitHub apontam /keep-alive para execuções mais longas. Sessões são específicas de usuário, e usuários Business ou Enterprise podem precisar que administradores habilitem controle remoto e políticas de CLI. Essas restrições são importantes: remote steering não é compute de fundo mágico; é uma sessão local ao vivo com um plano de controle remoto e gates de política.

O GitHub também expandiu as escolhas de modelo de agente cloud do Copilot com Claude Haiku 4.5 e GPT-5.4-mini, cada um listado com um multiplicador de 0.33x. Essa é a direção de produto certa para agentes de codificação porque nem todo trabalho delegado precisa do modelo mais forte. Bumps de dependência diretos, pequenas correções de teste, falhas de lint ou edições mecânicas podem rodar em um modelo mais barato, enquanto mudanças pesadas em design ou ambíguas podem usar um mais forte. Os docs dizem que a seleção de modelo está disponível a partir de entrypoints suportados como atribuir uma issue, mencionar @copilot em um comentário de pull request, começar de superfícies de agente, GitHub Mobile ou Raycast; onde não existe um picker, Auto é usado.

A terceira mudança no Copilot é o reparo em um clique para failures de GitHub Actions. Na página de logs de execução de workflow, assinantes do Copilot Business e Enterprise podem clicar em Fix with Copilot; o agente na nuvem investiga o failure, faz push de uma correção para a branch e marca o usuário para revisão. Tecnicamente, isso é um ponto de entrada de agente com um bundle de contexto forte: logs de jobs que falharam, estado da branch, instruções do repositório e ambiente de desenvolvimento em nuvem. A implicação prática para construtores é que failures de CI se tornam um item de trabalho delegável sem precisar colar logs manualmente no chat. O risco é a disciplina de revisão: uma correção de branch empurrada ainda precisa de code review, verificação de testes e atenção para saber se o agente otimizou para CI verde ao invés do design correto.

[38:30] Anthropic API — dados mais ricos de filings SEC na busca web da Claude

A nota da Claude Platform de 18 de maio da Anthropic diz que a ferramenta de busca web agora retorna dados mais ricos de filings SEC. Isso é uma atualização focada de API, mas importa para qualquer agente fazendo pesquisa financeira, análise de resultados, análise competitiva ou due diligence. A diferença entre um resultado web genérico e uma busca com consciência de filing é a qualidade da fonte. Um agente precisa saber se está citando um 10-K, 10-Q, 8-K, proxy statement ou outro filing primário, e precisa de metadata suficiente para manter essas citações anexadas através de resumos e relatórios.

O modo de failure que isso endereça é familiar: um modelo resume uma afirmação financeira de um resultado de busca, então perde a identidade do filing ou mistura filings primários com comentários de analistas. Dados mais ricos de filings SEC dão à camada de ferramenta uma melhor chance de carregar evidências de fonte primária para o contexto do modelo. Construtores devem preservar essa metadata em seus próprios outputs. Se um agente escreve um memo, cada afirmação material deve apontar de volta para o filing, data, empresa e seção quando disponíveis. Se o agente escreve notas de pesquisa estruturadas, a fonte do filing deve permanecer como um campo de primeira classe, não uma sentença enterrada em prosa.

A recomendação prática é tratar resultados de busca web como objetos de evidência. Manter a URL, título, tipo de filing, data, texto da citação e timestamp de recuperação. Quando o agente compara empresas ou resume fatores de risco, exigir que ele separe filings primários de comentários secundários. Para workflows que alimentam planilhas, relatórios ou decisões downstream, registrar o payload de citação junto com a resposta final. O resultado de busca mais rico da Claude só é útil se o aplicativo preservar o limite de grounding até o usuário.

[45:00] Encerramento — prioridades de upgrade

Para OpenClaw, teste a v2026.5.18 nas superfícies reais que mudaram: build/validação de plugin, manipulação de modal do browser, prontidão para restart do gateway, confiança do proxy HTTPS, Talk Mode no Android, topics do Telegram, voz realtime do Discord, manipulação de mídia de imagem e turns do app-server do Codex com imagens, rede sandboxed, code mode e política de remetente restrito. Também verifique a compatibilidade com Node 22.19 e quaisquer referências de skill locais para caminhos de comandos renomeados ou depreciados.

Para Codex, atualize para 0.131.0 e exercite a linha de status do TUI, comandos de service-tier, mentions unificados, comandos de share/marketplace de plugins, fluxos de controle remoto, ambientes remote configurados, roteamento de turns do Python SDK, codex doctor, casos de sandbox do Windows se relevantes, e recuperação de estado do app-server. Para Copilot, use modelos de agente em nuvem mais baratos para trabalhos de reparo simples, mantenha sessões remotas com política restrita e revise correções de Actions em um clique como mudanças de código ao invés de respostas finais. Para agentes financeiros do Claude, preserve metadata e citações de filings SEC como evidência estruturada, não apenas como texto.