Episode 53: OpenClaw 2026.5.18, Codex 0.131.0, Agentes

[00:00] Gancho — comenzar con el host y la CLI OpenClaw v2026.5.18 es la primera actualización a inspeccionar porque cambia las superficies de las que depende un host de agentes todos los días: herramientas de plugins, automatización de navegador, inicio de gateway, enrutamiento de proxy, voz móvil, entrega de canales, seguridad de medios y comportamiento del app-server de Codex. Codex rust-v0.131.0 llega junto a él como una versión de CLI y app-server: estado más visible en la TUI, búsqueda de menciones más amplia, comandos de marketplace de plugins, plomería de control remoto, ambientes remotos configurados, un SDK de Python y diagnósticos que hacen que los casos de soporte sean menos adivinanzas.

La lectura práctica es simple. Si OpenClaw es el host, v2026.5.18 mejora cómo los agentes se conectan a plugins, navegadores, canales, sesiones de voz móvil y runtimes respaldados por Codex. Si Codex es la superficie de codificación, 0.131.0 hace que la CLI sea más fácil de operar en sesiones largas y les da a los flujos de trabajo remotos y de SDK contratos más explícitos. Después del bloque de lanzamiento, el episodio gira hacia los cambios de agentes de Copilot del 18 de mayo de GitHub y la actualización de API de Anthropic para resultados de búsqueda más ricos de archivos SEC.

[02:30] Lectura de lanzamiento del stack de agentes — OpenClaw v2026.5.18 OpenClaw v2026.5.18 es un lanzamiento amplio de host, pero el primer cambio orientado a constructores es la forma de los plugins. El lanzamiento agrega defineToolPlugin más openclaw plugins init, openclaw plugins build y openclaw plugins validate para plugins de herramientas simples tipadas con metadatos de manifiesto generados, declaraciones opcionales y fábricas de contexto. Eso hace que el trabajo pequeño con plugins dependa menos del pegamento de manifiesto escrito a mano. También importa para la depreciación: el lanzamiento marca las APIs de productores de mensajes ricos más antiguos como las rutas directivas de Slack e interactivas heredadas como obsoletas mientras agrega límites de capacidad de presentación de canales, para que los autores de plugins obtengan un contrato más claro para lo que un renderizador realmente puede mostrar.

Los cambios del navegador son pequeños pero importantes para la confiabilidad de la automatización. Las instantáneas ahora muestran diálogos modales pendientes y manejados recientemente, las acciones pueden devolver blockedByDialog cuando se abre un modal, y browser dialog --dialog-id puede responder a un diálogo pendiente. Eso cambia un modo de falla común en navegadores: en lugar de que un clic falle silenciosamente porque una alerta o diálogo de confirmación tomó la página, la capa de automatización puede representar el diálogo como estado y darle al agente una siguiente acción explícita.

El inicio del gateway y el comportamiento del proxy también se mueven. El registro de inicio y el inicio del servicio de plugins ahora se superponen con sidecars de canal mientras preservan la compuerta de sidecar /readyz, y las trazas de reinicio atribuyen costos de sonda, configuración, runtime y conteo de recursos sin cambiar la semántica de preparación. Para los operadores, la parte útil no es solo un tiempo de preparación más rápido; es mejor evidencia cuando un reinicio es lento. El lanzamiento también agrega puntos finales de proxy de reenvío HTTPS gestionados y confianza proxy.tls.caFile con alcance, lo que les da a los despliegues una forma más limpia de enrutar a través de rutas de proxy inspeccionadas por TLS o privadas sin convertir la configuración del proxy en una decisión de confianza global.

El trabajo de QA-Lab es inusualmente importante. OpenClaw agrega escenarios de paridad de runtime de 20 turnos en la primera hora y opcionales de 100 turnos, openclaw qa suite --runtime-parity-tier, cobertura de fixtures de herramientas a través de openclaw qa coverage --tools, artefactos de eficiencia de tokens de runtime en vivo, y una compuerta dura para deriva de herramientas de runtime dinámico de OpenClaw requerido en el nivel estándar Codex-vs-Pi. En términos simples: el proyecto está agregando verificaciones de lanzamiento que comparan comportamiento de runtime, vocabulario de herramientas, uso de tokens y cobertura de herramientas en lugar de tratar una prueba de humo como suficiente. Esa es la dirección correcta para hosts de agentes, donde las regresiones a menudo aparecen como "el agente usó la herramienta equivocada" en lugar de "el proceso falló".

Android Talk Mode también obtiene un cambio importante de runtime. La app de Android cambia Talk Mode a sesiones de voz de relé de Gateway en tiempo real con entrada de micrófono en streaming, reproducción de audio en tiempo real, puenteo de resultados de herramientas y transcripciones en pantalla. Esto convierte la voz móvil de un simple envoltorio de entrada/salida en una sesión activa que puede llevar resultados de herramientas de vuelta a través del Gateway. El riesgo a probar es la interrupción y latencia: las sesiones de voz en streaming necesitan cancelación limpia, alineación de transcripciones y temporización de resultados de herramientas que no deje al usuario escuchando salida obsoleta.

Las correcciones son donde muchos mejoras de producción sentirán el lanzamiento. Las completaciones de medios generados ahora regresan a los temas del foro de Telegram preservando IDs de temas a través del traspaso agente-solicitante. La sondeo de metadatos de imagen evita invocar delegados de decodificador externos en bytes no reconocidos, y Sharp se instala con fallbacks a herramientas de imagen nativas, ImageMagick, GraphicsMagick o ffmpeg. Las sesiones de voz de Discord siguen escuchando turnos de seguimiento con OpenAI en tiempo real y reproducción de asistente pre-buffered para reducir arranques entrecortados. Las directivas de mensaje/TTS se aplican antes de que los envíos de herramientas de mensaje lleguen a las rutas de entrega, para que las salas opt-in obtengan notas de voz en lugar de etiquetas sin formato.

Las reparaciones del app-server de Codex de OpenClaw son especialmente relevantes para stacks de agentes mixtos. Los archivos adjuntos de imagen entrantes actuales se hidratan antes de las ejecuciones en cola para que los agentes respaldados por Responses reciban imágenes de canal como entrada de visión nativa. El modo de código nativo permanece disponible sin forzar código-only, lo que permite que las vueltas de herramientas dinámicas de OpenClaw se completen a través del puente del app-server. Se preserva el acceso a la red para vueltas de código en sandbox para las vueltas de código de Codex cuando el sandbox de OpenClaw permite egress saliente. La configuración de modo de código por agente se respeta en el esquema, activación del catálogo de runtime y filtrado de payload del modelo. La política de chat o remitente restringida ahora falla cerrado deshabilitando superficies nativas de código, app, ambiente y MCP de usuario para turnos restringidos. El patrón es claro: la integración de Codex se está apretando alrededor de política, medios, sandboxing y selección de modelo/runtime.

Las notas de migración para OpenClaw v2026.5.18 son concretas. La línea mínima de Node.js soportada sube a 22.19, los paquetes de Pi se mueven a 0.75.1, y las construcciones de Docker/Podman deberían preferir OPENCLAW_IMAGE_APT_PACKAGES mientras OPENCLAW_DOCKER_APT_PACKAGES permanece como fallback heredado. La habilidad de Obsidian ahora apunta al CLI oficial obsidian en lugar del de terceros obsidian-cli. La habilidad y helper de revisión de cierre de Codex del repo-local se renombran a autoreview. Los autores de canales/plugins deben inspeccionar las superficies de productores de mensajes obsoletas y los límites de capacidad de presentación antes de asumir que los controles de mensajes ricos antiguos se renderizan igual en todas partes.

[17:30] Lectura de lanzamiento del stack de agentes — Codex rust-v0.131.0 Codex rust-v0.131.0 es el lanzamiento del lado CLI coincidente. La TUI ahora expone comandos de nivel de servicio impulsados por datos, uso de tokens mezclado, permisos y modo de aprobación, raíces de workspace efectivas y tablas Markdown responsivas. Eso suena como trabajo de interfaz, pero cambia las operaciones día a día: durante una ejecución larga, el operador puede ver qué sobre de permisos y aprobación está usando realmente el agente y qué raíces de workspace están activas, en lugar de reconstruir esos hechos desde archivos de configuración y memoria.

Las menciones se vuelven más amplias. La búsqueda de @ ahora cubre archivos, directorios, plugins y habilidades en un solo selector, respaldado por metadatos de plugins del app-server. Eso hace que el modelo de interacción se acerque más a cómo los constructores realmente piensan: la cosa a traer al contexto puede ser un archivo, un directorio, una habilidad o un plugin, y la superficie del agente no debería hacer que esos sean carriles de descubrimiento separados. El riesgo es la inflación de contexto, así que la recomendación práctica es usar el selector para adjuntar el artefacto útil más pequeño en lugar de tratarlo como una herramienta de importación masiva.

Los flujos de trabajo de plugins también avanzan. Codex agrega comandos de CLI del marketplace, compartición con conocimiento de versión, checkout de compartición, buckets de workspace compartidos más claros y hooks de plugin habilitados por defecto. Este es un paso hacia que los plugins se comporten como artefactos de desarrollo gestionados en lugar de carpetas locales sueltas. El ítem de vigilancia de migración es la confianza y alcance de los hooks: los hooks habilitados por defecto son poderosos, así que la proveniencia de plugins, la compartición de workspaces y las compuertas de versión importan más a medida que el flujo de trabajo se vuelve más fluido.

El trabajo remoto es una parte principal de 0.131.0. El lanzamiento agrega codex remote-control gestionado por daemon, APIs de habilitación y deshabilitación de runtime, lecturas de estado, ambientes remotos respaldados por registro y configurados, y contratos de app-server/API para ambientes remotos y espacios de nombres de configuración de desktop. Para los usuarios, la capacidad es trabajo de agente remoto que puede ser iniciado, monitoreado o gestionado fuera del terminal inmediato. Para los constructores integrando Codex, los contratos de API importan porque los ambientes remotos necesitan identidad duradera, ciclo de vida, estado y límites de configuración en lugar de un proceso de shell de máximo esfuerzo.

El SDK de Python ahora es openai-codex / openai_codex, con tipos generados por runtime fijados, enrutamiento de turnos concurrente, modos de aprobación y cobertura de integración. Eso le da a las aplicaciones Python una forma más limpia de impulsar vueltas de Codex y recibir notificaciones por ID en lugar de tratar la CLI como un subproceso solo de texto. El mecanismo importante es el enrutamiento de turnos: el trabajo concurrente de agentes necesita IDs y eventos estructurados para que las aprobaciones, actividad de herramientas y salidas no se crucen.

Codex también agrega codex doctor para diagnósticos a través de runtime, auth, terminal, red, configuración y estado local. Este es el tipo de comando que se paga solo durante actualizaciones fallidas. En lugar de preguntar si la falla es un problema de terminal, un token de auth obsoleto, una política de red o un problema de base de datos de estado local, la CLI puede reunir evidencia lista para soporte en un solo lugar. El lanzamiento también hace que el inicio del app-server y estado local sea más seguro preservando datos SQLite, fallando cerrado cuando el estado no puede abrirse, agregando rutas de recuperación y suavizando fallas de sincronización de metadatos opcionales.

El bloque de corrección de bugs endurece modos de falla reales. El comportamiento del sandbox de Windows mejora alrededor de reglas de denegación de lectura, raíces de escritura con alcance, política de firewall inefectiva y casos extremos de PowerShell. Las restricciones de lectura gestionadas sobreviven a la escalada de permisos, y la resolución del perfil de permisos de raíz de workspace se limpia. La confiabilidad de Git y auth mejora a través de hooks de worktree raíz, ignorando la configuración de repo hook y fsmonitor en comandos helper, enlazando callbacks OAuth MCP locales y revocando tokens de login reemplazados. La limpieza remota y de Windows obtiene timeouts de transporte de exec-server más largos, taskkill más silencioso y lecturas de plugins sin cola. El lanzamiento es menos sobre una capacidad llamativa y más sobre hacer sesiones de CLI largas y sesiones remotas observables, recuperables y más seguras.

[29:30] Agentes de GitHub Copilot — dirección remota, modelos más baratos y reparación de Actions Las actualizaciones de Copilot del 18 de mayo de GitHub son una instantánea útil de hacia dónde van los agentes de codificación alojados. El control remoto para sesiones de CLI de Copilot ahora está generalmente disponible en GitHub Mobile, github.com, VS Code y JetBrains. La mecánica es explícita: iniciar con copilot --remote, habilitarlo dentro de una sesión con /remote on, o establecer remoteSessions en el archivo de configuración de Copilot. Una vez adjuntado, la superficie remota puede transmitir actividad de sesión, aceptar entrada en cola, responder a prompts de permisos, detener una sesión y dejar que el usuario dirija el trabajo lejos del terminal original.

Eso cambia la forma del trabajo de agente CLI. Un terminal local sigue siendo el ancla de ejecución, pero la superficie de supervisión puede moverse. La máquina necesita permanecer en línea, y los docs de GitHub mencionan /keep-alive para ejecuciones más largas. Las sesiones son específicas del usuario, y los usuarios de Business o Enterprise pueden necesitar que los administradores habiliten el control remoto y las políticas de CLI. Esas restricciones son importantes: la dirección remota no es magia de cómputo en segundo plano; es una sesión local en vivo con un plano de control remoto y compuertas de política.

GitHub también expandió las opciones de modelo de agente en la nube de Copilot con Claude Haiku 4.5 y GPT-5.4-mini, cada uno listado con un multiplicador de 0.33x. Esta es la dirección de producto correcta para agentes de codificación porque no cada trabajo delegable necesita el modelo más fuerte. Los bump de dependencias directos, pequeñas correcciones de pruebas, fallas de lint o ediciones mecánicas pueden ejecutarse en un modelo más barato, mientras que los cambios de diseño pesado o ambiguos pueden usar uno más fuerte. Los docs dicen que la selección de modelo está disponible desde puntos de entrada soportados como asignar un issue, mencionar @copilot en un comentario de pull request, iniciar desde superficies de agente, GitHub Mobile o Raycast; donde no existe un selector, se usa Auto.

El tercer cambio de Copilot es la reparación con un clic para GitHub Actions que fallan. Desde la página de logs de ejecución de un workflow, los suscriptores de Copilot Business y Enterprise pueden hacer clic en "Fix with Copilot"; el agente en la nube investiga la falla, hace push de una corrección a la rama y etiqueta al usuario para revisión. Técnicamente, esto es un punto de entrada de agente con un paquete de contexto sólido: logs del job que falló, estado de la rama, instrucciones del repositorio y entorno de desarrollo en la nube. La implicación práctica para los constructores es que las fallas de CI se convierten en un elemento de trabajo delegable sin tener que pegar manualmente los logs en el chat. El riesgo es la disciplina de revisión: una corrección de rama empujada aún necesita revisión de código, verificación de pruebas y atención a si el agente optimizó para un CI verde en lugar del diseño correcto.

[38:30] Anthropic API — datos más ricos de filings de SEC en la búsqueda web de Claude

La nota de la plataforma Claude de Anthropic del 18 de mayo dice que la herramienta de búsqueda web ahora devuelve datos más ricos de filings de SEC. Eso es una actualización de API enfocada, pero importa para cualquier agente que haga investigación financiera, análisis de ganancias, análisis competitivo o due diligence. La diferencia entre un resultado web genérico y una búsqueda consciente de filings es la calidad de la fuente. Un agente necesita saber si está citando una 10-K, 10-Q, 8-K, statement proxy u otro filing primario, y necesita suficientes metadatos para mantener esas citas adjuntas a través de resúmenes e informes.

El modo de falla que esto aborda es familiar: un modelo resume una afirmación financiera desde un resultado de búsqueda, luego pierde la identidad del filing o mezcla filings primarios con comentarios de analistas. Datos más ricos de filings de SEC le da a la capa de la herramienta una mejor oportunidad de llevar evidencia de fuente primaria al contexto del modelo. Los constructores deben preservar esos metadatos en sus propios outputs. Si un agente escribe un memo, cada afirmación material debe apuntar de vuelta al filing, fecha, empresa y sección cuando esté disponible. Si el agente escribe notas de investigación estructuradas, la fuente del filing debe permanecer como un campo de primera clase, no una oración enterrada en prosa.

La recomendación práctica es tratar los resultados de búsqueda web como objetos de evidencia. Mantener la URL, título, tipo de filing, fecha, texto de la cita y marca de tiempo de recuperación. Cuando el agente compara empresas o resume factores de riesgo, requerirle que separe filings primarios de comentarios secundarios. Para workflows que alimentan hojas de cálculo, informes o decisiones aguas abajo, registrar el payload de la cita con la respuesta final. La búsqueda más rica de Claude solo es útil si la aplicación preserva el límite de conexión a tierra hasta el usuario.

[45:00] Cierre — prioridades de actualización

Para OpenClaw, probar v2026.5.18 en las superficies reales que cambiaron: build/validación de plugins, manejo de modales de navegador, disposición para reinicio de gateway, confianza del proxy HTTPS, Talk Mode en Android, topics de Telegram, voz realtime de Discord, manejo de medios de imágenes, y turns del app-server de Codex con imágenes, red sandboxed, modo código y política de emisor restringido. También verificar compatibilidad con Node 22.19 y cualquier referencia a skills locales a rutas de comandos renombradas o deprecadas.

Para Codex, actualizar a 0.131.0 y ejercitar la línea de estado del TUI, comandos de service-tier, menciones unificadas, comandos de marketplace/compartido de plugins, flujos de control remoto, ambientes remotos configurados, enrutamiento de turns del Python SDK, codex doctor, casos de sandbox de Windows si es relevante, y recuperación de estado del app-server. Para Copilot, usar modelos de agente en la nube más baratos para trabajo de reparación simple, mantener sesiones remotas con política de por medio, y revisar las correcciones de Actions con un clic como cambios de código en lugar de como respuestas finales. Para agentes financieros de Claude, preservar metadatos y citas de filings de SEC como evidencia estructurada, no solo como texto.