Episode 57: OpenClaw 2026.5.22, Claude Code 2.1.149

OpenClaw v2026.5.22 y Claude Code 2.1.149 encabezan el EP057. OpenClaw mejora el gateway, plugins, captura de notas de reunión, callbacks de Discord, fallbacks de medios/proveedor, comportamiento de subagentes, reutilización de búsqueda xAI/Grok, navegación de sesiones de chat e integridad de paquetes. Claude Code añade mejor contabilidad de uso, navegación de diffs, renderizado de listas de tareas, controles de MCP en la nube y correcciones de shell/sandbox. Luego el episodio avanza hacia noticias de IA que importan al stack: agentes administrados de Gemini, Codex para trabajo remoto y entornos híbridos, adquisición de SDK/MCP de Anthropic, escaneo de seguridad de IA y proyectos alojados en GitHub que pueden mejorar los flujos de trabajo de agentes.

[00:00] Apertura: correcciones de releases, noticias de IA y radar de proyectos reales Este episodio comienza con OpenClaw v2026.5.22 y Claude Code 2.1.149 porque ambos releases cambiaron la maquinaria de la que dependen los stacks de agentes: inicio del gateway, metadatos de plugins, notas de reunión, callbacks de Discord, comportamiento de fallback de proveedor, política del conector MCP en la nube, contabilidad de uso, diffs y seguridad del shell. Luego el carril de noticias de IA cubre Google, OpenAI y Anthropic porque cada uno movió una superficie concreta de infraestructura de agentes: sandboxes remotos administrados, sesiones de Codex supervisadas desde móvil, despliegue híbrido/on-prem de Codex, generación de SDK/MCP y escaneo de seguridad de modelos frontier. El carril de proyectos se mantiene enfocado en herramientas alojadas en GitHub alrededor de contexto semántico de código, documentación actual, enrutamiento de modelos, construcción de MCP, agentes locales, paquetes de roles y escáneres de seguridad.

[02:00] Lectura de releases de OpenClaw v2026.5.22 y Claude Code 2.1.149 La actualización de OpenClaw es amplia, pero el tema útil es la confiabilidad y capacidad en los lugares donde los stacks de agentes generalmente arrastran problemas. El gateway se apoya en lecturas de catálogo de canales estables en procesos y reutilización de instantáneas de metadatos de plugins, haciendo que el inicio y el trabajo de estado sean menos desperdiciados. El trabajo de plugins en inicio/inactividad es más perezoso, los probes irrelevantes de PATH de Linuxbrew se saltan, y los manejadores de métodos core del gateway junto con los mapas de alias de superficie pública hacen que la ruta del gateway sea más consistente. Las notas de reunión reciben una mejora real: plugins externos y proveedores de código ahora tienen un contrato más limpio, la captura puede iniciar automáticamente desde la configuración, se soportan importaciones manuales, existe acceso CLI de solo lectura, y el voz de Discord se trata como una primera fuente en vivo en lugar de una ruta secundaria.

Las superficies de agente y plugin también se mueven. OpenClaw recorta el bootstrap de subagente por defecto hasta los archivos que más importan, añade correcciones de entrega nativa de completación de subagentes, añade helpers genéricos de envío de polling de mensajes de canal y flujo de trabajo de sesión en el SDK de plugins, y clarifica los contratos de capacidad del proveedor de embedding. La superficie de control de chat obtiene búsqueda y paginación de Cargar Más en el selector de sesiones, lo cual importa una vez que un gateway tiene un backlog real. Los callbacks de componentes de Discord ahora tienen un TTL limitado, reduciendo el riesgo de que botones de revisión antiguos o callbacks de UI obsoletos permanezcan vivos más allá de su vida útil. El manejo de proveedores se vuelve más limpio: OAuth de xAI puede reutilizarse para búsqueda web de Grok, los alias de modelos y timeouts de operación mejoran, CLI de Antigravity se convierte en un fallback de menor prioridad de imagen/video después de APIs de proveedor configuradas, y la generación de imágenes con clave API de Codex usa la API nativa de Imágenes de OpenAI. Añade la actualización de dependencias, protobufjs 8.4.0, trabajo de dependencias bloqueadas, poda de catálogo, limpieza de write-lock de sesión, turnos sin herramientas de vLLM estrictos, correcciones de topics de Telegram, correcciones de bypass de proxy local de Chrome/Ollama, y esto es un real release de mantenimiento y capacidad.

La actualización 2.1.149 de Claude Code es más pequeña, pero golpea el uso diario. /usage puede mostrar uso de límites por categoría, incluyendo skills, subagentes, plugins y costo por servidor MCP. La vista de detalle de /diff soporta scroll con teclado. La salida Markdown renderiza checkboxes de listas de tareas con estilo de GitHub. Los admins de Enterprise obtienen una configuración administrada allowAllClaudeAiMcps para cargar conectores MCP de claude.ai en la nube junto con configuración MCP administrada. Las correcciones son la historia de seguridad: bypass de permisos de PowerShell a través de funciones incorporadas de cambio de directorio, allowlists de escritura de sandbox que accidentalmente cubrían demasiado de un worktree de git, bugs de reglas de prefijo/wildcard de PowerShell, seguimiento de variables obsoletas alrededor de PWD/OLDPWD/DIRSTACK, una falla de find en macOS que podría agotar tablas de archivos en directorios grandes, y varias correcciones de sesión remota, configuraciones administradas, helper de telemetría, transcripción y UI. La versión 2.1.150 es solo infraestructura interna, así que el delta visible para el usuario es 2.1.149 incluso cuando el paquete instalado es más nuevo.

[10:00] Gemini 3.5 Flash y Agentes Administrados de Gemini API El anuncio de Gemini 3.5 Flash de Google merece tratarse como noticia de infraestructura de agentes, no solo marketing de modelos. Google dice que 3.5 Flash está construido para flujos de trabajo agenticos y codificación, con afirmaciones más fuertes en Terminal-Bench, GDPval-AA, Atlas de MCP, multimodal, velocidad y tareas de largo horizonte. La pregunta importante no es si un benchmark gana la semana. Es si un modelo rápido puede mantenerse lo suficientemente bueno a través de largos bucles con herramientas pesadas donde la latencia y la supervisión importan.

El lanzamiento de Agentes Administrados de Gemini API hace eso concreto. Una sola llamada puede levantar un agente impulsado por Antigravity en un entorno Linux aislado y efímero. El agente puede razonar, llamar herramientas, ejecutar código, gestionar archivos y navegar la web. Las llamadas de seguimiento pueden reutilizar un entorno, así que el estado puede continuar en lugar de que cada solicitud se convierta en un prompt stateless fresco. Los desarrolladores pueden definir agentes personalizados con instrucciones, skills y datos en archivos estilo AGENTS.md y SKILL.md. Eso es directamente relevante para el pensamiento de OpenClaw local y Hermes: qué debería permanecer local porque toca credenciales o código privado, y qué puede moverse de manera segura a un sandbox administrado porque el entorno es controlado, descartable y más fácil de escalar.

[17:00] Supervisión remota de Codex, tokens de acceso y entornos híbridos La dirección de Codex de OpenAI es sobre supervisión y forma de despliegue. Codex en la app móvil de ChatGPT permite a un usuario conectar a trabajo activo ejecutándose en un Mac o entorno remoto, ver estado de proyecto en vivo, aprobar comandos, revisar salida de terminal, capturas de pantalla, resultados de pruebas y diffs, luego redirigir la tarea sin estar en la máquina host. Eso importa porque los agentes de codificación de larga duración no fallan solo por falta de inteligencia. Fallan porque llegan a un punto de decisión y esperan, o toman el camino equivocado porque un humano no estaba ahí para dar un poco de juicio.

El lado enterprise es igual de importante. SSH remoto está generalmente disponible, Codex puede funcionar dentro de entornos remotos administrados, los hooks pueden escanear prompts en busca de secretos o ejecutar validadores, y los tokens de acceso programáticos dan a flujos de trabajo no interactivos una identidad de workspace con alcance. La asociación con Dell apunta a entornos híbridos y on-prem donde el código, los datos, las políticas y el compute aprobado ya residen. Esa es la historia seria de Codex: un agente de codificación que puede ser supervisado desde cualquier lugar mientras todavía se ejecuta cerca de los archivos, credenciales y controles que necesita.

[24:00] Stainless de Anthropic y Project Glasswing La adquisición de Stainless por Anthropic es una historia de conectividad de agentes. Stainless convierte especificaciones de API en SDKs, CLIs y servidores MCP en múltiples lenguajes, y Anthropic dice que Stainless ha generado SDKs oficiales de Anthropic desde temprano en la API de Claude. Para los agentes, esto importa porque un agente solo es tan útil como los sistemas a los que puede alcanzar de manera segura y correcta. SDKs limpios, CLIs y servidores MCP no son trabajo aburrido de wrapper; son los mangos que los agentes usan para actuar.

Project Glasswing es el lado más oscuro de esa misma aceleración. Anthropic dice que Claude Mythos Preview ha sido usado con socios para escanear más de mil proyectos de código abierto e identificar grandes cantidades de vulnerabilidades de severidad alta o crítica. El cuello de botella cambia de encontrar problemas a verificarlos, divulgarlos y parcharlos. Para un stack de agentes, la lección no es "soltar cada modelo en cada repo". Es alcance, evidencia, verificación y flujo de reparación. La IA puede aumentar el throughput de seguridad, pero el proceso humano y de mantenedores tiene que absorber los hallazgos sin causar caos.

[32:00] Proyectos de GitHub: inteligencia de codebase para Claude Code, Codex y Hermes El mejor carril de proyectos de GitHub para este stack comienza con inteligencia de codebase. Serena trae herramientas de recuperación semántica, edición, refactorización y debugging basadas en MCP. Claude Context da a Claude Code y otros agentes búsqueda semántica de código sobre repos grandes. Sourcebot aloja por cuenta propia búsqueda de código, navegación, exploración de archivos y Q&A de repo con citas. Understand-Anything convierte codebases en grafos interactivos que humanos y agentes pueden preguntar. Chunkhound y Code Review Graph empujan inteligencia de código local-first y mapas persistentes.

La prueba práctica es simple: elige un repo grande y pide a un agente que planifique un cambio dos veces. Primero, déjalo usar solo búsqueda integrada y contexto de transcripción. Luego dale un mapa semántico o herramienta de inteligencia de código MCP y ve si el plan toca menos archivos equivocados, hace mejores preguntas y evita sobrecarga de contexto. Si la respuesta es sí, la mejora del stack no es un prompt más grande. Es un mejor mapa.

[39:00] Proyectos de GitHub: documentación actual, enrutamiento de modelos, constructores de MCP, agentes locales y escáneres de seguridad El segundo grupo de proyectos cambia operación en lugar de contexto. Claude Code Router enruta solicitudes a través de proveedores y modelos, lo cual es útil cuando trabajo de fondo, trabajo barato, trabajo de largo contexto y trabajo de alto razonamiento no deben todos golpear el mismo modelo. mcp-use ayuda a construir e inspeccionar servidores y apps MCP en TypeScript o Python. goose es un agente de escritorio/CLI/API local con soporte multi-proveedor y extensión MCP. gstack empaqueta roles y flujos de trabajo de Claude Code para revisión, QA, release, seguridad y planificación. deepsec usa agentes de codificación para escaneo de vulnerabilidades. Las herramientas de context-mode y setup-sync intentan reducir ruido de salida y mantener configuraciones multi-harness consistentes a través de Claude Code, Codex, OpenCode, Gemini CLI y agentes adyacentes.

Context7 pertenece a este grupo porque la documentación actual de bibliotecas es una de las formas más rápidas de reducir alucinaciones de API obsoletas. Claude Code Router es útil solo cuando la elección de proveedor permanece visible. mcp-use es más fuerte cuando la primera superficie de herramientas es estrecha e inspeccionable. goose vale la pena observar como punto de comparación de agentes locales. gstack es útil si sus roles producen evidencia concreta de revisión en lugar de ceremonia pulida. deepsec pertenece en trabajo de seguridad con alcance donde los hallazgos pueden verificarse. Estos proyectos son interesantes porque se sientan entre el modelo, el repo, las herramientas y el loop de decisión humano.

[46:00] Cierre La cola del EP057 es directa. OpenClaw v2026.5.22 hace que el gateway, plugins, fuentes de notas de reunión, fallbacks de proveedores, navegación de sesiones y controles de Discord sean más sólidos. Claude Code 2.1.149 mejora la visibilidad de uso, revisión de diffs, renderizado de listas de tareas, política de conector MCP en la nube administrada y seguridad de shell/sandbox. Los Agentes Administrados de Gemini muestran que los sandboxes de agentes remotos se están convirtiendo en producto. Codex se mueve hacia ejecución híbrida supervisada desde móvil, con alcance de tokens, gobernada por hooks. El trabajo de Stainless y Glasswing de Anthropic muestra la convergencia de generación de SDK/MCP y escaneo de seguridad de IA. El radar de GitHub es la capa práctica: mapas de código, documentación actual, enrutadores, constructores de MCP, agentes locales, paquetes de roles, escáneres y herramientas de setup que se ganan su lugar solo cuando hacen el trabajo de agentes más concreto y verificable.