Episode 66: Corte de Claude el viernes, Corrección .168 de

[00:00] Intro: Cambio de cadencia mensual de OpenClaw v2026.6.5-beta.2, corrección tardía de Claude Code .168, superapp ChatGPT de OpenAI, Apple WWDC 2026, expansión de Anthropic Mythos, Microsoft MAI en Copilot, Gemma 4 12B en Mac

La versión preliminar de OpenClaw v2026.6.5-beta.2 es el lanzamiento principal del ciclo. Cambió los trenes de lanzamiento a un esquema de numeración de parches mensuales con el piso de junio de 2026 anclado en 5.28. El build incluye el nuevo proveedor bundled de web_search paralelo, coerción de resultados de herramientas MCP para bloques no textuales y no de imagen, recuperación de extended-thinking de Anthropic después del vencimiento del prompt-cache, y una corrección del modo node en macOS. La pila de Claude también sufrió una interrupción el viernes 5 de junio durante aproximadamente dos horas a partir de las 11:19 a.m. EDT, afectando a Claude API, Claude Code, claude.ai y Claude Cowork con tasas de error elevadas que impactaron principalmente a Opus 4.7 y 4.8 — Downdetector alcanzó cerca de mil reportes en EE.UU. antes de que Anthropic confirmara que el incidente se resolvió a primera hora de la tarde del viernes. Claude Code 2.1.168 es la respuesta al día siguiente: una corrección de errores enfocada, un día tarde, sobre la base .167 que cierra los errores de session attachment, ordenamiento de eventos stream-json y manejo de interrupciones, varios de los cuales coinciden con los modos de falla que los usuarios reportaron durante la ventana de interrupción. Después del bloque harness, OpenAI está reconstruyendo ChatGPT en una superapp de coding-agents antes de una IPO en otoño, Apple WWDC 2026 abre con una Siri construida con Gemini, Anthropic amplía Project Glasswing a más de 150 organizaciones, Microsoft envía MAI-Thinking-1 y MAI-Code-1-Flash a GitHub Copilot, y Gemma 4 12B llega a Google AI Edge Gallery para Mac como un modelo multimodal local de 16GB. El carril MCP es breve esta semana — un breve párrafo, no un análisis profundo. El radar de proyectos cubre A2A v1.0 y el harness Python de CheetahClaws.

[02:00] Interrupción de Claude del viernes (5 de junio), corrección de errores tardía de Claude Code .168, cambio de cadencia mensual de OpenClaw v2026.6.5-beta.2 — cobertura del lanzamiento

La pila de Claude sufrió un impacto de aproximadamente dos horas el viernes 5 de junio de 2026, comenzando a las 11:19 a.m. EDT. Anthropic confirmó tasas de error elevadas en Claude API, Claude Code, claude.ai y Claude Cowork. La interrupción afectó principalmente a Opus 4.7 y 4.8, y Downdetector alcanzó cerca de mil reportes en EE.UU. — cuarenta por ciento Claude Chat, treinta y tres por ciento Claude Code, veinte por ciento la app de Claude. La página de estado de Anthropic mostró que el incidente se resolvió a primera hora de la tarde del viernes, y la declaración pública fue que las tasas de éxito habían vuelto a los niveles esperados. La interrupción es la razón real por la que Claude Code .168 se lanzó al día siguiente. El lanzamiento es una corrección de errores enfocada sobre la base .167 que cierra los problemas de session attachment, regresiones en el ordenamiento de eventos stream-json y errores de manejo de interrupciones — varios de los cuales coinciden con los modos de falla que los usuarios reportaron durante la interrupción. La lección para la capa harness es el tiempo de respuesta operativa. Una interrupción de dos horas el viernes, un lanzamiento de corrección de errores el sábado, y una entrada de changelog en la misma semana es lo nuevo normal para la pila de agents.

Claude Code 2.1.168 es el latest de npm, publicado el 6 de junio a las 23:41 UTC, un día después de la ola de lanzamientos .166 y .167. La versión está verificada desde el registry de npm y el changelog. Este es un lanzamiento de corrección de errores enfocado, no un lanzamiento de características. Las notas del lanzamiento describen una ola de limpieza que cierra los problemas de session attachment, regresiones en el ordenamiento de eventos stream-json y errores de manejo de interrupciones reportados contra la base .167. El alcance importa porque esas tres superficies son exactamente donde el trabajo de background agent sale mal silenciosamente. Una sesión en background que no logra adjuntarse limpiamente es una sesión que pierde su tarea en ejecución, y el modo de falla es invisible hasta que el operador se reconecta y encuentra una lista de tareas vacía. Una sesión stream-json que maneja mal el ordenamiento de eventos es una sesión que pierde trabajo a mitad de una tool-call, y el consumidor al otro extremo del pipe JSON ve un evento parcial o duplicado. Un handler de interrupción que traga un keypress es una sesión que parece estar colgada cuando en realidad aceptó el input y está esperando al modelo. El punto uno sesenta y ocho es la pasada de limpieza para el punto uno sesenta y siete, y el equipo sacó el parche en menos de un día del lanzamiento de características. Los metadatos de la versión también merecen una nota. El dist-tag latest de npm es punto uno sesenta y ocho, y el dist-tag stable de npm permanece en punto uno cincuenta y tres. Esa brecha entre latest y stable es intencional. Anthropic usa el dist-tag latest para avanzar a través de lanzamientos de limpieza mientras mantiene stable anclado a un build conocido como bueno para entornos de fleet que prefieren no perseguir cada punto release. El delta de comportamiento entre punto uno sesenta y siete y punto uno sesenta y ocho está en la estabilidad de sesión, no en la capacidad. Las sesiones en background que estaban trabadas deberían reanudarse limpiamente. Los consumidores de stream-json que estaban recibiendo eventos de herramientas truncados o duplicados deberían ver un ordenamiento de eventos limpio. Los usuarios interactivos que presionaron interrupt al inicio de un turno y observaron que la sesión ignoraba el keypress ahora deberían ver la interrupción aceptada.

La línea de OpenClaw se mueve en un eje diferente. La versión preliminar v2026.6.5-beta.2 publicada el 7 de junio lleva el nuevo esquema de numeración de parches mensuales, y el piso de junio de 2026 está anclado en cinco punto dos ocho. El cambio significativo es estructural. El tren de lanzamiento ha cambiado a una cadencia mensual, y el esquema de nomenclatura de versiones ha cambiado. El próximo lanzamiento estable de OpenClaw tiene una cadencia mensual, y los operadores deben esperar una nueva forma en adelante. Las etiquetas pre-transición permanecen compatibles, lo que significa que nada se rompe en la actualización, y los despliegues existentes de seis punto uno continúan funcionando sin intervención. El bundle de la versión preliminar de junio en sí es denso. El proveedor bundled de web_search paralelo reemplaza una dependencia externa con una implementación in-process, y la ganancia es latencia y confiabilidad en la ruta de búsqueda. El proveedor bundled elimina un salto de red y una superficie de API de terceros, lo que significa que una llamada de herramienta que devuelve resultados de búsqueda ya no depende de que un servicio externo esté disponible. La coerción de resultados de herramientas MCP maneja bloques de resultados no textuales y no de imagen de manera uniforme, así que una herramienta que devuelve un payload estructurado ya no necesita un adapter personalizado para que el agent lo consuma. La recuperación de extended-thinking de Anthropic después del vencimiento del prompt-cache cierra una clase de problemas de recuperación donde el prompt cache se invalida y el estado de extended-thinking se pierde. La corrección del modo node en macOS previene una autoreconexión silenciosa alejada de una sesión de Gateway directa saludable. OpenClaw estable permanece en seis punto uno desde el 3 de junio.

[12:00] OpenAI ChatGPT "superapp" — chat is dead

El Financial Times reportó el 7 de junio que OpenAI está preparando la mayor revisión de ChatGPT desde su lanzamiento. El pitch desde dentro de la empresa es directo, y un empleado senior de OpenAI le dijo al FT que "chat is dead." El nuevo ChatGPT está siendo reconstruido como una superapp unificada que integra Codex, AI agents, generación de imágenes y servicios de terceros. La superficie del producto se está reduciendo a un solo producto de ingresos que hace el trabajo en lugar de conversar sobre él. Thibault Sottiaux, quien lidera el producto core y la plataforma de OpenAI, enmarcó el objetivo como "un agente personal capaz de ayudarte en todo en tu vida, ya sea personalmente o en el trabajo." El contexto estratégico es una carrera hacia la IPO. Anthropic filed confidentially el 1 de junio. Se espera que OpenAI siga en las próximas semanas. Los ingresos anualizados de Anthropic alcanzaron $47 mil millones en mayo, frente a $30 mil millones a principios de año, principalmente por Claude Code y la preview de Mythos. A OpenAI se le está diciendo por parte de los inversores que necesita un camino de ingresos más claro, y la superapp es eso. El movimiento también explica el wind-down de Sora. En marzo, el Wall Street Journal reportó que OpenAI estaba abandonando "side quests" como el producto de video Sora independiente. La estrategia de superapp confirma esa lectura. OpenAI está consolidando su superficie en un solo producto de ingresos en lugar de un portafolio de experimentos. ChatGPT Plugins, el primer intento de la compañía de esta consolidación en marzo de 2023, no pegó. El intento de 2026 tiene una base diferente. Codex es real, el coding agentic está pagando, y el cliente enterprise ya tiene un camino de single sign-on. El framing de "chat is dead" es el reset de marketing — el framing anterior era assistant, el actual es coworker.

[22:00] Apple WWDC 2026 — Siri construida con Gemini

WWDC 2026 abre el 8 de junio a las 10:00 a.m. PT con un keynote pregrabado transmitido desde Apple Park. Esta es la última WWDC de Tim Cook como CEO antes de entregar el rol a John Ternus en septiembre. El titular es la revisión de Siri que Apple ha estado anunciando y retrasando desde WWDC 2024. La nueva Siri está construida sobre un modelo personalizado de Gemini desarrollado conjuntamente con el equipo de Gemini de Google como parte de la alianza Apple-Google de enero de 2026. El set de características reportado: más conversacional, aware del contexto, manejo de tareas de múltiples pasos, acciones que abarcan apps, y una app independiente de Siri capaz de competir directamente con ChatGPT, Claude y Gemini. Mark Gurman de Bloomberg reporta una nueva sección de "Visual Intelligence" en la app de Cámara que usa Google Image Search para reconocimiento de objetos. Los reportes también apuntan a características de Fotos impulsadas por IA, wallpapers de IA vinculados al estado de ánimo del usuario, Genmoji expandido, e integración de un agente de IA en el App Store. El lineup de sistemas operativos se envía como iOS 27, iPadOS 27, macOS 27, watchOS 27 y visionOS 27. iOS 27 necesita acomodar el primer iPhone plegable de Apple que se envía en septiembre. Se espera que el iPhone Fold soporte dos apps lado a lado por primera vez, con una pantalla tipo iPad cuando esté abierto.

[32:00] Project Glasswing de Anthropic se amplía a más de 150 organizaciones

Anthropic anunció el 2 de junio que Project Glasswing, su programa joint industry para encontrar y corregir vulnerabilidades críticas de software usando IA, se está expandiendo a aproximadamente 150 nuevas organizaciones en más de 15 países. La expansión cubre energía, agua, salud, comunicaciones y hardware. Industrias que no estaban "bien representadas" en la cohorte original de 50 socios que obtuvo acceso a la preview de Claude Mythos en abril. El nuevo acceso va a Okta, el vendor de identidad y seguridad basado en EE.UU., a las compañías surcoreanas Samsung, SK Hynix y SK Telecom, a la OTAN, a la agencia de ciberseguridad de la UE ENISA, y otros. Se reporta que la cohorte original ha usado Mythos para encontrar más de 10,000 defectos de seguridad de alto o crítico nivel. Anthropic dice que está "trabajando tan rápido como podemos para liberar de manera segura capacidades de nivel Mythos" al público, pero la liberación pública espera "salvaguardas altamente robustas" para prevenir el mal uso. Politico reportó esta semana que Anthropic se ha comprometido a hacer los modelos de clase Mythos disponibles para todos los clientes "en las próximas semanas." La línea de tiempo de IPO de Anthropic (filed confidentially el 1 de junio) está en la misma ventana. La compañía necesita un lanzamiento de modelo público de clase Mythos y una historia de seguridad lo suficientemente fuerte para que un S-1 aterrice. El contexto competitivo: OpenAI ofrece GPT-5.5 Cyber a bancos del Reino Unido a los que Anthropic hasta ahora ha bloqueado de las previews de Mythos. El UK AI Security Institute probó ambos modelos y reportó "un nivel similar de rendimiento." Ese resultado es la señal de que el frontier está genuinamente bifurcándose. Ambos labs tienen un modelo con capacidad cyber, ambos están gatekeeping el acceso cuidadosamente, y ambos están usando framing de safety para diferenciarse.

[42:00] Microsoft MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5

Microsoft usó Build 2026 el 2 de junio para anunciar su primer modelo de razonamiento avanzado in-house y un pipeline completo de modelos de soporte. MAI-Thinking-1 es un modelo "de tamaño medio" que Microsoft dice que iguala a los modelos líderes en benchmarks clave de ingeniería de software. MAI-Code-1-Flash está posicionado como eficiente en inferencia y está integrado en GitHub Copilot y Visual Studio Code. Ese es el drop más relevante para la pila de agent, porque MAI-Code ahora es una opción first-party de Microsoft para flujos en modo código en el editor al que la mayoría de los agents ya están cableados. MAI-Image-2.5 (y una variante flash) maneja text-to-image y edición de imágenes. MAI-Transcribe-1.5 es "cinco veces más rápido que modelos competidores" en speech-to-text. MAI-Voice-2 (con una versión flash "coming soon") añade 15 nuevos idiomas y nuevas opciones de voz. PCMag probó los cuatro y llamó a la nueva familia MAI "fine, y eso es lo mejor que puedo decir de ellos." El razonamiento es competitivo, los modelos de imagen y voz son funcionales pero no diferenciados, y la lección es que Microsoft ahora tiene un lineup de modelos in-house funcional que puede sustituir a OpenAI a través de paths de imagen, voz y código. Esa capacidad de sustitución es el punto estratégico. Microsoft ya no depende exclusivamente de OpenAI para la capa de modelo de su superficie de producto.

[52:00] Gemma 4 12B en Google AI Edge Gallery para Mac

Google lanzó Gemma 4 12B el 3 de junio de 2026 — un modelo de código abierto con 12 mil millones de parámetros con licencia Apache 2.0, diseñado para ejecutarse localmente en una laptop estándar con 16 gigabytes de VRAM o memoria unificada. El cambio arquitectónico es el diseño "Unified" sin encoder. Las formas de onda de audio sin procesar y los parches visuales fluyen directamente hacia el backbone del LLM sin módulos de procesamiento secundarios, lo que significa que el modelo puede escuchar, ver y razonar sin una capa de enrutamiento. La ventana de contexto es de 256K tokens, con capacidades nativas de uso de herramientas agentic y un modo de razonamiento paso a paso. Gemma 4 12B está disponible inmediatamente en Hugging Face, Kaggle y a través de Google AI Edge Gallery, que se lanzó en macOS el mismo día. La app complementaria Google AI Edge Eloquent de dictación también está disponible en Mac. Los cinco modelos de Google disponibles en AI Edge Gallery para Mac son todos de la familia Gemma, ajustados para comportamiento de instruct — seguimiento de instrucciones en lugar de completado de texto. La arquitectura sin encoder importa porque elimina la sobrecarga de latencia y memoria de encoders separados de audio y visión. El diseño multimodal tradicional enruta audio y visión a través de encoders dedicados que producen embeddings, y los embeddings luego se concatenan con el stream de tokens de texto y se alimentan al LLM. El diseño sin encoder omite la etapa del encoder y alimenta los tokens de audio y visión sin procesar directamente al LLM, lo que significa que el modelo aprende a manejar audio y visión como parte del mismo stream de tokens. La ganancia de latencia es real: una solicitud multimodal ya no paga el costo de inferencia del encoder, y la ganancia de memoria es real: los pesos del encoder desaparecen del working set. La ventana de contexto de 256K es la otra apuesta arquitectónica. Un modelo de 12 mil millones de parámetros con una ventana de contexto de 256K es una capacidad real para pilas de agents locales.

[60:00] Carril MCP (breve mención) y radar de proyectos: CheetahClaws, A2A Protocol v1.0

Una breve nota de MCP esta semana. OpenAI está implementando Lockdown Mode y Active Sessions para ChatGPT el 8 de junio, trayendo dos controles de seguridad de cuenta más ampliamente disponibles — Lockdown Mode limita las solicitudes de red salientes para reducir la exfiltración de datos de ataques de prompt-injection, y Active Sessions permite a los usuarios revisar dónde su cuenta tiene sesiones activas. Los controles llegan a cuentas personales y Business de autoservicio. El mismo ecosistema MCP que produjo la auditoría de finales de mayo se mueve rápido en el lado de la respuesta, y las superficies de scanner y server hardening están recibiendo actualizaciones ambas. Eso es una breve mención de un párrafo, no un análisis profundo — el ciclo de noticias es pesado en modelos esta semana. CheetahClaws tres punto cero cinco es un harness de agent multimodelo nativo de Python de SafeRL-Lab, diseñado como una alternativa legible al bundle de TypeScript compilado con el que la mayoría de los agent harnesses se envían. El lanzamiento aterrizó el 4 de junio con output silencioso estilo Claude-Code como comportamiento por defecto. El loop del agent cabe en aproximadamente 740 líneas de Python, y la lista de soporte de modelos es amplia — Anthropic, OpenAI, Gemini, Kimi, Qwen, Zhipu, DeepSeek, varios otros, Ollama, LM Studio, y cualquier endpoint compatible con OpenAI. El set de características cubre registro de herramientas en runtime con plugins MCP y git, skills de markdown para definición declarativa de capacidades, un grafo de dependencias de tareas con blocks y semantics de blocked-by, compresión de contexto de dos capas, voz offline, sync de sesión en la nube, y bridges a Telegram, WeChat, Slack y QQ. El repo tiene más de 700 estrellas con actividad concentrada en el agent loop y el grafo de tareas. El trade-off es real — el manejo de errores en fallas de provider, la lógica de retry en errores transitorios de herramientas, y los hooks de observabilidad son más delgados que un harness maduro como Claude Code. El A2A Protocol alcanzó la versión uno en 2026 bajo la Linux Foundation. Originalmente lanzado por Google, A2A ahora se gobierna junto con MCP. El protocolo define agent cards — manifests de capacidades JSON para descubrimiento de agents — y una máquina de estados basada en tareas para interacciones de larga duración usando JSON-RPC 2.0. La distinción MCP versus A2A es el modelo mental clave: MCP estandariza cómo un agent se conecta a herramientas externas, bases de datos y fuentes de datos; A2A estandariza cómo los agents se comunican entre sí. El repositorio tiene más de 24,000 estrellas y desarrollo activo, y el protocolo ha alcanzado una madurez suficiente para que los builders deben estar conscientes de él al diseñar flujos de trabajo multi-agent.

[66:00] Cola práctica

La cola práctica esta semana es corta y concreta. Para Claude Code, ejecuta el comando de versión y confirma que estás en punto uno sesenta y ocho; si has estado sosteniendo una sesión en background que exhibía stalls de stream-json o problemas de interrupción en punto uno sesenta y siete, la actualización debería resolverlos. Para resiliencia ante interrupciones, observa la página de estado de Anthropic y suscríbete al feed RSS de incidentes para que puedas correlacionar errores de modelo locales con incidentes de la plataforma en tiempo real, y rota cualquier sesión larga de Claude API que pueda haber terminado a mitad de llamada durante la ventana del viernes 5 de junio. Para OpenClaw, decide si rastrear la versión preliminar de junio o mantenerte en stable en seis punto uno basado en tu política de pin de versión. Para OpenAI ChatGPT, audit productos independientes que colapsarán en la superapp y anota las rutas de exportación de datos para cualquier servicio propenso a ser deprecated. Instala el beta de iOS 27 o macOS 27 después de WWDC y prueba la nueva Siri contra ChatGPT o Claude para manejo de tareas de múltiples pasos. Para Anthropic, monitorea el anuncio de liberación pública de Mythos y pregunta a tu equipo de cuenta por la línea de tiempo. Para Microsoft, habilita MAI-Code-1-Flash en GitHub Copilot y ejecuta una prueba de completado contra tu modelo default actual. Para Gemma 4 12B, descarga el checkpoint y ejecútalo en un Mac de 16GB para comparar una tarea de coding contra tu modelo local actual. Para CheetahClaws, clona el repo y lee el agent loop de 740 líneas. Para A2A, lee la especificación de versión uno e identifica un punto de handoff en tu flujo de trabajo donde las agent cards podrían reemplazar una integración personalizada.

[68:00] Cierre

Ese es el ciclo. Primero harness, segundo model lane, tercero project radar, y por último practical queue. La caída de Claude del viernes es un recordatorio de que el agent stack ahora tiene preocupaciones reales de confiabilidad en producción, y el lanzamiento de corrección de errores al día siguiente es el patrón operativo que hace que esas preocupaciones sean manejables. Para ver las notas completas del programa con enlaces y el listado de capítulos, consulta las notas del programa en Toby On Fitness Tech punto com.

Gracias por escuchar AgentStack Daily.

Volveremos pronto.