
Hermes Agent v0.16.0 Aplicación de Escritorio, Codex 0.137 Multi-Agente v2, Modelos de Respaldo de Claude Code y Gemma 4 12B en la Stack Local
Hermes Agent v0.16.0 — «The Surface Release»— lanza una aplicación de escritorio nativa con OAuth remoto, arrastrar y soltar archivos y un panel de administración web. Codex 0.137 incorpora persistencia de runtime multi-agente v2 y búsqueda web paralela, mientras que Claude Code 2.1.166/2.1.167 introduce cadenas de modelos de respaldo y reglas de denegación de nombres de herramientas glob. Gemma 4 12B es el último modelo abierto de 12B de Google que funciona localmente en un portátil con 16GB de VRAM. Show notes: https://tobyonfitnesstech.com/es/podcasts/episode-65/
🎧 Listen to EpisodeEpisodio 65 — 6 de junio de 2026
[00:00] Gancho del episodio
Hermes Agent v0.16.0 (v2026.6.5) lanza "The Surface Release" el 6 de junio de 2026 — una aplicación de escritorio nativa multiplataforma con conexión remota OAuth, entrada de archivos arrastrar y soltar, y un panel de administración web completo basado en navegador, todo distribuido en 874 commits y 542 PRs fusionados desde v0.15.2. OpenAI Codex rust-v0.137.0 añade persistencia de elección de runtime multi-agente v2 por hilo, búsqueda web independiente paralela, y controles de límite de crédito empresarial. Claude Code 2.1.166 introduce cadenas de modelos de respaldo configurables de hasta tres modelos y reglas de denegación de nombre de herramienta con patrones glob, con 2.1.167 siguiendo como versión de corrección de errores. Gemma 4 12B es la versión de peso abierto de Google del 3 de junio que coloca un modelo multimodal sin codificador de 12B parámetros en el punto óptimo de 16GB de VRAM para flujos de trabajo agentes locales. El radar del proyecto cubre A2A Protocol v1.0 como la capa formal de interoperabilidad de agentes, Kimi Code CLI como un agente de codificación terminal nativo de TypeScript, y el índice de recursos curados awesome-ai-agents-2026.
[02:00] Hermes Agent v0.16.0 — aplicación de escritorio nativa, conexión remota OAuth y panel de administración web
Hermes Agent v0.16.0 es la versión que cambia cómo Hermes se encuentra con el desarrollador. El titular es una verdadera aplicación de escritorio Electron nativa — no un wrapper de terminal, no una pestaña web — que se instala como cualquier otra aplicación de macOS, Linux o Windows y se actualiza automáticamente desde dentro de la aplicación. La GUI de escritorio te da una ventana de chat adecuada con streaming, una lista de sesiones que puedes archivar y buscar, archivos de arrastrar y soltar en cualquier parte del área de chat, pegado de imágenes del portapapeles, una paleta de comandos Cmd+K, y un selector de modelo justo en la barra de estado. Si has estado diciéndoles a compañeros no técnicos "es un agente CLI" y viendo cómo se les cruzan los ojos, ahora simplemente puedes enviarles un instalador.
La aplicación de escritorio no tiene que ejecutar Hermes localmente. Apúntala a una puerta de enlace remota de Hermes — tu homelab, un servidor hosted, el servidor de un compañero — y se conecta a través de un WebSocket seguro, autenticando con OAuth o nombre de usuario/contraseña. Sin trucos con flags --insecure o tokens de sesión copiados a mano. Cada perfil puede apuntar a su propio host remoto, y puedes ejecutar sesiones concurrentes en múltiples perfiles simultáneamente. Esta es la historia de conexión remota que los despliegues empresariales y de equipo de Hermes han estado esperando.
El panel web creció hasta convertirse en un panel de administración completo basado en navegador. Tienes gestión del catálogo MCP, configuración de canales de mensajería, almacenamiento de credenciales, gestión de webhooks, configuración de memoria, y login conectable OIDC o nombre de usuario/contraseña — todo desde un navegador sin tocar la CLI. La configuración inicial ahora tiene una ruta de "Configuración rápida vía Nous Portal" que te lleva de la instalación al primer mensaje en segundos, lo cual importa para incorporar nuevos usuarios o evaluar Hermes en un entorno nuevo.
El conjunto de habilidades predeterminado se recortó a lo que realmente necesitas. NVIDIA/skills se unió a los taps del Skills Hub de confianza. El selector de modelo ahora es buscable con coincidencia difusa en todas partes — escritorio, web, TUI y CLI — lo cual suena trivial hasta que tienes una larga lista de modelos y sin búsqueda. /undo finalmente te permite deshacer los últimos N turnos, que es la característica de calidad de vida que los usuarios han solicitado desde el primer lanzamiento.
Entre bastidores, dos correcciones P0 y 62 correcciones P1 viajan junto. La ronda de seguridad vale la pena mencionarla individualmente: CVE-2026-48710 fija la dependencia de Starlette a una versión específica, el endurecimiento off-loop de SSRF cierra una clase de vectores de falsificación de solicitudes del lado del servidor en rutas de solicitudes de plugins y proveedores, y el剥离 de credenciales de subprocesos asegura que las credenciales no se filtren en entornos de procesos secundarios.
Lista práctica de actualización: descarga e instala la aplicación de escritorio para tu SO; prueba el login OAuth contra una puerta de enlace remota si tienes una; explora el panel de administración web para auditar servidores MCP, canales y credenciales; ejecuta Configuración rápida vía Nous Portal en una instalación nueva para comparar la nueva experiencia de primer inicio; y verifica que /undo funciona para los últimos N turnos en tu sesión.
[16:00] Codex rust-v0.137.0 — multi-agente v2, búsqueda web paralela y controles empresariales
Codex rust-v0.137.0 publicado el 4 de junio de 2026 como la última etiqueta estable de CLI, dos lanzamientos después de la línea base rust-v0.135.0 del EP063. El cambio más arquitectónicamente significativo es multi-agente v2 con persistencia de elección de runtime: cada hilo generado ahora lleva su propia elección de runtime hacia adelante, y los agentes generados obtienen defaults más limpios de seguimiento y metadatos. Esto significa que cuando una sesión Codex padre genera un agente hijo, el hijo no pierde su lugar cuando la sesión padre transfiere — la elección de runtime se mantiene con el hilo, no solo con el proceso padre. Para flujos de trabajo de orquestación multi-agente, esta es la diferencia entre un agente que se mantiene cohesionado a través de una transferencia y uno que silenciosamente pierde contexto.
Soporte de atajos de teclado F13-F24 en la TUI y pegado en menús buscables mejoran la experiencia de terminal para usuarios avanzados que usan diseños de teclado extendidos. Los flujos empresariales y de administración ahora muestran límites de crédito mensuales y pueden aplicar bundles de configuración administrados en la nube incluyendo espacios de trabajo EDU — la visibilidad del límite de crédito cierra un vacío donde los operadores no podían ver el gasto hasta que llegaba la factura.
Los flujos de trabajo de plugins ganó salida legible por máquina codex plugin list --json y sugerencias de catálogo remoto en caché. La salida legible por máquina significa que puedes canalizar listas de plugins a scripts, pipelines de CI o herramientas de gestión de flota sin analizar texto legible por humanos. Las sugerencias de catálogo remoto en caché aceleran el flujo de descubrimiento de plugins evitando llamadas de red repetidas.
Las herramientas web hosted y de imagen están disponibles en más flujos de modo código, con búsquedas web independientes ahora capaces de ejecutarse en paralelo. La búsqueda web independiente paralela significa que Codex puede disparar múltiples consultas de búsqueda simultáneamente y sintetizar resultados en lugar de ejecutarlas secuencialmente — una victoria real de latencia para flujos de trabajo intensivos en investigación. Las solicitudes y aprobaciones de permisos ahora llevan identidad de entorno, lo que cierra un vacío donde un permiso concedido en un contexto podía aplicarse incorrectamente a través de límites de contexto. La confiabilidad de la plataforma mejoró para lanzamientos de aplicaciones macOS y inicio de SQLite en Windows, reanudación de hilos y actualizaciones de configuración de sandbox.
Lista práctica de actualización: actualiza Codex a rust-v0.137.0; prueba una sesión multi-agente para verificar que la elección de runtime persiste correctamente a través de generación y reanudación; ejecuta codex plugin list --json para ver el formato de salida legible por máquina; prueba la búsqueda web paralela en un flujo de modo código; revisa la nueva visualización de límite de crédito mensual en flujos empresariales/de administración.
[26:00] Claude Code 2.1.166/2.1.167 — cadenas de modelos de respaldo y reglas de denegación de nombre de herramienta con patrones glob
El latest de npm de Claude Code ahora es 2.1.166 y 2.1.167, siguiendo a 2.1.165. La versión 2.1.166 es la versión de características con dos adiciones visibles para el operador. El titular es una nueva configuración fallbackModel que te permite configurar hasta tres modelos de respaldo probados en orden cuando el modelo primario está sobrecargado o no disponible. El flag --fallback-model ahora también se aplica a sesiones interactivas, no solo a las de fondo — lo que significa que las sesiones de terminal interactivas también pueden automáticamente cambiar al siguiente modelo en la cadena cuando el primario se satura. Esto cambia cómo manejas la no disponibilidad del modelo: en lugar de que una sola instrucción falle cuando una API está en capacidad, Claude Code automáticamente prueba el siguiente modelo que configuraste.
El soporte de patrones glob en posiciones de nombre de herramienta de reglas de denegación es la segunda característica. Usar "*" deniega todas las herramientas. Las reglas de permiso rechazan globs no MCP, y los nombres de herramientas desconocidos en reglas de denegación ahora warnan al inicio en lugar de aceptar silenciosamente reglas mal formadas. La advertencia de inicio para nombres de herramientas desconocidos es la mejora amigable para el operador: ahora sabes al inicio si una regla de denegación está mal configurada en lugar de descubrirlo cuando la regla no se activa.
La versión 2.1.167 es puro arreglo de bugs y mejoras de confiabilidad — la ola de higiene que mantiene el tren de lanzamiento limpio entre versiones de características.
Lista práctica de actualización: añade fallbackModel a tu configuración de Claude Code con dos o tres alternativas ordenadas por preferencia; prueba la cadena haciendo temporalmente no disponible tu modelo principal y verificando que el respaldo se activa correctamente; usa "*" en una regla de denegación para probar el bloqueo completo de herramientas; verifica que nombres de herramientas desconocidos en reglas de denegación produzcan advertencias al inicio; y actualiza a 2.1.167 para las últimas correcciones de errores.
[34:00] Gemma 4 12B — modelo multimodal sin codificador en el punto óptimo de 16GB de VRAM
Google lanzó Gemma 4 12B el 3 de junio de 2026 como un checkpoint de权重 abierta bajo licencia Apache 2.0 con una ventana de contexto de 256K, diseñado para llevar la inteligencia multimodal agéntica directamente a laptops para flujos de trabajo locales. La decisión arquitectónica clave es la entrada multimodal sin codificador: la visión y el audio fluyen directamente hacia la columna vertebral del LLM en lugar de pasar por un codificador multimodal separado. Este es el mismo patrón arquitectónico que permite que los grandes modelos multimodales quepan en recuentos de parámetros más pequeños — al eliminar la sobrecarga del codificador, el modelo de 12B puede manejar entradas de imagen y audio sin una etapa de procesamiento separada que añade parámetros y latencia.
El rendimiento en benchmarks se describe como cercano al modelo de 26B de Google en tareas de razonamiento avanzado, lo que situaría a un modelo de 12B competitivo con modelos del doble de su tamaño en los benchmarks que importan para flujos de trabajo agénticos. El posicionamiento para flujos de trabajo agénticos es explícito: procesamiento autónomo de datos, insights visuales y construcción de páginas web se enumeran como casos de uso objetivo. Google AI Edge proporciona el camino para el despliegue local en hardware de laptop con 16GB y 32GB de VRAM.
Para el stack de agentes, Gemma 4 12B es el modelo de权重 abierta de 12B más realista para uso de agente de codificación local en hardware de consumo. Cambia cómo se ven los flujos de trabajo agénticos local-first cuando el modelo y los pesos se mantienen en tu máquina — sin latencia de API, sin datos saliendo de tu entorno, sin costo por token. La ventana de contexto de 256K significa que puede manejar bases de código grandes o documentos largos sin la fragmentación de contexto que requieren modelos con ventanas más pequeñas.
Lista práctica de actualización: descarga el checkpoint de Gemma 4 12B desde Hugging Face y ejecútalo a través de LM Studio u Ollama en una laptop con 16GB de VRAM; compara la salida de una tarea de codificación contra tu modelo local actual; prueba la ventana de contexto de 256K en una tarea de comprensión de base de código larga o documento; y usa Google AI Edge para el camino de despliegue local gestionado si prefieres una instalación con un comando.
[42:00] Kimi Code CLI — agente de codificación nativo de terminal en TypeScript con soporte nativo de MCP
Moonshot AI lanzó Kimi Code CLI el 5 de junio de 2026 como un agente de codificación de IA de terminal de código abierto con licencia MIT escrito en TypeScript. El proyecto es el sucesor del antiguo kimi-cli y se distribuye a través de npm o un script de instalación único que no necesita Node.js preinstalado. En macOS o Linux: curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash. En Windows: irm https://code.kimi.com/kimi-code/install.ps1 | iex. La instalación global de npm requiere Node.js 24.15.0 o posterior.
Kimi Code CLI lee y edita código, ejecuta comandos de shell, busca archivos, obtiene páginas web y elige su siguiente paso basándose en retroalimentación — el bucle estándar del agente de codificación. Funciona de fábrica con los modelos Kimi de Moonshot AI y puede configurarse para usar otros proveedores compatibles. El modelo de ejecución basado en retroalimentación ejecuta operaciones de solo lectura automáticamente y pide confirmación para ediciones de archivos o comandos de shell — un flujo de aprobación que mantiene las acciones riesgosas bajo el control del desarrollador.
Las características notables incluyen una TUI rápida lista en milisegundos, entrada de video para soltar grabaciones de pantalla en el chat, configuración de MCP nativa de IA a través de /mcp-config, subagentes para trabajo paralelo (subagentes coder, explore y plan en contextos aislados), y hooks de ciclo de vida para bloquear llamadas a herramientas, auditar decisiones o activar notificaciones. La configuración de MCP a través de /mcp-config es la característica que lo vincula al stack de agentes: puedes añadir y autenticar servidores MCP desde dentro del CLI sin archivos de configuración externos.
Versión 0.11.0 publicada el 5 de junio de 2026. El proyecto tiene 1,902 estrellas en GitHub y desarrollo activo.
Lista práctica de actualización: instala Kimi Code CLI y verifica con kimi --version; conéctalo a tu clave de API de Kimi o OAuth de Moonshot AI; prueba la configuración de un servidor MCP a través de /mcp-config; ejecuta un subagente en paralelo contra una tarea de base de código; y compara la calidad de ejecución contra tu agente CLI actual.
[50:00] Protocolo A2A v1.0 — la capa formal de interoperabilidad de agentes
El Protocolo Agente-a-Agente alcanzó v1.0 en 2026 bajo la Fundación Linux, estableciendo una especificación formal para cómo los agentes de diferentes marcos se descubren entre sí, establecen canales de comunicación y delegan tareas. El protocolo define "tarjetas de agente" — manifiestos de capacidades en JSON — para el descubrimiento de agentes, y una máquina de estados basada en tareas para interacciones de larga duración usando JSON-RPC 2.0. Originalmente lanzado por Google, A2A ahora está gobernado por la Fundación Linux junto con MCP.
La distinción MCP versus A2A es el modelo mental clave: MCP estandariza cómo un agente se conecta a herramientas externas, bases de datos y fuentes de datos — se trata de lo que un agente puede hacer. A2A estandariza cómo los agentes se comunican entre sí — se trata de cómo los agentes trabajan juntos. MCP ya está ampliamente adoptado en el stack de agentes. A2A v1.0 es el protocolo complementario que permitirá la transferencia de agentes entre marcos sin código de integración personalizado para cada par.
El repositorio a2aproject/A2A tiene 24,153 estrellas y desarrollo activo hasta el 6 de junio de 2026. Para el stack de agentes, A2A v1.0 es la capa de interoperabilidad que permitirá que una sesión de Claude Code delegue a un agente Hermes, o que un agente OpenClaw transfiera a un hilo de Codex — sin construir una integración personalizada para cada par. El protocolo ha alcanzado una madurez suficiente para que los constructores deben estar conscientes de él al diseñar flujos de trabajo multi-agente.
Lista práctica de actualización: lee la especificación A2A v1.0 en el repositorio de GitHub a2aproject/A2A para entender la estructura de tarjetas de agente y la semántica de la máquina de estados de tareas; si estás construyendo un flujo de trabajo multi-agente, diseña los puntos de transferencia de agentes teniendo en cuenta las tarjetas de agente de A2A; y prueba una delegación de agente entre marcos si tienes dos entornos de ejecución de agentes diferentes disponibles.
[58:00] Cola práctica
Para Hermes Agent, descarga el instalador de la aplicación de escritorio y ejecútalo contra tu gateway existente; prueba la conexión remota OAuth si tienes un Hermes alojado; explora el panel de administración web para auditar servidores MCP y credenciales. Para Codex, actualiza a rust-v0.137.0 y prueba la persistencia de elección del runtime v2 multi-agente a través de un ciclo de spawn y resume. Para Claude Code, añade fallbackModel a tu configuración con dos o tres alternativas; prueba la regla de denegación glob "*" para bloqueo completo de herramientas. Para Gemma 4 12B, descarga el checkpoint desde Hugging Face y ejecútalo en una máquina con 16GB de VRAM; compara una tarea de codificación contra tu modelo local actual. Para Kimi Code CLI, instálalo y conecta un servidor MCP a través de /mcp-config. Para A2A, lee la especificación v1.0 e identifica un punto de transferencia multi-agente en tu flujo de trabajo donde las tarjetas de agente de A2A podrían reemplazar una integración personalizada.