
AgentStack Daily EP050 – Was gibt's Neues bei Agent-Releases
Diese AgentStack Daily-Folge behandelt, was es Neues im Bereich LLM- und Agent-Tooling gibt. Hermes Agent v2026.5.7 führt Durable Boards, Worker-Health-Checks, Checkpoint-Pruning, Gateway-Resume, No-Agent-Cron, Provider-Plugins, Platform-Allowlists und MCP-Fixes ein, während Claude Code v2.1.141 bis v2.1.129 die Agent-Ansicht, Hook-JSON-Updates, Plugin- und Workload-Identity-Kontrollen, MCP-Reparaturen sowie Hintergrund-Agent-Berechtigungskorrekturen hinzufügt. Google ADK dokumentiert das Pausieren und Fortsetzen von Agents mit persistiertem Zustand, und GitHub enthüllt… Show notes: https://tobyonfitnesstech.com/de/podcasts/episode-50/
🎧 Listen to EpisodeAgentStack Daily EP050 beginnt mit dem aktuellen Agent-Tooling-Stack in einfacher Sprache und geht dann zur Release-Spotlight der Woche über: Hermes Agent v2026.5.7 und Claude Code v2.1.141 bis v2.1.129. OpenClaw ist die Runtime-Basislinie in der Episode, während Hermes und Claude Code die frischen Release-Schlagzeilen tragen. Das Ziel ist unkompliziert: was sich geändert hat, was hinzugefügt wurde, warum es wichtig ist und was nach dem Upgrade getestet werden sollte.
[00:00] Eröffnung — Was gibt es Neues im Agent-Stack NOVA und ALLOY stellen die Agent- und LLM-Tooling-Updates der Woche vor. Die wichtigsten Änderungen sind Hermes-Board-Durability, Worker-Visibility, Checkpoint-Pruning, Gateway-Resume, Deterministisches Cron, Provider-Plugins, Plattform-Richtlinien, MCP-Transport-Fixes, Claude Code Agent-Visibility, Reichhaltigere Hook-Ausgabe, Plugin-Kontrollen, Workload-Identity-Scoping, MCP-Reparaturen und Background-Agent-Berechtigungsfixes. OpenClaw bleibt die Operator-Runtime in der Geschichte, während Hermes und Claude Code heute die frischen Release-Schlagzeilen tragen.
[02:30] Release-Durchsicht — Hermes Agent v2026.5.7 Bevor es zu den Release-Details geht, definiert die Episode die wichtigsten Tools in praktischer Sprache. OpenClaw ist die Operator-/Runtime-/Channel-/Tool-/Browser-/Media-/Proof-Schicht. Hermes ist das Multi-Agent-Board für Delegation, Durability, Task-State und Worker-Health. Claude Code ist der terminal-lokale Coding-Agent mit Hooks, MCP, Projekt-Einstellungen und Background-Agents. Codex ist die repo-fokussierte Coding-, Patch- und Review-Spur. Google ADK ist ein App-Framework für langlebige Agents, die persistenten State und Pause-/Resume-Verhalten benötigen. GitHub Copilot Agent-Tasks sind GitHub-gehostete asynchrone Coding-Tasks, die über API, Branch, Status und Pull-Request-Oberflächen exponiert werden.
Hermes v2026.5.7 ist der Haupt-Release-Block. Die konkreten Ergänzungen umfassen Multi-Agent-Kanban-Verbesserungen, Worker-Heartbeats, Stale-Task-Reclaim, Darwin-Zombie-Detection, /goal, Checkpoints v2, Checkpoint-Pruning, Disk-Guardrails, Gateway-Auto-Resume, Source-Reload-Verhalten, no_agent-Cron-Modus, Provider-Plugins, OAuth/SSE/MCP-Reparaturen, WhatsApp-Stranger-Rejection, Plattform-Allowlists, Guild-scoped Discord-Rollenrichtlinie und Sicherere-Redaction-Standards. Behandeln Sie jeden Punkt als Produkt-Delta. Kanban plus Ownership bedeutet, dass das Board anzeigen kann, wer eine Aufgabe hat, anstatt den Status in einem Transcript zu vergraben. Heartbeats und Stale-Reclaim bedeuten, dass ein verschwundener Worker zu einem erkennbaren Zustand wird. Darwin-Zombie-Detection schließt eine lokale Zuverlässigkeitslücke auf macOS. /goal gibt einem Run ein benanntes Ziel. Checkpoint-Pruning und Disk-Guardrails reduzieren Persistence-Clutter. Gateway-Auto-Resume macht Neustarts weniger destruktiv. no_agent-Cron ermöglicht deterministische Checks ohne Modell. Provider-Plugins machen Integration weniger hard-codiert. MCP-Fixes rund um OAuth, SSE, Keepalives, Stale-Pipes, Bild-Ergebnisse und Reconnects machen Tool-Calls weniger fragil. Plattform-Allowlists, WhatsApp-Stranger-Rejection, Discord-Rollen-Scope und Redaction-Standards verschärfen, wer Arbeit auslösen kann und welche Daten leaken. Der praktische Takeaway ist eine Release-Testliste: Board-State, Worker-Health, Resume, Cron, Plugin-Loading, MCP-Transport und Channel-Richtlinie. Erwähnen Sie auch die Migrationsform. Nach dem Upgrade sind die nützlichen Fragen konkret: Zeigt ein laufendes Board Live-Ownership, wird ein toter Worker reclaimed, setzt ein Checkpoint mit dem neuesten Task-State fort, hält Pruning die Disk-Nutzung begrenzt, bewahrt ein Gateway-Restart benutzer-sichtbare Arbeit auf, erzeugt ein Script-only-Cron die erwartete Benachrichtigung, laden Provider-Plugins sauber, reconnecten MCP-Tools nach Auth-Refresh oder Transport-Unterbrechung, und blockieren Channel-Allowlists den falschen Sender. Das hält das Segment fokussiert auf neue Features und Verifizierung.
[19:00] Release-Durchsicht — Claude Code v2.1.141 bis v2.1.129
Claudius aktuelle Versionen von Code fügen sichtbares Agent-Management und sauberere Extension-Oberflächen hinzu. Das größte für die Hörer relevante Element ist claude agents, plus Projekt-Filterung durch claude agents --cwd. Hooks gewinnen JSON-Ausgabefelder wie terminalSequence, direkte args und besseres Fortsetzungsverhalten bei blockierter Tool-Nutzung. Plugin-Quell-Kontrollen, HTTPS-Quell-Kloning, Managed-Setting-Migration, CLAUDE_PROJECT_DIR, ANTHROPIC_WORKSPACE_ID, Workload-Identity-Scoping, MCP-Server-Erhaltung nach Clear, Verbesserungen bei Concurrent OAuth-Refresh und Background-Agent-Berechtigungsvererbung zeigen alle auf ein Tool, das in echten Projekten einfacher zu betreiben wird. Die praktische Testliste ist einfach: Können Sie laufende und blockierte Agents sehen, erzwingen Hooks weiterhin Richtlinien, überleben MCP-Server erwartete Lifecycle-Events, verhalten sich Plugin-Kontrollen wie konfiguriert, und vererben Background-Agents den beabsichtigten Berechtigungsmodus?
[29:00] Google ADK-Update — Persistierter State für Pause-und-Resume-Agents
Der Google ADK-Punkt ist ein Feature-Update über State. Das Tutorial zeigt einen langlebigen Agent, der current_step, ToolContext.state, einen Session-Service, SQLite für lokale Entwicklung, Cloud SQL für langlebigere Deployments und externe Wakeups wie Webhooks verwendet. Die Bedeutung ist, dass ein Agent für Genehmigung, Zahlung, Kundeneingabe oder ein anderes externes Signal pausieren und von explizitem State fortfahren kann, anstatt sich auf einen riesigen replaysierten Transcript zu verlassen. Die Episode sollte den Mechanismus abdecken: Tools schreiben State, Anweisungen können State interpolieren, ein Datenbank-gestützter Session-Service behält die wichtigen Felder, und die App kann testen, ob die nächste Aktion sicher ist.
[39:00] GitHub Copilot Agent-Tasks — Coding-Arbeit bekommt eine API-Oberfläche Githubs Copilot Agent-Task REST API öffentliche Vorschau macht Cloud-Coding-Tasks zu adressierbaren Objekten. Die Docs zeigen Task-Erstellung, Modell-Auswahl, Repository-Kontext, Branch- oder Pull-Request-Output, Task-Status-Inspektion und einen Lifecycle, der durch normale Repository-Reviews gating werden kann. Die wichtige Änderung ist nicht, dass Copilot Code schreiben kann; es ist, dass Copilot-Coding-Arbeit über eine Plattform-API gestartet, verfolgt und überprüft werden kann. Erwähnen Sie die Einschränkungen: API-Versionierung, Authentifizierung und Token-Scope, Enterprise- oder Repository-Richtlinien, Status-Zustände, Branch-Artefakte, CI-Checks und Human-Review vor Merge.
[47:00] Abschluss — Was als nächstes zu testen ist
Der Takeaway ist eine prägnante Test-Checkliste. Für Hermes: Worker-Health, Stale-Reclaim, Checkpoints, Gateway-Resume, Cron-Modus, Plattform-Allowlists, Redaction und MCP-Reconnects testen. Für Claude Code: claude agents, --cwd, Hooks, Plugin-Richtlinie, Workload-Identity, MCP-Lifecycle und Background-Agent-Berechtigungen testen. Für ADK: Persistierten State nach einer Verzögerung testen. Für Copilot-Tasks: Task-Erstellung, Status-Polling, Pull-Request-Erstellung und CI/Review-Gating testen. Dies sind die neuen Oberflächen, die diese Woche zu überprüfen sind.