
OpenClaw 2026.5.22, Claude Code 2.1.149, Gemini Managed Agents, Codex Remote Work, Anthropic Tooling und Agent-Stack Projects
AgentStack Daily EP057 beginnt mit OpenClaw v2026.5.22 und Claude Code 2.1.149/2.1.150 und erweitert dann auf quellengestützte KI-Nachrichten und praktische GitHub-gehostete Projekte. OpenClaw verbessert das Gateway-Startverhalten, die Wiederverwendung von Plugin-Metadaten, Vereinbarungen zur Erfassung von Besprechungsnotizen, Chat-Sitzungs-Paginierung, Discord-Callback-Lebensdauern, xAI/Grok-Suche-Wiederverwendung, Plugin-SDK-Hilfsfunktionen, Provider-/Medien-Fallbacks und Zuverlässigkeitskorrekturen. Claude Code 2.1.149 fügt nutzungsbasierte Buchhaltung pro Kategorie und per Tastatur scrollbare Diff-Details hinzu. Show notes: https://tobyonfitnesstech.com/de/podcasts/episode-57/
🎧 Listen to EpisodeOpenClaw v2026.5.22 und Claude Code 2.1.149 stehen im Mittelpunkt von EP057. OpenClaw verbessert das Gateway, Plugins, Meeting-Notes-Erfassung, Discord-Callbacks, Media/Provider-Fallbacks, Subagent-Verhalten, xAI/Grok-Suchwiederverwendung, Chat-Session-Navigation und Paketintegrität. Claude Code bringt besseres Usage-Accounting, Diff-Navigation, Task-Listen-Rendering, Cloud-MCP-Steuerung und Shell/Sandbox-Fixes. Dann geht es im Episodenverlauf um KI-News, die für den Stack relevant sind: Gemini Managed Agents, Codex Remote Work und Hybrid-Umgebungen, Anthropics SDK/MCP-Akquisition, KI-Sicherheitsscanning und GitHub-gehostete Projekte, die Agent-Workflows verbessern können.
[00:00] Eröffnung: Release-Fixes, KI-News und reales Projekt-Radar
Diese Episode beginnt mit OpenClaw v2026.5.22 und Claude Code 2.1.149, da beide Releases die Maschinerie verändert haben, von der Agent-Stacks abhängen: Gateway-Startup, Plugin-Metadaten, Meeting-Notes, Discord-Callbacks, Provider-Fallback-Verhalten, Cloud-MCP-Connector-Richtlinie, Usage-Accounting, Diffs und Shell-Sicherheit. Dann deckt die KI-News-Spur Google, OpenAI und Anthropic ab, da jeder konkrete Agent-Infrastrukturflächen bewegt hat: verwaltete Remote-Sandboxes, mobile-überwachte Codex-Sessions, Hybrid/On-Prem-Codex-Deployment, SDK/MCP-Generierung und Frontier-Model-Sicherheitsscanning. Die Projekt-Spur bleibt auf GitHub-gehostete Tools fokussiert rund um semantischem Code-Kontext, aktuelle Docs, Model-Routing, MCP-Building, lokale Agents, Rollenpakete und Sicherheitsscanner.
[02:00] OpenClaw v2026.5.22 und Claude Code 2.1.149 Release-Durchgang
OpenClaws Update ist breit gefächert, aber das nützliche Thema ist Zuverlässigkeit und Capability an den Stellen, wo Agent-Stacks normalerweise hängen bleiben. Das Gateway stützt sich auf prozessstabile Katalog-Lesezugriffe und Plugin-Metadaten-Snapshot-Wiederverwendung, was Startup und Status-Abfragen weniger verschwenderisch macht. Startup-Idle-Plugin-Arbeit ist fauler, irrelevante Linuxbrew-PATH-Probes werden übersprungen, und Core-Gateway-Method-Handler plus öffentliche Oberflächen-Alias-Maps machen den Gateway-Pfad konsistenter. Meeting-Notes bekommen ein echtes Upgrade: externe Plugins und Source-Provider haben jetzt einen saubereren Vertrag, Capture kann aus der Konfiguration auto-starten, manuelle Imports werden unterstützt, es gibt read-only CLI-Zugriff, und Discord-Voice wird als erste Live-Source behandelt, nicht als Nebenpfad.
Die Agent- und Plugin-Oberflächen bewegen sich ebenfalls. OpenClaw beschneidet den Default-Subagent-Bootstrap auf die Dateien, die am meisten relevant sind, fügt native Subagent-Completion-Handoff-Fixes hinzu, fügt generisches Channel-Message-Poll-Senden und Session-Workflow-Helfer im Plugin-SDK hinzu, und klärt Embedding-Provider-Capability-Verträge. Die Chat-Kontrolloberfläche bekommt Suche und Load-More-Pagination im Session-Picker, was relevant wird, sobald ein Gateway einen echten Backlog hat. Discord-Component-Callbacks haben jetzt ein bounded TTL, was das Risiko reduziert, dass alte Review-Buttons oder stale UI-Callbacks jenseits ihrer Nutzungsdauer live bleiben. Provider-Handling wird sauberer: xAI OAuth kann für Grok web_search wiederverwendet werden, Modell-Aliase und Operation-Timeouts verbessern sich, Antigravity CLI wird nach konfigurierten Provider-APIs zur Niederpriorität-Image/Video-Fallback, und Codex-API-Key-Image-Generation nutzt die native OpenAI Images API. Dazu kommen Dependency-Refresh, protobufjs 8.4.0, Locked-Dependency-Arbeit, Catalog-Pruning, Session-Write-Lock-Cleanup, strenge vLLM-tool-free-Turns, Telegram-Topic-Fixes, lokale Chrome/Ollama-Proxy-Bypass-Fixes, und dies ist ein echtes Maintenance-und-Capability-Release.
Claude Codes 2.1.149-Update ist kleiner, aber es trifft den täglichen Gebrauch. /usage kann Limit-Nutzung nach Kategorie zeigen, einschließlich Skills, Subagents, Plugins und per-MCP-Server-Kosten. /diff Detailansicht unterstützt Keyboard-Scrolling. Markdown-Output rendert GitHub-flavored Task-List-Checkboxes. Enterprise-Admins bekommen eine allowAllClaudeAiMcps Managed Setting für das Laden von claude.ai Cloud-MCP-Connectors zusammen mit managed MCP-Config. Die Fixes sind die Sicherheitsstory: PowerShell-Permission-Bypasses durch eingebaute Directory-Change-Funktionen, Sandbox-Write-Allowlists, die versehentlich zu viel vom Git-Worktree abgedeckt haben, PowerShell-Prefix/Wildcard-Rule-Bugs, stale Variable-Tracking rund um PWD/OLDPWD/DIRSTACK, ein macOS-find-Failure, der Datei-Tables bei großen Directories erschöpfen konnte, und mehrere Remote-Session-, Managed-Settings-, Telemetry-Helper-, Transcript- und UI-Fixes. Version 2.1.150 ist nur interne Infrastruktur, also ist das User-facing Delta 2.1.149, selbst wenn das installierte Package neuer ist.
[10:00] Gemini 3.5 Flash und Gemini API Managed Agents
Googles Gemini 3.5 Flash-Ankündigung ist es wert, als Agent-Infrastruktur-News behandelt zu werden, nicht nur als Modell-Marketing. Google sagt, 3.5 Flash ist für Agentic-Workflows und Coding gebaut, mit stärkeren Terminal-Bench, GDPval-AA, MCP Atlas, multimodal, Speed und Long-Horizon-Task-Claims. Die wichtige Frage ist nicht, ob ein Benchmark die Woche gewinnt. Es ist, ob ein schnelles Modell gut genug über lange, tool-heavy Loops bleiben kann, wo Latenz und Supervision relevant sind.
Der Gemini API Managed Agents Launch macht das konkret. Ein einzelner Call kann einen Antigravity-powered Agent in einer isolierten, ephemeral Linux-Umgebung hochfahren. Der Agent kann reasonen, Tools aufrufen, Code ausführen, Dateien managen und im Web browsen. Follow-up-Calls können eine Umgebung wiederverwenden, also kann State weitergehen, statt jede Request zu einem frischen stateless Prompt zu machen. Entwickler können Custom Agents mit Instructions, Skills und Daten in AGENTS.md und SKILL.md-Style-Dateien definieren. Das ist direkt relevant für lokales OpenClaw und Hermes-Denken: was sollte lokal bleiben, weil es Credentials oder privaten Code berührt, und was kann sicher in eine Managed Sandbox verschoben werden, weil die Umgebung kontrolliert, disposable und leichter skalierbar ist?
[17:00] Codex Remote Supervision, Access Tokens und Hybrid-Umgebungen
OpenAIs Codex-Richtung dreht sich um Supervision und Deployment-Form. Codex in der ChatGPT Mobile App lässt einen User sich zu aktiver Arbeit verbinden, die auf einem Mac oder einer Remote-Umgebung läuft, Live-Project-State sehen, Commands approven, Terminal-Output, Screenshots, Test-Results und Diffs reviewen, und dann die Task umleiten, ohne am Host-Machine sein zu müssen. Das ist relevant, weil langlaufende Coding-Agents nicht nur an Intelligenz-Mangel scheitern. Sie scheitern, weil sie einen Decision-Point erreichen und warten, oder sie nehmen den falschen Fork, weil kein Mensch da war, um ein kleines bisschen Urteilsvermögen zu geben.
Die Enterprise-Seite ist genauso wichtig. Remote SSH ist allgemein verfügbar, Codex kann in Managed Remote Environments arbeiten, Hooks können Prompts auf Secrets scannen oder Validators laufen lassen, und programmatic Access Tokens geben nicht-interaktiven Workflows eine scoped Workspace Identity. Die Dell-Partnerschaft zeigt auf Hybrid- und On-Prem-Umgebungen, wo Code, Daten, Policies und approved Compute bereits leben. Das ist die ernsthafte Codex-Story: ein Coding Agent, der von überall überwacht werden kann, während er nahe an den Files, Credentials und Controls läuft, die er braucht.
[24:00] Anthropic Stainless und Project Glasswing
Anthropics Akquisition von Stainless ist eine Agent-Connectivity-Story. Stainless verwandelt API-Specs in SDKs, CLIs und MCP-Server über Sprachen hinweg, und Anthropic sagt, Stainless hat seit Anfang des Claude API offizielle Anthropic SDKs generiert. Für Agents ist das relevant, weil ein Agent nur so nützlich ist wie die Systeme, die er sicher und korrekt erreichen kann. Saubere SDKs, CLIs und MCP-Server sind keine langweilige Wrapper-Arbeit; sie sind die Handles, die Agents nutzen, um zu handeln.
Project Glasswing ist die dunklere Seite derselben Beschleunigung. Anthropic sagt, Claude Mythos Preview wurde mit Partnern genutzt, um mehr als tausend Open-Source-Projekte zu scannen und große Zahlen von High- oder Critical-Severity-Vulnerabilities zu identifizieren. Der Bottleneck verschiebt sich vom Finden von Issues zum Verifizieren, Disclose und Patching. Für einen Agent-Stack ist die Lektion nicht „jedes Modell auf jedes Repo loslassen". Es ist Scope, Evidence, Verification und Repair Flow. KI kann Security-Throughput erhöhen, aber der menschliche und Maintainer-Prozess muss die Findings absorbieren, ohne Chaos zu verursachen.
[32:00] GitHub-Projekte: Codebase-Intelligence für Claude Code, Codex und Hermes
Die beste GitHub-Projekt-Spur für diesen Stack beginnt mit Codebase-Intelligence. Serena bringt MCP-basiertes semantisches Retrieval, Editing, Refactoring und Debugging-Tools. Claude Context gibt Claude Code und anderen Agents semantische Code-Suche über große Repos. Sourcebot self-hosts Code-Suche, Navigation, File-Exploration und Repo Q&A mit Citations. Understand-Anything verwandelt Codebases in interaktive Graphen, die Menschen und Agents Fragen stellen können. Chunkhound und Code Review Graph pushen local-first Code-Intelligence und persistente Maps.
Der praktische Test ist einfach: nimm ein großes Repo und lass einen Agent zweimal eine Änderung planen. Zuerst, lass ihn nur eingebaute Suche und Transcript-Context nutzen. Dann gib ihm eine semantische Map oder ein MCP Code-Intelligence-Tool und schau, ob der Plan weniger falsche Files berührt, bessere Fragen stellt und Context-Bloat vermeidet. Wenn die Antwort ja ist, ist der Stack-Upgrade kein größeres Prompt. Es ist eine bessere Map.
[39:00] GitHub-Projekte: Aktuelle Docs, Model-Routing, MCP-Builder, lokale Agents und Security-Scanner
Die zweite Projektgruppe verändert Operation statt Context. Claude Code Router routed Requests über Provider und Models, was nützlich ist, wenn Background-Work, Cheap-Work, Long-Context-Work und High-Reasoning-Work nicht alle dasselbe Model treffen sollten. mcp-use hilft beim Bauen und Inspizieren von MCP-Servern und Apps in TypeScript oder Python. goose ist ein lokaler Desktop/CLI/API-Agent mit Multi-Provider und MCP-Extension-Support. gstack packaged Claude Code Roles und Workflows für Review, QA, Release, Security und Planning. deepsec nutzt Coding-Agents für Vulnerability-Scanning. context-mode und setup-sync-Tools versuchen, Output-Noise zu reduzieren und Multi-Harness-Setups über Claude Code, Codex, OpenCode, Gemini CLI und adjacente Agents hinweg konsistent zu halten.
Context7 gehört in diese Gruppe, weil aktuelle Library-Dokumentation einer der schnellsten Wege ist, stale API-Halluzinationen zu reduzieren. Claude Code Router ist nur nützlich, wenn Provider-Wahl sichtbar bleibt. mcp-use ist am stärksten, wenn die erste Tool-Oberfläche eng und inspizierbar ist. goose ist einen Blick wert als lokaler Agent-Vergleichspunkt. gstack ist nützlich, wenn seine Roles konkretes Review-Evidence produzieren statt polierter Zeremonie. deepsec gehört in scoped Security-Work, wo Findings verifiziert werden können. Diese Projekte sind interessant, weil sie zwischen dem Model, dem Repo, den Tools und der menschlichen Decision-Loop sitzen.
[46:00] Abschluss
Die Queue von EP057 ist direkt. OpenClaw v2026.5.22 macht das Gateway, Plugins, Meeting-Notes-Sources, Provider-Fallbacks, Session-Navigation und Discord-Controls solider. Claude Code 2.1.149 verbessert Usage-Visibility, Diff-Review, Task-List-Rendering, Managed Cloud-MCP-Connector-Richtlinie und Shell/Sandbox-Sicherheit. Gemini Managed Agents zeigen, dass Remote-Agent-Sandboxes produktisiert werden. Codex bewegt sich in Richtung Mobile-supervised, Token-scoped, Hook-governed, Hybrid-Execution. Anthropics Stainless- und Glasswing-Arbeit zeigt SDK/MCP-Generierung und KI-Sicherheitsscanning konvergieren. Das GitHub-Radar ist die praktische Schicht: Code-Maps, aktuelle Docs, Router, MCP-Builder, lokale Agents, Rollenpakete, Scanner und Setup-Tools, die ihren Platz nur verdienen, wenn sie Agent-Arbeit konkreter und verifizierbarer machen.