Episode 58: OpenClaw 2026.5.27, Codex 0.134, Claude Code

OpenClaw v2026.5.27 und v2026.5.26, Codex rust-v0.134.0, Claude Code 2.1.153 und Hermes v2026.5.16 setzen den Release-Kontext. OpenClaw verschärft Content-Grenzen, prüft auf No-Auth-Exposure, verbessert die Codex App-Server-Wiederherstellung, Anbieterkataloge, Embedding-Anbieter, Pixverse, VLLM Thinking-Parameter, Claude OAuth Overlays, Kanalzustellung, Metadaten-Caches, Paketprüfungen und CI-Proof-Pfade. Codex fügt lokale Konversationshistorie-Suche, Profil-zuerst-Konfiguration, besseres MCP-Setup, streamable HTTP OAuth, schreibgeschützte MCP-Parallelität, Connector-Schemaerhaltung, reichhaltigeren Hook- und Extension-Kontext sowie Remote-Zuverlässigkeitsbehebungen hinzu. Claude Code fügt Code-Review-Fix-Modus, Skill-Tool-Einschränkungen, Skill-Reload-Hooks, Nachrichtenanzeige-Hooks, Marketplace-Vorschläge, Fallback-Modell-Kontinuität, Update-/Doctor-Sichtbarkeit, strengere Subagent-MCP-Richtlinienbehandlung, OAuth-Gateway-Credential-Fixes und Hintergrundsitzungsreparaturen hinzu. Dann bewegt sich die Episode in aktuelle Stack-Storys: Governance-MCP-Gateways, lokale Code-Graph-Tools, gemeinsam genutzter lokaler Agent-Speicher, mobile Kontroll-Bridges, lokale Modell-Router und DGX Spark plus LM Studio als privater Modell-Server.

[00:00] Eröffnung: der Stack wird strenger und lokaler Die nützlichsten Agent-Stack-Updates dieser Woche sind keine aufsehenerregenden Modell-Demos. Es sind die Teile, die entscheiden, ob ein Agent sicher handeln, sauber wiederherstellen, den richtigen Anbieter wählen und den richtigen Code finden kann, bevor er ihn bearbeitet. OpenClaws neue Version handelt von schärferen Content-Grenzen, weniger Gateway-Fluktuation, sichereren Exposure-Prüfungen, stabilerem Codex App-Server-Verhalten, besseren Anbietern und zuverlässigerer Zustellung. Codex' Update macht lokale Historie, Profile, MCP-Setup, Schema-Handling und Remote-Zuverlässigkeit ernsthafter. Claude Codes neueste Änderungen machen Review, Skills, Hooks, Fallback-Modelle, MCP-Richtlinien, Update-Status und Hintergrundsitzungen vertrauenswürdiger.

[03:00] OpenClaw v2026.5.27, Codex 0.134 und Claude Code 2.1.153 OpenClaws Release hat eine klare Sicherheitslinie. Gruppen-Prompt-Text bleibt aus dem System-Prompt heraus. Hostnames mit wiederholten Punkten werden normalisiert. Befehls-Wrapper mit Nebeneffekten und unsichere Node-Laufzeitumgebung-Überschreibungen werden blockiert. No-Auth Tailscale-Exposure wird abgelehnt. Node- und Device-Role-Genehmigungen erfordern Admin-Autorität. Das ist wichtig, weil Agent-Stacks zunehmend mit echten Kanälen, lokalen Maschinen und privaten Netzwerken verbunden sind; das Gateway muss seltsame Autoritätsformen ablehnen, bevor sie das Modell erreichen.

Die Codex-spezifische OpenClaw-Arbeit ist genauso wichtig. Laufzeitmodelle werden zuerst aufgelöst, Workspace-Speicher wird durch Tools geroutet, gemeinsam genutzte App-Server-Clients überstehen Startup- und Spawned-Helper-Fehler, Hook-Relay-Generationen überstehen Neustarts, und falsche Laufzeit-Live-Switches werden vermieden. Das Gateway macht auch weniger Wiederentdeckung auf Hot-Paths: Sitzungslesevorgänge, Plugin-Metadaten-Fingerabdrücke, Auth-Snapshots, Plugin-Konfiguration, Tool-Suchkataloge und stabile Metadaten-Caches werden alle intelligenter wiederverwendet. Die Anbieterabdeckung erweitert sich mit Core OpenAI-kompatiblen Embedding-Anbietern, vollständiger Credential-bewusster DeepInfra-Modell-Suche, Pixverse-Videogenerierung und Regionsauswahl, VLLM Thinking-Parametern, Claude CLI OAuth Overlays für PI-Profile und direkten Anthropic-Modell-IDs.

Codex 0.134 ist ein praktisches CLI-Release. Die lokale Konversationshistorie-Suche bedeutet, dass alte Arbeit nach Inhalt mit Vorschauen durchsuchbar ist. Die Profil-zuerst-Konfiguration macht --profile zur Hauptsache für die Auswahl von Berechtigungen und Sandbox-Verhalten. Das MCP-Setup verbessert sich mit per-Server-Umgebungs-Targeting und OAuth-Optionen für streamable HTTP-Server. Connector-Tool-Schemas bewahren lokale Referenzen und Definitionen besser, überdimensionierte Schemas komprimieren vor der Exposure, und schreibgeschützte MCP-Tools können parallel ausgeführt werden, wenn sie den richtigen Hinweis anzeigen. Extension- und Hook-Kontext wird ebenfalls reichhaltiger, einschließlich Konversationshistorie für Extension-Tools und Subagent-Identität in Hook-Inputs.

Claude Codes neueste Reihe teilt sich zwischen Feature-Arbeit und Bereinigung auf. Das Feature-Release fügt /code-review --fix hinzu, ermöglicht /simplify diesen Fix-Pfad aufzurufen, erlaubt Skills und Slash-Commands das Entfernen von Tools mit disallowed-tools, fügt /reload-skills hinzu, ermöglicht SessionStart-Hooks das Neuladen von Skills und Setzen von Titeln, fügt MessageDisplay-Hooks hinzu und führt verwaltete Plugin-Vorschlags-Marketplaces ein. Es wechselt auch zu einem konfigurierten Fallback-Modell für den Rest einer Sitzung, wenn das primäre Modell nicht verfügbar ist. Das Follow-up-Release fügt LFS-Skip-Optionen für Plugin-Marketplace-Quellen, Update-Sichtbarkeit in /doctor, kombinierte MCP-Authentifizierungshinweise, Kontinuität der macOS-Hintergrund-Agent-Berechtigung, strengere Subagent-MCP-Richtlinienbehandlung, einen Fix für benutzerdefinierte API-Gateways, die die falschen OAuth-Credentials erhalten, und viele Hintergrundsitzungsreparaturen hinzu.

[12:00] MCP-Gateways werden zu geregelter Infrastruktur IBM ContextForge und Jarvis Registry sind die Art von GitHub-Projekten, die MCP weniger wie einen Haufen von Connector-Demos und mehr wie Infrastruktur erscheinen lassen. ContextForge verbindet MCP, A2A, REST und gRPC-APIs hinter einer Registry und einem Proxy mit Governance, Discovery, Observability, Plugins, OpenTelemetry, Redis-gestützter Federation und Kubernetes-Deployment. Sein neuestes Release schließt ein React Admin UI-Rewrite ab, verbessert Datenbank-Migrationen, stärkt OAuth-Flows und verbessert Multi-Replica-Deployment-Verhalten.

Jarvis Registry zielt von einer Workflow-Perspektive auf dasselbe Tool-Governance-Problem. Es gibt Copilots und autonomen Agents ein einzelnes sicheres MCP- und A2A-Gateway mit Identität, Zugriffskontrolle, semantischer Discovery, Audit-Logs und Metriken. Sein neuestes Release fügt eine Workflow-Execution-Engine mit MongoDB-gestütztem Run-State hinzu, Dispatch an A2A-Agents und MCP-Server, Pause/Resume/Cancel/Retry-APIs, persistente Workflow-Endpunkte, OAuth-Refresh-Token-Rotation, Access-Token-Scope-Verhandlung und A2A-Discovery durch Suche und Gateway-Tools.

Die praktische Frage ist einfach: Wenn ein Coding-Agent ein Tool anfordert, wo passiert die Discovery, wo lebt die Identität und wo ist der Trace nach dem Aufruf? Wenn die Antwort „in einem Dutzend separater Konfigurationen" ist, ist ein Gateway oder eine Registry einen Test wert.

[19:00] Code-Graph-Tools geben Agents bessere lokale Sicht Codanna und Roam Code sind zwei nützliche Beispiele dafür, wie lokale Code-Intelligenz agent-lesbar wird. Codanna ist ein Rust MCP-Server und CLI für Code-Suche, Symbole, Aufrufe und Dokumente. Sein neuestes Release verbessert die Method-Call-Auflösung: statische Aufrufe disambiguieren nach Empfängertyp, Instanzaufrufe leiten Empfängertypen von Caller-Parametern ab, und PHP erhält vererbungsbewusste Auflösung. Die Breaking Change ist die richtige Art von konservativ: ein Aufruf, der zuvor auf eine falsche gleichnamige Methode aufgelöst wurde, gibt jetzt unresolved zurück.

Roam Code ist eher eine Agent-Preflight- und Evidence-Schicht. Es baut einen lokalen SQLite-Code-Graph über viele Sprachen auf, bietet eine große CLI- und MCP-Oberfläche, läuft standardmäßig lokal, bereinigt Secrets aus MCP-Antworten und verpackt Änderungsevidenz, damit eine KI-unterstützte Bearbeitung beantworten kann, welche Autorität bestand, welcher Kontext gelesen wurde, was sich änderte, was kaputtgehen könnte, welche Richtlinie angewendet wurde, was sie verifizierte und wer das Risiko akzeptierte. Seine preflight-Form ist besonders nützlich vor einer riskanten Bearbeitung: Blast Radius, betroffene Tests, Komplexität, Kopplung und Konventionen, bevor der Agent Dateien ändert.

Die Stack-Verbesserung ist nicht abstrakt. Bevor ein Coding-Agent ein großes Repo anfässt, sollte er einen lokalen Code-Graph fragen, welches Symbol er bearbeitet, wer es aufruft, welche Tests relevant sein könnten und welcher Abhängigkeitspfad kaputtgehen könnte. Das ist besser, als das Modell zu bitten, Architektur aus einem Grep-Sprint abzuleiten.

[26:00] Gemeinsam genutzter lokaler Speicher und Task-State reduzieren Parallel-Agent-Kollisionen Das Agent-Guild-Projekt zielt auf einen anderen Schmerzpunkt: mehrere Agents arbeiten am selben Projekt, verlieren aber den State zwischen den Sitzungen. Es ist ein einzelnes Go-Binary mit einem MCP-Server, lokalem SQLite, BM25 plus semantischer Retrieval und atomaren Task-Ansprüchen. Claude Code, Codex, Cursor oder ein anderer MCP-Client kann denselben Projektkontext lesen, Arbeit beanspruchen, Ergebnisse aufzeichnen und Übergaben hinterlassen. Sein neuestes Release verschärft lokale Dateiberechtigungen, validiert Katalog-Kinds vorab, macht Event-Ordering unter gleichzeitigen Schreibvorgängen deterministisch und stabilisiert Leser mit gleichem Zeitstempel.

Das ist wichtig, weil Agent-Speicher oft wie ein persönliches Notizbuch für eine Modell-Sitzung behandelt wird. Die nützlichere Version ist gemeinsam genutzter lokaler Projekt-State: Entscheidungen, aktive Arbeit, beanspruchte Tasks, blockierte Tasks und Übergabenotizen, die Komprimierung überstehen und von mehr als einer Agent-Oberfläche gelesen werden können. Der erste Test sollte klein sein: ein Projekt-State-Store, zwei Clients, ein Task-Anspruch, eine Übergabe und keine Kollision.

[31:00] Mobile Kontroll-Bridges halten lokale Ausführung, verschieben aber die Genehmigungsoberfläche Lucarne ist eine leichtgewichtige Antwort auf das Babysitting-Problem. Es überwacht lokale Coding-Agent-Sitzungen und sendet Genehmigungen, Klärungsanfragen, Fehler und Fortschritt an Telegram oder WeChat. Es tut dies ohne Hooks, Skills, MCP oder Projektänderungen hinzuzufügen. Claude, Codex, Gemini, Copilot und Pi bleiben auf dem lokalen Computer; das Telefon wird zur Aufmerksamkeitsoberfläche.

Diese Unterscheidung ist wichtig. Gehostete Remote-Agents verlagern sowohl Ausführung als auch Supervision weg von der lokalen Maschine. Eine Kontroll-Bridge hält Dateien, Credentials und Tools lokal und leitet dann die menschlichen Aufmerksamkeitsmomente durch einen bestehenden Messaging-Kanal. Die Sache, die zu verifizieren ist, ist nicht, ob eine Benachrichtigung einmal ankommt. Verifiziere, dass sie am richtigen Entscheidungspunkt ankommt, die Antwort zurück zum richtigen Workspace und Session leitet und keine neue breite Autoritätsoberfläche hinzufügt.

[36:00] Lokale Modell-Router werden hardwarebewusst SmarterRouter ist ein OpenAI-kompatibler Router für Ollama, llama.cpp und OpenAI-Style-Endpunkte. Er profiled Modelle, verfolgt Fähigkeitsmetadaten, schätzt VRAM, unterstützt semantisches Caching und routet Prompts nach Task und lokaler Hardware. Sein neuestes Release fügt dynamische Modell-Metadaten-Extraktion hinzu, Gemma 4-Unterstützung, automatisierte Fähigkeitserkennung von Ollama, MoE-bewusste VRAM-Schätzung und quantisierungsbewusste Dimensionierung.

Das passt zu OpenClaws Release, weil lokale Modell-Stacks mehr als eine Liste von Endpoint-URLs brauchen. Embeddings, Tool-Calling, Vision, langer Kontext, Thinking-Parameter, Quantisierung, MoE-aktive Parameter und VRAM-Limits beeinflussen alle, welches Modell einen Task bearbeiten sollte. Ein lokaler Router sollte wissen, dass ein kleines lokales Modell Logs zusammenfassen kann, ein größeres lokales Modell Code inspizieren kann, ein Embedding-Endpoint separat sein sollte und ein abonniertes Cloud-Modell für Arbeit reserviert werden sollte, wo es das Ergebnis verändert.

[41:00] DGX Spark plus LM Studio sieht aus wie ein privates Modell-Appliance NVIDIA's LM Studio on DGX Spark Guide ist ein konkretes lokales Serving-Muster. Führe LM Studio auf einem Spark-Gerät aus, bediene ein Modell lokal mit GPU-Beschleunigung und nutze es von einem Laptop. Mit LM Link kann das Spark-gehostete Modell auf einer anderen Maschine über einen verschlüsselten Link erscheinen, ohne Same-LAN-Setup oder das Öffnen eines öffentlichen Dienstes.

Das ist relevant, weil der Rest des Stacks zunehmend freundlicher zu OpenAI-kompatiblen Anbietern, lokalen Embedding-Anbietern, Modell-Routern und Hybrid-Ausführung wird. Ein DGX Spark in diesem Muster ist nicht nur ein schneller Desktop. Es ist ein privates Modell-Appliance: lokal genug, um Daten und Inferenz nah zu halten, service-orientiert genug, dass Laptops und Agent-Gateways es nutzen können, und isoliert genug, dass es als echte Grenze behandelt werden kann.

[46:00] Close

Die EP058-Warteschlange ist konkret. OpenClaw für Content-Grenzen, Provider-Abdeckung, Codex App-Server-Resilienz und Gateway-Hot-Path-Bereinigung aktualisieren. Codex für lokale Verlaufssuche, Profile, MCP-Einrichtung, Schema-Erhaltung und Read-Only-Tool-Parallelität aktualisieren. Claude Code für Review-Fixes, werkzeugbeschränkte Skills, Skill-Reloads, Nachrichtenanzeige-Hooks, Fallback-Modelle, Update-Sichtbarkeit und strengere Subagent-MCP-Richtlinie aktualisieren. Dann ein Infrastruktur-Experiment wählen: ein verwaltetes MCP-Gateway, einen lokalen Code-Graphen, einen Shared State Store, eine Mobile-Control-Bridge, einen lokalen Model-Router oder einen DGX Spark / LM Studio Private-Serving-Pfad. Das Thema ist praktisch: Mehr Agenten-Fähigkeit hilft nur, wenn der Stack Tools verwalten kann, Code akkurat sieht, State teilt, den Menschen im richtigen Moment erreicht und Modelle nach dem richtet, was die Hardware tatsächlich leisten kann.