OpenClaw 2026.5.18, Codex 0.131.0, Copilot Remote Agents und Claude Search Grounding — Episode 53 cover art
Episode 53·19. Mai 2026·47:19

OpenClaw 2026.5.18, Codex 0.131.0, Copilot Remote Agents und Claude Search Grounding

AgentStack Daily EP053 beginnt mit konkreter Release-Arbeit: OpenClaw v2026.5.18 fügt typisierte Plugin‑Werkzeuge, schnellere Gateway‑Bereitschaft, dialogbewusste Browser‑Automatisierung, Runtime‑Paritäts‑QA, Echtzeit‑Android‑Talk‑Modus, sicherere Medienverarbeitung, stärkere Kanalzustellung, Codex‑App‑Server‑Reparaturen, Proxy‑TLS‑Unterstützung und Mac‑App‑Politur für Betreiber hinzu. OpenAI Codex CLI 0.131.0 fügt reichhaltigere TUI‑Steuerungen, einheitliche Erwähnungen, einen Plugin‑Marktplatz sowie Sharing‑Befehle, daemon‑verwaltete Fernsteuerung und konfigurierbare Fernsteuerung hinzu. Show notes: https://tobyonfitnesstech.com/de/podcasts/episode-53/

🎧 Listen to Episode

[00:00] Hook — start with the host and the CLI OpenClaw v2026.5.18 ist das erste Upgrade, das es zu prüfen gilt, da es die Oberflächen verändert, von denen ein Agent-Host täglich abhängt: Plugin-Tools, Browser-Automatisierung, Gateway-Start, Proxy-Routing, Mobile Voice, Kanalzustellung, Mediensicherheit und Codex App-Server-Verhalten. Codex rust-v0.131.0 erscheint daneben als CLI- und App-Server-Release: mehr sichtbarer Status in der TUI, breitere Erwähnungssuche, Plugin-Marktplatz-Befehle, Fernsteuerungs-Infrastruktur, konfigurierte Remote-Umgebungen, ein Python SDK und Diagnosen, die Support-Fälle weniger spekulativ machen.

Die praktische Leseart ist simpel. Wenn OpenClaw der Host ist, verbessert v2026.5.18, wie Agents sich mit Plugins, Browsern, Kanälen, Mobile-Voice-Sessions und Codex-gestützten Runtimes verbinden. Wenn Codex die Coding-Oberfläche ist, macht 0.131.0 die CLI einfacher zu bedienen in langen Sessions und gibt Remote- und SDK-Workflows explizitere Verträge. Nach dem Release-Block geht es weiter mit GitHub's Copilot-Agent-Änderungen vom 18. Mai und Anthropic's API-Update für reichere SEC-Einreichungssuchen.

[02:30] Agent-stack release readout — OpenClaw v2026.5.18 OpenClaw v2026.5.18 ist ein umfangreiches Host-Release, aber die erste builder-orientierte Änderung betrifft die Plugin-Form. Das Release fügt defineToolPlugin plus openclaw plugins init, openclaw plugins build und openclaw plugins validate hinzu für typisierte Simple-Tool-Plugins mit generierter Manifest-Metadaten, optionalen Deklarationen und Context-Factories. Das macht kleine Plugin-Arbeit weniger abhängig von handgeschriebener Manifest-Klempnerei. Es ist auch wichtig für die Deprecation: Das Release markiert ältere Rich-Message-Producer-APIs wie Legacy-Interactive- und Slack-Direktive-Pfade als deprecated, während es Kanalpräsentations-Fähigkeitslimits hinzufügt, sodass Plugin-Autoren einen klareren Vertrag dafür bekommen, was ein Renderer tatsächlich anzeigen kann.

Die Browser-Änderungen sind klein, aber wichtig für die Automatisierungs-Zuverlässigkeit. Snapshots zeigen jetzt ausstehende und kürzlich behandelte Modal-Dialoge, Aktionen können blockedByDialog zurückgeben, wenn ein Modal sich öffnet, und browser dialog --dialog-id kann einen ausstehenden Dialog beantworten. Das ändert einen häufigen Fehlermodus bei Browser-Agents: Statt dass ein Klick still scheitert, weil ein Alert- oder Confirm-Dialog die Seite ergriffen hat, kann die Automatisierungsschicht den Dialog als State repräsentieren und dem Agent eine explizite nächste Aktion geben.

Gateway-Start und Proxy-Verhalten bewegen sich ebenfalls. Startup-Logging und Plugin-Service-Startup überlappen jetzt mit Channel-Sidecars, während sie /readyz-Sidecar-Gating bewahren, und Restart-Traces führen Probe-, Config-, Runtime- und Resource-Count-Kosten auf, ohne Readiness-Semantik zu ändern. Für Operatoren ist der nützliche Teil nicht nur schnellere Ready-Zeit; es ist besseres Beweismaterial, wenn ein Restart langsam ist. Das Release fügt auch HTTPS Managed Forward-Proxy-Endpunkte und scoped proxy.tls.caFile Trust hinzu, was Deployments einen saubereren Weg gibt, durch TLS-inspizierte oder private Proxy-Pfade zu routen, ohne Proxy-Konfiguration zu einer globalen Vertrauensentscheidung zu machen.

Die QA-Lab-Arbeit ist ungewöhnlich wichtig. OpenClaw fügt erste-Stunde-20-Turn- und optionale 100-Turn-Runtime-Parity-Szenarien hinzu, openclaw qa suite --runtime-parity-tier, Tool-Fixture-Coverage durch openclaw qa coverage --tools, Live-Runtime-Token-Efficiency-Artefakte und ein hartes Gate für erforderlichen OpenClaw Dynamic Runtime-Tool Drift im Standard Codex-vs-Pi-Tier. In einfachen Worten: Das Projekt fügt Release-Checks hinzu, die Runtime-Verhalten, Tool-Vokabular, Token-Nutzung und Tool-Coverage vergleichen, anstatt einen Smoke-Test als ausreichend zu betrachten. Das ist die richtige Richtung für Agent-Hosts, wo Regressionen oft als „der Agent hat das falsche Tool verwendet" und nicht als „der Prozess ist abgestürzt" auftreten.

Android Talk Mode bekommt ebenfalls eine große Runtime-Änderung. Die Android-App wechselt Talk Mode zu Echtzeit-Gateway-Relay-Voice-Sessions mit Streaming-Mikrofoneingabe, Echtzeit-Audiowiedergabe, Tool-Result-Bridging und On-Screen-Transkripten. Das verwandelt Mobile Voice von einem einfachen Input/Output-Wrapper in eine aktive Session, die Tool-Results zurück durch das Gateway tragen kann. Das zu testende Risiko ist Unterbrechung und Latenz: Streaming-Voice-Sessions brauchen saubere Cancellation, Transkript-Ausrichtung und Tool-Result-Timing, das den Benutzer nicht stale Output hören lässt.

Die Fixes sind dort, wo viele Produktions-Upgrades den Release spüren werden. Generierte Media-Completions kehren jetzt zu Telegram-Forum-Themen zurück, indem Topic-IDs über Requester-Agent-Hand-off erhalten bleiben. Bildmetadaten-Probing vermeidet das Aufrufen externer Decoder-Delegates auf nicht erkannten Bytes, und Sharp wird mit Fallbacks auf native Imaging-Tools, ImageMagick, GraphicsMagick oder ffmpeg installiert. Discord-Voice-Sessions hören weiterhin Follow-up-Turns mit OpenAI Realtime und prebuffer Assistant-Playback, um holprige Starts zu reduzieren. Message/TTS-Direktiven werden angewendet, bevor Message-Tool-Sends Delivery-Pfade erreichen, sodass Opt-in-Räume Voice-Notes statt roher Tags bekommen.

OpenClaw's Codex App-Server-Reparaturen sind besonders relevant für gemischte Agent-Stacks. Aktuelle eingehende Bildanhänge hydratisieren vor Queue-Runs, sodass Responses-gestützte Agents Kanalbilder als native Vision-Input erhalten. Native Code Mode bleibt verfügbar, ohne Code-Mode-Only zu erzwingen, was OpenClaw Dynamic Tool-Turns erlaubt, durch die App-Server-Bridge abzuschließen. Netzwerkzugriff wird für sandboxed Codex Code-Mode-Turns bewahrt, wenn der OpenClaw-Sandbox ausgehenden Egress erlaubt. Per-Agent Code-Mode-Config wird in Schema, Runtime-Katalog-Aktivierung und Model-Payload-Filterung respektiert. Restricted Chat oder Sender Policy schließt jetzt, indem native Code, App, Environment und User MCP-Flächen für restricted Turns deaktiviert werden. Das Muster ist klar: Codex-Integration wird um Policy, Media, Sandboxing und Model/Runtime-Selection herum straffer gemacht.

Migrations-Notizen für OpenClaw v2026.5.18 sind konkret. Die minimal unterstützte Node.js 22-Linie steigt auf 22.19, Pi-Pakete wechseln zu 0.75.1, und Docker/Podman-Builds sollten OPENCLAW_IMAGE_APT_PACKAGES bevorzugen, während OPENCLAW_DOCKER_APT_PACKAGES als Legacy-Fallback bleibt. Das Obsidian-Skill zielt jetzt auf das offizielle obsidian-CLI statt auf das Drittanbieter-obsidian-cli. Das Repo-lokale Codex-Closeout-Review-Skill und Helper werden zu autoreview umbenannt. Kanal/Plugin-Autoren sollten deprecated Message-Producer-Flächen und Präsentations-Fähigkeitslimits prüfen, bevor sie annehmen, dass alte Rich-Message-Kontrollen überall gleich rendern.

[17:30] Agent-stack release readout — Codex rust-v0.131.0 Codex rust-v0.131.0 ist das entsprechende CLI-seitige Release. Die TUI exponiert jetzt datengesteuerte Service-Tier-Befehle, blended Token-Nutzung, Permissions und Approval-Modus, effektive Workspace-Roots und responsive Markdown-Tabellen. Das klingt nach Interface-Arbeit, aber es verändert den täglichen Betrieb: während eines langen Runs kann der Operator sehen, welche Permission und Approval-Envelope der Agent tatsächlich verwendet und welche Workspace-Roots aktiv sind, anstatt diese Fakten aus Config-Dateien und Erinnerung zu rekonstruieren.

Mentions werden breiter. @-Suche deckt jetzt Dateien, Verzeichnisse, Plugins und Skills in einem Picker ab, backed by App-Server-Plugin-Metadaten. Das macht das Interaktionsmodell näher an der Art, wie Builder tatsächlich denken: die Sache, die in den Kontext gebracht werden soll, kann eine Datei, ein Verzeichnis, ein Skill oder ein Plugin sein, und die Agent-Oberfläche sollte das nicht zu separaten Discovery-Lanes machen. Das Risiko ist Context-Bloat, also ist die praktische Empfehlung, den Picker zu verwenden, um das kleinste nützliche Artefakt anzuhängen, anstatt ihn als Bulk-Import-Tool zu behandeln.

Plugin-Workflows bewegen sich auch vorwärts. Codex fügt Marketplace-CLI-Befehle hinzu, version-aware Sharing, Share Checkout, klarere Shared-Workspace-Buckets und default-enabled Plugin-Hooks. Das ist ein Schritt in Richtung Plugins, die sich wie managed Development-Artefakte statt loser lokaler Ordner verhalten. Das Migrations-Watch-Item ist Hook-Trust und -Scope: Default-enabled Hooks sind mächtig, also matter Plugin-Provenance, Workspace-Sharing und Version-Gates mehr, wenn der Workflow reibungsloser wird.

Remote-Arbeit ist ein großer Teil von 0.131.0. Das Release fügt Daemon-managed codex remote-control hinzu, Runtime-Enable- und Disable-APIs, Status-Reads, Registry-backed und konfigurierte Remote-Environments und App-Server/API-Verträge für Remote-Environments und Desktop-owned Config-Namespaces. Für Benutzer ist die Capability Remote-Agent-Arbeit, die außerhalb des unmittelbaren Terminals gestartet, überwacht oder verwaltet werden kann. Für Builder, die Codex integrieren, sind die API-Verträge wichtig, weil Remote-Environments durable Identity, Lifecycle, Status und Konfigurations-Grenzen statt eines Best-Effort-Shell-Prozesses brauchen.

Das Python SDK ist jetzt openai-codex / openai_codex, mit gepinnten Runtime-generierten Types, Concurrent-Turn-Routing, Approval-Modi und Integrations-Abdeckung. Das gibt Python-Anwendungen einen saubereren Weg, Codex-Turns zu fahren und Benachrichtigungen nach ID zu empfangen, anstatt die CLI als Text-only Subprocess zu behandeln. Der wichtige Mechanismus ist Turn-Routing: Concurrently Agent-Arbeit braucht IDs und strukturierte Events, sodass Approvals, Tool-Aktivität und Outputs keine Drähte kreuzen.

Codex fügt auch codex doctor für Diagnosen über Runtime, Auth, Terminal, Network, Config und Local State hinzu. Das ist die Art von Befehl, die sich während fehlgeschlagener Upgrades selbst bezahlt macht. Anstatt zu fragen, ob das Problem ein Terminal-Issue, ein stale Auth-Token, eine Netzwerk-Policy oder ein lokales State-Datenbank-Problem ist, kann die CLI Support-bereites Beweismaterial an einem Ort sammeln. Das Release macht auch App-Server- und Local-State-Startup sicherer, indem es SQLite-Daten bewahrt, beim Scheitern schließt, Recovery-Pfade hinzufügt und optionale Metadaten-Sync-Fehler abmildert.

Der Bug-Fix-Block härtet reale Fehlermodi. Windows Sandbox-Verhalten verbessert sich um deny-read-Regeln, scoped Write-Roots, unwirksame Firewall-Policy und PowerShell-Edge-Cases. Managed Read-Restrictions überleben Permission-Escalation, und Workspace-Root Permission-Profile-Resolution wird aufgeräumt. Git und Auth-Zuverlässigkeit verbessern sich durch Root-Worktree-Hooks, Ignorieren von Repo-Hook- und fsmonitor-Config in Helper-Befehlen, Binding von lokalem MCP OAuth-Callbacks und Widerrufen von abgelösten Login-Tokens. Remote und Windows Cleanup bekommen längere Exec-Server-Transport-Timeouts, leiseres taskkill und Non-Queued Plugin-Reads. Das Release ist weniger über eine aufregende Capability und mehr über das Machen von langen CLI-Sessions und Remote-Sessions observabel, recoverabel und sicherer.

[29:30] GitHub Copilot agents — remote steering, cheaper models, and Actions repair GitHub's Copilot-Updates vom 18. Mai sind ein nützliches Snapshot davon, wohin gehostete Coding-Agents gehen. Remote Control für Copilot CLI-Sessions ist jetzt allgemein verfügbar auf GitHub Mobile, github.com, VS Code und JetBrains. Die Mechanik ist explizit: starte mit copilot --remote, aktiviere es innerhalb einer Session mit /remote on, oder setze remoteSessions in der Copilot-Settings-Datei. Einmal angehängt, kann die Remote-Oberfläche Session-Aktivität streamen, Queued Input akzeptieren, Permission-Prompts beantworten, eine Session stoppen und den Benutzer die Arbeit vom ursprünglichen Terminal wegsteuern lassen.

Das ändert die Form von CLI-Agent-Arbeit. Ein lokales Terminal ist immer noch der Ausführungs-Anker, aber die Überwachungs-Oberfläche kann sich bewegen. Die Maschine muss online bleiben, und GitHub's Docs rufen /keep-alive für längere Runs auf. Sessions sind benutzerspezifisch, und Business- oder Enterprise-User brauchen möglicherweise Administratoren, um Remote Control und CLI-Policies zu aktivieren. Diese Constraints sind wichtig: Remote Steering ist keine magische Hintergrund-Compute; es ist eine Live-lokale Session mit einer Remote-Control-Plane und Policy-Gates.

GitHub hat auch Copilot Cloud-Agent-Model-Choices mit Claude Haiku 4.5 und GPT-5.4-mini erweitert, jedes mit einem 0.33x-Multiplikator aufgelistet. Das ist die richtige Produkt-Richtung für Coding-Agents, weil nicht jeder delegierte Job das stärkste Modell braucht. Straightforward Dependency-Bumps, kleine Test-Fixes, Lint-Failures oder mechanische Edits können auf einem günstigeren Modell laufen, während designlastige oder mehrdeutige Änderungen ein stärkeres verwenden können. Die Docs sagen, Model-Selection ist von unterstützten Entrypoints verfügbar wie dem Zuweisen eines Issues, dem Erwähnen von @copilot in einem Pull-Request-Kommentar, dem Starten von Agent-Oberflächen, GitHub Mobile oder Raycast; wo kein Picker existiert, wird Auto verwendet.

Die dritte Copilot-Änderung ist die Ein-Klick-Reparatur für fehlgeschlagene GitHub Actions. Auf der Seite mit den Workflow-Ausführungsprotokollen können Copilot Business- und Enterprise-Abonnenten auf „Mit Copilot reparieren" klicken. Der Cloud-Agent untersucht den Fehler, überträgt einen Fix auf den Branch und markiert den Benutzer zur Überprüfung. Technisch gesehen ist dies ein Agent-Einstiegspunkt mit einem umfangreichen Kontextpaket: fehlgeschlagene Job-Protokolle, Branch-Zustand, Repository-Anweisungen und Cloud-Entwicklungsumgebung. Die praktische Implikation für Entwickler ist, dass CI-Fehler zu delegierbaren Arbeitsaufgaben werden, ohne Protokolle manuell in den Chat einfügen zu müssen. Das Risiko liegt in der Prüfdisziplin: Ein übertragener Branch-Fix erfordert immer noch Code-Review, Testverifizierung und darauf zu achten, ob der Agent für erfolgreiches CI statt für das richtige Design optimiert hat.

[38:30] Anthropic API – Reichhaltigere SEC-Einreichungsdaten in der Claude-Websuche In Anothrops Anmerkung zur Claude-Plattform vom 18. Mai heißt es, dass das Websuch-Tool nun reichhaltigere SEC-Einreichungsdaten zurückgibt. Das ist ein fokussiertes API-Update, aber es ist wichtig für jeden Agenten, der Finanzrecherchen, Gewinnanalysen, Wettbewerbsanalysen oder Due-Diligence durchführt. Der Unterschied zwischen einem generischen Web-Ergebnis und einer einreichungsbewussten Suche liegt in der Quellenqualität. Ein Agent muss wissen, ob er ein 10-K, 10-Q, 8-K, Proxy-Statement oder eine andere Primäreinreichung zitiert, und er benötigt genügend Metadaten, um diese Zitate durch Zusammenfassungen und Berichte hindurch beizubehalten.

Der Fehlermodus, den dies adressiert, ist bekannt: Ein Modell fasst eine Finanzbehauptung aus einem Suchergebnis zusammen und verliert dann die Identität der Einreichung oder vermischt Primäreinreichungen mit Analystenkommentaren. Reichhaltigere SEC-Einreichungsdaten geben der Werkzeugschicht eine bessere Chance, Primärquellen-Nachweise in den Modellkontext zu tragen. Entwickler sollten diese Metadaten in ihren eigenen Ausgaben bewahren. Wenn ein Agent ein Memo verfasst, sollte jede wesentliche Behauptung auf die Einreichung, das Datum, das Unternehmen und den Abschnitt zurückweisen, wenn verfügbar. Wenn der Agent strukturierte Recherche-Notizen verfasst, sollte die Einreichungsquelle ein Erstklassiges Feld bleiben, kein Satz, der in Prosa vergraben ist.

Die praktische Empfehlung ist, Websuchergebnisse als Evidenzobjekte zu behandeln. Behalten Sie die URL, den Titel, den Einreichungstyp, das Datum, den Zitiertext und den Abrufzeitstempel. Wenn der Agent Unternehmen vergleicht oder Risikofaktoren zusammenfasst, fordern Sie ihn auf, Primäreinreichungen von sekundären Kommentaren zu trennen. Für Workflows, die nachgelagerte Tabellen, Berichte oder Entscheidungen speisen, protokollieren Sie die Zitat-Nutzlast mit der endgültigen Antwort. Claudes reichhaltigere Suchergebnisse sind nur nützlich, wenn die Anwendung die Grounding-Grenze bis zum Benutzer bewahrt.

[45:00] Abschluss – Upgrade-Prioritäten Für OpenClaw testen Sie v2026.5.18 auf den realen Oberflächen, die sich geändert haben: Plugin-Build/Validierung, Browser-Modal-Handling, Gateway-Restart-Bereitschaft, HTTPS-Proxy-Trust, Android Talk Mode, Telegram-Topics, Discord-Echtzeit-Sprache, Bildmedien-Handling und Codex-App-Server-Runden mit Bildern, Sandbox-Netzwerk, Code-Modus und eingeschränkter Absender-Richtlinie. Überprüfen Sie auch die Node 22.19-Kompatibilität und alle lokalen Skill-Referenzen auf umbenannte oder deprecated Befehlspfade.

Für Codex aktualisieren Sie auf 0.131.0 und testen Sie die TUI-Statuszeile, Service-Tier-Befehle, einheitliche Erwähnungen, Plugin-Marktplatz/Share-Befehle, Remote-Control-Flows, konfigurierte Remote-Umgebungen, Python-SDK-Turn-Routing, codex doctor, Windows-Sandbox-Fälle falls relevant und App-Server-Zustandswiederherstellung. Für Copilot verwenden Sie günstigere Cloud-Agent-Modelle für einfache Reparaturarbeiten, halten Sie Remote-Sitzungen richtliniengesteuert und betrachten Sie Ein-Klick-Actions-Fixes als Code-Änderungen und nicht als endgültige Antworten. Für Claude-Finanzagenten bewahren Sie SEC-Einreichungsmetadaten und Zitate als strukturierte Evidenz auf, nicht nur als Text.

🎙 Never miss an episode — subscribe now

🎙 Subscribe to AgentStack Daily