Episode 59: Hermes Agent 0.15.x, Codex 0.135, Claude Code

OpenClaw v2026.5.27 स्थिर OpenClaw बेसलाइन बना हुआ है जबकि v2026.5.28 एक बीटा वॉच आइटम है, और Hermes Agent v2026.5.29.2 नया स्थिर एजेंट-स्टैक रिलीज इवेंट है। Codex 0.135, Claude Code 2.1.157, और Opus 4.8 EP059 के लिए रिलीज संदर्भ पूरा करते हैं। Hermes को सबसे बड़ा प्लेटफॉर्म मूव मिलता है: कानबान ऑर्केस्ट्रेशन, वर्कट्री-पेर-टास्क एक्जीक्यूशन, शेड्यूल्ड टास्क, फास्टर सेशन सर्च, प्रॉम्प्टवेयर डिफेंस, स्किल बंडल, MCP कैटलॉग सेलेक्शन, ntfy मैसेजिंग, और लूपबैक डैशबोर्ड, Docker इनसिक्योर मोड, MCP PATH रेजोल्यूशन, .md मीडिया, और प्लगइन पैकेजिंग के लिए फॉलो-अप फिक्सेस। Codex बेहतर डायग्नोस्टिक्स, रिमोट स्टेटस, नेम्ड परमिशन प्रोफाइल्स, SDK सैंडबॉक्स प्रेसेट्स, नॉन-इंटरैक्टिव इंस्टॉल सपोर्ट, और TUI/रनटाइम रिलायबिलिटी जोड़ता है। Claude Code Opus 4.8, डायनामिक वर्कफ्लोज़, ऑटोमैटिक .claude/skills प्लगइन लोडिंग, प्लगइन स्कैफोल्डिंग, वर्कट्री स्विचिंग, टेलीमेट्री डिटेल ऑप्शंस, और बैकग्राउंड-सेशन क्लीनअप जोड़ता है। फिर एपिसोड वर्कस्पेस-एजेंट पॉलिसी, ब्राउज़र रनटाइम MCP, कोड-फ्लो ग्राफ़, यूज़ेज टेलीमेट्री, और एजेंट-बिल्ट मीडिया में जाता है।

[00:00] ओपनिंग: एजेंट स्टैक इंस्पेक्ट करना आसान हो गया आज का उपयोगी थीम इंस्पेक्टेबिलिटी है। Hermes ऑर्केस्ट्रेशन को दृश्य बना रहा है। Codex doctor, /status, प्रोफाइल्स, और SDK सैंडबॉक्स प्रेसेट्स के माध्यम से रनटाइम का अधिक नाम रख रहा है। Claude Code वर्कफ्लोज़, प्लगइन्स, प्रयास, वर्कट्रीज़, और बैकग्राउंड सेशन्स को स्पष्ट रेल पर लगा रहा है। OpenAI वर्कस्पेस एजेंट्स पब्लिशिंग, Slack, स्पीच, और ऐप एक्शन्स के आसपास पॉलिसी कंट्रोल पा रहे हैं। प्रोजेक्ट लेन एक ही आकार रखता है: ब्राउज़र स्टेट, कोड-फ्लो स्टेट, यूज़ेज कॉस्ट, और मीडिया रेंडरिंग सब कुछ एजेंट क्वेरी कर सकता है गेसिंग के बजाय।

[03:00] OpenClaw और Hermes Agent रिलीज रीडआउट OpenClaw इस रिलीज ब्लॉक को स्टेबिलिटी चेक के रूप में शुरू करता है। नवीनतम स्थिर टैग v2026.5.27 बना हुआ है, जिसका मतलब है कि प्राथमिक स्थिर रिलीज से कंटेंट-बाउंडरी, Codex ऐप-सर्वर रिकवरी, प्रोवाइडर कैटलॉग, एम्बेडिंग-प्रोवाइडर, VLLM थिंकिंग-पैरामीटर, चैनल-डिलीवरी, और मेटाडेटा-कैश काम अभी भी बेसलाइन है। नया v2026.5.28 लाइन बीटा मटेरियल के रूप में दिखाई देता है, और इस पर नज़र रखना worth है क्योंकि बीटा नोट्स लोकल एजेंट स्टैक के बारे में सही सतहों की ओर इशारा करते हैं: ऐप-सर्वर रिकवरी, सबएजेंट cwd/वर्कस्पेस सेपरेशन, हुक कॉन्टेक्स्ट आइसोलेशन, टाइमआउट लॉक रिलीज, स्टेल रिस्टार्ट एवॉइडेंस, चैनल आइडेंटिटी, Discord रिकवर्ड टूल वार्निंग्स, Slack और Telegram डिलीवरी पाथ्स, मालफॉर्म्ड कॉलबैक रिजेक्शन, प्रोवाइडर एडिशन्स, और ब्राउज़र टाइमआउट वैलिडेशन। क्योंकि यह बीटा है, यह स्थिर अपग्रेड लेन के बजाय वॉच लेन में है।

Hermes Agent के पास दिन का सबसे बड़ा स्थिर एजेंट-स्टैक रिलीज है। 0.15 लाइन बहुत सारी मशीनरी को कोर प्रोडक्ट सतहों में ले जाती है। Kanban अब प्रॉम्प्ट्स के आसपास एक पतला बोर्ड नहीं है; यह ऑर्केस्ट्रेशन फीचर्स जैसे ऑटो-डिकंपोजीशन, स्वार्म टोपोलॉजी, शेड्यूल्ड टास्क, वर्कट्री-पेर-टास्क एक्जीक्यूशन, और पर-टास्क मॉडल ओवरराइड्स बढ़ाता है। यह मायने रखता है क्योंकि मल्टी-एजेंट वर्क को डurable असाइनमेंट, आइसोलेशन, और रिकवरी की जरूरत है। एक बोर्ड तभी उपयोगी है अगर वर्क बंटा जा सके, क्लेम किया जा सके, रिट्राई किया जा सके, और इंस्पेक्ट किया जा सके बिना चैट ट्रांसक्रिप्ट्स के ढीले ढेर में बदले।

कोडबेस शेप भी बदला। बड़ा run_agent.py पाथ छोटे मॉड्यूल्स में बंटा, कोल्ड स्टार्ट फिर से बेहतर हुआ, और session_search नाटकीय रूप से फास्टर और फ्री हुआ। व्यावहारिक मूल्य सरल है: जब लोकल एजेंट के पास कई सेशन्स, कई टूल्स, और बहुत सारा याद किया हुआ वर्क है, सर्च और स्टार्टअप कॉस्ट वर्कफ्लो का हिस्सा बन जाते हैं। धीमा सर्च मेमोरी को नकली महसूस कराता है। फास्ट सर्च पिछले वर्क को रीचेबल बनाता है।

Hermes promptware डिफेंस, Bitwarden Secrets Manager सपोर्ट, स्किल बंडल, एक Ink मल्टी-सेशन TUI, दो इमेज-जेनरेशन प्रोवाइडर्स, Nous-अप्रूव्ड MCP कैटलॉग इंटरैक्टिव पिकर के साथ, ntfy मैसेजिंग, और deeper xAI इंटीग्रेशन भी जोड़ता है। फॉलो-अप रिलीज़ेस भी जरूरी हैं। डैशबोर्ड लूपबैक 401 रीलोड लूप फिक्स है। Docker इनसिक्योर मोड बाइंड होस्ट से inferred करने के बजाय explicit opt-in बन गया। MCP bare-command PATH रेजोल्यूशन बेहतर हुआ। Markdown मीडिया डिलीवरी रिस्टोर है। पैकेजिंग अब व्हील और सोर्स डिस्ट्रीब्यूशन्स में बंडल्ड प्लगइन मैनिफेस्ट शामिल करती है।

[12:00] Codex 0.135 फेलर्स को अधिक डायग्नोज़ेबल बनाता है Codex 0.135 सबसे शोरिला रिलीज़ नहीं है, लेकिन यह रोज़मर्रा सपोर्ट सतह को बेहतर बनाता है। codex doctor अब अमीर एनवायरनमेंट, Git, टर्मिनल, ऐप-सर्वर, और थ्रेड इन्वेंटरी डायग्नोस्टिक्स रिपोर्ट करता है। इस तरह का कमांड मायने रखता है क्योंकि कोडिंग-एजेंट फेलर्स अक्सर एनवायरनमेंटल होते हैं: शेल हेल्पर गलत है, ऐप-सर्वर स्टेल है, रिमोट ट्रांसपोर्ट मिसमैच है, रेपो स्टेट सरप्राइज़िंग है, या टर्मिनल आउटपुट करप्ट कर रहा है।

रिमोट /status अब कनेक्शन डिटेल्स और सर्वर वर्जन दिखाता है जब TUI रिमोट ट्रांसपोर्ट से कनेक्टेड हो। /permissions नेम्ड परमिशन प्रोफाइल्स समझता है और कस्टम प्रोफाइल्स दिखाता है। पैकेज्ड बिल्ड्स सपोर्टेड macOS और Linux टारगेट्स में बंडल्ड पैच्ड zsh हेल्पर खोज सकते हैं। Python SDK थ्रेड और टर्न APIs के लिए फ्रेंडली Sandbox प्रेसेट्स जोड़ता है। इंस्टॉल स्क्रिप्ट्स CODEX_NON_INTERACTIVE=1 के माध्यम से नॉन-इंटरैक्टिव इंस्टॉलेशन सपोर्ट करती हैं।

फिक्सेस भी व्यावहारिक हैं: markdown टेबल्स और मल्टीलाइन लिस्ट्स अधिक पठनीय रेंडर होती हैं, TUI आउटपुट macOS और Zellij पर अधिक स्थिर है, स्लैश-कमांड कम्प्लीशन ड्राफ्ट टेक्स्ट प्रीज़र्व करता है, पुराने tmux और iTerm कंट्रोल-मोड सेशन्स नॉर्मल Ctrl-C बिहेवियर रखते हैं, एक्सटेंशन टूल्स एरर्स बेहतर सर्फेस करते हैं, रिमोट अटैचमेंट्स सही ढंग से अटैच करते हैं, ऐप-सर्वर रनटाइम मॉडल चॉइसिस respect करता है, और डिस्कनेक्टेड MCP टूल्स running के रूप में दिखाना बंद करते हैं। रिलीज़ लोकल और रिमोट Codex रन को उनके बिगड़ने पर समझाना आसान बनाने के बारे में है।

[19:00] Claude Code 2.1.157 और Opus 4.8 Claude Code की नवीनतम लेन Opus 4.8 रिलीज़ वेव से गुज़री। वर्जन 2.1.154 Opus 4.8 सपोर्ट, डायनामिक वर्कफ्लोज़, फास्ट मोड चेंजेस, प्रयास लेबल अपडेट्स, claude agents से बैकग्राउंड शेल डिस्पैच, डिफॉल्ट स्ट्रीमिंग टूल एक्जीक्यूशन, stdio MCP सेशन एनवायरनमेंट वेरिएबल्स, और .mcp.json सर्वर्स के लिए पेंडिंग-अप्रूवल रेंडरिंग जोड़ता है। डायनामिक वर्कफ्लो पीस सबसे अहम हिस्सा है: यह Claude Code को बैकग्राउंड एजेंट्स और वर्कफ्लो स्टेटस के ज़रिए बड़े प्रयासों को ऑर्गनाइज़ करने देता है बजाय एक फोरग्राउंड टर्न पर पूरी जॉब लेने के।

Version 2.1.156 Opus 4.8 पर एक thinking-block समस्या ठीक करता है। Version 2.1.157 फिर plugin और worktree व्यवहार को अधिक सीधे मार्ग में बदल देता है। .claude/skills निर्देशिकाओं में plugins स्वचालित रूप से लोड होते हैं। claude plugin init एक नया plugin scaffold करता है। /plugin autocomplete में सुधार होता है। claude agents settings.json में configured agent field का सम्मान करता है। EnterWorktree Claude-प्रबंधित worktrees के बीच स्विच कर सकता है। Tool-decision telemetry में tool parameters शामिल हो सकते हैं जब उपयोगकर्ता detail में opt-in करता है। पूर्ण worktrees unlockable छोड़ दिए जाते हैं ताकि cleanup उन्हें prune कर सके।

Anthropic का Opus 4.8 release उसी आंदोलन का model पक्ष है। यह कठिन कोडिंग, agentic कार्यों और पेशेवर कार्य के लिए तैनात है, Opus 4.7 से अपरिवर्तित नियमित मूल्य निर्धारण और पूर्ववर्ती fast-mode मूल्य निर्धारण से सस्ता fast mode के साथ। सही मूल्यांकन केवल यह नहीं है कि benchmark बदला या नहीं। यह है कि model plus workflow layer एक बड़ा कार्य चला सकता है, बेहतर प्रश्न पूछ सकता है, मौन गलत से बच सकता है, और उसके बाद अपने worktree को साफ कर सकता है।

[27:00] Workspace agents को policy की आवश्यकता है क्योंकि वे अब shared channels में रहते हैं OpenAI के workspace-agent release notes एक और दिशा दिखाते हैं: agents shared workspace actors बन रहे हैं। Workspace agents reasoning effort controls के साथ GPT-5.5 का उपयोग कर सकते हैं। Admins नियंत्रण कर सकते हैं कि कौन से roles agents को shared directory में publish करते हैं। Guided setup उपयोगकर्ताओं को agents कॉन्फ़िगर करने में मदद करता है। Agents ऑडियो फ़ाइलें उत्पन्न कर सकते हैं। Slack agents initial mention के बाद एक thread में relevant follow-up संदेशों का जवाब दे सकते हैं। Builders प्रत्येक enabled app में actions के लिए safeguards परिभाषित कर सकते हैं।

ये विवरण महत्वपूर्ण हैं क्योंकि shared agents के personal chat से अलग जोखिम होते हैं। एक Slack-thread agent तभी उपयोगी हो सकता है जब वह जानता है कि follow-up relevant कब है और कब चुप रहना है। एक speech-output agent को storage, review और distribution अपेक्षाओं की आवश्यकता है। एक shared directory को publishing permissions की आवश्यकता है, केवल clever prompts का ढेर नहीं। App safeguards agent को write-capable tools मिलने से पहले सेट की जानी चाहिए।

Codex remote access और access tokens उसी पैटर्न में fit करते हैं। मशीन जो files और credentials के स्वामी हैं वह execution boundary बनी रहती है, जबकि फोन, scripts और managed workspace identity control surfaces बन जाते हैं। यह agent कार्य के लिए stable architecture है: डेटा के पास run करें, उस channel से supervise करें जो moment के लिए उपयुक्त हो, और identity scoped रखें।

[34:00] Browser runtime MCP source से guess करने से बेहतर है Chrome DevTools MCP एक अच्छा project है जिस पर नजर रखनी चाहिए क्योंकि frontend agents को browser evidence की आवश्यकता है। एक model source files पढ़ सकता है और फिर भी runtime problem miss कर सकता है: एक network request failed, एक console error hydration के बाद हुआ, एक CSS rule overridden था, एक page id बदल गई, या एक performance issue तब ही दिखाई देती है जब app run होता है। एक DevTools-backed MCP bridge agent को actual browser state inspect करने की अनुमति देता है।

Current release एक छोटी CLI page-id fix है, लेकिन project shape उस patch से बड़ा है। MCP DOM, console, network, runtime और performance surfaces को expose कर सकता है ऐसे तरीके से जिससे coding agents पूछ सकें। यह visual computer use से अलग है। Screenshots दिखाते हैं कि user क्या देखता है; DevTools state बताता है कि browser ने वहां क्यों व्यवहार किया। Local apps के लिए, सबसे अच्छा loop evidence first है: reproduce, inspect, patch, verify।

[39:00] Code flow, usage cost और generated media agent-readable बनते हैं Project radar में तीन और useful surfaces हैं। CodeGraph agents को एक local pre-indexed code knowledge graph देता है। इसकी latest release Go gRPC implementation resolution में सुधार करती है, generated files को deprioritize करती है, endpoint source plus callers और callees शामिल करके dynamic-dispatch trace breaks को handle करती है, multi-module endpoint selection में सुधार करती है, और small projects के लिए routing context inlines करती है। यही वह है जो एक coding agent को चाहिए जब एक प्रश्न flow के बारे में है, केवल text matches नहीं।

ccusage एक अलग blind spot पर attack करता है: usage और cost। इसकी current release Opus 4.8 rates, fallback pricing, missing-price warnings, Copilot telemetry explanations, opencode cost fixes, और release/install improvements जोड़ती है। जैसे-जैसे background workflows और multi-agent runs सामान्य होते जाते हैं, usage telemetry accounting trivia नहीं रह जाता। यह scheduler input बन जाता है। एक system जो model cost, missing pricing और telemetry gaps जानता है, वह एक छोटा model चुन सकता है, budget window का इंतज़ार कर सकता है, या रुक सकता है इससे पहले कि कोई कार्य wasteful हो जाए।

Hyperframes media counterpart है। यह video को HTML source plus renderable runtime के रूप में treat करता है, जो generated media को अधिक inspectable बनाता है। Agents source को edit कर सकते हैं, render कर सकते हैं, inspect कर सकते हैं, playback behavior को patch कर सकते हैं, और media scene को version control में रख सकते हैं। यह final MP4 को पहली real artifact मानने से अधिक reliable है।

[46:00] क्लोज़

EP059 से व्यावहारिक कतार स्पष्ट है। Hermes एक प्रमुख प्लेटफॉर्म रिलीज़ है जिसका अध्ययन करना है। Codex पर्यावरण और अनुमतियों को बेहतर ढंग से दिखाता है जो वह वास्तव में उपयोग कर रहा है। Claude Code वर्कफ़्लोज़, प्लगइन्स, प्रयास और वर्कट्रीज़ को अग्रभूमि में ले जा रहा है। Opus 4.8 हाई-एंड कोडिंग मॉडल लेन को बदलता है। वर्कस्पेस एजेंट्स को नीति की आवश्यकता है क्योंकि वे अब साझा चैनलों में संचालित हो रहे हैं। Browser MCP, कोड ग्राफ़, उपयोग टेलीमेट्री और सोर्स-कंट्रोल्ड मीडिया वह टूल लेयर है जो एजेंट के काम को कम रहस्यमय बनाती है। सबसे अच्छा स्टैक वह नहीं है जिसमें सबसे अधिक एजेंट चल रहे हों। यह वह है जहाँ प्रत्येक एजेंट रनटाइम देख सके, कोड पथ जान सके, बजट समझ सके और प्रमाण छोड़ सके।