ओपनक्लॉ, कोडेक्स, क्लॉड कोड, हर्मीस, ऐपशॉट्स, एमसीपी टनल, और एजेंट समाचार — Episode 56 cover art
Episode 56·24 मई 2026·1:05:35

ओपनक्लॉ, कोडेक्स, क्लॉड कोड, हर्मीस, ऐपशॉट्स, एमसीपी टनल, और एजेंट समाचार

एजेंटस्टैक डेली EP056 उस रिलीज़ कार्य के साथ शुरू होता है जो अभी मायने रखता है: OpenClaw v2026.5.20 नीति जाँच, सुरक्षित सीक्रेट-फ़ाइल हैंडलिंग, प्रोवाइडर रूटिंग, क्रॉन और सबएजेंट रिकवरी, वॉयस संदर्भ, और छवि-जनरेशन टाइमआउट फिक्सेस जोड़ता है; Codex rust-v0.133.0 लक्ष्य, रिमोट-कंट्रोल तत्परता, अनुमति-प्रोफाइल API, प्लगइन खोज, और लाइफसाइकल हुक जोड़ता है; Claude Code 2.1.148 एक बड़े 2.1.147 अपडेट के बाद पिन किए गए बैकग्राउंड सेशन, कोड समीक्षा, MCP पेजिनेशन, एंटरप्राइज़ पॉलिसी प्रवर्तन के साथ आता है, Show notes: https://tobyonfitnesstech.com/hi/podcasts/episode-56/

🎧 Listen to Episode

OpenClaw v2026.5.20 आगे है क्योंकि यह उन सतहों को बदलता है जिन पर एक एजेंट वास्तव में निर्भर करता है: पॉलिसी चेक, सुरक्षित सीक्रेट्स, प्रोवाइडर राउटिंग, क्रॉन आउटपुट, सबएजेंट पूर्णता, वॉइस कॉन्टेक्स्ट, और इमेज टाइमआउट। Hermes v2026.5.16 को अपना व्यावहारिक सेगमेंट मिलता है क्योंकि यह इंस्टॉल, लोकल प्रॉक्सी, प्रोवाइडर ऑथ, ब्राउज़र स्पीड, मैसेजिंग, LSP डायग्नोस्टिक्स, फ़ाइल-चेंज वेरिफिकेशन, कंप्यूटर यूज़, और Codex/Claude-संबद्ध वर्कफ़्लो को बदलता है। Codex rust-v0.133.0 गोल स्टोरेज, रिमोट-कंट्रोल रेडीनेस, परमिशन प्रोफ़ाइल्स, प्लगइन डिस्कवरी, और लाइफ़साइकल हुक जोड़ता है। Claude Code 2.1.148 एक बड़े टर्मिनल-एजेंट अपडेट के बाद पinned सessions, कोड रिव्यू, MCP पेजिनेशन, एंटरप्राइज़ पॉलिसी एनफ़ोर्समेंट, Windows रिपेयर्स, परमिशन रीयूज़, और Bash रिलायबिलिटी का अनुसरण करता है। उसके बाद, एपिसोड तेज़ी से Appshots, MCP टनल्स, ड्यूरेबल एजेंट एक्ज़ीक्यूशन, एजेंट सब्सट्रेट इन्फ़्रास्ट्रक्चर, Antigravity माइग्रेशन, स्मॉल-मॉडल कंप्यूटर यूज़, डेटा एजेंट्स, API-key हार्डनिंग, और Copilot प्लानिंग टूल्स से गुज़रता है।

[00:00] रिलीज़ पर खोलें जो दैनिक एजेंट वर्क बदलती हैं चार टूल्स से शुरू करें जिन्हें बिल्डर्स इस सप्ताह सबसे अधिक टच करने वाले हैं: OpenClaw, Codex, Claude Code, और Hermes। पहले मिनट को जीवंत रखें: स्टैक अब केवल "मॉडल से पूछें" नहीं है; यह पॉलिसी, ऑथ, गोल्स, प्लगइन्स, लोकल प्रॉक्सीज़, ब्राउज़र स्टेट, मैसेजिंग, बैकग्राउंड सेशन्स, और अप्रूवल्स है। हर बड़ी स्टोरी के लिए एक ठोस try-now एक्शन का वादा करें।

[03:00] OpenClaw, Codex, और Claude Code अपग्रेड पाथ OpenClaw: openclaw doctor चलाएं, पॉलिसी फ़ाइंडिंग्स इंस्पेक्ट करें, प्लेनटेक्स्ट सीक्रेट वार्निंग्स वेरिफाई करें, कन्फ़र्म करें कि टोकन फ़ाइलें symlinked नहीं हैं, OpenRouter प्रोवाइडर राउटिंग टेस्ट करें, एक क्रॉन टास्क चलाएं जो डायग्नोस्टिक वार्निंग्स के साथ समाप्त होता है, और एक सबएजेंट टास्क चलाएं जो पैरेंट सेशन के आगे बढ़ने के बाद खत्म होता है। रिलीज़ को एक होस्ट-रनटाइम बदलाव के रूप में मानें, केवल चैट-मॉडल बदलाव नहीं: पॉलिसी, कॉन्फ़िगरेशन, ऑथ, प्रोवाइडर सेलेक्शन, शेड्यूल्ड एक्ज़ीक्यूशन, सबएजेंट डेलिवरी, ब्राउज़र/इमेज सैनिटाइज़ेशन, वॉइस कॉन्टेक्स्ट, मैसेज डेलिवरी, टाइमआउट बिहेवियर, डायग्नोस्टिक्स, और रिकवरी सभी को एक named टेस्ट की ज़रूरत है। Codex: एक गोल-ड्रिवन टास्क बनाएं, codex remote-control टेस्ट करें, परमिशन प्रोफ़ाइल्स लिस्ट करें, प्लगइन डिस्कवरी आउटपुट इंस्पेक्ट करें, और तय करें कि कौन से लाइफ़साइकल इवेंट्स को लॉग किया जाना चाहिए। आर्किटेक्चर मूव है ड्यूरेबल गोल स्टेट, एक्सप्लिसिट परमिशन प्रोफ़ाइल्स, इंस्पेक्टेबल प्लगइन इन्वेंटरी, और टूल एक्ज़ीक्यूशन, टर्न्स, सबएजेंट्स, और अप्रूवल्स के आसपास एक्सटेंशन हुक। Claude Code: एक पinned बैकग्राउंड सेशन टेस्ट करें, एक असली diff पर /code-review, एक से अधिक पेज वाले सर्वर के खिलाफ MCP पेजिनेशन, बैकग्राउंड परमिशन रीयूज़, Windows शेल पाथ्स यदि relevant हों, और Bash रिग्रेशन पाथ। देखने के लिए फ़ेलियर मोड्स ठोस हैं: पेज एक के बाद missing MCP रिसोर्सेस, एक बैकग्राउंड सेशन पहले से दी गई परमिशन के लिए फिर से पूछ रहा है, एंटरप्राइज़ लॉगिन पॉलिसी दूसरे प्रोवाइडर पाथ के माध्यम से बाइपास हो रही है, या शेल कमांड्स गलत एग्ज़िट स्टेट रिपोर्ट कर रहे हैं। टास्क छोटा होने पर API और SDK बिहेवियर, रनटाइम आर्किटेक्चर, इवैल्यूएशन नोट्स, बेंचमार्क एविडेंस, ऑब्ज़र्वेबिलिटी सिग्नल्स, सिक्योरिटी और प्राइवेसी बाउंड्रीज़, डेप्लॉयमेंट कॉन्फ़िगरेशन, लेटेंसी, थ्रुपुट, कॉस्ट, मेमोरी, शेड्यूलर स्टेट, लॉग्स, ट्रेस IDs, रिक्वेस्ट/रिस्पॉन्स शेप, और रेट्री बिहेवियर कैप्चर करें। उपयोगी सेटअप मूव एक छोटा वेरिफिकेशन मैट्रिक्स है: एक चैनल एक्शन, एक शेड्यूल्ड रन, एक प्रोवाइडर-राउटेड मॉडल कॉल, एक टूल अप्रूवल, एक MCP इन्वेंटरी क्वेरी, एक ब्राउज़र/इमेज ऑपरेशन, और एक डेलिगेटेड सबएजेंट।

[10:00] Hermes Agent व्यावहारिक लोकल बेंच के रूप में Hermes एक अलग सेगमेंट के लायक है। फ़ाउंडेशन रिलीज़ आसान PyPI इंस्टॉल पाथ, hermes proxy, OAuth-बैक्ड प्रोवाइडर्स, SuperGrok, X सर्च, Teams, लेज़ी इंस्टॉल्स, फ़ास्टर लॉन्च, ब्राउज़र-कंसोल एक्सेलेरेशन, LINE, SimpleX, /handoff, नेटिव क्लैरिफ़ाई बटन्स, Discord बैकफ़िल, पिक्सल विज़न, फ़ाइल म्यूटेशन वेरिफिकेशन, LSP डायग्नोस्टिक्स, प्लगेबल वीडियो जेनरेशन, वाइडर कंप्यूटर यूज़, Zed ACP रजिस्ट्री इंटीग्रेशन, OpenRouter Pareto Code राउटिंग, ऑप्शनल स्किल्स, API अप्रूवल इवेंट्स, और प्लगइन-साइड LLM कॉल्स जोड़ता है। इसे एक टेस्ट पाथ में बदलें: इंस्टॉल या अपडेट करें, hermes doctor चलाएं, प्रॉक्सी स्टार्ट करें, एक OpenAI-कम्पैटिबल क्लाइंट को इसकी ओर मुँह करें, एक ब्राउज़र इंस्पेक्शन टेस्ट करें, एक छोटी फ़ाइल एडिट करें और LSP फ़ीडबैक देखें, एक सेशन हैंड ऑफ़ करें, और एक क्लैरिफ़िकेशन बटन पाथ आज़माएं। पेऑôफ़ "हर फ़ीचर यूज़ करें" नहीं है; यह Hermes को Codex, Claude, लोकल प्रोवाइडर्स, और चैट सरफ़ेस के लिए एक तेज़ बेंच बनाना है।

[17:00] Codex Appshots और गोल मोड UI या डेस्कटॉप-ऐप समस्या का वर्णन करने से जब वर्णन करना आसान हो तो Appshots का उपयोग करें। उपयोगी बंडल स्क्रीनशॉट प्लस उपलब्ध टेक्स्ट प्लस एक ड्यूरेबल गोल है। ब्राउज़र एनोटेशन विज़ुअल फ़ीडबैक को विशिष्ट बनाते हैं। रीड-ओनली JavaScript कॉन्टेक्स्ट इंस्पेक्शन को सुरक्षित बनाता है। लॉक्ड कंप्यूटर यूज़ सुपरवाइज़्ड लॉन्ग लोकल टास्क्स के लिए है जहाँ Mac रन खत्म होने से पहले लॉक हो सकता है। एक UI इश्यू के साथ यह आज़माएं: खराब स्टेट कैप्चर करें, एक गोल सेट करें, सबसे छोटा कोड बदलाव माँगें, पेज चलाएं, और रिज़ल्ट स्वीकार करने से पहले दूसरा स्टेट कैप्चर करें।

[22:00] सिक्योर MCP टनल्स सिक्योर MCP टनल्स का उपयोग तब करें जब एक प्राइवेट टूल एजेंट द्वारा बिना इनबाउंड फ़ायरवॉल पोर्ट्स खोले पहुँचा जा सकता हो। टनल कनेक्टिविटी सॉल्व करता है, ऑथराइज़ेशन नहीं। एक प्राइवेट MCP सर्वर कनेक्ट करने से पहले, टूल अलाउलिस्ट, अकाउंट/प्रोजेक्ट बाइंडिंग, ऑडिट ट्रेल, लोकल सर्वर ट्रस्ट बाउंड्री, और सीक्रेट पाथ तय करें। टनल को यूनिवर्सल प्राइवेट-नेटवर्क ब्रिज न बनाने से बचें। पहला एक बनाएं read-only और म्यूटेटिंग कॉल्स से पहले ह्यूमन अप्रूवल की आवश्यकता करें।

[27:00] Google Agent Executor और ड्यूरेबल एजेंट रन्स Agent Executor मायने रखता है क्योंकि लॉन्ग-रनिंग एजेंट्स को इवेंट लॉग्स, स्नैपशॉट्स, रीकनेक्ट/बैकफ़िल, आइसोलेटेड एक्टर्स, सिंगल-राइटर स्टेट, और ब्रांचेबल ट्रैजेक्टरीज़ की ज़रूरत है। एक वर्तमान एजेंट टास्क को उन टुकड़ों में मैप करने का प्रयास करें: कौन सा इवेंट स्ट्रीम मौजूद है, स्टेट कहाँ स्टोर है, रिज़्यूम कैसे काम करता है, एक फ़ेल्ड पाथ को कैसे ब्रांच करें, और रन के बाद कौन सा प्रूफ़ बचा है। अगर सिस्टम जवाब नहीं दे सकता, एजेंट एक बार काम कर सकता है लेकिन यह बार-बार लॉन्ग-रनिंग जॉब्स के लिए अभी तक भरोसेमंद नहीं है।

[32:00] GKE Agent Sandbox और Agent Substrate GKE Agent Sandbox और Agent Substrate एजेंट सिस्टम्स के वर्कलोड शेप को टारगेट करते हैं: आइसोलेटेड सेशन्स, बहुत सारा आइडल टाइम, क्विक वेकअप्स, स्टेटफ़ुल सैंडबॉक्सेस, और बर्स्टी टूल यूज़। व्यावहारिक टेस्ट यह है कि क्या वॉर्म पूल्स, स्नैपशॉट्स, gVisor, और एक्टर शेड्यूलिंग स्टेट और डीबगिंग एविडेंस छिपाए बिना एक्टिवेशन डिले को कम करते हैं। सक्रिय सेशन्स, आइडल सेशन्स, रिटेन्ड स्टेट, अलाउड टूल्स, वेक लेटेंसी, और प्रति उपयोगी सेशन लागत का अनुमान लगाएं।

[37:00] Antigravity CLI माइग्रेशन Gemini CLI कंज़्यूमर/फ्री यूज़ 18 जून, 2026 से रिक्वेस्ट्स की सर्विसिंग बंद कर देगा। Antigravity CLI प्लानिंग टारगेट बन जाता है। अभी Gemini CLI टास्क्स का ऑडिट करें: ऑथ, कॉन्फ़िग, स्किल्स, हुक्स, सबएजेंट्स, प्लगइन्स, एसिंक जॉब्स, और डेस्कटॉप/CLI कॉन्टेक्स्ट शेयरिंग। कटऑफ़ से पहले नए पाथ के माध्यम से एक मौजूदा प्रॉम्प्ट चलाएं और रिकॉर्ड करें कि क्या बदला। माइग्रेशन सबसे आसान तब होता है जब पुराना पाथ अभी भी जवाब देता है।

[42:00] Microsoft MagenticLite और स्मॉल-मॉडल कंप्यूटर यूज़ MagenticLite उपयोगी है क्योंकि यह छोटे मॉडल्स को एक हार्नेस, सैंडबॉक्स, अप्रूवल्स, और ब्राउज़र/फ़ाइल टूल्स के साथ जोड़ता है। टेस्ट यह नहीं है कि क्या एक छोटा मॉडल सब कुछ कर सकता है। यह है कि कौन से टास्क्स सस्ते और भरोसेमंद enough हो जाते हैं जब ऑर्केस्ट्रेटर, ब्राउज़र मॉडल, अप्रूवल पॉइंट्स, और QEMU सैंडबॉक्स एक साथ डिज़ाइन किए जाते हैं। एक बाउंडेड डैशबोर्ड चेक, ड्राफ्ट-फॉर्म फ़िल, known-वेब-टूल नेविगेशन, या सैंडबॉक्स्ड लोकल रिपोर्ट से शुरू करें।

[47:00] Google Data Agent Kit Data Agent Kit डेटा एक्सेस को कोडिंग एजेंटों के लिए कॉन्फ़िगर किए गए टूल्स और स्किल्स के रूप में पैकेज करता है। इसका उपयोग तब करें जब किसी डेटा टास्क को BigQuery, AlloyDB, Spanner, Cloud Storage, क्वेरी वैलिडेशन, या ड्रिफ्ट चेक्स के लिए गवर्न्ड एक्सेस की आवश्यकता हो। पहला डिज़ाइन चॉइस स्कोप है: एजेंट क्या क्वेरी कर सकता है, यह क्या लिख सकता है, क्रेडेंशियल्स कैसे स्टोर किए जाते हैं, और क्या संदर्भ में पेस्ट करने के बजाय सारांशित किया जाना चाहिए।

[51:00] Gemini API keys और Copilot planning tools Gemini API keys को पेड बियरर टोकन की तरह ट्रीट करें। स्टैंडअलोन प्रोजेक्ट बनाएं, keys को इरादा किए गए API तक सीमित करें, एप्लिकेशन रिस्ट्रिक्शंस जोड़ें, सर्वर-साइड keys को Secret Manager में स्टोर करें, क्रेडेंशियल ID के आधार पर रिक्वेस्ट काउंट मॉनिटर करें, और जो keys फैली हुई हैं उन्हें रोटेट करें। फिर कोड एडिट्स से पहले Copilot semantic issue search का उपयोग करें: issues को फेलियर मोड, प्लेटफॉर्म, या रिलीज एरिया के हिसाब से ग्रुप करें, और उसके बाद ही नैरोड टास्क को एजेंट को सौंपें। अगर Copilot Auto मॉडल चुनता है, तो हाई-रिस्क चेंजेस के लिए मॉडल को लॉग करें।

[55:00] Close एक कंक्रीट क्यू के साथ क्लोज करें: OpenClaw/Codex/Claude Code को अपग्रेड करें, Hermes को एक छोटे प्रॉक्सी/ब्राउज़र/LSP/handoff टेस्ट से गुज़ारें, एक Codex Appshot कैप्चर करें, कनेक्टिविटी से पहले permissions के साथ एक MCP टनल डिज़ाइन करें, एक लॉन्ग-रनिंग एजेंट के लिए ड्यूरेबल स्टेट स्केच करें, एक Gemini CLI टास्क को Antigravity की तरफ माइग्रेट करें, एक सैंडबॉक्स में एक छोटे-मॉडल कंप्यूटर-यूज टास्क ट्राई करें, एक डेटा एजेंट टूल स्कोप करें, keys लॉक डाउन करें, और कोडिंग एजेंट से एडिट करने से पहले semantic issue search का उपयोग करें।

🎙 Never miss an episode — subscribe now

🎙 Subscribe to AgentStack Daily