
AgentStack Daily EP050 — एजेंट रिलीज़ में नया क्या है
यह एपिसोड LLM और एजेंट टूलिंग में नए परिवर्तनों पर नज़र डालता है: Hermes Agent v2026.5.7 ड्यूरेबल बोर्ड, वर्कर हेल्थ चेक, चेकपॉइंट प्रूनिंग, गेटवे रीज़्यूम, नो-एजेंट क्रॉन, प्रोवाइडर प्लगइन, प्लेटफ़ॉर्म अलाउलिस्ट और MCP फिक्सेस जोड़ता है; Claude Code v2.1.141 से v2.1.129 तक एजेंट व्यू, हुक JSON अपडेट, प्लगइन और वर्कलोड-आइडेंटिटी कंट्रोल, MCP मरम्मत और बैकग्राउंड-एजेंट अनुमति फिक्स प्रदान करता है। Google ADK पर्सिस्टेड स्थिति के साथ पॉज़-एंड-रीज़्यूम एजेंटों का दस्तावेज़ीकरण करता है, और GitHub उजागर करता है। Show notes: https://tobyonfitnesstech.com/hi/podcasts/episode-50/
🎧 Listen to EpisodeAgentStack Daily EP050 पॉडकास्ट सामान्य अंग्रेज़ी में वर्तमान एजेंट-टूलिंग स्टैक के साथ शुरू होता है, फिर सप्ताह की रिलीज़ स्पॉटलाइट में जाता है: Hermes Agent v2026.5.7 और Claude Code v2.1.141 से v2.1.129। OpenClaw एपिसोड में रनटाइम बेसलाइन है, जबकि Hermes और Claude Code में ताज़ी रिलीज़ हेडलाइन हैं। लक्ष्य सीधा है: क्या बदला, क्या जोड़ा गया, इसका महत्व क्या है, और अपग्रेड करने के बाद क्या टेस्ट करना है।
[00:00] ओपनिंग — एजेंट स्टैक में नया क्या है NOVA और ALLOY सप्ताह के एजेंट और LLM टूलिंग अपडेट पेश करते हैं। मुख्य बदलाव हैं Hermes बोर्ड ड्यूरेबिलिटी, वर्कर विजिबिलिटी, चेकपॉइंट प्रूनिंग, गेटवे रिज्यूम, डिटर्मिनिस्टिक क्रॉन, प्रोवाइडर प्लगइन, प्लेटफॉर्म पॉलिसी, MCP ट्रांसपोर्ट फिक्स, Claude Code एजेंट विजिबिलिटी, रिचर हुक आउटपुट, प्लगइन कंट्रोल, वर्कलोड आइडेंटिटी स्कोपिंग, MCP रिपेयर्स, और बैकग्राउंड-एजेंट परमिशन फिक्स। OpenClaw कहानी में ऑपरेटर रनटाइम बना हुआ है, जबकि Hermes और Claude Code में आज ताज़ी रिलीज़ हेडलाइन हैं।
[02:30] रिलीज़ रीडआउट — Hermes Agent v2026.5.7 रिलीज़ विवरण से पहले, एपिसोड व्यावहारिक भाषा में प्रमुख टूल को परिभाषित करता है। OpenClaw ऑपरेटर/रनटाइम/चैनल/टूल/ब्राउज़र/मीडिया/प्रूफ लेयर है। Hermes डेलीगेशन, ड्यूरेबिलिटी, टास्क स्टेट, और वर्कर हेल्थ के लिए मल्टी-एजेंट बोर्ड है। Claude Code hooks, MCP, प्रोजेक्ट सेटिंग्स, और बैकग्राउंड एजेंट वाला टर्मिनल-लोकल कोडिंग एजेंट है। Codex रेपो-फोकस्ड कोडिंग, पैच, और रिव्यू लेन है। Google ADK लॉन्ग-रनिंग एजेंट्स के लिए ऐप फ्रेमवर्क है जिन्हें पर्सिस्टेड स्टेट और पॉज़/रिज्यूम व्यवहार की जरूरत है। GitHub Copilot एजेंट टास्क GitHub-होस्टेड एसिंक कोडिंग टास्क हैं जो API, ब्रांच, स्टेटस, और पुल-रिक्वेस्ट सरफेस के माध्यम से एक्सपोज़ हैं।
Hermes v2026.5.7 मुख्य रिलीज़ ब्लॉक है। ठोस एडिशन में मल्टी-एजेंट Kanban सुधार, वर्कर हार्टबीट्स, स्टेल-टास्क रीक्लेम, Darwin ज़ॉम्बी डिटेक्शन, /goal, Checkpoints v2, चेकपॉइंट प्रूनिंग, डिस्क गार्डरेल्स, गेटवे ऑटो-रिज्यूम, सोर्स रीलोड व्यवहार, no_agent क्रॉन मोड, प्रोवाइडर प्लगइन, OAuth/SSE/MCP रिपेयर्स, WhatsApp स्ट्रेंजर रिजेक्शन, प्लेटफॉर्म अलाउलिस्ट, गिल्ड-स्कोप्ड Discord रोल पॉलिसी, और सेफर रिडक्शन डिफॉल्ट्स शामिल हैं। प्रत्येक आइटम को प्रोडक्ट डेल्टा के रूप में मानें। Kanban प्लस ओनरशिप का मतलब है कि बोर्ड यह दिखा सकता है कि किसके पास टास्क है, ट्रांसक्रिप्ट के अंदर स्टेटस दबाने के बजाय। हार्टबीट्स और स्टेल रीक्लेम का मतलब है कि गायब वर्कर एक डिटेक्टेबल कंडीशन बन जाता है। Darwin ज़ॉम्बी डिटेक्शन macOS पर स्थानीय विश्वसनीयता अंतर को बंद करता है। /goal एक रन को नामित टारगेट देता है। चेकपॉइंट प्रूनिंग और डिस्क गार्डरेल्स पर्सिस्टेंस क्लटर को कम करते हैं। गेटवे ऑटो-रिज्यूम रीस्टार्ट को कम डिस्ट्रक्टिव बनाता है। no_agent क्रॉन मॉडल के बिना डिटर्मिनिस्टिक चेक चलाने देता है। प्रोवाइडर प्लगइन इंटीग्रेशन को कम हार्ड-कोडेड बनाते हैं। OAuth, SSE, कीपअलाइव्स, स्टेल पाइप्स, इमेज रिजल्ट्स, और रीकनेेक्ट्स के आसपास MCP फिक्स टूल कॉल्स को कम ब्रिटल बनाते हैं। प्लेटफॉर्म अलाउलिस्ट, WhatsApp स्ट्रेंजर रिजेक्शन, Discord रोल स्कोप, और रिडक्शन डिफॉल्ट्स यह टाइट करते हैं कि कौन वर्क ट्रिगर कर सकता है और कौन सा डेटा लीक होता है। व्यावहारिक टेकअवे एक रिलीज़ टेस्ट लिस्ट है: बोर्ड स्टेट, वर्कर हेल्थ, रिज्यूम, क्रॉन, प्लगइन लोडिंग, MCP ट्रांसपोर्ट, और चैनल पॉलिसी। माइग्रेशन शेप का भी उल्लेख करें। अपग्रेड करने के बाद, उपयोगी सवाल ठोस हैं: क्या चल रहा बोर्ड लाइव ओनरशिप दिखाता है, क्या मृत वर्कर रीक्लेम होता है, क्या चेकपॉइंट नवीनतम टास्क स्टेट के साथ रिज्यूम होता है, क्या प्रूनिंग डिस्क यूज़ को बाउंडेड रखता है, क्या गेटवे रीस्टार्ट यूज़र-विजिबल वर्क को प्रिज़र्व करता है, क्या स्क्रिप्ट-ओनली क्रॉन अपेक्षित नोटिफिकेशन प्रोड्यूस करता है, क्या प्रोवाइडर प्लगइन साफ़-सुथरे ढंग से लोड होते हैं, क्या MCP टूल्स ऑथ रिफ्रेश या ट्रांसपोर्ट इंटरप्शन के बाद फिर से कनेक्ट होते हैं, और क्या चैनल अलाउलिस्ट गलत सेंडर को ब्लॉक करते हैं। यह सेगमेंट को नई फीचर्स और वेरिफिकेशन पर केंद्रित रखता है।
[19:00] रिलीज़ रीडआउट — Claude Code v2.1.141 से v2.1.129
Claude Code के हालिया वर्शन विजिबल एजेंट मैनेजमेंट और क्लीनर एक्सटेंशन सरफेस जोड़ते हैं। सबसे बड़ा लिसनर-फेसिंग आइटम claude agents है, प्लस claude agents --cwd के माध्यम से प्रोजेक्ट फिल्टरिंग। Hooks terminalSequence, डायरेक्ट args, और ब्लॉक्ड टूल यूज़ के आसपास बेहतर कंटिनुएशन व्यवहार जैसे JSON आउटपुट फील्ड्स हासिल करते हैं। प्लगइन सोर्स कंट्रोल, HTTPS सोर्स क्लोनिंग, मैनेज्ड-सेटिंग माइग्रेशन, CLAUDE_PROJECT_DIR, ANTHROPIC_WORKSPACE_ID, वर्कलोड आइडेंटिटी स्कोपिंग, क्लियर के बाद MCP सर्वर प्रिज़र्वेशन, कंकरेंट OAuth रिफ्रेश सुधार, और बैकग्राउंड-एजेंट परमिशन इनहेरिटेंस सब एक टूल की ओर इशारा करते हैं जो रियल प्रोजेक्ट्स में ऑपरेट करना आसान हो रहा है। व्यावहारिक टेस्ट लिस्ट सरल है: क्या आप रनिंग और ब्लॉक्ड एजेंट्स देख सकते हैं, क्या hooks अभी भी पॉलिसी लागू करते हैं, क्या MCP सर्वर अपेक्षित लाइफसाइकल इवेंट्स से बचे रहते हैं, क्या प्लगइन कंट्रोल कॉन्फिगर के रूप में व्यवहार करते हैं, और क्या बैकग्राउंड एजेंट्स इरादे से परमिशन मोड इनहेरिट करते हैं?
[29:00] Google ADK अपडेट — पॉज़-एंड-रिज्यूम एजेंट्स के लिए पर्सिस्टेड स्टेट
Google ADK आइटम स्टेट के बारे में एक फीचर अपडेट है। ट्यूटोरियल current_step, ToolContext.state, एक सेशन सर्विस, लोकल डेवलपमेंट के लिए SQLite, अधिक ड्यूरेबल डिप्लॉयमेंट के लिए Cloud SQL, और वेबहुक्स जैसे एक्सटर्नल वेकअप्स का उपयोग करने वाले एक लॉन्ग-रनिंग एजेंट को दिखाता है। महत्व इस बात का है कि एक एजेंट अप्रूवल, पेमेंट, कस्टमर इनपुट, या किसी अन्य एक्सटर्नल सिग्नल के लिए रुक सकता है और एक विशाल रीप्लेड ट्रांसक्रिप्ट पर भरोसा करने के बजाय स्पष्ट स्टेट से रिज्यूम हो सकता है। एपिसोड मैकेनिज्म को कवर करना चाहिए: टूल्स स्टेट लिखते हैं, इंस्ट्रक्शंस स्टेट इंटरपोलेट कर सकते हैं, डेटाबेस-बैक्ड सेशन सर्विस महत्वपूर्ण फील्ड्स रखता है, और ऐप टेस्ट कर सकता है कि अगला एक्शन सुरक्षित है या नहीं।
[39:00] GitHub Copilot एजेंट टास्क — कोडिंग वर्क को API सरफेस मिलता है GitHub का Copilot एजेंट-टास्क REST API पब्लिक प्रीव्यू क्लाउड कोडिंग टास्क को एड्रेसेबल ऑब्जेक्ट्स में बदलता है। डॉक्स टास्क क्रिएशन, मॉडल चॉइस, रेपोजिटरी कॉन्टेक्स्ट, ब्रांच या पुल-रिक्वेस्ट आउटपुट, टास्क स्टेटस इंस्पेक्शन, और एक लाइफसाइकल दिखाते हैं जो सामान्य रेपोजिटरी रिव्यू से गेटेड हो सकता है। महत्वपूर्ण बदलाव यह नहीं है कि Copilot कोड लिख सकता है; यह है कि Copilot कोडिंग वर्क को प्लेटफॉर्म API के माध्यम से शुरू, ट्रैक और रिव्यू किया जा सकता है। कंस्ट्रेंट्स का उल्लेख करें: API वर्शनिंग, ऑथेंटिकेशन और टोकन स्कोप, एंटरप्राइज़ या रेपोजिटरी पॉलिसी, स्टेटस स्टेट्स, ब्रांच आर्टिफैक्ट्स, CI चेक्स, और मर्ज से पहले ह्यूमन रिव्यू।
[47:00] क्लोज़ — अगला क्या टेस्ट करना है
टेकअवे एक संक्षिप्त टेस्ट चेकलिस्ट है। Hermes के लिए, वर्कर हेल्थ, स्टेल रीक्लेम, चेकपॉइंट्स, गेटवे रिज्यूम, क्रॉन मोड, प्लेटफॉर्म अलाउलिस्ट, रिडक्शन, और MCP रीकनेेक्ट्स टेस्ट करें। Claude Code के लिए, claude agents, --cwd, hooks, प्लगइन पॉलिसी, वर्कलोड आइडेंटिटी, MCP लाइफसाइकल, और बैकग्राउंड-एजेंट परमिशन्स टेस्ट करें। ADK के लिए, डिले के बाद पर्सिस्टेड स्टेट टेस्ट करें। Copilot टास्क के लिए, टास्क क्रिएशन, स्टेटस पोलिंग, पुल-रिक्वेस्ट क्रिएशन, और CI/रिव्यू गेटिंग टेस्ट करें। ये नए सरफेस हैं जिन्हें इस सप्ताह चेक करना है।