OpenClaw 2026.5.12, Hermes Foundation, Claude Code पृष्ठभूमि नियंत्रण, और Gemini एजेंट परिनियोजन — Episode 51 cover art
Episode 51·16 मई 2026·54:21

OpenClaw 2026.5.12, Hermes Foundation, Claude Code पृष्ठभूमि नियंत्रण, और Gemini एजेंट परिनियोजन

AgentStack Daily EP051 एक एजेंट-स्टैक रिलीज़ रीडआउट के साथ शुरू होता है: OpenClaw v2026.5.12 कोर इंस्टॉल को हल्का करता है, Telegram, Codex, प्लगइन, गेटवे, ब्राउज़र और कॉन्फ़िग पथ को मजबूत बनाता है, और रिप्लाई डिलीवरी में सुधार करता है। Hermes Agent 2026.5.16 में मूल Windows बीटा, PyPI इंस्टॉलेशन, तेज़ स्टार्टअप, एक स्थानीय OpenAI-संगत प्रॉक्सी, विज़न, वीडियो, ब्राउज़र, LSP और सत्यापन अपग्रेड शामिल हैं। Claude Code 2.1.143 और 2.1.142 प्लगइन डिपेंडेंसी, पृष्ठभूमि-सत्र फ्लैग, PowerShell व्यवहार और वर्कट्री आइसोलेशन को मजबूत बनाते हैं। Show notes: https://tobyonfitnesstech.com/hi/podcasts/episode-51/

🎧 Listen to Episode

[00:00] हुक — अपग्रेड इंस्टॉल साइज, पोलिंग रेज़िलिएंस और बैकग्राउंड एजेंट्स से शुरू होता है

OpenClaw v2026.5.12 आज देखने वाली पहली चीज़ है क्योंकि यह उन होस्ट सरफेस को बदलता है जो तय करते हैं कि एजेंट स्टैक रोज़ाना चलाने में अच्छा है या नहीं: डिफ़ॉल्ट रूप से क्या इंस्टॉल होता है, Telegram इवेंट-लूप स्टॉल से कैसे बचता है, Codex/OpenAI ऑथ-बैक्ड मीडिया और MCP पाथ कैसे काम करते हैं, प्लगइन अपडेट वेज़िंग से कैसे बचते हैं, और रिच-ओनली कार्ड्स और सोर्स रिप्लाई के रिप्लाई डिलीवरी कैसे होती है। इसके अलावा, Hermes Agent 2026.5.16 एक बड़ा डिस्ट्रिब्यूशन और रनटाइम रिलीज़ है: नेटिव विंडोज़ अर्ली बीटा में है, pip install hermes-agent असली हो जाता है, कोल्ड स्टार्ट कम होता है, CDP ब्राउज़र कॉल ज़बरदस्ती तेज़ हो जाते हैं, और OAuth-बैक्ड प्रोवाइडर एक्सेस को OpenAI-कम्पैटिबल लोकल प्रॉक्सी के ज़रिए एक्सपोज़ किया जा सकता है। Claude Code 2.1.143 और 2.1.142 वे बैकग्राउंड-सेशन और प्लगइन कंट्रोल जोड़ते हैं जो तब मायने रखते हैं जब CLI एजेंट असली अनैटेंडेड काम कर रहे होते हैं: डिपेंडेंसी-अवेयर प्लगइन एनेबल/डिसेबल, प्रोजेक्टेड कॉन्टेक्स्ट कॉस्ट, बैकग्राउंड वर्कट्री आइसोलेशन, प्रिज़र्व्ड MCP और सेटिंग्स फ्लैग्स, PowerShell डिफ़ॉल्ट्स, और स्टॉप-हुक लूप्स पर कैप्स।

रिलीज़ रीडआउट के बाद का बाहरी कहानी प्रोडक्शन रोलआउट शेप के बारे में है। Google Cloud अब Gemini Enterprise Agent Platform यूज़र्स को इम्यूटेबल एजेंट रिविज़न बनाने और सक्रिय रिविज़न के बीच ट्रैफ़िक स्प्लिट करने देता है, जबकि Priority PayGo ज़्यादा प्रेडिक्टेबल लेटेंसी के लिए आम तौर पर उपलब्ध है जिसके लिए कमिटेड थ्रूपुट कॉन्ट्रैक्ट की ज़रूरत नहीं है। फिर हम एक स्कीमा माइग्रेशन के साथ बंद करते हैं जिसे बिल्डर्स को आखिरी हफ़्ते के लिए नहीं छोड़ना चाहिए: Google's Interactions API फ़्लैट outputs को टाइप्ड steps टाइमलाइन से बदल रहा है और आउटपुट कॉन्फ़िगरेशन को response_format के तहत कंसोलिडेट कर रहा है।

[03:00] एजेंट-स्टैक रिलीज़ रीडआउट — OpenClaw v2026.5.12, Hermes Agent 2026.5.16, और Claude Code 2.1.143/2.1.142

OpenClaw v2026.5.12 कोई सिंगल हेडलाइन फ़ीचर रिलीज़ नहीं है; यह एक होस्ट-क्वालिटी रिलीज़ है। पहला ऑपरेटर-फेसिंग बदलाव डिपेंडेंसी शेप है। Bedrock, Bedrock Mantle, Slack, OpenShell sandbox, Anthropic Vertex, WhatsApp, और संबंधित पैकेज कोस रनटाइम से बाहर कर दिए गए हैं ताकि इंस्टॉलेशन सिर्फ़ वही खींचे जो उसकी ज़रूरत है। यह मायने रखता है क्योंकि एजेंट होस्ट तब खराब होते हैं जब ऑप्शनल प्रोवाइडर चुपचाप मैंडेटरी डिपेंडेंसी कोन्स बन जाते हैं। लीनर इंस्टॉल्स का मतलब प्लेटफ़ॉर्म-स्पेसिफ़िक बिल्ड फ़ेलियर्स कम, अपडेट ब्लास्ट रेडियस छोटी, और कम डिबगिंग टाइम — एक प्रोवाइडर के लिए जो आपने कभी एनेबल ही नहीं किया था।

दूसरा बदलाव क्लस्टर चैनल रेज़िलिएंस है। Telegram पोलिंग एक अलग वर्कर पर चली गई है ड्यूरेबल लोकल स्पूलिंग के साथ, ताकि मेन इवेंट-लूप स्टॉल के कारण इनबाउंड मेसेजेस ड्रॉप या डिले होने की संभावना कम हो। रिलीज़ लेज़ी क्रॉन अनाउंसमेंट्स में रेंडर्ड HTML फ़ॉर्मैटिंग भी प्रिज़र्व करती है, मेंशन-गेटिंग एक्टिव होने पर डाउनलोड से पहले अनमेंशन्ड ग्रुप मीडिया को स्किप करता है, और रियल आंसर में रोटेट करने से पहले टूल-प्रोग्रेस-ओनली ड्राफ़्ट बबल्स डिलीट करता है। व्यावहारिक ऑपरेटर रेसिपी सीधी है: अपग्रेड करने के बाद, एक स्ट्रीम्ड रिप्लाई, एक शेड्यूल्ड या क्रॉन-स्टाइल अनाउंसमेंट, एक ग्रुप-मीडिया एज केस, और एक इंटरप्टेड टर्न टेस्ट करें। यह रिलीज़ मेसेजिंग लेयर को ट्रांसपोर्ट की तरह बर्ताव करने की कोशिश कर रही है, फ्रैज़ाइल UI साइड इफ़ेक्ट की तरह नहीं।

Codex और OpenAI पाथ दूसरी बड़ी OpenClaw अपग्रेड वजहें हैं। Auth-प्रोफ़ाइल-बैक्ड मीडिया टूल्स तब भी उपलब्ध रहते हैं जब OpenAI क्रेडेंशियल्स एजेंट के auth-प्रोफ़ाइल स्टोर में हों, एनवायरनमेंट में नहीं। Codex OAuth रिफ्रेश एरर्स को साफ़ तरीके से क्लासिफ़ाइ किया गया है, हाई-कॉन्फिडेंस ऐप-सर्वर रिफ्रेश फ़ेलियर्स अब रॉ रनटाइम फ़ेलियर्स में नहीं गिरते, और सेलेक्टेबल OpenAI एजेंट मॉडल्स को Codex रनटाइम रिक्वायरमेंट्स की तरह ट्रीट किया जाता है भले ही प्राइमरी कॉन्फ़िग Anthropic हो। रिलीज़ per-agent CODEX_HOME आइसोलेशन भी रखती है HOME को डिफ़ॉल्ट रूप से राइट नहीं करती, जो आइसोलेटेड Codex क्रेडेंशियल्स और ऑर्डिनरी सबप्रोसेस यूज़र-होम डिस्कवरी को तोड़ने के बीच का अंतर है। मिक्स्ड Claude/OpenAI/Codex होस्ट चलाने वाले बिल्डर्स के लिए, पॉइंट फ़ाल्स रीऑथ लूप्स और मॉडल-स्विच फ़ेलियर्स कम करना है।

OpenClaw प्लगइन और गेटवे मैकेनिक्स को भी टाइट करता है। प्लगइन इंस्टॉल्स peer डिपेंडेंसीज़ प्रिज़र्व करते हैं, pnpm 11 हैंडल करते हैं, कम्पैनियन प्लगइन्स के लिए deprecated मेमोरी SDK सबपाथ रिस्टोर करते हैं, रनटाइम एंट्री पॉइंट्स को नैरोअली स्कैन करते हैं, स्ट्रक्चर्ड सेटअप क्रेडेंशियल्स के ज़रिए प्रोवाइडर प्लगइन्स डिस्कवर करते हैं, और डॉक्टर क्लीनअप के ज़रिए इंस्टॉल रिकॉर्ड्स प्रिज़र्व करते हैं। गेटवे और सेशन हिस्ट्री अब मोनोटोनिक ट्रांसक्रिप्ट सीक्वेंस नंबर्स ले जाते हैं और explicit deltaText और replace फ़्रेम्स स्ट्रीम करते हैं ताकि SDK क्लाइंट्स को लोकली असिस्टेंट आउटपुट को डिफ़ करने की ज़रूरत नहीं पड़े। रिच-ओनली रिप्लाईज़, कार्ड्स, बटन्स, और मेसेज-टूल-ओनली रिस्पॉन्सेस को असली आउटबाउंड कंटेंट की तरह ट्रीट किया जाता है न कि खाली छोड़ दिया जाता। अगर आप गेटवे प्रोटोकॉल पर बना रहे हैं, तो यह वह रिलीज़ है जहाँ क्लाइंट असम्प्शन्स को कार्ड्स, मीडिया, सोर्स रिप्लाईज़, और रिकनेक्ट्स के खिलाफ़ टेस्ट किया जाना चाहिए, सिर्फ़ प्लेन टेक्स्ट के खिलाफ़ नहीं।

सिक्योरिटी और कॉन्फ़िग हार्डनिंग भी कंक्रीट हैं। विंडोज़ यूज़र-प्रोफ़ाइल रूट्स सैंडबॉक्स ब्लॉक्ड होम रूट्स में शामिल हैं ताकि क्रेडेंशियल-बियरिंग फ़ोल्डर्स तब भी डिनाइड हों जब HOME कहीं और पॉइंट करता हो। प्रोवाइडर क्रेडेंशियल्स ब्रॉड एनवायरनमेंट-वेरिएबल-लुकिंग स्ट्रिंग्स के बजाय स्ट्रक्चर्ड सीक्रेट रेफ़रेंस के ज़रिए रिज़ॉल्व किए जाते हैं, एक्सिडेंटल क्रेडेंशियल इन्फ़रेंस कम करते हुए। सेमांटिक कॉन्फ़िग म्यूटेशन्स सेंट्रली सीरियलाइज़ और रिट्राइ किए जाते हैं, जो clobber रिस्क कम करता है जब कंकरेंट कमांड्स कॉन्फ़िग एडिट करते हैं। ब्राउज़र CLI कमांड्स स्पष्ट रूप से मौजूदा ऑपरेटर-एडमिन गेटवे स्कोप रिक्वेस्ट करते हैं, अप्रूवल-लूप शोर से बचते हुए। ये ग्लैमरस बदलाव नहीं हैं, लेकिन ये बिलकुल वही बदलाव हैं जो एजेंट होस्ट को क्रेडेंशियल्स एक्सिडेंट या अपडेट-टाइम मिस्ट्री बनने से रोकते हैं।

Hermes Agent 2026.5.16 बड़ी रनटाइम कहानी है। रिलीज़ नेटिव विंडोज़ सपोर्ट को अर्ली बीटा के रूप में नामित करती है, PowerShell इंस्टॉलर, नेटिव सबप्रोसेस और PTY पाथ, taskkill-बेस्ड प्रोसेस मैनेजमेंट, MinGit ऑटो-इंस्टॉल, Python स्टब डिटेक्शन, Ctrl+C प्रिज़र्वेशन, और कई विंडोज़-ओनली फ़िक्सेस के साथ। यह एक असली PyPI व्हील भी शिप करती है: pip install hermes-agent && hermes। यह ऑनबोर्डिंग बदलता है क्योंकि यूज़र को अब एजेंट ट्राई करने के लिए रेपो क्लोन करने या कस्टम शेल इंस्टॉलर चलाने की ज़रूरत नहीं है। लेज़ी-डिपेंडेंसी फ़्रेमवर्क और एडवाइज़री चेकर भी बराबर ज़रूरी हैं: हेवी प्रोवाइडर लाइब्रेरीज़ पहले यूज़ तक डिफ़र करती हैं, इंस्टॉलर फ़ॉलबैक्स एक्स्ट्रास टायर्स के ज़रिए आगे बढ़ते हैं, और इंस्टॉल/अपडेट स्कैन अनसेफ़ वर्शन ढूंढते हैं।

Hermes में परफ़ॉर्मेंस नंबर्स इसलिए ध्यान देने योग्य हैं क्योंकि वे सीधे रोज़ाना एजेंट फ़ील से मैप करते हैं। रिलीज़ कहती है कि कोल्ड स्टार्ट स्किल्स कैशिंग, लेज़ी इम्पोर्ट्स, डिस्क-कैश-फ़र्स्ट मॉडल लुकअप, डिफ़र्ड प्रोवाइडर लाइब्रेरीज़, और पैरलल डॉक्टर चेक्स के ज़रिए लगभग उन्नीस सेकंड कम हो जाता है। hermes tools ऑल-प्लेटफ़ॉर्म्स लगभग चौदह सेकंड से डेढ़ सेकंड से कम हो जाता है। browser_console इवैल्यूएशन ज़बरदस्ती तेज़ हो जाते हैं पहले कॉल पर फ्रेश DevTools सेशन स्पॉन करने के बजाय सुपरवाइज़र के पर्सिस्टेंट CDP WebSocket को रीयूज़ करके। ब्राउज़र-हैवी एजेंट्स के लिए, पर्सिस्टेंट CDP इम्प्लिमेंटेशन डिटेल नहीं है; यह तय करता है कि डिबगिंग लूप तुरंत महसूस होता है या लगातार ब्राउज़र सेटअप पर इंतज़ार करता है।

Hermes उन कैपेबिलिटीज़ को भी जोड़ती है जो इसे ज़्यादा हब बनाती हैं। hermes proxy OAuth-ऑथेंटिकेटेड प्रोवाइडर्स को OpenAI-कम्पैटिबल लोकल एंडपॉइंट के ज़रिए एक्सपोज़ करती है, ताकि Codex, Aider, Cline, या एडिटर एक्सटेंशन जैसे टूल्स Claude Pro, ChatGPT Pro, SuperGrok, या इसी तरह के OAuth-बैक्ड अकाउंट्स से उनके पहले से समझे हुए इंटरफ़ेस के ज़रिए बात कर सकें। क्रॉस-सेशन एक-घंटे के Claude प्रॉम्प्ट कैशिंग से रिज़्यूम्स और नए सेशन में रिपीटेड-प्रिफ़िक्स कॉस्ट कम होता है। vision_analyze अब इमेज को टेक्स्ट में रिड्यूस करने के बजाय पिक्सल्स को विज़न-कैपेबल मॉडल्स को पास करता है। यूनिफ़ाइड video_generate टूल प्लगेबल वीडियो प्रोवाइडर्स सपोर्ट करता है। computer_use को एक नॉन-Anthropic-कैपेबल cua-driver बैकएंड मिलता है। /handoff लाइव सेशन को कंटेक्स्ट और टूल हिस्ट्री प्रिज़र्व करते हुए दूसरे मॉडल, पर्सोना, या प्रोफ़ाइल पर मूव करता है। इस रिलीज़ के बाद ऑपरेशनल सवाल सिर्फ़ यह नहीं है, "क्या Hermes चलता है?" यह है, "कौन से लोकल टूल्स को अपने प्रोवाइडर ब्रिज के रूप में Hermes की ओर पॉइंट करना चाहिए?"

कोड-लेखन एजेंटों के लिए, हर्मीज दो गार्डरेल जोड़ता है जो विशेष रूप से प्रासंगिक हैं। LSP सेमांटिक डायग्नोस्टिक्स write_file और patch के बाद चलते हैं, ताकि एजेंट डाउनस्ट्रीम काम जारी रखने से पहले बदली हुई फ़ाइल पर भाषा-सर्वर त्रुटियां देख सके। प्रति-टर्न फ़ाइल-म्यूटेशन वेरिफायर फुटर एजेंट को बताता है कि फ़ाइल लिखने वाले टर्न के बाद डिस्क पर वास्तव में क्या बदला। यह एक सामान्य विफलता मोड का प्रत्यक्ष उत्तर है: मॉडल मानता है कि उसने फ़ाइल संपादित की, लेकिन पैच चूक गया, गलत क्षेत्र को ओवरराइट कर दिया, या मौन टाइप त्रुटि उत्पन्न की। डायग्नोस्टिक्स प्लस म्यूटेशन सारांश परीक्षणों की जगह नहीं लेते, लेकिन वे परीक्षण चलाने से पहले लूप को छोटा करते हैं।

Claude Code 2.1.143 और 2.1.142 CLI-एजेंट पक्ष को पूरा करते हैं। प्लगइन डिपेंडेंसी एनफोर्समेंट का मतलब है कि प्लगइन को अक्षम करना अब तब अस्वीकार करता है जब कोई अन्य सक्षम प्लगइन उस पर निर्भर हो, disable-chain हिंट के साथ, और प्लगइन को सक्षम करना ट्रांज़िटिव डिपेंडेंसीज़ को फोर्स-सक्षम करता है। प्लगइन मार्केटप्लेस ब्राउज़ पेन प्रति टर्न और इनवोकेशन प्रोजेक्टेड कॉन्टेक्स्ट कॉस्ट दिखाता है, जो ऑपरेटरों को यह देखने में मदद करता है कि प्लगइन न केवल इंस्टॉल है बल्कि महंगा भी है। एक नई worktree.bgIsolation: "none" सेटिंग बैकग्राउंड सेशन्स को Git worktrees अव्यावहारिक होने पर सीधे वर्किंग कॉपी संपादित करने देती है, जबकि worktree क्लीनअप अब git worktree remove विफल होने पर डिस्ट्रक्टिव रिमूवल पर वापस नहीं जाता।

बैकग्राउंड-एजेंट फिक्सेस वे हैं जिन्हें वास्तविक काम में टेस्ट करना है। बैकग्राउंड सेशन्स आइडल से जागने के बाद मॉडल और प्रयास स्तर को संरक्षित करते हैं। /bg MCP कॉन्फ़िग, सेटिंग्स, add-dir, plugin-dir, स्ट्रिक्ट MCP कॉन्फ़िग, फ़ॉलबैक मॉडल, और bypass-permission उपलब्धता को रीस्पॉन या डीटैच में संरक्षित करता है। Claude एजेंट add-dir, सेटिंग्स, MCP कॉन्फ़िग, प्लगइन डायरेक्टरीज़, परमिशन मोड, मॉडल, प्रयास, और skip-permission डिफ़ॉल्ट्स के लिए फ्लैग स्वीकार करते हैं, और डैशबोर्ड से लॉन्च किए गए बैकग्राउंड सेशन्स कॉन्फ़िगर्ड डिफ़ॉल्ट परमिशन मोड का सम्मान करते हैं। MCP HTTP और SSE टूल कॉल अब कॉन्फ़िगर्ड टाइमआउट का सम्मान करते हैं 60 सेकंड पर सीमित होने के बजाय। स्टॉप हुक जो ब्लॉक करते रहते हैं अब आठ लगातार ब्लॉक के बाद जब तक ओवरराइड न किया जाए वार्निंग के साथ समाप्त होते हैं। संक्षेप में: कम बैकग्राउंड वर्कर्स अपना एनवायरनमेंट, परमिशन्स, मॉडल, या लॉन्ग-रनिंग MCP कॉल खोते हैं।

[24:00] Gemini Enterprise Agent Platform — रिवीज़न्स, ट्रैफ़िक स्प्लिटिंग, और Priority PayGo Google Cloud का 15 मई Gemini Enterprise Agent Platform अपडेट एक डिप्लॉयमेंट प्रिमिटिव जोड़ता है जो एजेंट टीमों को चाहिए: ट्रैफ़िक स्प्लिटिंग के साथ इम्यूटेबल एजेंट रिवीज़न्स। इस तरह की सुविधा से पहले, एजेंट डिप्लॉयमेंट अक्सर एक म्यूटेबल सर्विस एंडपॉइंट की तरह व्यवहार करता था। आप प्रॉम्प्ट, टूल्स, मॉडल सेटिंग्स, राउटिंग, या कंटेनर कोड अपडेट करते हैं; एंडपॉइंट बदलता है; और रोलबैक इस पर निर्भर करता है कि आपकी रिलीज़ प्रोसेस कितनी अनुशासित थी। रिवीज़न्स आपको एक नेम्ड डिप्लॉयमेंट आर्टिफैक्ट देते हैं। ट्रैफ़िक स्प्लिटिंग आपको पुराने वर्शन को अभी भी अधिकांश यूज़र्स की सर्विस करने देते हुए नए वर्शन पर प्रोडक्शन ट्रैफ़िक का एक नियंत्रित प्रतिशत ले जाने देता है।

यह मानक सॉफ्टवेयर डिप्लॉयमेंट की तरह लगता है, लेकिन एजेंट्स के लिए यह अधिक मायने रखता है क्योंकि एक छोटा बदलाव टूल चॉइस, विलंबता, रिफ्यूज़ल बिहेवियर, मेमोरी उपयोग, या हैल्यूसिनेशन प्रोफाइल को बदल सकता है। एक डिटर्मिनिस्टिक API के लिए कैनरी रिलीज़ अक्सर एरर रेट और p95 विलंबता देखती है। एक एजेंट के लिए कैनरी रिलीज़ को इनके अलावा टास्क कम्प्लीशन, टूल-कॉल काउंट, एस्केलेशन रेट, यूज़र करेक्शन रेट, रिट्रीवल मिस रेट, और कॉस्ट पर सक्सेसफुल आउटकम को देखना चाहिए। रिवीज़न ID ट्रेसेस, लॉग्स, इवैल्यूएशन रिकॉर्ड्स, और यूज़र-फीडबैक बंडल में दिखने चाहिए। यदि आप केवल एंडपॉइंट नेम लॉग करते हैं, तो आपको पता नहीं चलेगा कि किस एजेंट वर्शन ने रिग्रेशन का कारण बना।

14 मई के Priority PayGo अपडेट में कॉस्ट और विलंबता पक्ष की कहानी जुड़ती है। Provisioned Throughput तब सबसे अच्छा है जब आपको ट्रैफ़िक पता हो और कमिट कर सकें। Standard PayGo लचीला है लेकिन अधिक वेरिएबल परफॉर्मेंस हो सकती है। Priority PayGo उनके बीच बैठता है: स्टैंडर्ड कंजम्पशन की तुलना में अधिक सुसंगत परफॉर्मेंस बिना अपफ्रंट कमिटमेंट के। प्रोडक्शन एजेंट्स के लिए, यह उन वर्कलोड्स पर मैप होता है जो महत्वपूर्ण हैं लेकिन बर्स्टी हैं: कस्टमर सपोर्ट ट्रायज, इंटरनल रिसर्च असिस्टेंट्स, इंसिडेंट हेल्पर्स, और वर्कफ़्लो एजेंट्स जो बिज़नेस घंटों या आउटेज के दौरान स्पाइक करते हैं।

बिल्डर सिफारिश यह है कि इन दोनों रिलीज़ेस को एक साथ सोचें। बिहेवियरल बदलाव को सुरक्षित बनाने के लिए रिवीज़न्स और ट्रैफ़िक स्प्लिटिंग का उपयोग करें। जहां विलंबता वेरिएंस रोलआउट को वास्तव में दिखने से बदतर बनाएगा वहां Priority PayGo का उपयोग करें। यदि कोई नया एजेंट रिवीज़न धीमा है क्योंकि प्लेटफ़ॉर्म वेरिएबल लोड पर है, तो आप मॉडल या प्रॉम्प्ट रिग्रेशन का गलत निदान कर सकते हैं। यदि कोई नया रिवीज़न वास्तव में टूल कॉल्स या रिट्रीवल गहराई बढ़ाता है, तो Priority PayGo कॉस्ट प्रोफाइल को नहीं छुपाएगा; आपको अभी भी प्रति-रिवीज़न मेट्रिक्स चाहिए। न्यूनतम उपयोगी रोलआउट डैशबोर्ड में रिवीज़न, ट्रैफ़िक शेयर, विलंबता, मॉडल/टूल कॉस्ट, टूल एरर्स, ह्यूमन एस्केलेशन, और टास्क सक्सेस दिखना चाहिए।

[34:00] Gemini Interactions API — फ्लैट आउटपुट से टाइप्ड स्टेप्स टाइमलाइन तक Google का Interactions API ब्रेकिंग-चेंज गाइड एक स्कीमा माइग्रेशन है जिसके बड़े एजेंट-डिज़ाइन निहितार्थ हैं। पुराना आकार एक फ्लैट outputs एरे लौटाता था। नया आकार टाइप डिस्क्रिमिनेटर्स के साथ एक steps एरे लौटाता है। एक सरल अनुरोध के लिए, आप अभी भी अंतिम टेक्स्ट चंक पकड़ सकते हैं और आगे बढ़ सकते हैं। लेकिन लॉन्ग-रनिंग एजेंट्स, रिसर्च एजेंट्स, टूल-यूज़िंग एजेंट्स, और भविष्य के एसिंक्रोनस टूल कॉल्स के लिए, टाइमलाइन सही अब्स्ट्रैक्शन है। एक टर्न सिर्फ अंतिम उत्तर नहीं है; यह यूज़र इनपुट, मॉडल आउटपुट, टूल एक्टिविटी, इंटरमीडिएट स्टेट, और संभावित रूप से स्टीयरिंग इवेंट्स है।

गाइड आउटपुट कॉन्फ़िगरेशन को भी बदलता है। response_mime_type के बजाय, आउटपुट कंट्रोल एक पॉलीमॉर्फिक response_format में जाते हैं। यह उन वन-ऑफ़ फ़ील्ड्स की संख्या को कम करता है जिन पर क्लाइंट्स को ब्रांच करने की जरूरत होती है और API को बिना असंबंधित रिक्वेस्ट पैरामीटर्स के ढेर बढ़ाए स्ट्रक्चर्ड मोड्स जोड़ने की जगह देता है। SDK मेंटेनर्स के लिए, यह टाइप-जेनरेशन और कम्पैटिबिलिटी का मुद्दा है। ऐप बिल्डर्स के लिए, यह परसिस्टेंस का मुद्दा है: रिस्पॉन्स रीडर्स, फिक्सचर्स, टेस्ट्स, और डेटाबेस स्कीमास को अपडेट करें जिन्होंने माना कि outputs[-1].text कैनोनिकल उत्तर था।

माइग्रेशन-कंट्रोल डिटेल Api-Revision रिक्वेस्ट हेडर है। यह टीमों को प्रोडक्शन फेलर्स के माध्यम से रिमूवल डेट की खोज के बजाय माइग्रेशन के दौरान बिहेवियर को पिन करने का एक तरीका देता है। गाइड कहता है कि लेगसी स्कीमा 8 जून को हटाया जाता है, इसलिए व्यावहारिक योजना यह है: ड्यूल-रेड सपोर्ट जोड़ें, माइग्रेशन के दौरान रॉ इंटरैक्शन ऑब्जेक्ट्स स्टोर करें, सारांश और रीप्ले टूल्स को steps समझने के लिए अपडेट करें, और नए पार्सर के माध्यम से पुराने ट्रांसक्रिप्ट्स का एक छोटा सेट चलाएं। यदि आपके एजेंट लॉग्स evals, सपोर्ट, या ऑडिट के लिए उपयोग किए जाते हैं, तो सिर्फ पुराना टेक्स्ट-ओनली आकार रखने के लिए स्टेप टाइप्स को फेंकें नहीं।

इसलिए यह एपिसोड सेगमेंट के लिए मूल्यवान है क्योंकि यह भविष्य की दिशा का संकेत देता है। Google कहता है कि नया API shape भविष्य की क्षमताओं जैसे mid-flight steering और asynchronous tool calls को सपोर्ट करता है। इन फीचर्स के लिए एक structured event timeline की जरूरत है। अगर आपका क्लाइंट नई timeline को तुरंत वापस एक सिंगल string में बदल देता है, तो आप तकनीकी रूप से compatible होंगे लेकिन आर्किटेक्चरल रूप से पीछे हो जाएंगे। Migration को agent traces को first-class बनाने के मौके के रूप में लें: हर step को एक ID, type, timestamps, content, tool metadata और interaction से linkage मिलती है। यही तरीका है जिससे आप एक ऐसे agent को debug करते हैं जो किसी job के बीच में अपना course बदल देता है।

[43:00] समापन — क्या upgrade करें और क्या देखें Upgrade की प्राथमिकता स्पष्ट है। अगर आप OpenClaw संचालित करते हैं, तो v2026.5.12 को अपने channels, Codex/OpenAI profiles, gateway clients, browser commands, plugin installs और config mutations के विरुद्ध test करें। अगर आप Hermes संचालित करते हैं, तो नए install paths, proxy, browser latency, diagnostics और file-mutation verifier को एक toy prompt के बजाय real repo पर test करें। अगर आप Claude Code background agents का उपयोग करते हैं, तो update करें और verify करें कि /bg, claude agents, MCP configs, settings, permission modes, fallback models और PowerShell behavior detach, wake और idle में survive करते हैं।

Platform builders के लिए, Gemini Enterprise Agent Platform के revisions और traffic splitting copying के लिए production pattern हैं: agents को canaries, rollback, revision-aware observability और cost-aware rollout gates की जरूरत है। API builders के लिए, Interactions migration एक reminder है कि agent APIs event timelines बन रहे हैं। Steps को store करें। Type metadata रखें। Parser को अभी बनाएं, removal date से पहले, क्योंकि बाद में यह schema cleanup नहीं बल्कि outage बन जाएगा।

🎙 Never miss an episode — subscribe now

🎙 Subscribe to AgentStack Daily