
Hermes Agent v0.16.0 Desktop App, Codex 0.137 Multi-Agent v2, Claude Code Fallback Models, और Gemma 4 12B लोकल स्टैक पर
Hermes Agent v0.16.0 — "The Surface Release" — एक वास्तविक नेटिव डेस्कटॉप ऐप लाता है जिसमें OAuth रिमोट कनेक्ट, ड्रैग-एंड-ड्रॉप फ़ाइल इनपुट और ब्राउज़र-आधारित एडमिन पैनल शामिल है। Codex 0.137 मल्टी-एजेंट v2 रनटाइम चॉइस परसिस्टेंस और पैरलल वेब सर्च जोड़ता है, जबकि Claude Code 2.1.166/2.1.167 फॉलबैक मॉडल चेन और ग्लोब टूल-नेम डेनी रूल्स प्रस्तुत करता है। Gemma 4 12B Google का नवीनतम 12B मॉडल है जो 16GB VRAM वाले लैपटॉप पर स्थानीय रूप से चलता है। Show notes: https://tobyonfitnesstech.com/hi/podcasts/episode-65/
🎧 Listen to Episodeएपिसोड 65 — 6 जून, 2026
[00:00] एपिसोड हुक
Hermes Agent v0.16.0 (v2026.6.5) "The Surface Release" को 6 जून, 2026 को लाता है — एक नेटिव क्रॉस-प्लेटफॉर्म डेस्कटॉप ऐप जिसमें OAuth रिमोट कनेक्ट, ड्रैग-एंड-ड्रॉप फ़ाइल इनपुट, और पूर्ण ब्राउज़र-आधारित वेब एडमिन पैनल है, यह सब v0.15.2 के बाद से 874 कमिट्स और 542 मर्ज्ड PRs में शिप हुआ। OpenAI Codex rust-v0.137.0 प्रति थ्रेड मल्टी-एजेंट v2 रनटाइम चॉइस पर्सिस्टेंस, पैरलल स्टैंडअलोन वेब सर्च, और एंटरप्राइज़ क्रेडिट लिमिट कंट्रोल जोड़ता है। Claude Code 2.1.166 तीन मॉडल तक के कॉन्फ़िगर करने योग्य फ़ॉलबैक मॉडल चेन और ग्लोब टूल-नेम डेनी रूल्स पेश करता है, जिसके बाद 2.1.167 एक बग-फिक्स पॉलिश रिलीज़ के रूप में आता है। Gemma 4 12B Google की 3 जून की ओपन-वेट रिलीज़ है जो 16GB VRAM स्वीट स्पॉट में 12B-पैरामीटर एनकोडर-फ्री मल्टीमॉडल मॉडल लाती है, जो लोकल एजेंटिक वर्कफ़्लो के लिए आदर्श है। प्रोजेक्ट रडार में A2A Protocol v1.0 औपचारिक एजेंट इंटरऑपरेबिलिटी लेयर के रूप में, Kimi Code CLI TypeScript-नेटिव टर्मिनल कोडिंग एजेंट के रूप में, और awesome-ai-agents-2026 क्यूरेटेड रिसोर्स इंडेक्स के रूप में शामिल है।
[02:00] Hermes Agent v0.16.0 — नेटिव डेस्कटॉप ऐप, OAuth रिमोट कनेक्ट, और वेब एडमिन पैनल
Hermes Agent v0.16.0 वह रिलीज़ है जो बदलती है कि Hermes डेवलपर से कैसे मिलती है। मुख्य बात एक असली नेटिव Electron डेस्कटॉप ऐप्लिकेशन है — टर्मिनल रैपर नहीं, वेब टैब नहीं — जो किसी भी दूसरे macOS, Linux, या Windows ऐप की तरह इंस्टॉल होती है और ऐप के अंदर से खुद अपडेट लेती है। डेस्कटॉप GUI आपको स्ट्रीमिंग के साथ एक उचित चैट विंडो देता है, एक सेशन लिस्ट जिसे आप आर्काइव और सर्च कर सकते हैं, चैट एरिया में कहीं भी ड्रैग-एंड-ड्रॉप फ़ाइलें, क्लिपबोर्ड इमेज पेस्ट, एक Cmd+K कमांड पैलेट, और स्टेटस बार में सीधे एक मॉडल पिकर। अगर आप गैर-तकनीकी साथियों से "यह एक CLI एजेंट है" कह रहे थे और उनकी आँखें खुली देख रहे थे, तो अब आप बस उन्हें एक इंस्टॉलर भेज सकते हैं।
डेस्कटॉप ऐप को Hermes को लोकली चलाने की ज़रूरत नहीं है। इसे एक रिमोट Hermes गेटवे की ओर पॉइंट करें — आपका होमलैब, एक होस्टेड बॉक्स, किसी साथी का सर्वर — और यह सिक्योर WebSocket पर कनेक्ट होता है, OAuth या यूज़रनेम/पासवर्ड से ऑथेंटिकेट करता है। --insecure फ्लैग्स या हाथ से कॉपी की गई सेशन टोकन के साथ छेड़छाड़ नहीं। प्रत्येक प्रोफ़ाइल अपने रिमोट होस्ट को टारगेट कर सकती है, और आप एक साथ कई प्रोफ़ाइल्स में कंकरेंट सेशन चला सकते हैं। यह वह रिमोट-कनेक्ट स्टोरी है जिसका एंटरप्राइज़ और टीम Hermes डिप्लॉयमेंट इंतज़ार कर रहे थे।
वेब डैशबोर्ड में एक पूर्ण ब्राउज़र-आधारित एडमिनिस्ट्रेशन पैनल विकसित हुआ। आपको MCP कैटलॉग मैनेजमेंट, मैसेजिंग चैनल कॉन्फ़िगरेशन, क्रेडेंशियल स्टोरेज, वेबहुक मैनेजमेंट, मेमोरी कॉन्फ़िगरेशन, और प्लगेबल OIDC या यूज़रनेम-पासवर्ड लॉगिन मिलता है — यह सब ब्राउज़र से बिना CLI छुए। फर्स्ट-टाइम सेटअप में अब "Quick Setup via Nous Portal" पाथ है जो आपको सेकंडों में इंस्टॉल से पहले मैसेज तक लाता है, जो नए यूज़र्स को ऑनबोर्ड करने या Hermes को नए एनवायरनमेंट में इवैल्यूएट करने के लिए मायने रखता है।
डिफ़ॉल्ट स्किल सेट को कम करके वही रखा गया जो आपको वास्तव में चाहिए। NVIDIA/skills ने ट्रस्टेड Skills Hub टैप्स में शामिल होने का रास्ता खोला। मॉडल पिकर अब हर जगह — डेस्कटॉप, वेब, TUI, और CLI — फ़ज़ी-सर्चेबल है — जो तुच्छ लगता है जब तक आपके पास मॉडल की लंबी लिस्ट न हो और सर्च न हो। /undo आखिरकार आपको अंतिम N टर्न्स वापस लेने देता है, जो वह क्वालिटी-ऑफ़-लाइफ़ फीचर है जो यूज़र्स पहली रिलीज़ से माँग रहे थे।
हुड के नीचे, दो P0 और 62 P1 बग क्लोज़र सवार हैं। सिक्योरिटी राउंड अलग से नोट करने योग्य है: CVE-2026-48710 Starlette डिपेंडेंसी को फिक्स्ड वर्जन पर पिन करता है, SSRF ऑफ़-लूप हार्डनिंग प्लगइन और प्रोवाइडर रिक्वेस्ट पाथ्स में सर्वर-साइड रिक्वेस्ट फोर्जरी वेक्टर्स के एक क्लास को बंद करता है, और सबप्रोसेस क्रेडेंशियल स्ट्रिपिंग सुनिश्चित करता है कि क्रेडेंशियल्स चाइल्ड प्रोसेस एनवायरनमेंट में लीक न हों।
व्यावहारिक अपग्रेड लिस्ट: अपने OS के लिए डेस्कटॉप ऐप डाउनलोड और इंस्टॉल करें; अगर आपके पास रिमोट गेटवे है तो उसके खिलाफ OAuth लॉगिन टेस्ट करें; MCP सर्वर्स, चैनल्स, और क्रेडेंशियल्स ऑडिट करने के लिए वेब एडमिन पैनल एक्सप्लोर करें; नए फर्स्ट-रन एक्सपीरियंस की तुलना के लिए फ्रेश इंस्टॉल पर Quick Setup via Nous Portal चलाएँ; और अपने सेशन में अंतिम N टर्न्स के लिए /undo काम करता है यह वेरिफाई करें।
[16:00] Codex rust-v0.137.0 — मल्टी-एजेंट v2, पैरलल वेब सर्च, और एंटरप्राइज़ कंट्रोल
Codex rust-v0.137.0 जून 4, 2026 को नवीनतम स्थिर CLI टैग के रूप में प्रकाशित हुआ, EP063 के rust-v0.135.0 बेसलाइन से दो रिलीज़ आगे। सबसे आर्किटेक्चरल रूप से महत्वपूर्ण बदलाव मल्टी-एजेंट v2 है जिसमें रनटाइम चॉइस परसिस्टेंस है: प्रत्येक स्पॉन्ड थ्रेड अब अपना खुद का रनटाइम चॉइस आगे ले जाता है, और स्पॉन्ड एजेंट्स को साफ़-सुथरी फॉलो-अप और मेटाडेटा डिफ़ॉल्ट्स मिलते हैं। इसका मतलब है कि जब कोई पैरेंट Codex सेशन किसी चाइल्ड एजेंट को स्पॉन करता है, तो चाइल्ड अपनी जगह नहीं खोता जब पैरेंट सेशन हैंड-ऑफ करता है — रनटाइम चॉइस थ्रेड के साथ रहता है, सिर्फ पैरेंट प्रोसेस के साथ नहीं। मल्टी-एजेंट ऑर्केस्ट्रेशन वर्कफ़्लो के लिए, यह एक ऐसे एजेंट और दूसरे के बीच का अंतर है जो हैंड-ऑफ में एक साथ रहता है और जो चुपचाप कॉन्टेक्स्ट ड्रॉप करता है।
TUI में F13-F24 कीबाइंडिंग सपोर्ट और सर्चेबल मेन्यू में पेस्ट पावर यूज़र्स के लिए टर्मिनल एक्सपीरियंस को बेहतर बनाते हैं जो एक्सटेंडेड कीबोर्ड लेआउट का उपयोग करते हैं। एंटरप्राइज़ और एडमिन फ़्लो अब मासिक क्रेडिट लिमिट दिखाते हैं और EDU वर्कस्पेस सहित क्लाउड-मैनेज्ड कॉन्फ़िग बंडल लागू कर सकते हैं — क्रेडिट लिमिट विज़िबिलिटी एक ऐसे गैप को भरती है जहाँ ऑपरेटर्स बिल आने तक स्पेंड नहीं देख सकते थे।
प्लगइन वर्कफ़्लो में मशीन-रीडेबल codex plugin list --json आउटपुट और कैश्ड रिमोट कैटलॉग सुझाव मिले। मशीन-रीडेबल आउटपुट का मतलब है कि आप प्लगइन लिस्ट को स्क्रिप्ट, CI पाइपलाइन, या फ़्लीट मैनेजमेंट टूलिंग में पाइप कर सकते हैं बिना ह्यूमन-रीडेबल टेक्स्ट पार्स किए। कैश्ड रिमोट कैटलॉग सुझाव प्लगइन डिस्कवरी फ़्लो को तेज़ करते हैं रिपीटेड नेटवर्क कॉल से बचकर।
होस्टेड वेब और इमेज टूल्स अब और कोड-मोड फ़्लो में उपलब्ध हैं, स्टैंडअलोन वेब सर्च अब पैरलल चलाने में सक्षम हैं। पैरलल स्टैंडअलोन वेब सर्च का मतलब है कि Codex एक साथ कई सर्च क्वेरीज़ फ़ायर कर सकता है और उन्हें क्रमिक रूप से चलाने के बजाय परिणाम सिंथेसाइज़ कर सकता है — रिसर्च-हेवी वर्कफ़्लो के लिए यह एक असली लेटेंसी जीत है। परमिशन रिक्वेस्ट और अप्रूवल अब एनवायरनमेंट आइडेंटिटी ले जाते हैं, जो एक ऐसे गैप को भरता है जहाँ एक कॉन्टेक्स्ट में दी गई परमिशन गलती से दूसरे कॉन्टेक्स्ट बाउंड्री पर लागू हो सकती थी। macOS ऐप लॉन्च और Windows SQLite स्टार्टअप, थ्रेड रिज़्यूम, और सैंडबॉक्स सेटअप रिफ्रेश के लिए प्लेटफ़ॉर्म रिलायबिलिटी में सुधार हुआ।
व्यावहारिक अपग्रेड लिस्ट: Codex को rust-v0.137.0 पर अपग्रेड करें; एक मल्टी-एजेंट सेशन को टेस्ट करें ताकि रनटाइम चॉइस स्पॉन और रिज़्यूम में सही तरीके से जारी रहता है; मशीन-रीडेबल आउटपुट फॉर्मेट देखने के लिए codex plugin list --json चलाएं; किसी कोड-मोड फ़्लो में पैरलल वेब सर्च को टेस्ट करें; एंटरप्राइज़/एडमिन फ़्लो में नई मासिक क्रेडिट लिमिट डिस्प्ले देखें।
[26:00] Claude Code 2.1.166/2.1.167 — फ़ॉलबैक मॉडल चेन और ग्लोब टूल-नेम डेनी रूल्स
Claude Code का npm latest अब 2.1.166 और 2.1.167 है, 2.1.165 के बाद। वर्शन 2.1.166 फ़ीचर रिलीज़ है जिसमें दो ऑपरेटर-विज़िबल एडिशन हैं। हेडलाइन एक नई fallbackModel सेटिंग है जो आपको प्राइमरी मॉडल के ओवरलोडेड या अनुपलब्ध होने पर क्रम में ट्राइ किए जाने वाले तीन तक फ़ॉलबैक मॉडल कॉन्फ़िगर करने देती है। --fallback-model फ़्लैग अब बैकग्राउंड सेशन के अलावा इंटरैक्टिव सेशन पर भी लागू होती है — इसका मतलब है कि इंटरैक्टिव टर्मिनल सेशन भी अपने आप अगले मॉडल पर रोल ओवर कर सकते हैं जब प्राइमरी सैचुरेट हो। यह मॉडल अनुपलब्धता को हैंडल करने के तरीके को बदलता है: एक सिंगल प्रॉम्प्ट फेल होने के बजाय जब API कैपेसिटी पर हो, Claude Code अपने आप आपके कॉन्फ़िगर्ड अगले मॉडल को ट्राइ करता है।
डेनी रूल टूल-नेम पोज़िशन में ग्लोब पैटर्न सपोर्ट दूसरा फ़ीचर है। "*" का उपयोग करने से सभी टूल्स डिनाई होते हैं। अलाउ रूल्स नॉन-MCP ग्लोब्स को रिजेक्ट करते हैं, और डेनी रूल में अनजाने टूल नेम अब स्टार्टअप पर वार्न करते हैं बजाय चुपचाप मैलफॉर्म्ड रूल्स को एक्सेप्ट करने के। अनजाने टूल नेम के लिए स्टार्टअप वार्निंग ऑपरेटर-फ्रेंडली इम्प्रूवमेंट है: अब आपको स्टार्टअप पर पता चलता है अगर कोई डेनी रूल गलत कॉन्फ़िगर्ड है बजाय तब पता लगाने के जब रूल फ़ायर करने में फेल होता है।
वर्शन 2.1.167 शुद्ध बग फिक्स और रिलायबिलिटी इम्प्रूवमेंट है — हाइजीन वेव जो फ़ीचर रिलीज़ के बीच रिलीज़ ट्रेन को साफ़-सुथरा रखता है।
व्यावहारिक अपग्रेड सूची: अपने Claude Code कॉन्फ़िगरेशन में fallbackModel जोड़ें जिसमें प्राथमिकता के क्रम में दो या तीन विकल्प हों; श्रृंखला का परीक्षण अपने प्राथमिक मॉडल को अस्थायी रूप से अनुपलब्ध करके और सत्यापित करके करें कि फॉलबैक सही ढंग से काम कर रहा है; पूर्ण टूल लॉकआउट का परीक्षण करने के लिए deny नियम में "*" का उपयोग करें; सत्यापित करें कि deny नियमों में अज्ञात टूल नाम स्टार्टअप चेतावनियां उत्पन्न करते हैं; और नवीनतम बग फिक्स के लिए 2.1.167 पर अपग्रेड करें।
[34:00] Gemma 4 12B — 16GB VRAM सुनहरी सीमा में एन्कोडर-मुक्त मल्टीमॉडल मॉडल
Google ने 3 जून, 2026 को Gemma 4 12B को Apache 2.0 ओपन-वेट चेकपॉइंट के रूप में जारी किया, जिसमें 256K संदर्भ विंडो है, जो एजेंटिक मल्टीमॉडल बुद्धिमत्ता को सीधे लैपटॉप पर स्थानीय वर्कफ़्लो के लिए लाने के लिए डिज़ाइन किया गया है। मुख्य आर्किटेक्चरल निर्णय एन्कोडर-मुक्त मल्टीमॉडल इनपुट है: विज़न और ऑडियो सीधे LLM बैकबोन में प्रवाहित होते हैं, अलग मल्टीमॉडल एन्कोडर के बजाय। यही आर्किटेक्चरल पैटर्न बड़े मल्टीमॉडल मॉडलों को छोटे पैरामीटर गणनाओं में फिट बैठाता है — एन्कोडर ओवरहेड को हटाकर, 12B मॉडल पैरामीटर और विलंबता जोड़ने वाले अलग प्रोसेसिंग स्टेज के बिना छवि और ऑडियो इनपुट को संभाल सकता है।
बेंचमार्क प्रदर्शन को उन्नत तर्क कार्यों पर Google's 26B मॉडल के करीब बताया गया है, जो 12B मॉडल को उन बेंचमार्क पर दोगुने आकार के मॉडलों के साथ प्रतिस्पर्धात्मक स्थिति में रखेगा जो एजेंटिक वर्कफ़्लो के लिए मायने रखते हैं। एजेंटिक वर्कफ़्लो पोजिशनिंग स्पष्ट है: स्वायत्त डेटा प्रोसेसिंग, विज़ुअल इनसाइट्स, और वेबपेज बिल्डिंग को लक्षित उपयोग केस के रूप में सूचीबद्ध किया गया है। Google AI Edge 16GB और 32GB VRAM वाले लैपटॉप हार्डवेयर पर स्थानीय परिनियोजन का मार्ग प्रदान करता है।
एजेंट स्टैक के लिए, Gemma 4 12B उपभोक्ता हार्डवेयर पर स्थानीय कोडिंग-एजेंट उपयोग के लिए सबसे यथार्थवादी ओपन-वेट 12B मॉडल है। यह स्थानीय-प्रथम एजेंट वर्कफ़्लो को बदल देता है जब मॉडल और वेट आपकी मशीन पर रहते हैं — कोई API विलंबता नहीं, कोई डेटा आपके वातावरण से बाहर नहीं जाता, कोई प्रति-टोकन लागत नहीं। 256K संदर्भ विंडो का मतलब है कि यह छोटी-संदर्भ वाले मॉडलों द्वारा आवश्यक संदर्भ चंकिंग के बिना बड़े कोडबेस या लंबे दस्तावेज़ों को संभाल सकता है।
व्यावहारिक अपग्रेड सूची: Hugging Face से Gemma 4 12B चेकपॉइंट पुल करें और इसे 16GB VRAM वाले लैपटॉप पर LM Studio या Ollama के माध्यम से चलाएं; एक कोडिंग टास्क आउटपुट की तुलना अपने वर्तमान स्थानीय मॉडल से करें; किसी लंबे कोडबेस या दस्तावेज़ समझ टास्क पर 256K संदर्भ का परीक्षण करें; और यदि आप एक-कमांड इंस्टॉल पसंद करते हैं तो प्रबंधित स्थानीय परिनियोजन पथ के लिए Google AI Edge का उपयोग करें।
[42:00] Kimi Code CLI — मूल MCP सहायता के साथ TypeScript-नेटिव टर्मिनल कोडिंग एजेंट
Moonshot AI ने 5 जून, 2026 को Kimi Code CLI को MIT-लाइसेंस्ड ओपन-सोर्स टर्मिनल AI कोडिंग एजेंट के रूप में जारी किया जो TypeScript में लिखा गया है। यह प्रोजेक्ट पुराने kimi-cli का उत्तराधिकारी है और npm या एक एकल इंस्टॉल स्क्रिप्ट के माध्यम से वितरित किया जाता है जिसे पहले से इंस्टॉल की गई Node.js की आवश्यकता नहीं है। macOS या Linux पर: curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash। Windows पर: irm https://code.kimi.com/kimi-code/install.ps1 | iex। वैश्विक npm इंस्टॉल के लिए Node.js 24.15.0 या बाद का संस्करण आवश्यक है।
Kimi Code CLI कोड पढ़ता और संपादित करता है, शेल कमांड चलाता है, फ़ाइलें खोजता है, वेब पेज लाता है, और प्रतिक्रिया के आधार पर अपना अगला कदम चुनता है — मानक कोडिंग एजेंट लूप। बॉक्स से बाहर यह Moonshot AI के Kimi मॉडलों के साथ काम करता है और अन्य संगत प्रदाताओं का उपयोग करने के लिए कॉन्फ़िगर किया जा सकता है। फीडबैक-संचालित निष्पादन मॉडल रीड-ओनली ऑपरेशन स्वचालित रूप से चलाता है और फ़ाइल संपादन या शेल कमांड पर पुष्टि मांगता है — एक अनुमोदन प्रवाह जो जोखिम भरे कार्यों को डेवलपर के नियंत्रण में रखता है।
उल्लेखनीय विशेषताओं में मिलीसेकंड में तैयार फास्ट TUI, चैट में स्क्रीन रिकॉर्डिंग ड्रॉप करने के लिए वीडियो इनपुट, /mcp-config के माध्यम से AI-नेटिव MCP कॉन्फ़िगरेशन, पैरलल काम के लिए सबएजेंट्स (पृथक संदर्भों में coder, explore, और plan सबएजेंट्स), और टूल कॉल्स को गेट करने, निर्णयों का ऑडिट करने, या नोटिफिकेशन ट्रिगर करने के लिए लाइफसाइकल हुक शामिल हैं। /mcp-config के माध्यम से MCP कॉन्फ़िगरेशन वह सुविधा है जो इसे एजेंट स्टैक से जोड़ती है: आप बाहरी कॉन्फ़िगरेशन फ़ाइलों के बिना CLI के अंदर से MCP सर्वर जोड़ सकते हैं और प्रमाणित कर सकते हैं।
Version 0.11.0 जून 5, 2026 को प्रकाशित हुआ। प्रोजेक्ट में 1,902 GitHub स्टार्स हैं और सक्रिय विकास जारी है।
व्यावहारिक अपग्रेड सूची: Kimi Code CLI इंस्टॉल करें और kimi --version से सत्यापित करें; इसे अपने Kimi API key या Moonshot AI OAuth से कनेक्ट करें; /mcp-config के जरिए एक MCP सर्वर कॉन्फ़िगरेशन टेस्ट करें; codebase टास्क के खिलाफ समानांतर में एक सबएजेंट चलाएं; और अपने मौजूदा CLI एजेंट के मुकाबले execution गुणवत्ता की तुलना करें।
[50:00] A2A Protocol v1.0 — औपचारिक एजेंट इंटरऑपरेबिलिटी लेयर
Agent-to-Agent Protocol 2026 में Linux Foundation के तहत v1.0 तक पहुंचा, जिसने विभिन्न फ्रेमवर्क से आने वाले एजेंटों के लिए एक औपचारिक specification स्थापित किया — कैसे वे एक-दूसरे को खोजते हैं, संचार चैनल स्थापित करते हैं, और टास्क सौंपते हैं। प्रोटोकॉल एजेंट खोज के लिए JSON क्षमता manifests — "एजेंट कार्ड" परिभाषित करता है, और JSON-RPC 2.0 का उपयोग करके लंबे-चलने वाले इंटरैक्शन के लिए टास्क-आधारित state machine परिभाषित करता है। मूल रूप से Google द्वारा लॉन्च किया गया, A2A अब MCP के साथ-साथ Linux Foundation द्वारा शासित है।
MCP बनाम A2A भेद महत्वपूर्ण मानसिक मॉडल है: MCP मानकीकृत करता है कि एक एजेंट बाहरी टूल्स, डेटाबेस और डेटा स्रोतों से कैसे कनेक्ट होता है — यह इस बारे में है कि एक एजेंट क्या कर सकता है। A2A मानकीकृत करता है कि एजेंट एक-दूसरे से कैसे संवाद करते हैं — यह इस बारे में है कि एजेंट एक साथ कैसे काम करते हैं। MCP पहले से ही एजेंट स्टैक में व्यापक रूप से अपनाया गया है। A2A v1.0 पूरक प्रोटोकॉल है जो हर जोड़ी के लिए कस्टम इंटीग्रेशन कोड के बिना क्रॉस-फ्रेमवर्क एजेंट हैंडऑफ को सक्षम करेगा।
a2aproject/A2A repository में 24,153 स्टार्स हैं और जून 6, 2026 तक सक्रिय विकास है। एजेंट स्टैक के लिए, A2A v1.0 इंटरऑपरेबिलिटी लेयर है जो एक Claude Code सत्र को Hermes एजेंट को सौंपने, या एक OpenClaw एजेंट को Codex थ्रेड को हैंडऑफ करने देगा — हर जोड़ी के लिए कस्टम इंटीग्रेशन बनाने के बिना। प्रोटोकॉल पर्याप्त परिपक्वता तक पहुंच गया है कि बिल्डर्स को मल्टी-एजेंट वर्कफ़्लो डिज़ाइन करते समय इसके बारे में जानकारी होनी चाहिए।
व्यावहारिक अपग्रेड सूची: एजेंट कार्ड संरचना और टास्क state machine semantics को समझने के लिए a2aproject/A2A GitHub repo पर A2A v1.0 specification पढ़ें; यदि आप एक मल्टी-एजेंट वर्कफ़्लो बना रहे हैं, तो A2A एजेंट कार्ड्स को ध्यान में रखते हुए एजेंट हैंडऑफ पॉइंट्स डिज़ाइन करें; और यदि आपके पास दो अलग-अलग एजेंट रनटाइम उपलब्ध हैं तो एक क्रॉस-फ्रेमवर्क एजेंट delegation टेस्ट करें।
[58:00] व्यावहारिक कतार
Hermes Agent के लिए, desktop app installer डाउनलोड करें और इसे अपने मौजूदा gateway के खिलाफ चलाएं; यदि आपके पास hosted Hermes है तो OAuth remote connect टेस्ट करें; MCP सर्वर्स और credentials की जांच के लिए वेब admin panel एक्सप्लोर करें। Codex के लिए, rust-v0.137.0 पर अपग्रेड करें और spawn और resume cycle में मल्टी-एजेंट v2 runtime choice persistence टेस्ट करें। Claude Code के लिए, अपने config में दो या तीन विकल्पों के साथ fallbackModel जोड़ें; पूर्ण टूल लॉकआउट के लिए glob "*" deny rule टेस्ट करें। Gemma 4 12B के लिए, Hugging Face से checkpoint पुल करें और इसे 16GB VRAM मशीन पर चलाएं; अपने मौजूदा लोकल मॉडल के खिलाफ एक कोडिंग टास्क की तुलना करें। Kimi Code CLI के लिए, इसे इंस्टॉल करें और /mcp-config के जरिए एक MCP सर्वर कनेक्ट करें। A2A के लिए, v1.0 spec पढ़ें और अपने वर्कफ़्लो में एक मल्टी-एजेंट हैंडऑफ पॉइंट पहचानें जहां A2A एजेंट कार्ड एक कस्टम इंटीग्रेशन की जगह ले सकते हैं।