Episode 66·8 जून 2026·49:42

क्लॉड शुक्रवार आउटेज, क्लॉड कोड .168 दिन-देरी फिक्स, ओपनक्लॉ मासिक कैडेंस स्विच, ओपनएआई चैटजीपीटी सुपरऐप, ऐप्पल डब्ल्यूडब्ल्यूसी 2026, एंथ्रोपिक मिथोस विस्तार, माइक्रोसॉफ्ट MAI कॉपायलट में उतरा, मैक पर जेम्मा 4 12बी

एजेंट-हार्नेस चक्र का नेतृत्व OpenClaw v2026.6.5-beta.2 और Claude Code 2.1.168 ने किया, और चक्र की शुरुआत शुक्रवार 5 जून के आउटेज से हुई जिसने लगभग दो घंटे तक Claude API, Claude Code, claude.ai, और Claude Cowork को प्रभावित किया — मुख्य रूप से Opus 4.7 और 4.8 — जो लगभग एक हजार Downdetector रिपोर्ट तक पहुंचा। OpenClaw ने जून 2026 की फर्श 5.28 के साथ मासिक पैच कैडेंस पर रिलीज़ ट्रेन बदल दी। Claude Code ने .167 बेसलाइन पर एक दिन-देरी वाली बग-फिक्स रिलीज़ भेजी, जिसने सेशन अटैचमेंट और स्ट्रीम-जSON को बंद किया। Show notes: https://tobyonfitnesstech.com/hi/podcasts/episode-66/

🎧 Listen to Episode

Listen & Subscribe

Spotify Apple iHeart YouTube Music Amazon RSS

[00:00] इंट्रो: OpenClaw v2026.6.5-beta.2 मासिक कैडेंस स्विच, Claude Code .168 एक दिन लेट फिक्स, OpenAI ChatGPT सुपरऐप, Apple WWDC 2026, Anthropic Mythos विस्तार, Microsoft MAI in Copilot, Mac पर Gemma 4 12B

OpenClaw v2026.6.5-beta.2 प्रीरिलीज़ इस साइकल की हेडलाइन रिलीज़ है। इसने जून 2026 फ्लोर को 5.28 पर पिन किया हुआ मासिक पैच नंबरिंग स्कीम में रिलीज़ ट्रेन स्विच की है। बिल्ड में नया Parallel बंडल्ड web_search प्रोवाइडर, गैर-टेक्स्ट और गैर-इमेज ब्लॉक्स के लिए MCP टूल रिज़ल्ट कोएर्शन, प्रॉम्प्ट-कैश एक्सपायरी के बाद Anthropic एक्सटेंडेड-थिंकिंग रिकवरी, और macOS नोड मोड फिक्स शामिल है। Claude स्टैक ने भी शुक्रवार 5 जून की सुबह लगभग दो घंटे के लिए 11:19 a.m. EDT से शुरू होकर आउटेज लिया, जिसमें Claude API, Claude Code, claude.ai, और Claude Cowork प्रभावित हुए और मुख्य रूप से Opus 4.7 और 4.8 को ऊंची एरर रेट मिली — Downdetector US रिपोर्ट्स के लगभग हज़ार के करीब पीक पर पहुंचा, जिसके बाद Anthropic ने दोपहर के शुरुआत में घटना के हल होने की पुष्टि की। Claude Code 2.1.168 अगले दिन का जवाब है: .167 बेसलाइन पर एक फोकस्ड एक दिन लेट बग-फिक्स जो सेशन अटैचमेंट, stream-json इवेंट ऑर्डरिंग, और इंटरप्ट हैंडलिंग बग्स को बंद करता है, जिनमें से कई आउटेज विंडो के दौरान यूज़र्स द्वारा रिपोर्ट किए गए फेलियर मोड से मेल खाते हैं। हैर्नेस ब्लॉक के बाद, OpenAI IPO के लिए कोडिंग-एजेंट सुपरऐप के रूप में ChatGPT को फिर से बना रहा है, Apple WWDC 2026 एक Gemini-बिल्ट Siri के साथ खुलता है, Anthropic Project Glasswing को 150+ संगठनों तक विस्तारित करता है, Microsoft MAI-Thinking-1 और MAI-Code-1-Flash को GitHub Copilot में भेजता है, और Gemma 4 12B Mac के लिए Google AI Edge Gallery पर 16GB लोकल मल्टीमॉडल मॉडल के रूप में हिट करता है। MCP लेन इस सप्ताह संक्षिप्त है — एक पैराग्राफ का ब्लिप, डीप-डाइव नहीं। प्रोजेक्ट रडार A2A v1.0 और CheetahClaws Python हैर्नेस को कवर करता है।

[02:00] क्लॉड शुक्रवार आउटेज (5 जून), Claude Code .168 एक दिन लेट बग-फिक्स, OpenClaw v2026.6.5-beta.2 मासिक कैडेंस स्विच — रिलीज़ कवरेज

Claude स्टैक को शुक्रवार 5 जून, 2026 को 11:19 a.m. EDT से शुरू होकर लगभग दो घंटे का प्रहार हुआ। Anthropic ने Claude API, Claude Code, claude.ai, और Claude Cowork में ऊंची एरर रेट की पुष्टि की। व्यवधान मुख्य रूप से Opus 4.7 और 4.8 को प्रभावित करता था, और Downdetector US रिपोर्ट्स के लगभग हज़ार के करीब पीक पर पहुंचा — चालीस प्रतिशत Claude Chat, तैंतीस प्रतिशत Claude Code, बीस प्रतिशत Claude ऐप। Anthropic का स्टेटस पेज दोपहर के शुरुआत में घटना के हल होने का संकेत दिखा रहा था, और सार्वजनिक बयान यह था कि सफलता दर अपेक्षित स्तरों पर लौट आई थी। आउटेज वह वास्तविक कारण है जिसकी वजह से Claude Code .168 अगले दिन शिप हुआ। रिलीज़ .167 बेसलाइन पर एक फोकस्ड बग-फिक्स है जो सेशन अटैचमेंट इश्यू, stream-json इवेंट ऑर्डरिंग रिग्रेशन, और इंटरप्ट हैंडलिंग बग्स को बंद करता है — जिनमें से कई आउटेज विंडो के दौरान यूज़र्स द्वारा रिपोर्ट किए गए फेलियर मोड से मेल खाते हैं। हैर्नेस लेयर के लिए टेकअवे ऑपरेशनल रिस्पॉन्स टाइम है। शुक्रवार को दो घंटे का आउटेज, शनिवार को बग-फिक्स रिलीज़, और उसी सप्ताह का चेंजलॉग एंट्री एजेंट स्टैक के लिए नया सामान्य है।

Claude Code 2.1.168 npm latest है, 6 जून को 23:41 UTC पर पब्लिश हुआ, .166 और .167 रिलीज़ वेव के एक दिन बाद। वर्शन npm रजिस्ट्री और चेंजलॉग से वेरीफाइड है। यह एक फीचर रिलीज़ नहीं, फोकस्ड बग-फिक्स रिलीज़ है। रिलीज़ नोट्स एक क्लीनअप वेव का वर्णन करते हैं जो .167 बेसलाइन के खिलाफ रिपोर्ट किए गए सेशन अटैचमेंट इश्यू, stream-json इवेंट ऑर्डरिंग रिग्रेशन, और इंटरप्ट हैंडलिंग बग्स को बंद करता है। स्कोप मायने रखता है क्योंकि वे तीन सरफेस वहीं हैं जहां बैकग्राउंड एजेंट वर्क चुपचाप गलत होता है। एक बैकग्राउंड सेशन जो साफ़ तरीके से अटैच नहीं होता वह एक सेशन है जो अपना चल रहा टास्क खो देता है, और फेलियर मोड तब तक अदृश्य रहता है जब तक ऑपरेटर दोबारा कनेक्ट नहीं होता और खाली टास्क लिस्ट नहीं पाता। एक stream-json सेशन जो इवेंट ऑर्डरिंग को गलत तरीके से हैंडल करता है वह एक सेशन है जो मिड-टूल-कॉल पर काम खो देता है, और JSON पाइप के दूसरी तरफ कंस्यूमर एक पार्शियल या डुप्लिकेटेड इवेंट देखता है। एक इंटरप्ट हैंडलर जो एक कीप्रेस को निगल लेता है वह एक सेशन है जो लगता है कि हैंग हो गया है जबकि वास्तव में उसने इनपुट स्वीकार कर लिया है और मॉडल पर इंतज़ार कर रहा है। पॉइंट वन सिक्स्टी एट पॉइंट वन सिक्स्टी सेवन का क्लीनअप पास है, और टीम ने फीचर रिलीज़ के एक दिन के भीतर पैच को दरवाज़े से बाहर निकाल दिया। वर्शन मेटाडेटा भी एक नोट के काबिल है। npm latest dist-tag पॉइंट वन सिक्स्टी एट है, और npm stable dist-tag पॉइंट वन फिफ्टी थ्री पर रहता है। latest और stable के बीच का यह गैप जानबूझकर है। Anthropic latest dist-tag का उपयोग क्लीनअप रिलीज़ के माध्यम से आगे बढ़ने के लिए करता है जबकि stable को फ्लीट एनवायरनमेंट के लिए ज्ञात-अच्छा बिल्ड पर पिन रखता है जो हर पॉइंट रिलीज़ के पीछे नहीं दौड़ना चाहते। पॉइंट वन सिक्स्टी सेवन और पॉइंट वन सिक्स्टी एट के बीच बिहेवियर डेल्टा सेशन स्टेबिलिटी में है, कैपेबिलिटी में नहीं। जो बैकग्राउंड सेशन फंसे हुए थे उन्हें अब साफ़ तरीके से फिर से शुरू होना चाहिए। जो stream-json कंस्यूमर्स पार्शियल या डुप्लिकेटेड टूल इवेंट्स प्राप्त कर रहे थे उन्हें अब साफ़ इवेंट ऑर्डरिंग दिखनी चाहिए। इंटरैक्टिव यूज़र्स जिन्होंने टर्न की शुरुआत में इंटरप्ट प्रेस किया और सेशन को कीप्रेस को अनदेखा करते देखा, उन्हें अब इंटरप्ट स्वीकृत दिखना चाहिए।

OpenClaw लाइन एक अलग अक्ष पर आगे बढ़ रही है। v2026.6.5-beta.2 प्रीरिलीज़ 7 जून को पब्लिश हुई नए मासिक पैच नंबरिंग स्कीम के साथ आती है, और जून 2026 फ्लोर 5.28 पर पिन है। सार्थक बदलाव संरचनात्मक है। रिलीज़ ट्रेन मासिक कैडेंस पर स्विच हो गई है, और वर्शन नेमिंग स्कीम बदल गई है। अगली स्थिर OpenClaw रिलीज़ मासिक कैडेंस पर है, और ऑपरेटर्स को आगे एक नया आकार उम्मीद करना चाहिए। प्री-ट्रांज़िशन टैग संगत हैं, जिसका अर्थ है कि अपग्रेड पर कुछ नहीं टूटता, और मौजूदा छह बिंदु एक डिप्लॉयमेंट बिना हस्तक्षेप के काम करना जारी रखते हैं। जून प्रीरिलीज़ बंडल स्वयं घना है। Parallel बंडल्ड web_search प्रोवाइडर बाहरी डिपेंडेंसी को इन-प्रोसेस इम्प्लीमेंटेशन से बदल देता है, और जीत सर्च पाथ पर लेटेंसी और रिलायबिलिटी में है। बंडल्ड प्रोवाइडर एक नेटवर्क हॉप और तृतीय-पक्ष API सरफेस हटाता है, जिसका अर्थ है कि जो टूल कॉल सर्च रिज़ल्ट्स रिटर्न करता है वह अब बाहरी सर्विस के ऊपर निर्भर नहीं है। MCP टूल रिज़ल्ट कोएर्शन गैर-टेक्स्ट और गैर-इमेज रिज़ल्ट ब्लॉक्स को समान रूप से हैंडल करता है, इसलिए एक टूल जो स्ट्रक्चर्ड पेलोड रिटर्न करता है उसके लिए एजेंट द्वारा उपभोग करने के लिए अब कस्टम एडाप्टर की जरूरत नहीं है। प्रॉम्प्ट-कैश एक्सपायरी के बाद Anthropic एक्सटेंडेड-थिंकिंग रिकवरी एक प्रकार की रिकवरी इश्यू को बंद करता है जहां प्रॉम्प्ट कैश इनवैलिडेट हो जाती है और एक्सटेंडेड-थिंकिंग स्टेट खो जाता है। macOS नोड मोड फिक्स एक स्वस्थ सीधे Gateway सेशन से चुपचाप दूर स्वयं-पुनःकनेक्ट होने से रोकता है। स्थिर OpenClaw 3 जून से छह बिंदु एक पर रहता है।

[12:00] OpenAI ChatGPT "सुपरऐप" — चैट मर गई है

फाइनेंशियल टाइम्स ने 7 जून को रिपोर्ट किया कि OpenAI सबसे बड़े ChatGPT ओवरहॉल की तैयारी कर रहा है जब से लॉन्च हुआ है। कंपनी के अंदर से पिच सीधी है, और एक वरिष्ठ OpenAI कर्मचारी ने FT को बताया कि "चैट मर गई है।" नया ChatGPT एक एकीकृत सुपरऐप के रूप में फिर से बनाया जा रहा है जो Codex, AI एजेंट्स, इमेज जनरेशन, और तृतीय-पक्ष सर्विसेज़ को मोड़ता है। प्रोडक्ट सरफेस एक राजस्व उत्पाद तक सिकोड़ा जा रहा है जो बात करने के बजाय काम करता है। Thibault Sottiaux, जो OpenAI के कोर प्रोडक्ट और प्लेटफॉर्म का नेतृत्व करते हैं, ने लक्ष्य को "एक पर्सनल एजेंट" के रूप में फ्रेम किया जो "आपके जीवन में हर चीज़ में मदद करने में सक्षम हो, चाहे वह निजी तौर पर हो या काम पर।" रणनीतिक संदर्भ IPO रेस है। Anthropic ने 1 जून को गोपनीय रूप से फाइल किया। OpenAI के आने के हफ्तों में आने की उम्मीद है। Anthropic की वार्षिक राजस्व मई में 47 अरब डॉलर पहुंच गई, इस साल की शुरुआत में 30 अरब डॉलर से, जो मुख्य रूप से Claude Code और Mythos प्रीव्यू पर थी। निवेशकों द्वारा OpenAI को बताया जा रहा है कि उसे एक स्पष्ट राजस्व पथ की जरूरत है, और सुपरऐप वही है। यह मूव Sora विंड-डाउन की भी व्याख्या करता है। मार्च में, वॉल स्ट्रीट जर्नल ने रिपोर्ट किया था कि OpenAI स्टैंडअलोन Sora वीडियो प्रोडक्ट जैसे "साइड क्वेस्ट्स" को छोड़ रहा था। सुपरऐप रणनीति उस पढ़ने की पुष्टि करती है। OpenAI अपने सरफेस एरिया को प्रयोगों के पोर्टफोलियो के बजाय एक एकल राजस्व उत्पाद में समेकित कर रहा है। ChatGPT Plugins, कंपनी का मार्च 2023 में इस समेकन का पहला प्रयास, नहीं चला। 2026 का प्रयास एक अलग फाउंडेशन पर है। Codex असली है, एजेंटिक कोडिंग पैसे दे रही है, और एंटरप्राइज कस्टमर के पास पहले से ही एक सिंगल साइन-ऑन पथ है। "चैट मर गई है" फ्रेमिंग मार्केटिंग रीसेट है — पिछला फ्रेमिंग असिस्टेंट था, वर्तमान वाला कोवर्कर है।

[22:00] Apple WWDC 2026 — Gemini-बिल्ट Siri

WWDC 2026 8 जून को सुबह 10:00 बजे PT पर Apple Park से स्ट्रीम किए गए प्री-रिकर्डेड कीनोट के साथ खुलता है। यह सितंबर में जॉन टर्नस को भूमिका सौंपने से पहले टिम कुक का अंतिम WWDC CEO के रूप में है। हेडलाइन वह Siri ओवरहॉल है जिसे Apple WWDC 2024 से टीज़ और डिले कर रहा है। नया Siri जनवरी 2026 Apple-Google पार्टनरशिप के हिस्से के रूप में Google के Gemini टीम के साथ संयुक्त रूप से विकसित एक कस्टम Gemini मॉडल पर बना है। रिपोर्ट किया गया फीचर सेट: अधिक संवादात्मक, कॉन्टेक्स्ट-अवेयर, मल्टी-स्टेप टास्क हैंडलिंग, ऐप-स्पैनिंग एक्शन्स, और एक स्टैंडअलोन Siri ऐप जो ChatGPT, Claude, और Gemini से सीधे प्रतिस्पर्धा करने में सक्षम है। Bloomberg के मार्क गरमन रिपोर्ट करते हैं कि कैमरा ऐप में एक नया "विजुअल इंटेलिजेंस" सेक्शन है जो ऑब्जेक्ट रिकग्निशन के लिए Google Image Search का उपयोग करता है। रिपोर्ट्स AI-ड्रिवन फोटोस फीचर्स, यूज़र मूड से जुड़े AI वॉलपेपर्स, विस्तारित Genmoji, और App Store AI एजेंट इंटीग्रेशन की ओर भी इशारा करती हैं। ऑपरेटिंग सिस्टम लाइनअप iOS 27, iPadOS 27, macOS 27, watchOS 27, और visionOS 27 के रूप में शिप होता है। iOS 27 को Apple's पहले फोल्डेबल iPhone के सितंबर में शिपिंग को समायोजित करना होगा। iPhone Fold पहली बार दो ऐप्स को साइड-बाय-साइड सपोर्ट करने की उम्मीद है, खुलने पर iPad जैसी डिस्प्ले के साथ।

[32:00] Anthropic प्रोजेक्ट ग्लासविंग 150+ संगठनों तक विस्तृत

Anthropic ने 2 जून को घोषणा की कि प्रोजेक्ट ग्लासविंग — AI का उपयोग करके महत्वपूर्ण सॉफ्टवेयर भेद्यताओं को खोजने और ठीक करने के लिए उसका संयुक्त उद्योग कार्यक्रम — 15 से अधिक देशों में लगभग 150 नए संगठनों तक विस्तारित हो रहा है। यह विस्तार बिजली, पानी, स्वास्थ्य सेवा, संचार और हार्डवेयर को शामिल करता है। उन उद्योगों को जो मूल 50-साझेदार कोहोर्ट में "अच्छी तरह प्रतिनिधित्व" नहीं थे, जिन्हें अप्रैल में Claude Mythos Preview एक्सेस मिला था। नया एक्सेस U.S.-आधारित पहचान और सुरक्षा विक्रेता Okta, दक्षिण कोरियाई कंपनियां Samsung, SK Hynix और SK Telecom, NATO, EU के साइबर सुरक्षा एजेंसी ENISA, और अन्य को जा रहा है। रिपोर्ट के अनुसार, मूल कोहोर्ट ने Mythos का उपयोग करके 10,000 से अधिक उच्च या गंभीर सुरक्षा दोष पाए हैं। Anthropic का कहना है कि वह "जितनी जल्दी हो सके सुरक्षित रूप से Mythos-स्तरीय क्षमताओं को जनता के लिए जारी करने पर काम कर रहा है," लेकिन सार्वजनिक रिलीज "दुरुपयोग को रोकने के लिए अत्यंत मजबूत सुरक्षा उपायों" की प्रतीक्षा कर रही है। Politico ने इस सप्ताह रिपोर्ट किया कि Anthropic ने "आने वाले सप्ताहों में" सभी ग्राहकों के लिए Mythos-क्लास मॉडल उपलब्ध कराने का वादा किया है। Anthropic की IPO टाइमलाइन (1 जून को गोपनीय रूप से दायर) उसी खिड़की में है। कंपनी को Mythos-क्लास पब्लिक मॉडल लॉन्च और S-1 लैंड करने के लिए पर्याप्त मजबूत सुरक्षा कहानी की आवश्यकता है। प्रतिस्पर्धात्मक संदर्भ: OpenAI UK बैंकों को GPT-5.5 Cyber प्रदान करता है, जिसके लिए Anthropic ने अभी तक Mythos प्रीव्यू ब्लॉक किया है। UK AI Security Institute ने दोनों मॉडलों का परीक्षण किया और "समान स्तर का प्रदर्शन" रिपोर्ट किया। यह परिणाम वह संकेत है कि फ्रंटियर वास्तव में विभाजित हो रहा है। दोनों प्रयोगशालाओं के पास साइबर-सक्षम मॉडल है, दोनों सावधानी से एक्सेस को नियंत्रित कर रहे हैं, और दोनों अंतर के लिए सुरक्षा फ्रेमिंग का उपयोग कर रहे हैं।

[42:00] Microsoft MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5

Microsoft ने 2 जून को Build 2026 में अपना पहला इन-हाउस एडवांस्ड रीज़निंग मॉडल और समर्थन मॉडलों की पूरी पाइपलाइन की घोषणा की। MAI-Thinking-1 एक "मध्यम-आकार का मॉडल" है जो Microsoft के अनुसार प्रमुख सॉफ्टवेयर इंजीनियरिंग बेंचमार्क पर अग्रणी मॉडलों से मेल खाता है। MAI-Code-1-Flash को इन्फरेंस-एफिशिएंट के रूप में पोजीशन किया गया है और इसे GitHub Copilot और Visual Studio Code में इंटीग्रेट किया गया है। एजेंट स्टैक के लिए यह सबसे स्टैक-प्रासंगिक रिलीज है, क्योंकि MAI-Code अब संपादक में कोड-मोड फ्लो के लिए Microsoft का प्रथम-पक्ष विकल्प है जिसमें अधिकांश एजेंट पहले से जुड़े हुए हैं। MAI-Image-2.5 (और एक फ्लैश वेरिएंट) टेक्स्ट-टू-इमेज और इमेज एडिटिंग को संभालता है। MAI-Transcribe-1.5 स्पीच-टू-टेक्स्ट पर "प्रतिस्पर्धी मॉडलों से पांच गुना तेज़" है। MAI-Voice-2 (फ्लैश वर्शन "जल्द आ रहा है" के साथ) 15 नई भाषाएं और नए वॉइस विकल्प जोड़ता है। PCMag ने चारों का परीक्षण किया और नए MAI फैमिली को "ठीक है, और यही उनके बारे में मैं सबसे अच्छा कह सकता हूं" बताया। रीज़निंग प्रतिस्पर्धात्मक है, इमेज और वॉइस मॉडल कार्यात्मक हैं लेकिन अंतर नहीं करते, और निष्कर्ष यह है कि Microsoft के पास अब इन-हाउस मॉडल लाइनअप है जो इमेज, वॉइस और कोड पथों पर OpenAI का विकल्प बन सकता है। वह प्रतिस्थापन क्षमता रणनीतिक बिंदु है। Microsoft अब अपने प्रोडक्ट सतह के मॉडल लेयर के लिए OpenAI पर पूरी तरह निर्भर नहीं है।

[52:00] Mac के लिए Google AI Edge Gallery पर Gemma 4 12B

Google ने 3 जून, 2026 को Gemma 4 12B रिलीज किया — एक बारह अरब पैरामीटर का ओपन-वेट्स मॉडल जिसमें Apache 2.0 लाइसेंस है, जिसे सोलह गीगाबाइट VRAM या यूनिफाइड मेमोरी वाले स्टैंडर्ड लैपटॉप पर स्थानीय रूप से चलाने के लिए डिज़ाइन किया गया है। आर्किटेक्चरल शिफ्ट एन्कोडर-मुक्त "Unified" डिज़ाइन है। कच्चे ऑडियो वेवफॉर्म और विज़ुअल पैच सीधे LLM बैकबोन में प्रवाहित होते हैं बिना सेकंडरी प्रोसेसिंग मॉड्यूल के, जिसका अर्थ है कि मॉडल बिना राउटिंग लेयर के सुन, देख और तर्क कर सकता है। कॉन्टेक्स्ट विंडो 256K टोकन है, जिसमें नेटिव एजेंटिक टूल-यूज़ क्षमताएं और स्टेप-बाय-स्टेप रीज़निंग मोड है। Gemma 4 12B तुरंत Hugging Face, Kaggle और Google AI Edge Gallery के माध्यम से उपलब्ध है, जो उसी दिन macOS पर लॉन्च हुआ। साथी Google AI Edge Eloquent डिक्टेशन ऐप भी Mac पर उपलब्ध है। AI Edge Gallery for Mac में उपलब्ध पांच Google मॉडल सभी Gemma फैमिली से हैं, instruct व्यवहार के लिए ट्यून किए गए — टेक्स्ट कम्प्लीशन के बजाय इंस्ट्रक्शन-फॉलोइंग के लिए। एन्कोडर-मुक्त आर्किटेक्चर महत्वपूर्ण है क्योंकि यह अलग ऑडियो और विज़न एन्कोडर की विलंबता और मेमोरी ओवरहेड को हटाता है। पारंपरिक मल्टीमॉडल डिज़ाइन ऑडियो और विज़न को समर्पित एन्कोडरों के माध्यम से रूट करता है जो एम्बेडिंग उत्पन्न करते हैं, और फिर एम्बेडिंग को टेक्स्ट टोकन स्ट्रीम के साथ जोड़ा जाता है और LLM में डाला जाता है। एन्कोडर-मुक्त डिज़ाइन एन्कोडर स्टेज को छोड़ देता है और कच्चे ऑडियो और विज़न टोकन सीधे LLM में डालता है, जिसका अर्थ है कि मॉडल ऑडियो और विज़न को एक ही टोकन स्ट्रीम के हिस्से के रूप में संभालना सीखता है। विलंबता की जीत वास्तविक है: मल्टीमॉडल अनुरोध अब एन्कोडर इन्फरेंस लागत का भुगतान नहीं करता, और मेमोरी की जीत वास्तविक है: एन्कोडर वेट्स वर्किंग सेट से गायब हैं। 256K कॉन्टेक्स्ट विंडो दूसरा आर्किटेक्चरल दांव है। 256K कॉन्टेक्स्ट विंडो वाला बारह अरब पैरामीटर मॉडल स्थानीय एजेंट स्टैक के लिए वास्तविक क्षमता है।

[60:00] MCP लेन (संक्षिप्त झलक) और प्रोजेक्ट रडार: CheetahClaws, A2A Protocol v1.0

इस सप्ताह एक संक्षिप्त MCP नोट। OpenAI 8 जून को ChatGPT के लिए Lockdown Mode और Active Sessions रोल आउट कर रहा है, जो दो अकाउंट-सुरक्षा नियंत्रणों को व्यापक रूप से उपलब्ध कराता है — Lockdown Mode आउटबाउंड नेटवर्क रिक्वेस्ट को सीमित करता है ताकि प्रॉम्प्ट-इंजेक्शन हमलों से डेटा एक्सफिल्ट्रेशन को कम किया जा सके, और Active Sessions उपयोगकर्ताओं को समीक्षा करने देता है कि उनका अकाउंट कहां साइन इन है। नियंत्रण पर्सनल और सेल्फ-सर्व बिज़नेस अकाउंट पर आते हैं। जिस MCP इकोसिस्टम ने मई के अंत में ऑडिट का उत्पादन किया, वह प्रतिक्रिया पक्ष पर तेज़ी से आगे बढ़ रहा है, और स्कैनर और सर्वर हार्डनिंग सतहें दोनों अपडेट प्राप्त कर रही हैं। यह एक पैराग्राफ की झलक है, गहराई में नहीं — न्यूज़ साइकिल इस सप्ताह मॉडल-भारी है। CheetahClaws तीन दशमलव शून्य पांच SafeRL-Lab से एक Python-नेटिव मल्टी-मॉडल एजेंट हैनेस है, जिसे पठनीय विकल्प के रूप में डिज़ाइन किया गया है जो अधिकांश एजेंट हैनेस जहाज के रूप में भेजते हैं। रिलीज़ 4 जून को आई जिसमें डिफ़ॉल्ट व्यवहार के रूप में Claude-Code-स्टाइल क्वाइट आउटपुट था। एजेंट लूप लगभग 740 लाइनों के Python में फिट होता है, और मॉडल सपोर्ट सूची व्यापक है — Anthropic, OpenAI, Gemini, Kimi, Qwen, Zhipu, DeepSeek, कई अन्य, Ollama, LM Studio, और कोई भी OpenAI-संगत एंडपॉइंट। फीचर सेट में MCP और git प्लगइन के साथ रनटाइम टूल रजिस्ट्रेशन, डिक्लेरटिव कैपेबिलिटी डेफिनिशन के लिए मार्कडाउन स्किल्स, ब्लॉक और blocked-by सेमांटिक्स वाला टास्क डिपेंडेंसी ग्राफ, दो-लेयर कॉन्टेक्स्ट कम्प्रेशन, ऑफ़लाइन वॉइस, क्लाउड सेशन सिंक, और Telegram, WeChat, Slack और QQ से ब्रिज शामिल हैं। रेपो में 700 से अधिक स्टार्स हैं जिनका एक्टिविटी एजेंट लूप और टास्क ग्राफ में केंद्रित है। ट्रेड-ऑफ वास्तविक है — प्रोवाइडर फेलियर पर एरर हैंडलिंग, ट्रांज़िएंट टूल एरर्स पर रिट्री लॉजिक, और ऑब्ज़र्वेबिलिटी हुक Claude Code जैसे परिपक्व हैनेस की तुलना में पतले हैं। A2A Protocol ने 2026 में Linux Foundation के तहत वर्शन वन तक पहुंची। मूल रूप से Google द्वारा लॉन्च किया गया, A2A अब MCP के साथ संयुक्त रूप से शासित है। प्रोटोकॉल एजेंट कार्ड्स को परिभाषित करता है — एजेंट डिस्कवरी के लिए JSON कैपेबिलिटी मैनिफेस्ट — और लंबे-चलने वाले इंटरैक्शन के लिए JSON-RPC 2.0 का उपयोग करके टास्क-आधारित स्टेट मशीन। MCP बनाम A2A अंतर मुख्य मानसिक मॉडल है: MCP मानकीकृत करता है कि एक एजेंट बाहरी टूल्स, डेटाबेस और डेटा स्रोतों से कैसे जुड़ता है; A2A मानकीकृत करता है कि एजेंट एक दूसरे से कैसे संवाद करते हैं। रिपोजिटरी में 24,000 से अधिक स्टार्स और सक्रिय विकास है, और प्रोटोकॉल पर्याप्त परिपक्वता तक पहुंच गया है कि बिल्डर्स को मल्टी-एजेंट वर्कफ़्लो डिज़ाइन करते समय इसके बारे में जानना चाहिए।

[66:00] प्रैक्टिकल क्यू

इस सप्ताह का प्रैक्टिकल क्यू छोटा और ठोस है। Claude Code के लिए, वर्शन कमांड चलाएं और पुष्टि करें कि आप point one sixty eight पर हैं; यदि आप एक बैकग्राउंड सेशन पकड़ रहे थे जो point one sixty seven पर stream-json स्टॉल या इंटरप्ट इश्यू दिखा रहा था, तो अपग्रेड उन्हें ठीक करेगा। आउटेज-रिज़िलिएंस के लिए, Anthropic स्टेटस पेज देखें और इंसिडेंट RSS फीड की सदस्यता लें ताकि आप प्लेटफॉर्म इंसिडेंट के साथ-साथ स्थानीय मॉडल एरर्स को रियल टाइम में सहसंबंधित कर सकें, और शुक्रवार 5 जून की विंडो के दौरान मिड-कॉल समाप्त हुए किसी भी लॉन्ग-लाइव्ड Claude API सेशन को रोटेट करें। OpenClaw के लिए, तय करें कि जून प्रीरिलीज़ को ट्रैक करना है या छह point one पर स्टेबल रखना है आपके वर्शन-पिन पॉलिसी के आधार पर। OpenAI ChatGPT के लिए, स्टैंडअलोन प्रोडक्ट्स का ऑडिट करें जो सुपरऐप में विलीन हो जाएंगे और किसी भी सनसेट-प्रोन सर्विस के लिए डेटा एक्सपोर्ट पाथ नोट करें। WWDC के बाद iOS 27 या macOS 27 बीटा इंस्टॉल करें और मल्टी-स्टेप टास्क हैंडलिंग के लिए नए Siri का ChatGPT या Claude के खिलाफ परीक्षण करें। Anthropic के लिए, Mythos पब्लिक रिलीज़ घोषणा की निगरानी करें और टाइमलाइन के लिए अपनी अकाउंट टीम से पूछें। Microsoft के लिए, GitHub Copilot में MAI-Code-1-Flash को इनेबल करें और अपने वर्तमान डिफ़ॉल्ट मॉडल के खिलाफ एक कम्प्लीशन टेस्ट चलाएं। Gemma 4 12B के लिए, चेकपॉइंट पुल करें और एक 16GB Mac पर अपने वर्तमान स्थानीय मॉडल के खिलाफ एक कोडिंग टास्क की तुलना करें। CheetahClaws के लिए, रेपो क्लोन करें और 740-लाइन एजेंट लूप पढ़ें। A2A के लिए, वर्शन वन स्पेसिफिकेशन पढ़ें और अपने वर्कफ़्लो में एक हैंडऑफ पॉइंट पहचानें जहां एजेंट कार्ड्स कस्टम इंटीग्रेशन की जगह ले सकते हैं।

[68:00] समापन

यह चक्र है। पहले हार्नेस, दूसरे मॉडल लेन, तीसरे प्रोजेक्ट रेडार, अंत में प्रैक्टिकल क्यू। क्लॉड फ्राइडे आउटेज इस बात की याद दिलाता है कि एजेंट स्टैक में अब वास्तविक प्रोडक्शन विश्वसनीयता की चिंताएं हैं, और अगले दिन का बग-फिक्स रिलीज वह ऑपरेशनल पैटर्न है जो इन चिंताओं को प्रबंधनीय बनाता है। लिंक और चैप्टर स्लेट के साथ पूर्ण शो नोट्स के लिए, Toby On Fitness Tech dot com पर शो नोट्स देखें।