Episode 38·24 अप्रैल 2026·1:03:51

OpenClaw v2026.4.22, Chrome Agents, Codex Surfaces, और Builder Stack के लिए लड़ाई

OpenClaw v2026.4.22 EP038 की नई प्रमुख कहानी है, और यह एक घना वाला है। हम रिलीज से शुरू करते हैं: xAI इमेज, TTS, STT, और रियलटाइम ट्रांसक्रिप्शन सपोर्ट; Gateway के बिना टर्मिनल एम्बेडेड मोड; ऑनबोर्डिंग के दौरान मिसिंग प्रोवाइडर और चैनल प्लगइन्स का ऑटो-इंस्टॉल; चैट-साइड मॉडल रजिस्ट्रेशन; डायग्नोस्टिक्स एक्सपोर्ट; Tencent Cloud सपोर्ट; Codex auth-path टाइटनिंग; प्रोवाइडर्स में GPT-5 ओवरले शेयरिंग; प्लगइन-लोड स्पीडअप्स; और प्राइसिंग, सेशन पर ऑपरेटर-फेसिंग फिक्सेस की एक लंबी टेल। एपिसोड Chrome, Cursor, Google के TPU स्प्लिट, OpenAI के वर्क सरफेस की ओर चढ़ाई, और Anthropic के Claude Code कंट्रोल ड्रामा में बड़ी बिल्डर-सरफेस लड़ाई में फैल जाता है। Show notes: https://tobyonfitnesstech.com/hi/podcasts/episode-38/

🎧 Listen to Episode

Listen & Subscribe

Spotify Apple iHeart YouTube Music Amazon RSS

OPENCLAW DAILY — EPISODE 038 — 23 अप्रैल, 2026

[00:00] इंट्रो / हुक OpenClaw v2026.4.22 अभी-अभी आया है, और इसने आज की बातचीत की शुरुआत तुरंत बदल दी।

क्योंकि यह रिलीज़ केवल रखरखाव नहीं है। यह प्रोवाइडर सतहों का विस्तार करता है, एक नया लोकल टर्मिनल मोड जोड़ता है, Codex पहचान हैंडलिंग को सुव्यवस्थित करता है, ऑनबोर्डिंग में सुधार करता है, सपोर्ट-रेडी डायग्नोस्टिक्स एक्सपोर्ट जोड़ता है, चैट-साइड मॉडल रजिस्ट्रेशन खोलता है, प्लगइन लोडिंग को तेज करता है, और रनटाइम को एक पतले चैट रैपर की जगह एक अधिक सक्षम ऑपरेटर OS की ओर धकेलता रहता है।

तो EP038 वहीं से शुरू होता है जहां से उसे शुरू होना चाहिए। OpenClaw v2026.4.22 पहले। फिर बिल्डर-सर्फेस लड़ाई का बाकी हिस्सा: Chrome, Cursor, TPU स्पेशलाइज़ेशन, Codex-स्टाइल वर्क सरफेस, और Anthropic का Claude Code एक्सेस पर नियंत्रण।

[01:30] स्टोरी 1 — OpenClaw v2026.4.22 प्रोवाइडर और ऑपरेटर सरफेस का विस्तार करता है v2026.4.22 के बारे में सबसे बड़ी बात यह है कि यह एक फीचर रिलीज़ नहीं है। यह कई रणनीतिक दिशाएं एक साथ स्पष्ट हो रही हैं।

xAI सपोर्ट से शुरू करें। OpenClaw अब xAI इमेज जनरेशन, टेक्स्ट-टू-स्पीच, स्पीच-टू-टेक्स्ट, और रियलटाइम ट्रांसक्रिप्शन सपोर्ट जोड़ता है, जिसमें Grok इमेज मॉडल, रेफरेंस-इमेज एडिट्स, कई लाइव वॉइस, कई ऑडियो आउटपुट फॉर्मैट, बैच ट्रांसक्रिप्शन, और वॉइस कॉल स्ट्रीमिंग ट्रांसक्रिप्शन शामिल हैं। यह इसलिए मायने रखता है क्योंकि यह xAI को एक संकीर्ण मॉडल एंडपॉइंट से OpenClaw के अंदर एक अधिक पूर्ण मीडिया-कैपेबल प्रोवाइडर सरफेस में ले जाता है।

और रिलीज़ यहीं नहीं रुकती। स्ट्रीमिंग ट्रांसक्रिप्शन अब Deepgram, ElevenLabs, और Mistral में भी विस्तारित होता है, ElevenLabs को इनबाउंड मीडिया के लिए Scribe v2 बैच ट्रांसक्रिप्शन मिलता है। यह एक सीधी बिल्डर और ऑपरेटर कहानी है: वॉइस कॉल और इनबाउंड-ऑडियो फ्लो एक प्रोवाइडर फैमिली से कम बंधे हो जाते हैं, जो उन वास्तविक डिप्लॉयमेंट के लिए प्रोडक्ट को अधिक लचीला बनाता है जहां कॉस्ट, लेटेंसी, और प्रोवाइडर प्रेफरेंस जॉब के हिसाब से बदलते रहते हैं।

TUI बदलाव भी इससे अधिक महत्वपूर्ण है जितना लगता है। v2026.4.22 Gateway के बिना चैट चलाने के लिए एक लोकल एम्बेडेड टर्मिनल मोड जोड़ता है, जबकि प्लगइन अप्रूवल गेट्स लागू रहते हैं। यह बहुत ही वास्तविक क्वालिटी-ऑफ-लाइफ और डिप्लॉयमेंट बदलाव है। यह लोकल, टर्मिनल-नेटिव यूज़ के लिए एक साफ रास्ता बनाता है, यह झूठी उम्मीद नहीं रखते हुए कि सुरक्षा या अप्रूवल गायब हो जाने चाहिए क्योंकि Gateway सर्किट से बाहर है।

फिर ऑनबोर्डिंग है। सेटअप फ्लो अब मिसिंग प्रोवाइडर और चैनल प्लगइन्स को ऑटो-इंस्टॉल कर सकता है ताकि पहली-रन कॉन्फ़िगरेशन मैनुअल प्लगइन रिकवरी के बिना पूरा हो सके। यह उन बदलावों में से एक है जो रिलीज़ नोट्स में छोटे लगते हैं और लाइव्ड प्रोडक्ट एक्सपीरियंस में огромные। पहले-रन फ्रिक्शन वह जगह है जहां बहुत सारा ट्रस्ट खोया जाता है। अगर सेटअप भंगुर लगता है, तो पूरा प्रोडक्ट भंगुर लगता है।

चैट-साइड मॉडल रजिस्ट्रेशन भी एक और शांत रूप से मजबूत एडिशन है। नया /models add <provider> <modelId> कमांड इसका मतलब है कि आप चैट से एक मॉडल रजिस्टर कर सकते हैं और Gateway को रीस्टार्ट किए बिना उसका उपयोग कर सकते हैं। यह वही तरह का ऑपरेटर-क्वालिटी इम्प्रूवमेंट है जो अनावश्यक सेरेमोनी को कम करता है। यह मॉडल सरफेसिंग को रनटाइम एडमिनिस्ट्रेशन जैसा बनाता है और कॉन्फ़िग सर्जरी जैसा नहीं।

[10:30] कहानी 1B — Codex कठोरता, GPT-5 ओवरले शेयरिंग, डायग्नोस्टिक्स, और स्पीड v2026.4.22 के कुछ सबसे महत्वपूर्ण परिवर्तन फीचर बुलेट्स नहीं हैं। ये वे सफाई कदम हैं जो रनटाइम को अधिक ईमानदार और कम ड्रिफ्ट-प्रवण बनाते हैं।

सबसे महत्वपूर्ण में से एक OpenAI Codex auth परिवर्तन है। OpenClaw onboarding और प्रोवाइडर डिस्कवरी से Codex CLI auth import path को हटाता है, ताकि यह अब agent auth stores में ~/.codex OAuth सामग्री की प्रतिलिपि न बनाए। Browser login या device pairing अब इसका रास्ता है। यह मायने रखता है क्योंकि टूलिंग सीमाओं में कॉपी की गई पहचान सामग्री ठीक वही सुविधा है जो दीर्घकालिक सुरक्षा और डिबगिंग समस्या बन जाती है।

एक गहरी harness-consistency कहानी भी है। रिलीज native Codex app-server turns को prompt hooks, compaction hooks, message-write hooks, और lifecycle hooks जैसे llm_input, llm_output, और agent_end के माध्यम से रूट करती है, जबकि async tool result middleware के लिए bundled-plugin extension seams जोड़ती है। व्यावहारिक मूल्य यह है कि Codex-path व्यवहार Pi-path व्यवहार से ड्रिफ्ट करना बंद कर देता है। जब harnesses में एकीकरण भिन्न होते हैं, ऑपरेटर आश्चर्यचकित होते हैं। यह रिलीज उन आश्चर्यों को कम करने की कोशिश करती है।

GPT-5 ओवरले मूव उसी कारण से मायने रखता है। GPT-5 prompt overlay अब shared provider runtime में रहता है ताकि संगत GPT-5 मॉडल OpenAI, OpenRouter, OpenCode, Codex, और अन्य GPT प्रोवाइडरों में समान व्यवहार प्राप्त करें। यह एक वास्तविक आर्किटेक्चरल सफाई है। एक प्रोवाइडर के पास plugin quirk के रूप में विशेष व्यवहार रखने के बजाय, runtime उस व्यवहार को cross-provider क्षमता के रूप में देखना शुरू कर देता है।

Diagnostics export एक और ऑपरेटर-उन्मुख जीत है। Payload-free stability recording डिफ़ॉल्ट रूप से सक्षम है, और अब sanitized logs, status, health, config, और stability snapshots के साथ support-ready diagnostics export है जो bug reports के लिए है। यह वही चीज है जो support और debugging को अस्पष्ट किस्सों पर निर्भरता से कम और reproducible state पर अधिक निर्भर बनाती है।

और गंभीर प्रदर्शन सफाई जीतें भी हैं। Built dist modules के लिए native Jiti loading के साथ bundled plugin loading नाटकीय रूप से तेज हो जाती है, और installed dist entries को प्राथमिकता देने और lazy-loading paths के माध्यम से doctor plugin runtime उल्लेखनीय रूप से छोटी हो जाती है। ये भव्य शीर्षक नहीं हैं। लेकिन ये वे परिवर्तन हैं जो यह निर्धारित करते हैं कि बार-बार वास्तविक उपयोग में एक सिस्टम कितना सक्षम लगता है।

[18:00] कहानी 1C — Tencent, Azure Images, Sessions, Pricing, और Operator Layer v2026.4.22 का बाकी हिस्सा operator layer को भरता रहता है।

Tencent Cloud support TokenHub onboarding, model catalog entries, और tiered pricing metadata के साथ bundled provider plugin के रूप में आता है। Azure OpenAI-style image endpoint support ठीक हो गया है ताकि image generation और edits Azure-hosted OpenAI resources के खिलाफ सही auth और deployment URL व्यवहार के साथ काम करें। OpenAI-compatible local backends को बेहतर streaming-usage accounting मिलती है ताकि token totals stale या unknown counts में बिगड़ना बंद करें।

Model pricing और status handling भी साफ होते हैं। OpenRouter और LiteLLM pricing अब startup पर asynchronously fetch करती हैं, catalog fetch timeouts बढ़ाए गए हैं, /status को एक Runner field मिलती है, और fast mode status rendering अधिक ईमानदार बनती है। ये वही विवरण हैं जो multi-provider runtime को जब कुछ अजीब होता है तो अधिक पठनीय बनाते हैं।

Session handling को भी महत्वपूर्ण correctness fixes मिलते हैं। Daily reset और idle-maintenance bookkeeping activity को bump करना या freshly active routes को prune करना बंद करते हैं, transcript write locks डिफ़ॉल्ट रूप से non-reentrant हो जाते हैं, और session-list surfaces को बेहतर filters और previews मिलते हैं। उपयोगी पैटर्न सरल है: कम भ्रामक maintenance noise, कम state drift, और runtime वास्तव में जो कर रही है उसकी बेहतर operator visibility।

एक व्यापक प्लगइन और ट्रांसपोर्ट कहानी भी है। ऑनबोर्डिंग आधिकारिक WeCom प्लगइन को अधिक स्पष्ट रूप से दिखा सकती है, WhatsApp को मूल रिप्लाई कोटिंग के साथ-साथ प्रति-ग्रुप और प्रति-डायरेक्ट सिस्टम-प्रॉम्प्ट फॉरवर्डिंग मिलती है, Telegram फोरम टॉपिक्स पुनर्प्राप्त मेटाडेटा को अधिक प्रभावी ढंग से कैश करते हैं, और मेमोरी सर्च को बेहतर sqlite-vec रिकॉल पथ मिलता है। फिर से, इनमें से कोई भी पूर्ण रिलीज़ नहीं है। बात संचय में है। v2026.4.22 देखने में OpenClaw एक साथ प्रोवाइडर्स, ट्रांसपोर्ट्स, डायग्नोस्टिक्स और हार्नेसेस में रनटाइम को अधिक पूर्ण बना रहा है।

रिलीज़ का व्यावहारिक मतलब यह है। OpenClaw एक चैट बॉक्स के पीछे मॉडल को केवल एक्सपोज़ करने के बजाय कई सतहों को समन्वयित करने वाली परत बनने के बारे में अधिक गंभीर हो रहा है। अधिक प्रोवाइडर विस्तार, अधिक ऑपरेटर टूलिंग, साफ़ auth बाउंड्री, मजबूत डायग्नोस्टिक्स, और कम हार्नेस ड्रिफ्ट। यही तरह की रिलीज़ है जो डेमो के बाद मायने रखती है। → https://github.com/openclaw/openclaw/releases/tag/v2026.4.22

[26:00] कहानी 2 — GPT 5.5 अभी आ गया। OpenClaw के लिए इससे क्या बदलता है? बिल्डर-सतह की लड़ाई के बाकी हिस्से पर वापस जाने से पहले, हमें एक प्रमुख नए विकास पर रुकना होगा: GPT 5.5 अभी Codex में उतरा प्रतीत होता है।

अब, हमें यहाँ सावधान रहना चाहिए। रिकॉर्डिंग के क्षण पर, जो हम सीधे जानते हैं वह यह है कि Codex अपडेट हुआ और यह परिवर्तन इतना बड़ा है कि इसे एक प्रमुख मॉडल इवेंट जैसा लग रहा है। हम जिन बेंचमार्क डेल्टास को अभी तक स्वतंत्र रूप से सत्यापित नहीं किया है उन पर निश्चितता का ढोंग नहीं करेंगे। लेकिन उस सावधानी के बावजूद, रणनीतिक निहितार्थ पहले से स्पष्ट हैं।

अगर GPT 5.5 Codex सतह के अंदर सामग्री रूप से बेहतर है, तो यह तुरंत पूरे बाज़ार में अपेक्षाओं को बदल देता है। यह बदलता है कि डेवलपर्स को कोडिंग वर्कबेंच कैसा महसूस होना चाहिए। यह हर रैपर, हर IDE असिस्टेंट, हर ब्राउज़र-प्लस-कोड टूल, और हर एजेंट रनटाइम के लिए तुलना बिंदु बदलता है जो सॉफ्टवेयर वर्क को छूता है।

OpenClaw के लिए विशेष रूप से, पहला सवाल यह नहीं है कि क्या इसे OpenAI-ओनली बनना चाहिए। नहीं बनना चाहिए। पहला सवाल यह है कि एक प्रमुख GPT-क्लास जंप मल्टी-प्रोवाइडर रनटाइम के अंदर रूटिंग, ओवरले, डिफ़ॉल्ट्स और ऑपरेटर अपेक्षाओं को कैसे बदलता है।

अगर एक प्रोवाइडर अचानक लॉन्ग-कॉन्टेक्स्ट कोडिंग, टूल यूज़ या एजेंट रिलायबिलिटी में मजबूत हो जाता है, तो OpenClaw का काम अधिक महत्वपूर्ण हो जाता है, कम नहीं। क्योंकि किसी को अभी भी तय करना होगा कि वह मॉडल लागत के लायक है या नहीं, कौन से टास्क वहाँ रूट करने चाहिए, चैट और टर्मिनल पथों में उन मॉडल्स को कैसे सरफेस किया जाए, फॉलबैक क्या होना चाहिए, और सिस्टम व्यवहार को प्रोवाइडर्स में पठनीय कैसे रखे बिना वन-ऑफ एक्सेप्शन्स के ढेर बने।

यहीं पर पहले v2026.4.22 रिलीज़ विवरण अधिक प्रासंगिक हो जाते हैं, कम प्रासंगिक नहीं। संगत प्रोवाइडर्स में शेयर्ड GPT-5 ओवरले व्यवहार तब अधिक मायने रखता है अगर शीर्ष OpenAI-क्लास मॉडल तेज़ी से आगे बढ़ रहे हैं। Codex-पथ क्लीनअप तब अधिक मायने रखता है अगर Codex एक अधिक महत्वपूर्ण सतह बन जाता है। चैट-साइड मॉडल रजिस्ट्रेशन तब अधिक मायने रखता है अगर ऑपरेटर्स को जल्दी से नए मॉडल सरफेस करने की जरूरत है। डायग्नोस्टिक्स एक्सपोर्ट तब अधिक मायने रखता है अगर टीमों को मॉडल शिफ्ट के बाद व्यवहार और लागत की तुलना करने की जरूरत है।

एक मार्केट कहानी भी यहाँ है। एक बड़ा GPT 5.5 मूव बाज़ार पर दबाव बढ़ाएगा Claude Code, Cursor, Gemini-संचालित सतहों पर, और हर तीसरे पक्ष के कोडिंग वातावरण पर जो मॉडल क्वालिटी और वर्कफ्लो क्वालिटी के बीच के गैप पर निर्भर करता है कि वह इतना चौड़ा रहे कि बचाव किया जा सके। अगर अंतर्निहित मॉडल काफी तेज़ी से बेहतर हो जाता है, तो जो प्रोडक्ट्स केवल पॉलिश जोड़ते हैं उन पर दबाव पड़ेगा। जो प्रोडक्ट्स ऑर्केस्ट्रेशन, मेमोरी, अप्रूवल्स, चैनल रीच और डurable वर्कफ्लो स्ट्रक्चर जोड़ते हैं उनके पास अपना आधार बनाए रखने की बेहतर संभावना है।

और वही OpenClaw एंगल है जो सबसे अधिक मायने रखता है। OpenClaw मॉडल जंप्स को नज़रअंदाज़ करके नहीं जीतता। वह उन्हें अवशोषित करना आसान बनाकर जीतता है। तुलना करना आसान बनाकर। रूट करना आसान बनाकर। ऑपरेशनलाइज़ करना आसिन बनाकर। स्विच करना आसान बनाकर बिना हर बार एक प्रमुख अपडेट ड्रॉप होने पर अपना पूरा वर्कफ्लो पुनर्निर्मित किए।

तो संभावित GPT 5.5 मोमेंट के लिए सही प्रतिक्रिया न तो दहशत है और न ही इनकार। यह आर्किटेक्चरल स्पष्टता है। अगर फ्रंटियर मॉडल इतनी तेजी से बढ़ रहे हैं, तो सबसे महत्वपूर्ण सिस्टम वे हैं जो बिल्डर्स को उस गति का फायदा उठाने देते हैं बिना इसमें फंसने के।

इस सेगमेंट को ट्रांसक्रिप्ट बिल्ड में और विस्तार से दर्शाया जाना चाहिए, render time से पहले हम जितना भी नया सत्यापित साक्ष्य इकट्ठा कर सकें।

[31:00] स्टोरी 3 — Google एजेंटिक वेब वर्क को सीधे Chrome में लाता है इस बैच की सबसे बड़ी व्यावहारिक ब्राउज़र स्टोरी Google का enterprise यूजर्स के लिए Chrome में auto browse लाना है।

यह इसलिए मायने रखता है क्योंकि ब्राउज़र अभी भी जहां वास्तविक काम का एक बहुत बड़ा हिस्सा होता है। CRM सिस्टम, इंटरनल टूल्स, प्रोक्योरमेंट, भर्ती, सपोर्ट क्यू, वेंडर रिसर्च, ट्रैवल बुकिंग, डैशबोर्ड और फॉर्म-भारी एडमिन टास्क पहले से वहां मौजूद हैं। तो अगर आप काम को ऑटोमेट करना चाहते हैं, तो ब्राउज़र एक अत्यंत high-leverage सतह है।

रणनीतिक चाल "Google के पास एक एजेंट है" नहीं है। हर किसी के पास एजेंट है। रणनीतिक चाल यह है कि Google Chrome को खुद एजेंटिक वर्क के लिए स्वीकृत एंटरप्राइज सतह बनाने की कोशिश कर रहा है। एनाउंसमेंट के मुताबिक, Gemini लाइव टैब कॉन्टेक्स्ट समझ सकता है और CRM अपडेट, वेंडर तुलना, मीटिंग शेड्यूलिंग, उम्मीदवार समीक्षा, बुकिंग और अन्य ब्राउज़र-नेटिव टास्क में मदद कर सकता है, जबकि अंतिम कार्रवाई की समीक्षा और पुष्टि के लिए एक इंसान को शामिल करता है।

वह human-in-the-loop आर्किटेक्चर डेमो से ज्यादा मायने रखता है। वास्तविक संगठनों में, full autonomy आमतौर पर गलत default है। उपयोगी पैटर्न यह है कि मॉडल टास्क का बोरिंग बीच का हिस्सा करे जबकि इंसान approval का मालिक हो। यही deployment मॉडल है जो अधिकांश ब्राउज़र ऑटोमेशन को वास्तव में चाहिए।

यहां एक गहरा control play भी है। Google इस फीचर को saved workflow Skills, policy enablement और Chrome Enterprise Premium फीचर्स के साथ जोड़ता है जिनमें Shadow IT detection, suspicious extension मॉनिटरिंग और anomalous agent activity शामिल हैं। दूसरे शब्दों में, वही कंपनी sanctioned automation path और unsanctioned विकल्पों के लिए visibility layer दोनों को own करने की कोशिश कर रही है।

बिल्डर्स के लिए, पाठ व्यावहारिक है। अगर ब्राउज़र वेंडर automation path और उसके चारों ओर की security framing को own करता है, तो independent browser-agent प्रोडक्ट्स को एक स्पष्ट moat की जरूरत है। OpenClaw जैसे सिस्टम के लिए, जवाब "browser use exists" नहीं है। जवाब ब्राउज़र के ऊपर का broader operator layer है: orchestration, memory, approvals, channel reach और multi-surface execution। → https://techcrunch.com/2026/04/22/google-turns-chrome-into-an-ai-coworker-for-the-workplace/

[39:00] स्टोरी 4 — SpaceX Coding Surface को इतना मूल्यवान बना देता है कि यह सिंपल नहीं रह सकता Cursor स्टोरी startup gossip से बड़ी है। TechCrunch की रिपोर्ट के मुताबिक, Cursor SpaceX द्वारा collaboration deal और $60 बिलियन के अधिग्रहण की राह के साथ आगे आने से पहले $50 बिलियन valuation पर $2 बिलियन का फंडिंग राउंड बंद करने की राह पर था।

मार्केट सिग्नल स्पष्ट है। AI coding अब सिर्फ एक developer-productivity फीचर कैटेगरी नहीं रही। Coding surface खुद इतना स्ट्रैटेजिक हो गया है कि इन्फ्रास्ट्रक्चर-स्केल पैसा इसे own करना चाहता है।

यह समझ में आता है क्योंकि वर्कबेंच वह जगह है जहां आदत बनती है। वहां पर repo context, planning, review, retry behavior, artifacts, browser use, और execution सब मिलकर product lock-in बनाना शुरू करते हैं। सवाल अब सिर्फ यह नहीं है कि कौन सा मॉडल साफ कोड लिखता है। सवाल यह है कि कौन सा environment actual shipping software की process को सबसे अच्छा support करता है।

यह भी क्यों Cursor कुछ महीने पहले की तुलना में अब ज्यादा exposed दिखता है। यह बहु-पक्षीय तरीकों से native या semi-native surfaces से दबाव में है: Claude Code, Codex, और OpenClaw जैसी broader operator systems। Great UX अभी भी मायने रखता है। लेकिन एक बार जब model vendors और compute vendors दोनों यह तय कर लेते हैं कि surface layer strategic है, UX अकेला एक durable moat नहीं है।

बिल्डर्स के लिए, यह useful warning है। अगर आपका coding product मूल रूप से एक wrapper है जिसमें nicer polish है, तो उसके नीचे की जमीन काफी कम stable हो रही है। वे products survive करते हैं जो real workflow gravity रखते हैं: context, memory, integration, trust, और team habit। → https://techcrunch.com/2026/04/22/how-spacex-preempted-a-2b-fundraise-with-a-60b-buyout-offer/

[44:30] STORY 5 — Google Splits TPU Design Into Training and Inference Google का अगला TPU generation दो chips में split हो रहा है: एक training के लिए और एक inference के लिए।

यह useful signal है। Real story benchmark bragging नहीं है। यह है कि बड़ी cloud providers में से एक explicit बता रहा है कि training और inference अलग businesses हैं जिनके अलग economics हैं।

Training एक throughput और cluster-scale problem है। Inference एक latency, concurrency, और cost-per-request problem है। ये same optimization target नहीं हैं, और hyperscalers अब ऐसे act कर रहे हैं।

बिल्डर्स के लिए, यह मायने रखता है क्योंकि ongoing inference bill अक्सर तय करती है कि कोई product truly viable है या नहीं। Glamorous training run rarely वह चीज है जो business खत्म करती है। Serving real users की sustained cost वह चीज है।

Google अभी भी Nvidia के साथ काम कर रहा है और अभी भी Nvidia hardware को अपने cloud में ला रहा है, तो यह एक clean anti-GPU story नहीं है। यह एक specialization story है। Cloud layer workload-specific हो रहा है, और बिल्डर्स को बहुत clearer तरीके से think करना होगा कि training कहां lives, inference कहां lives, और वे किन vendor economics में खुद को lock कर रहे हैं। → https://techcrunch.com/2026/04/22/google-cloud-next-new-tpu-ai-chips-compete-with-nvidia/

[49:00] STORY 6 — OpenAI Keeps Climbing From Model Endpoint to Work Surface इस month का एक clearest strategic patterns में से एक OpenAI का raw model access से अधिक complete work surfaces में upward move करना है।

आप इसे Codex में देख सकते हैं, जो branding से ज्यादा एक serious coding environment के रूप में मायने रखता है। और आप इसे Images 2.0 में देख सकते हैं, जो इसलिए मायने रखता है क्योंकि text-heavy, layout-heavy visual work काफी usable होने के करीब पहुंच रहा है।

TechCrunch की Images 2.0 पर हाथों-की-सजावट से पता चलता है कि पुराना संकेत — इमेज के अंदर का टूटा हुआ टेक्स्ट — धीरे-धीरे कमजोर हो रहा है। मेनू, पोस्टर, UI एलिमेंट्स, आइकनोग्राफी, घनी लेआउट, और गैर-लैटिन टेक्स्ट पिछली पीढ़ियों की तुलना में काफी अधिक विश्वसनीय दिख रहे हैं। यह इमेज जनरेशन को असली कंटेंट वर्कफ्लो के लिए अधिक व्यवहार्य बनाता है: ग्राफिक्स, थंबनेल, इंटरफेस मॉक, डायग्राम, डेक एसेट्स, मार्केटिंग विजुअल्स, और स्ट्रक्चर्ड आर्टिफैक्ट्स जहां टेक्स्ट काम का हिस्सा है।

यह मायने रखता है क्योंकि एक बार जब ये आउटपुट काफी विश्वसनीय हो जाते हैं, तो वैल्यू उनके आसपास के वर्कफ्लो में ऊपर की ओर स्थानांतरित हो जाती है: प्रॉम्प्ट, रेंडर, कम्पेयर, अप्रूव, पब्लिश, और सर्फेस पर रूट करना। Codex में भी यही व्यापक पैटर्न दिखाई देता है। कंपनी आउटपुट को पावर देने वाले API एंडपॉइंट के साथ-साथ उस जगह को भी अपने कब्जे में लेना चाहती है जहां इंटेंट आउटपुट में बदलता है।

बिल्डर्स के लिए, महत्वपूर्ण कॉन्ट्रास्ट स्पष्ट है। OpenClaw एक अधिक ओपन, मल्टी-प्रोवाइडर, ऑपरेटर-OS एंगल से कुछ समान टेरिटरी में प्रतिस्पर्धा करता है। लड़ाई अब सिर्फ बेस्ट मॉडल बनाम बेस्ट मॉडल नहीं है। यह इस बारे में है कि किसका एनवायरनमेंट असली काम को स्पेसिफाई, एक्जीक्यूट, वेरिफाई, और कल जारी रखना सबसे आसान बनाता है।

→ https://techcrunch.com/2026/04/21/chatgpts-new-images-2-0-model-is-surprisingly-good-at-generating-text/

[54:30] स्टोरी 7 — Anthropic का Claude Code व्हिपलैश वास्तव में कंट्रोल के बारे में है इस हफ्ते कमरे में हाथी Anthropic के Claude Code प्लान ड्रामा है। Claude Code $20 प्लान से हटा दिया गया था, फिर वापस जोड़ दिया गया।

महत्वपूर्ण बिंदु सटीक सपोर्ट-टिकट टाइमलाइन नहीं है। महत्वपूर्ण बिंदु यह है कि यह इंसिडेंट स्ट्रक्चरल रूप से क्या प्रकट करता है। जब कोई फ्रंटियर लैब मॉडल और प्रेफर्ड शेल दोनों को कंट्रोल करती है, तो प्राइसिंग में बदलाव सिर्फ बिलिंग में बदलाव नहीं हैं। वे कंट्रोल डिसीजन हैं। वे एक्सपेरिमेंटेशन, टीम की आदतों, थर्ड-पार्टी वर्कफ्लो व्यवहार्यता, और वेंडर के प्रेफर्ड पाथ से बाहर रहने की लागत को प्रभावित करते हैं।

इसीलिए परिपक्व बिल्डर रिस्पॉन्स आर्किटेक्चरल है, इमोशनल नहीं। कन्वीनियंस को ओनरशिप से न भूलें। एक वर्कफ्लो जो सिर्फ इसलिए काम करता है क्योंकि कोई वेंडर अस्थायी रूप से उदार है, वह डurable वर्कफ्लो नहीं है। एक वर्कबेंच जिसे आप बदल नहीं सकते वह वास्तव में आपका नहीं है। और एक शेल जिस पर आपका कंट्रोल नहीं है, वह रातोंरात प्राइसिंग लीवर बन सकता है।

यह पूरे एपिसोड के नीचे छिपा व्यापक पाठ है। लीवरेज उन सर्फेस में केंद्रित हो रहा है जहां लोग वास्तव में काम करते हैं। और अगर आप उन सर्फेस के ऊपर बनाते हैं, तो आपका असली काम सिर्फ सबसे स्मार्ट मॉडल चुनना नहीं है। यह डिपेंडेंसीज चुनना है जिनसे आप बच सकें।

[59:00] आउट्रो / क्लोज़ तो EP038 अब वहां से शुरू होती है जहां से उसे शुरू होना चाहिए: OpenClaw v2026.4.22 के साथ। एक रिलीज़ जो प्रोवाइडर ब्रेड्थ बढ़ाती है, auth बाउंड्रीज़ को टाइट करती है, ऑनबोर्डिंग में सुधार करती है, बेहतर डायग्नोस्टिक्स जोड़ती है, प्लगइन लोडिंग को तेज करती है, और रनटाइम को एक अधिक पूर्ण ऑपरेटर सर्फेस की ओर आगे बढ़ाती रहती है।

और बाहरी कहानियां केवल उसी व्यावहारिक वास्तविकता को और मजबूत करती हैं। Chrome एक मैनेज्ड ब्राउज़र-एजेंट सर्फेस बन रहा है। Cursor स्ट्रैटेजिक है enough to attract infrastructure-scale deal pressure. Google हार्डवेयर को ट्रेनिंग और इंफरेंस के बीच स्प्लिट के आसपास डिज़ाइन कर रहा है। OpenAI complete work surfaces की ओर चढ़ता रहता है। और Anthropic ने सभी को याद कराया है कि शेल एक्सेस प्लेटफॉर्म पावर है।

अगर आप इस मार्केट में बना रहे हैं, तो सवाल सिर्फ यह नहीं है कि कौन सा मॉडल सबसे अच्छा है। असली सवाल यह है कि आप किस सर्फेस पर निर्भर रहना चाहते हैं जब नियम बदलें।

→ प्रतिलेखन स्वीकृत करने के लिए यहां उत्तर दें।

🎙 Never miss an episode — subscribe now

Spotify Apple iHeart YouTube Music Amazon RSS

🎙 Subscribe to AgentStack Daily