Episode 74·24 जून 2026·31:07

OpenAI Codex 0.142 स्थिर, डेब्रेक सुरक्षा सुइट, सैमसंग लॉन्च करता है Codex, नेक्स-एन2-प्रो, रिफ्लेक्शन एआई x स्पेसएक्स

OpenAI Codex 0.142 उपयोग-सीमा रीसेट क्रेडिट, संगठित प्लगइन सतहों और कॉन्फ़िगर करने योग्य रोलआउट टोकन बजट के साथ 0.142 लाइन का पहला स्थिर संस्करण लाता है। OpenAI Daybreak एक नई भेद्यता-खोज पहल के रूप में Codex Security और GPT-5.5-Cyber को पेश करता है, साथ ही ओपन-सोर्स मेंटेनर्स के लिए Patch the Planet प्रोग्राम भी लाता है। सैमसंग इलेक्ट्रॉनिक्स अपने वैश्विक कार्यबल के लिए ChatGPT Enterprise और Codex को लागू कर रहा है। Nex AGI ने Qwen3.5 पर आधारित 397B MoE, Nex-N2-Pro को OpenRouter पर सूचीबद्ध किया है। sqlite-utils 4.0rc1 स्कीमा माइग्रेशन और नेस्टेड ट्रांजेक्शन जोड़ता है। iOS 27 सिरी सतह के नीचे व्यावहारिक AI सुविधाएँ लाता है। SpaceX ने Reflection AI के साथ $150M/माह के कंप्यूट समझौते पर हस्ताक्षर किए हैं। Groq ने $650M जुटाने की पुष्टि की है। उत्पादन में 'लूपी' एजेंट पैटर्न काफी लोकप्रिय हो रहा है।

🎧 Listen to Episode

Listen & Subscribe

Spotify Apple iHeart YouTube Music Amazon RSS

Episode 074 — June 22, 2026

[00:00] Episode hook

OpenAI Codex 0.142 नया stable है, जिसमें usage-limit reset credits, organized plugin surfaces, और configurable rollout token budgets हैं जो किसी लंबे agent run को budget boundary पर खत्म होने से बचाते हैं। OpenAI Daybreak उसी दिन आया, जो Codex Security को एक नए GPT-5.5-Cyber model के साथ जोड़ता है और Patch the Planet लॉन्च करता है — एक पहल जो AI-assisted review को open-source vulnerability repair के लिए human maintainers के साथ जोड़ती है। Samsung Electronics अपने वैश्विक workforce को ChatGPT Enterprise और Codex दे रही है। Nex AGI का Nex-N2-Pro अब OpenRouter पर Qwen3.5 base पर 397B mixture-of-experts के रूप में उपलब्ध है। sqlite-utils 4.0rc1 schema migrations और nested transactions जोड़ता है। iOS 27 Siri की सतह के नीचे व्यावहारिक AI features लाता है, SpaceX ने Reflection AI के साथ $150M-per-month का compute deal किया है, और Groq ने $650M raise की पुष्टि की है। "loopy" agent pattern, जहां agents का एक समूह पृष्ठभूमि में लगातार चलता है, production में दिखने लगा है।

[02:00] OpenAI Codex 0.142 stable release

[ALLOY]: OpenAI ने Codex 0.142 को नया stable बनाया, कुछ दिनों बाद 0.142 prerelease line ने cycling शुरू की। यही वह version है जो अधिकांश teams अगले cycle के लिए pin करेंगी, और इसमें तीन बदलाव हैं जो CLI के व्यवहार को किसी लंबे run के दौरान बदल देते हैं।

[NOVA]: पहला है usage-limit reset credits। /usage कमांड अब अर्जित reset credits दिखा और redeem कर सकती है, confirmation, retry, और refreshed availability states के साथ। व्यवहार में, इसका मतलब है कि किसी agent को mid-run rate limit का सामना करना पड़ा तो वह global timer का इंतज़ार किए बिना उसी session में recover कर सकता है।

[ALLOY]: दूसरा है plugin organization। /plugins कमांड अब remote plugins को OpenAI Curated, Workspace, और Shared with me में groups करता है, और eligible turns relevant plugins recommend और install कर सकते हैं। मुद्दा cosmetic grouping से कम और यह है कि recommendation और install अब free-form install step के बजाय typed, reviewable surface पर हैं।

[NOVA]: तीसरा है configurable rollout token budgets। CLI अब agent threads में usage track कर सकती है, remaining-budget reminders दे सकती है, और जब budget exhaust हो जाए तो turns abort कर सकती है। जो builder workflows रात भर या किसी coding-agent harness के पीछे Codex thread चलाते हैं, उनके लिए यह "run silently cap through कर गई" को explicit, recoverable boundary में बदल देता है।

[02:08] OpenAI Daybreak launches Codex Security and GPT-5.5-Cyber

[ALLOY]: OpenAI ने 22 June को Daybreak announced किया, एक coordinated security initiative जो एक नए model को एक नए agent surface के साथ जोड़ता है। मुख्य हिस्से हैं Codex Security, एक vulnerability-finding workflow, और GPT-5.5-Cyber, एक नया model जो cybersecurity reasoning के लिए trained है।

[NOVA]: यह तंत्र एंड-टू-एंड भेद्यता कार्य है। Codex Security एजेंट लूप है: यह उम्मीदवार भेद्यता को खोजता है, इसे मान्य करता है, और एक पैच प्रस्तावित करता है। GPT-5.5-Cyber वह मॉडल है जो शोषनीयता और पैच सुधार के बारे में कठिन तर्क करता है। इस संयोजन का उद्देश्य find-to-fix चक्र को संपीड़ित करना है जो सुरक्षा टीमें आमतौर पर अलग-अलग उपकरणों और अलग-अलग मनुष्यों के साथ चलाती हैं।

[ALLOY]: दिलचस्प बिल्डर एंगल पैच-वैलिडेशन लूप है। AI-जनरेटेड पैच के लिए एक सामान्य विफलता mode यह है कि मॉडल एक सुधार प्रस्तावित करता है जो "सही दिखता है" लेकिन वास्तव में मूल शोष पथ को बंद नहीं करता। एक समर्पित साइबर मॉडल द्वारा पैच को मान्य करने से, उस विफलता mode की सतह सिकुड़ती है। यह किसी भी टीम के लिए महत्वपूर्ण है जो बिल्ड पाइपलाइन के हिस्से के रूप में AI-सहायता प्राप्त सुरक्षा उपकरण शिप कर रही है।

[NOVA]: Daybreak एक खुले, opt-in कार्यक्रम के रूप में स्थित है। OpenAI कहता है कि वे सुरक्षा टीमों के साथ निष्कर्षों को मान्य करने और जिम्मेदारी से प्रकट करने के लिए काम करेंगे, जो इस पहल को Project Zero या समान समन्वित प्रकटीकरण कार्यक्रमों के समान संचालन श्रेणी में रखता है।

[02:14] OpenAI Patch the Planet: AI-assisted vulnerability repair for open source

[ALLOY]: Daybreak का साथी टुकड़ा Patch the Planet है, जो खुले स्रोत मेन्टेनर्स को AI और विशेषज्ञ समीक्षा के साथ भेद्यताओं को खोजने, मान्य करने और ठीक करने में मदद करने की पहल है। फ्रेमिंग यह है कि अधिक maintenance वाले खुले स्रोत प्रोजेक्ट्स की लंबी पूंछ वह जगह है जहां अधिकांश जोखिम रहता है, और मौजूदा सुरक्षा कार्यक्रम उस पूंछ को अच्छी तरह से कवर नहीं करते।

[NOVA]: तंत्र एक maintainer-first वर्कफ्लो है। मेन्टेनर्स एक प्रोजेक्ट को कार्यक्रम में ला सकते हैं, आने वाली भेद्यता रिपोर्ट पर AI-सहायता प्राप्त ट्रायज कर सकते हैं, और प्रस्तावित पैच पर विशेषज्ञ समीक्षा प्राप्त कर सकते हैं। OpenAI मॉडल समय और वर्कफ्लो सतह प्रदान कर रहा है; वास्तविक फिक्स मेन्टेनर्स की शर्तों पर मेन्टेनर्स के repo में उतरता है।

[ALLOY]: बिल्डर-स्टैक टीमों के लिए, व्यावहारिक निहितार्थ यह है कि अगले छह से बारह महीनों में supply-chain तस्वीर सार्थक रूप से बेहतर होगी। एक विशिष्ट agent स्टैक में बहुत सारा खुला स्रोत कोड स्वयंसेवकों द्वारा maintained है जिनके पास सीमित सुरक्षा bandwidth है, और यह वह कार्यक्रम है जो इसे बदल देता है। यह देखने के लिए अगली तिमाही में प्रकटीकरण cadence देखें कि कौन से प्रोजेक्ट वास्तव में बैकलॉग साफ़ करते हैं।

[02:18] Samsung Electronics brings ChatGPT Enterprise and Codex to employees

[ALLOY]: Samsung Electronics दुनिया भर के कर्मचारियों को ChatGPT Enterprise और Codex रोल आउट कर रहा है, जो इसे OpenAI के सबसे बड़े enterprise AI deployments में से एक बनाता है। महत्वपूर्ण हिस्सा सिर्फ सीट संख्या नहीं है। यह एक सामान्य enterprise सहायक और एक कोडिंग agent सतह का संयोजन है एक ऐसी कंपनी के भीतर जो उपभोक्ता उपकरणों, चिप्स, डिस्प्ले, सॉफ्टवेयर और manufacturing सिस्टम में फैली हुई है।

[NOVA]: यहां Codex को नवाचार के रूप में नहीं माना जा रहा है। इसे उन employee वर्कफ्लो में रखा जा रहा है जहां सॉफ्टवेयर परिवर्तन hardware कार्यक्रमों, आंतरिक प्लेटफॉर्म, उत्पाद टूलिंग और संभवतः ऑटोमेशन स्क्रिप्ट की एक लंबी पूंछ को छूते हैं। यह एक बहुत अलग ऑपरेटिंग वातावरण बनाता है जो एक छोटी टीम द्वारा एक वेब सेवा को पैच करने के लिए agent का उपयोग करने से काफी अलग है। अनुमतियां, repo एक्सेस, समीक्षा नीतियां और ऑडिट ट्रेल वास्तविक एकीकरण कार्य बन जाते हैं।

[ALLOY]: डिप्लॉयमेंट अन्य बड़े नियोक्ताओं को भी एक संकेत भेजता है। एक बार Samsung जैसे पैमाने की कंपनी ChatGPT Enterprise और Codex को मानकीकृत कर लेती है, तो खरीदार कॉर्पोरेट वातावरण में एजेंटिक कोडिंग को शामिल करने के लिए एक संदर्भ पैटर्न का उल्लेख कर सकते हैं। OpenAI को इस प्रूफ पॉइंट से लाभ होता है, लेकिन बिल्डर्स को इसे उम्मीदों में बदलाव के रूप में पढ़ना चाहिए: कोडिंग एजेंट वैकल्पिक पावर-यूज़र टूल्स से स्वीकृत आंतरिक इन्फ्रास्ट्रक्चर की ओर बढ़ रहे हैं।

[NOVA]: जोखिम असमान रूप से अपनाने में है। वैश्विक रोलआउट स्वचालित रूप से यह गारंटी नहीं देता कि हर टीम को समान गुणवत्ता का एकीकरण मिले। उपयोगी डिप्लॉयमेंट वे होंगे जो Codex को सही स्रोत सतहों, इश्यू ट्रैकर्स, रिव्यू गेट्स और आंतरिक ज्ञान प्रणालियों से जोड़ें, बिना इसे डिफ़ॉल्ट रूप से व्यापक पहुंच दिए।

[02:25] Nex AGI ने OpenRouter पर Nex-N2-Pro को 397B MoE on Qwen3.5 के रूप में सूचीबद्ध किया

[ALLOY]: Nex AGI ने OpenRouter के माध्यम से Nex-N2-Pro खोला, बिल्डर्स को एक नए एजेंटिक मिक्सचर-ऑफ-एक्सपर्ट्स मॉडल तक API पहुंच प्रदान की। हेडलाइन आंकड़े बड़े हैं: 397 अरब कुल में से 17 अरब सक्रिय पैरामीटर, Qwen3.5 आर्किटेक्चर पर निर्मित। यह टेक्स्ट और छवि इनपुट स्वीकार करता है, और लिस्टिंग इसे एजेंटिक वर्कलोड के लिए पोजीशन करती है जहां लंबे संदर्भ और मल्टीमॉडल इनटेक मायने रखते हैं।

[NOVA]: जो मैकेनिज्म मायने रखती है वह प्रोवाइडर रूटिंग है। क्योंकि Nex-N2-Pro OpenRouter के माध्यम से उपलब्ध है, एक बिल्डर इसे मौजूदा मॉडल रूटर के पीछे जोड़ सकता है, सीधे वेंडर इंटीग्रेशन की प्रतीक्षा किए बिना। इसका मतलब यह है कि पहला अपनाने का रास्ता पूर्ण प्लेटफॉर्म रीराइट नहीं है; यह वही इन्फरेंस लेयर में एक नया मॉडल टारगेट है जहां टीमें पहले से ही क्वालिटी, लेटेंसी, संदर्भ हैंडलिंग और लागत की तुलना करती हैं।

[ALLOY]: सक्रिय बनाम कुल पैरामीटर स्प्लिट भी महत्वपूर्ण है। मिक्सचर-ऑफ-एक्सपर्ट्स मॉडल बड़ी कुल क्षमता प्रदान कर सकते हैं जबकि प्रति टोकन नेटवर्क का केवल एक भाग सक्रिय करते हैं। व्यवहार में, खुला सवाल यह है कि क्या Nex-N2-Pro की रूटिंग मल्टी-स्टेप कोडिंग, रिसर्च और प्लानिंग सत्रों के तहत बेहतर एजेंट व्यवहार देती है, या क्या हेडलाइन साइज मुख्य रूप से बेंचमार्क-स्टाइल प्रॉम्प्ट पर मदद करता है।

[NOVA]: बिल्डर्स के लिए, यह एक नया कैंडिडेट के रूप में व्यवहार करने योग्य है, न कि नया डिफ़ॉल्ट। पहला उपयोगी सिग्नल वास्तविक एजेंट ट्रेस से आएगा: टूल सेलेक्शन, गलत मोड़ के बाद रिकवरी, विज़ुअल इनपुट हैंडलिंग, और क्या इसका लंबे-संदर्भ व्यवहार सुसंगत रहता है जब सत्र में कोड, आवश्यकताएं, लॉग और पूर्व निर्णय शामिल हों।

[02:32] sqlite-utils 4.0rc1 में माइग्रेशन और नेस्टेड ट्रांज़ैक्शन जोड़े गए

[ALLOY]: sqlite-utils ने 4.0 रिलीज़-कैंडिडेट स्टेज पर दो बदलावों के साथ पहुंच गया जो एजेंट-बैक्ड ऐप्स के लिए मायने रखते हैं: स्कीमा माइग्रेशन और नेस्टेड ट्रांज़ैक्शन। प्रोजेक्ट पहले से ही Python डेवलपर्स को SQLite के साथ काम करने का एक उच्च-स्तरीय तरीका प्रदान करता है, जिसमें टेबल ट्रांसफॉर्मेशन और JSON-आकार पेलोड से स्वचालित टेबल क्रिएशन शामिल है। नया रिलीज़ कैंडिडेट इसे एप्लिकेशन इन्फ्रास्ट्रक्चर की ओर और आगे बढ़ाता है।

[NOVA]: माइग्रेशन हेडलाइन हैं क्योंकि SQLite अक्सर प्रोटोटाइप, एजेंट, छोटी सेवाओं, इवैल्यूएशन हार्नेस और पर्सनल ऑटोमेशन के लिए लोकल स्टेट लेयर होता है। जब स्कीमा विकसित होती है, बिल्डर्स को डेटाबेस को अपग्रेड करने का एक पूर्वानुमेय तरीका चाहिए, बिना नाजुक सेटअप लॉजिक हाथ से लिखे। sqlite-utils में माइग्रेशन डालने से यह पथ अधिक स्पष्ट और डिप्लॉय स्टेप्स में वायर करना आसान हो जाता है।

[ALLOY]: नेस्टेड ट्रांज़ैक्शन दूसरा व्यावहारिक लाभ है। एजेंट वर्कफ़्लो अक्सर परिवर्तनों की एक श्रृंखला करते हैं: एक रन स्टोर करें, टूल इवेंट जोड़ें, स्थिति अपडेट करें, मूल्यांकन परिणाम संलग्न करें, फिर यदि एक कदम विफल हो तो पुनर्प्राप्त करें। नेस्टेड ट्रांज़ैक्शन सपोर्ट एप्लिकेशन कोड को आंशिक ऑपरेशनों पर अधिक सटीक नियंत्रण देता है, खासकर जब हेल्पर फ़ंक्शन को ट्रांज़ैक्शनल व्यवहार की आवश्यकता होती है लेकिन वे एक बड़े ट्रांज़ैक्शन के भीतर चल सकते हैं।

[NOVA]: बिल्डर प्रासंगिकता सरल है: SQLite गंभीर लोकल और एज वर्कफ़्लो में दिखना जारी रखता है क्योंकि यह तेज़, पोर्टेबल है, और शिप करना आसान है। एक मजबूत sqlite-utils लेयर उन वर्कफ़्लो को कम ad hoc बनाती है। सावधानी यह है कि यह अभी भी एक रिलीज़ कैंडिडेट है, इसलिए टीमों को इसे 4.0 API का पूर्वावलोकन मानना चाहिए, इस पर निर्भर होने से पहले production माइग्रेशन के लिए।

[02:40] iOS 27 Siri सतह के बाहर व्यावहारिक AI फ़ीचर उतरते हैं

[ALLOY]: iOS 27 Mail, Photos, Notes, और Spotlight में व्यावहारिक AI फ़ीचर ला रहा है, पूरा ध्यान Siri पर नहीं दे रहा है। Apple का दृष्टिकोण अधिकांश अनुरोधों के लिए on-device Foundation Models पर निर्भर करता है, भारी काम के लिए Private Cloud Compute को फ़ॉलबैक के रूप में उपयोग करता है। यह iPhone को एक अधिक ambient AI लेयर देता है: सारांशीकरण, जेनरेशन, सेमांटिक सर्च, और ऐप-ट्रिगर्ड एक्शन लोगों के पहले से काम करने की जगहों में बुनकर।

[NOVA]: डेवलपर्स के लिए तकनीकी सतह App Intents है। Apple सारांशीकरण, जेनरेशन, और सेमांटिक सर्च के लिए intent टाइप जोड़ रहा है, जो ऐप्स को सिस्टम AI के लिए एक्शन एक्सपोज़ करने देता है बिना हर ऐप के अपना क्लाउड मॉडल बैकएंड बनाने के। यह एक बहुत Apple मूव है: मॉडल प्लेटफ़ॉर्म रनटाइम का हिस्सा बन जाता है, और डेवलपर्स ऐप व्यवहार को सिस्टम लेयर से जोड़ते हैं।

[ALLOY]: Spotlight विशेष रूप से महत्वपूर्ण है क्योंकि यह कीवर्ड सर्च से local vector embeddings की ओर शिफ्ट करता है। On-device कंटेंट के विरुद्ध नैचुरल-लैंग्वेज क्वेरीज़ फ़ोन को कम लॉन्चर जैसा और अधिक पर्सनल रिट्रीवल सिस्टम जैसा बनाती हैं। अगर यह अच्छा काम करता है, तो लाभ चैटबॉट मोमेंट नहीं है। यह सही नोट, फ़ोटो, मैसेज, या ऐप कंटेंट कम स्पष्ट फ़िल्टर के साथ खोजना है।

[NOVA]: खुला सवाल यह है कि इसमें से कितना तृतीय-पक्ष डेवलपर्स के लिए curated App Intents पाथ से परे उपलब्ध होता है। अगर पब्लिक SDK सतह संकरी रहती है, Apple को प्राइवेसी और निरंतरता मिलती है लेकिन प्रयोग सीमित होता है। अगर यह अधिक क्षमता खोलता है, तो iOS प्राइवेसी-फर्स्ट AI फ़ीचर के लिए प्रमुख डिप्लॉयमेंट टारगेट बन जाता है जिन्हें डिफ़ॉल्ट रूप से क्लाउड सर्विंग की ज़रूरत नहीं होती।

[02:50] SpaceX Reflection AI के साथ $150M/महीना कंप्यूट डील साइन करता है

[ALLOY]: SpaceX ने Reflection AI के साथ एक कंप्यूट डील साइन की है, एक ओपन-सोर्स AI लैब, जो 1 जुलाई 2026 से 2029 तक प्रति महीने $150 मिलियन है। Reflection को Memphis, Tennessee के पास SpaceX के Colossus 2 डेटा सेंटर में Nvidia के नवीनतम GB300 AI चिप्स और सहायक हार्डवेयर पर तुरंत पहुंच मिलती है।

[NOVA]: मैकेनिज़्म सीधी हाइपरस्केलर-स्टाइल कंप्यूट एलोकेशन है, लेकिन स्केल कहानी है। तीन साल तक प्रति महीने $150M बनाए रखना वास्तविक है, और GB300 जेनरेशन AI ट्रेनिंग और इंफरेंस के लिए वर्तमान टॉप-एंड Nvidia सिलिकॉन है। यह Reflection को उस स्केल पर ट्रेन और सर्व करने की रनवे देता है जो ओपन-सोर्स लैब को आमतौर पर भीख मांगनी पड़ती है।

[ALLOY]: बिल्डर-स्टैक वॉचर्स के लिए दिलचस्प पहलू यह है कि यह नियोक्लाउड इकोनॉमिक्स के बारे में क्या कहता है। Colossus 2 SpaceX का एक नियोक्लाउड प्रोवाइडर बनने की दिशा में कदम है, इसके लॉन्च बिज़नेस के अलावा, और एक असली AI लैब की दीर्घकालिक प्रतिबद्धता उस दांव को मान्य करती है। बिल्डर्स के लिए, व्यावहारिक निहितार्थ यह है कि नियोक्लाउड क्षमता AI इन्फ्रास्ट्रक्चर मार्केट की एक निरंतर परत की तरह दिखने लगी है, न कि एक साइड प्रोजेक्ट की तरह।

[NOVA]: अगली तिमाही में GPU मिक्स पर नज़र रखें। reflection-vs-GB300 आवंटन, नए GB300 रैक पर लीड टाइम, और अन्य लैब्स के साथ कोई फॉलो-ऑन डील्स बताएंगी कि हार्डवेयर स्टैक के टॉप एंड पर नियोक्लाउड क्षमता के लिए वास्तविक मांग कितनी है।

[02:55] Groq ने $650M का फंडरेज़ कन्फर्म किया और Nvidia के $20B नॉन-एक्वायर-हायर के बाद री-स्टाफ कर रहा है

[ALLOY]: AI चिपमेकर Groq ने $650M का फंडरेज़ कन्फर्म किया है और Nvidia के $20B नॉन-एक्वायर-हायर डील के बाद री-स्टाफ कर रहा है। TechCrunch आर्टिकल में फ्रेमिंग यह है कि Nvidia के साथ डील एक अधिग्रहण नहीं थी बल्कि एक हायरिंग व्यवस्था थी, और Groq ने पोस्ट-डील स्पष्टता का उपयोग एक नियोक्लाउड बिज़नेस के अगले चरण को फंड करने के लिए किया।

[NOVA]: मैकेनिज़्म एक जानबूझकर नियोक्लाउड पिवट है। Groq का LPU इन्फरेंस सिलिकॉन हाई-थ्रुपुट, लो-लेटेंसी सर्विंग के लिए अच्छी तरह से उपयुक्त है, और नियोक्लाउड बिज़नेस उस क्षमता को उन टीमों को बेचता है जो अपना खुद का Groq हार्डवेयर नहीं चलाना चाहतीं। रेज़ सिलिकॉन डेवलपमेंट और नियोक्लाउड साइड के ऑपरेशनल एक्सपैंशन दोनों को फंड करता है।

[ALLOY]: बिल्डर-स्टैक वॉचर्स के लिए दिलचस्प पहलू इन्फरेंस मार्केट स्ट्रक्चर है। Groq, SpaceX-Reflection डील के साथ मिलकर, यह सुझाव देता है कि हम एक ऐसे मार्केट से आगे बढ़ रहे हैं जहां Nvidia-डायरेक्ट और कुछ हाइपरस्केलर्स का वर्चस्व था, एक ऐसे मार्केट की ओर जहां टॉप एंड पर कई स्पेशलाइज़्ड इन्फरेंस प्रोवाइडर हैं। यह राउटिंग लॉजिक को ज़्यादा काम देता है और बिल्डर्स को कॉस्ट-सेंसिटिव वर्कलोड रखने के लिए ज़्यादा जगहें देता है।

[NOVA]: Groq का LPU Nvidia GPU का सर्व-राउंड सब्सटीट्यूट नहीं है, लेकिन स्पेसिफिक मॉडल आर्किटेक्चर और लेटेंसी प्रोफाइल्स के लिए सर्विंग करने में यह एक असली ऑप्शन है। अगली तिमाही में मॉडल-कवरेज अनाउंसमेंट्स पर नज़र रखें यह देखने के लिए कि किन मॉडल्स को पहला-क्लास Groq सपोर्ट मिलता है।

[03:00] AI दुनिया "लूपी" हो रही है: हमेशा-ऑन एजेंट स्वॉर्म्स

[ALLOY]: इस हफ्ते TechCrunch का एक आर्टिकल एजेंटिक AI में "लूपी" पैटर्न के उदय का वर्णन करता है: एक एजेंट जो तब चलता है जब कोई इंसान पूछता है, इसके बजाय एजेंट्स का एक स्वॉर्म बैकग्राउंड में लगातार काम करने के लिए अधिकृत है, टास्क उठाते हुए, छोटे फैसले लेते हुए, और तभी सतह पर आते हुए जब उन्हें किसी इंसान की ज़रूरत होती है।

[NOVA]: मैकेनिज़्म एक लॉन्गर-होराइज़न एजेंट लूप है जिसमें एक कंट्रोल्ड ऑटोनॉमी एनवेलप है। स्वॉर्म में प्रत्येक एजेंट के पास एक परिभाषित स्कोप, एक परिभाषित कॉस्ट बजट, और एक परिभाषित एस्केलेशन नियम है। यूज़र अब सिंक्रोनस प्रॉम्प्ट-रेस्पॉन्स लूप में नहीं है; यूज़र रिज़ल्ट-रिव्यू लूप में है।

[ALLOY]: दिलचस्प पहलू operational shift है। एक "loopy" deployment chat tool से ज्यादा managed service जैसी दिखती है। एक heartbeat, एक audit log, एक kill switch, एक cost dashboard, और scheduled check-ins का एक सेट है। Agents तब चल रहे हैं जब user सो रहा है, और morning review human-in-the-loop checkpoint है।

[NOVA]: यह वह pattern है जिसे बाकी stack को catch up करना है। Agent harnesses वहां पहुंच रही हैं, memory layers वहां पहुंच रही हैं, cost controls वहां पहुंच रही हैं, और Codex 0.142 में rollout token budgets cost-control piece के land होने का एक उदाहरण है। अगली quarter देखें पहले production-grade "loopy" agent product के लिए जो individual builders को target करता है, न कि सिर्फ enterprise teams को।

[10:00] GitHub Project Radar: Cursor-Talk-To-Figma-MCP, Firecrawl MCP, Semble

[ALLOY]: इस cycle में GitHub project radar agent-tooling surface पर भारी है, जो episode के बाकी हिस्सों को देखते हुए समझ में आता है। तीन repos जिनके बारे में जानना worth है: grab's cursor-talk-to-figma-mcp, Firecrawl's official MCP server, और MinishLab's Semble for agent-friendly code search.

[NOVA]: Grab से Figma MCP किसी भी MCP-compatible agent को Figma file में एक typed surface देता है। एक coding agent design पढ़ सकता है, component structure समझ सकता है, और changes back push कर सकता है। दिलचस्प हिस्सा loop है: design changes agent में flow होते हैं, agent code change करता है, और design system sync में रहता है। पहले एक छोटी Figma file पर try करें यह देखने के लिए कि round-trip कितनी cleanly काम करता है।

[ALLOY]: Firecrawl का MCP server web scraping और search को एक MCP tool के रूप में expose करता है, जिसका मतलब है कि कोई भी agent harness जो MCP बोलती है वह hand-rolling a scraper के बिना retrieval-augmented research कर सकती है। एक coding agent के लिए जिसे API docs देखने या library के latest version की जांच करने की जरूरत है, यह एक multi-step glue-code task को एक single tool call में बदल देता है। बात यह नहीं है कि Firecrawl new है, यह है कि यह अब agent-tooling surface पर first-class है।

[NOVA]: Semble इस cycle का code-search pick है। यह एक repo को index करता है और agents को एक fast lookup primitive देता है जो grep-plus-read flow की तुलना में tokens का एक fraction use करता है। large repos पर long sessions के लिए, यह token saving compound होती है। दिलचस्प test यह है कि Semble की index quality messy, real-world codebases पर hold up करती है या सिर्फ clean OSS examples पर।

[10:30] Practical queue

[ALLOY]: आज की stories से: Codex 0.142 rollout token budget और reset-credit redemption के साथ एक stable release land करता है जो आखिरकार एक long agent run को एक bounded thing बनाते हैं। Daybreak और Patch the Planet together suggest करते हैं कि AI-assisted security research से coordinated disclosure की ओर बढ़ रहा है। Samsung का enterprise deployment अब तक का सबसे बड़ा signal है कि coding agents sanctioned infrastructure हैं, power-user toys नहीं। Nex-N2-Pro एक new large MoE है जो आपके evaluation harness में routing करने योग्य है, sqlite-utils 4.0rc1 side project पर schema migrations test करने के लिए stable release से पहले सही जगह है, और loopy agent pattern वह है जो agent products का अगला साल दिखने वाला है।

🎙 Never miss an episode — subscribe now

Spotify Apple iHeart YouTube Music Amazon RSS

🎙 Subscribe to AgentStack Daily