Codex rust-v0.142.4, pacto HP-OpenAI Frontier, aposta de memória de IA da Micron, agente de câncer Claude — Episode 76 cover art
Episode 76·29 de junho de 2026·29:01

Codex rust-v0.142.4, pacto HP-OpenAI Frontier, aposta de memória de IA da Micron, agente de câncer Claude

O AgentStack Daily de hoje cobre o lançamento do OpenAI Codex rust-v0.142.4 como uma versão de manutenção apenas para tarefas menores, a HP Inc. lançando uma parceria estratégica Frontier com a OpenAI em engenharia e no portal de parceiros com mais de 100 mil, e a OpenAI + Broadcom revelando o chip de inferência Jalapeño. Acompanhamos o caso de um fundador que usa o Claude como coordenador pessoal de tratamento de câncer, a Ford recontratando engenheiros seniores após falhas na qualidade da IA e a Micron se tornando a próxima aposta da Wall Street em memória de IA baseada em HBM. Encerramos com a SoftBank. Show notes: https://tobyonfitnesstech.com/pt/podcasts/episode-76/

🎧 Listen to Episode

Episódio 076 — 29 de junho de 2026

[00:00] Gancho do episódio

A OpenAI lançou o Codex rust-v0.142.4 neste ciclo, com o lançamento verificado na fonte primária do projeto. A mesma empresa publicou um estudo sobre força de trabalho mapeando como a automação pode remodelar ocupações na União Europeia, sinalizando empregos específicos que enfrentam deslocamento, crescimento e mudança nos fluxos de trabalho. A HP Inc. anunciou que está ampliando sua parceria Frontier com a OpenAI para implementar sistemas ageonômicos em experiência do cliente, desenvolvimento de software e operações corporativas. Em uma reversão separada, a liderança da Ford reconheceu que a montadora "pensou erroneamente que apenas introduzir inteligência artificial... resultaria em um produto de alta qualidade" e agora está readmitindo engenheiros seniores para reforçar a qualidade. Um perfil da TechCrunch de 27 de junho também detalhou a decisão do fundador Connor Christou, após um diagnóstico de câncer, de alimentar seu conjunto de dados médicos pessoais no Claude para coordenar seu próprio tratamento.

[02:00] Leitura do Release do Agent Stack: OpenAI Codex rust-v0.142.4

A OpenAI enviou o Codex rust-v0.142.4 neste ciclo, e tanto a página de release do GitHub quanto o rótulo da API de comparação identificam como um patch apenas de tarefas sem alterações visíveis para o usuário desde a v0.142.3. O diff da tag contra 0.142.3 tem três commits: um PR de feature do catálogo Bedrock integrado por back-merge mais duas alterações no [codex] — e a v0.142.3 também era apenas tarefas, então o delta visível para o usuário nos últimos dois releases do Codex rust é efetivamente zero. O sinal interessante não é o número da versão, é que a OpenAI está pousando alterações via back-merges em vez de esperar por um corte maior, o que significa que qualquer pessoa chamando o Bedrock diretamente deve verificar se sua configuração de roteamento de modelo ainda resolve para o caminho do catálogo esperado. Para a maioria dos builders, nenhuma ação de pin ou atualização é necessária; apenas verifique se qualquer comportamento do Codex pré-0.142.3 ainda se mantém em um ambiente de staging antes de fazer o rollout. Fique de olho no próximo tag do Codex que não seja apenas tarefas como o primeiro release onde novo comportamento realmente pousa.

[02:04] Mapeando a Oportunidade de Força de Trabalho de IA na Europa

A OpenAI publicou "Mapeando a Oportunidade de Força de Trabalho de IA na Europa" em 29 de junho, um relatório de Pesquisa Econômica da OpenAI que mapeia como a IA pode remodelar empregos em toda a UE. A metodologia é uma sobreposição de taxonomia: ocupações ESCO indexadas contra dados de emprego do Eurostat, estendendo a estrutura dos EUA da OpenAI de abril de 2026 para a Europa — não uma pesquisa, não dados de parceiros. O relatório agrupa os empregos da UE em quatro "arquétipos de transição" com aproximadamente 12% "crescer com IA", 14% potencial de automação mais alto no curto prazo, 27% "provavelmente reorganizar", e 47% "mudança menos imediata." Seis países são nomeados explicitamente: Luxemburgo, Suécia e Holanda lideram em ocupações de participação em crescimento; Alemanha, Grécia e Itália lideram em ocupações com potencial de automação. A UE tem uma participação menor em ocupações de maior automação do que os EUA, e o período é explicitamente "curto prazo" sem um horizonte fixo. Para builders europeus, a questão prática é em qual arquétipo os fluxos de trabalho da organização de clientes se encaixam, e se sua integração de IA mapeia claramente para uma estrutura de "reorganizar" em vez de "automação". Se sua narrativa de implantação de IA pousar diante de um cliente da UE, mapeie seu posicionamento para os quatro arquétipos explicitamente, já que compras estão lendo cada vez mais esses relatórios. Fique de olho na cobertura subsequente da EURACTIV e Politico EU que pode trazer tabelas em nível de país.

[02:57] HP Inc. lança parceria estratégica Frontier com a OpenAI

A HP anunciou a parceria estratégica "Frontier" com a OpenAI em 28 de junho, ampliando pilotos que começaram em fevereiro de 2026 em soluções voltadas para clientes e parceiros, telemetria de clientes, produtividade de funcionários, desenvolvimento de software, segurança e suporte a preços/parceiros/lojas/clientes — global, corporativo, sem contagem de assentos publicada. A stack fica sobre a OpenAI Frontier como camada de governança e contexto, com modelos da OpenAI e ChatGPT abaixo para remediação de segurança e trabalho de conhecimento, e Codex abaixo para modernização de código, planejamento, scaffolding de UI e entrega paralela. A HP está conectando isso à plataforma de frota de dispositivos WXP e ao HP Partner Portal, que serve mais de 100.000 parceiros globalmente e canaliza mais de 80% dos negócios da HP. Os KPIs de piloto da HP são concretos: um engenheiro enviou 122 PRs em 43 projetos em poucas semanas, múltiplos bugs de software que anteriormente levavam até um mês foram remediados em um dia, e a equipe de segurança desbloqueou aproximadamente 82 horas por semana de capacidade, com um engenheiro citando que "é uma ferramenta incrível, e estou usando diariamente." Treat these numbers as a benchmark when scoping an OpenAI-Frontier rollout against your own dev and security surface — 122 PRs per engineer per project-cluster and ~82 hours per week of security capacity are concrete figures you can compare against. Se você está avaliando a OpenAI Frontier para uma org de múltiplas equipes, planeje para a questão de roteamento Codex-versus-ChatGPT cedo, já que remediação de segurança, trabalho de conhecimento e modernização de código cada um precisam de configuração diferente. Fique de olho no primeiro cliente de referência publicado além da HP em si.

[03:49] Fundador transforma Claude em coordenador pessoal de tratamento de câncer

Em 27 de junho, a TechCrunch fez um perfil de Connor Christou, um fundador que, após um diagnóstico de câncer, alimentou todo seu conjunto de dados de saúde pessoal — painéis de sangue, dados de exames, saída de wearables e entradas de diário — no Claude e usou o modelo para coordenar sua própria pesquisa de tratamento. O fluxo de trabalho trata o LLM como um agregador entre fontes de dados pessoais heterogêneas em vez de uma ferramenta médica de propósito único, e funciona porque um humano pode manter um contexto cruzado de domínio mais longo do que qualquer clínico individual em seu caso.

O mecanismo concreto é ingestão multimodal de contexto longo: PDFs de laboratórios, exportações de séries temporais de wearables e notas não estruturadas são colados em uma única sessão de modelo onde o pattern-matching é executado em toda a linha do tempo. O Claude atua como coordenador de pesquisa, superficializando resultados de literatura, comparando protocolos e sinalizando anomalias em tendências de biomarcadores pessoais contra linhas de base de coorte. O pipeline é preparação manual de dados antes de um único prompt — sem agent harness, sem SDK médico, apenas uma janela de contexto longo e um operador motivado.

O que isso valida para builders é um padrão: qualquer domínio pessoal de alto contexto — saúde, finanças, legal — onde você possui o stream de entrada diário é uma superfície de agente viável hoje, porque o LLM está fazendo a síntese longitudinal que o humano não consegue. O gargalo é o encanamento de ingestão de dados, não a capacidade do modelo, e os lados de API e SDK já são maduros o suficiente para suportá-lo.

A coisa para observar é a camada de ingestão: se fornecedores de EHR expuserem servidores MCP ou endpoints de exportação canônicos que permitam que agentes puxem registros estruturados diretamente, a etapa manual de upload de PDF no centro do stack de Christou desaparece e o padrão escala além do fundador que tem tempo para curar manualmente.

[05:31] OpenAI + Broadcom apresentam chip de inferência Jalapeño

OpenAI e Broadcom apresentaram Jalapeño em 24 de junho — um chip de IA personalizado construído para inferência de LLM, projetado para melhorar desempenho, eficiência e escala nos sistemas da OpenAI. O chip pousa como o terceiro programa de aceleração de inferência公开 da OpenAI após a parceria com Cerebras e a stack de silício interno da OpenAI ainda não entregue, colocando a Broadcom no centro de um roadmap de inferência interno que mira a dependência de Nvidia diretamente. O silício de inferência公开 da OpenAI agora abrange três caminhos diferentes de fornecedores — Broadcom para silício de inferência personalizado, Cerebras para inferência rápida, e um programa interno — o que significa que para builders executando cargas de trabalho na inferência hospedada da OpenAI, a questão prática é se a camada de roteamento da OpenAI roteará diferentes famílias de modelos para diferentes backends de silício, uma mudança que deslocaria perfis de latência e throughput sem um único bump de versão de API. Builders otimizando para custo-por-token na OpenAI devem esperar que camadas de preços e perfis de latência mudem conforme as rotas baseadas em Jalapeño entrem em operação, e as decisões de roteamento serão provavelmente opacas. Trate sua linha de base de latência da OpenAI como estável por agora; reavalie quando a OpenAI publicar telemetria de roteamento por modelo. Fique de olho no primeiro modelo servido por Jalapeño anunciado e se é uma implantação de nível de raciocínio ou nível geral.

[06:23] Ford Readmite Engenheiros Seniores Após Impasse na Qualidade de IA

A Ford fez uma desculpa pública esta semana: a empresa está readmitindo engenheiros veteranos que haviam sido dispensados, após admitir que sua aposta na IA para impulsionar a qualidade não funcionou. A citação da liderança — "Erroneamente pensamos que apenas introduzir inteligência artificial... resultaria em um produto de alta qualidade" — apareceu em 28 de junho via TechCrunch e é uma das admissões mais claras de uma empresa Fortune 100 de que a implantação de IA sem o contexto ao redor certo pode regredir resultados em vez de melhorá-los.

O mecanismo de falha não foi o modelo. Foi o runtime ao redor do modelo: chamadas de inferência executando sem o contexto institucional, loops de revisão e consciência de casos extremos que engenheiros experientes trazem. A Ford parece ter tratado a IA como um substituto drop-in para julgamento humano, em vez de uma camada que precisa se integrar com controles de qualidade existentes e revisão sênior. A peça que faltava era o handoff — saída do modelo fluindo para um fluxo de trabalho onde ninguém com conhecimento profundo do domínio estava posicionado para captar o que o sistema perdeu.

Para equipes de ferramentas de desenvolvimento, o paralelo é direto. Fluxos de trabalho de codificação com agentes que enviam sem um revisor sênior no loop, sem ganchos de validação para saída de baixa confiança e sem um caminho claro de escalonamento estão fazendo a mesma aposta. O que a Ford está publicamente recuando é exatamente o que um harness de agente sub-instrumentado arrisca em menor escala: saída mais rápida, sinal mais baixo, e uma deriva de qualidade que não emerge até a produção.

O que observar a seguir: se a reversão da Ford aparece como um padrão de contratação em outras fabricantes, e se a lição se estende para implementações de software empresarial onde recursos de IA estão sendo distribuídos com as mesmas camadas finas de revisão.

[08:07] Micron se torna a próxima aposta da Wall Street no estilo Nvidia para memória de IA

A Micron apareceu na lista de favoritos da Wall Street para o próximo vencedor de IA no estilo Nvidia em 28 de junho, com mesas de venda apontando para a demanda crescente por memória de alta largura de banda em aceleradores de IA. O fabricante de memória baseado em Boise se tornou um fornecedor-chave de HBM — a DRAM empilhada que fica entre os dies de GPU e os alimenta com dados em taxas de terabytes por segundo — e analistas argumentam que memória, não computação bruta, é agora a restrição vinculante em construções de infraestrutura de IA. HBM3E é enviada em aceleradores de geração atual da Nvidia e AMD, e a Micron é um dos três fornecedores qualificados no nó de ponta, ao lado da SK Hynix e Samsung. Para construtores, isso importa porque a alocação de HBM agora determina quais equipes realmente recebem remessas de GPU totalmente configuradas, e SKUs ricos em memória consistentemente foram os primeiros a atrasar na alocação até 2026. O que observar a seguir: se a rampa de HBM4 da Micron cumpre seus compromissos de capacidade para 2026, e se os regimes de controle de exportação se estendem à memória avançada da mesma forma que já fizeram para silício de computação de ponta.

[09:06] O CEO da SoftBank não é o único com perguntas sobre o hype do centro de dados orbital de Elon Musk

O CEO da SoftBank, Masayoshi Son, questionou publicamente a economia do pitch de Elon Musk de colocar centros de dados de IA em órbita, com o ceticismo técnico centrado na economia de lançamento e na necessidade de substituir satélites a cada poucos anos. A mesma matéria do TechCrunch observa que o CEO da OpenAI, Sam Altman, também foi cético, enquadrado em torno da dependência de participação de lançamento na demanda do Starlink e nos incentivos de receita de lançamento e Starlink mais amplos da SpaceX. Os três problemas de custo concretos que os céticos estão apontando: dólares de lançamento por quilograma para LEO caiu apenas cerca de dez vezes em uma década e mostra claras restrições físicas de piso; a vida útil do satélite antes da reentrada em constelações MEO e LEO é de cinco a sete anos; e a irradiação solar acima da atmosfera é apenas cerca de um vírgula quatro vezes a terrestre, não suficiente para compensar o delta de custo de lançamento para a mesma área de computação. A latência de fibra subsegundo entre centros de dados terrestres também é uma vantagem difícil de replicar para qualquer carga de trabalho coerente de treinamento. Para construtores planejando capacidade, tratem computação orbital como uma entrada de risco extremo em vez de uma premissa básica para os próximos cinco anos.

[09:58] Executivo do Apple Vision Pro supostamente deixando para ir para a OpenAI

Paul Meade, vice-presidente da Apple responsável pelo headset Vision Pro, está deixando a Apple para ingressar na equipe de hardware da OpenAI, segundo Mark Gurman da Bloomberg, conforme primeiras informações de 27 de junho. Na Apple, Meade também liderou o desenvolvimento do produto de óculos inteligentes alimentados por IA planejado pela Apple para o próximo ano, e Gurman vincula a saída à elevação iminente de John Ternus a CEO da Apple e a uma reorganização de VP de hardware que deixou alguns VPs se sentindo preteridos. A OpenAI já está colaborando com o ex-diretor de design chief da Apple, Jony Ive, em um dispositivo de IA que Sam Altman descreveu como "mais pacífico e calmo do que um iPhone". Este é o segundo VP de hardware da Apple a surgir na equipe de hardware da OpenAI no ciclo de sucessão pós-Ternus, e o pipeline importa porque o programa de dispositivos de consumo da OpenAI agora está atraindo do banco de VPs da Apple em vez de ex-alunos de mecanismo de busca ou OEMs de Android. O enquadramento de "mais pacífico e calmo" é em si um sinal de posicionamento de produto: um dispositivo posicionado explicitamente contra a captura de atenção em formato de telefone.

[10:52] Startups asiáticas lançam modelos comparáveis ao Anthropic enquanto proibição de exportação estagna

Múltiplos laboratórios de IA asiáticos começaram a lançar modelos fundamentais apresentados como concorrentes diretos da linha Mythos da Anthropic, aproveitando a proibição prolongada de exportação dos EUA. Os lançamentos abrangem vários mercados na região e visam desenvolvedores empresariais, com fornecedores enfatizando paridade de inferência, suporte multimodal e compatibilidade de API com ferramentas ocidentais existentes. Como os modelos são treinados e servidos em infraestrutura fora da jurisdição dos EUA, eles contornam o regime de controle de exportação que tem moldado a distribuição de modelos nos últimos trimestres. Construtores na Ásia agora têm alternativas críveis para cargas de trabalho de nível superior, com estruturas de preços relatadamente competitivas contra incumbentes dos EUA. A mudança aparece em compras: equipes regionais enfrentando requisitos de residência de dados ou conformidade podem adotar esses modelos sem a ambiguidade legal que acompanhou a inferência transfronteiriça. Laboratórios dos EUA estão observando anos de construção de mercado potencialmente cedidos a concorrentes que não foram retardados pela mesma fricção regulatória. O que observar: quais fornecedores enviam SLAs empresariais estáveis, se os preços de API permanecem agressivos conforme a escala cresce, e como a Anthropic responde quando — ou se — os controles de exportação diminuem. Se os laboratórios dos EUA não lançarem uma resposta de parceria ou preço regional em breve, a lacuna pode se endurecer em uma preferência padrão para compradores asiáticos.

[12:06] Fila prática

Das histórias de hoje: ingestão multimodal de contexto longo é a superfície barata para agentes de IA pessoais agora — qualquer pessoa com uma pilha de dispositivos vestíveis diários e um hábito de anotações pode replicar o padrão hoje, então o gargalo é o encanamento de dados, não a qualidade do modelo. Implementação de IA sem ganchos de revisão e validação sênior em torno do modelo regrediu resultados em produção, que é a lição pública que a Ford acabou de reverter, e que qualquer equipe distribuindo fluxos de codificação de agentes sem um humano no loop está atualmente reaprendendo em menor escala. Planos de aquisição de GPU para o resto de 2026 devem tratar a alocação de memória como a restrição vinculante em vez da disponibilidade de chips em si, porque SKUs ricos em HBM consistentemente foram os primeiros a atrasar na alocação. Construtores asiáticos com requisitos de residência de dados ou conformidade agora podem avaliar provedores de modelos não americanos com paridade de capacidade de nível superior crível, e essa variável de compras só se ampliará.

🎙 Never miss an episode — subscribe now

🎙 Subscribe to AgentStack Daily