
AgentStack Daily EP050 — O que há de novo nos lançamentos de agentes
Este episódio do AgentStack Daily cobre as novidades em ferramentas de LLM e agentes: Hermes Agent v2026.5.7 adiciona boards duráveis, verificações de saúde de workers, poda de checkpoints, retomada de gateway, cron sem agente, plugins de provider, allowlists de plataforma e correções de MCP; Claude Code v2.1.141 até v2.1.129 adiciona a visualização do agente, atualizações de hook JSON, controles de plugin e workload-identity, reparos de MCP e correções de permissão de agente em segundo plano; e o Google ADK documenta agentes de pausa e retomada com estado persistido, enquanto o GitHub expõe. Show notes: https://tobyonfitnesstech.com/pt/podcasts/episode-50/
🎧 Listen to EpisodeAgentStack Daily EP050 abre com o stack atual de ferramentas de agente em linguagem simples, depois passa para o destaque de lançamentos da semana: Hermes Agent v2026.5.7 e Claude Code v2.1.141 até v2.1.129. OpenClaw é a baseline de runtime no episódio, enquanto Hermes e Claude Code carregam os destaques de lançamentos mais recentes. O objetivo é direto: o que mudou, o que foi adicionado, por que importa, e o que testar após atualizar.
[00:00] Abertura — Novidades no stack de agentes
NOVA e ALLOY apresentam as atualizações de ferramentas de agente e LLM da semana. As mudanças principais são durabilidade do quadro Hermes, visibilidade de workers, poda de checkpoints, retomada de gateway, cron determinístico, plugins de provider, política de plataforma, correções de transporte MCP, visibilidade de agente Claude Code, saída de hooks mais rica, controles de plugin, escopo de identidade de workload, reparos MCP e correções de permissão de agente em segundo plano. OpenClaw continua sendo o runtime de operador na história, enquanto Hermes e Claude Code carregam os destaques de lançamentos mais recentes hoje.
[02:30] Leitura de lançamento — Hermes Agent v2026.5.7
Antes dos detalhes do lançamento, o episódio define as principais ferramentas em linguagem prática. OpenClaw é a camada de operador/runtime/canal/ferramenta/navegador/mídia/prova. Hermes é o quadro multiagente para delegação, durabilidade, estado de tarefa e saúde do worker. Claude Code é o agente de codificação local no terminal com hooks, MCP, configurações de projeto e agentes em segundo plano. Codex é a faixa focada em codificação, patch e revisão de repositório. Google ADK é um framework de aplicativo para agentes de longa execução que precisam de estado persistido e comportamento de pausa/retomada. Tarefas de agente do GitHub Copilot são tarefas de codificação assíncronas hospedadas no GitHub expostas através de superfícies de API, branch, status e pull request.
Hermes v2026.5.7 é o bloco principal de lançamento. As adições concretas incluem melhorias no Kanban multiagente, heartbeats de worker, recuperação de tarefas obsoletas, detecção de zumbi no Darwin, /goal, Checkpoints v2, poda de checkpoints, guardrails de disco, retomada automática de gateway, comportamento de reload de fonte, modo cron no_agent, plugins de provider, reparos de OAuth/SSE/MCP, rejeição de estranhos no WhatsApp, allowlists de plataforma, política de função Discord com escopo de guild e padrões de redação mais seguros. Treat each item as a product delta. Kanban mais propriedade significa que o quadro pode mostrar quem tem uma tarefa em vez de burying status inside a transcript. Heartbeats e recuperação de obsoletos mean a vanished worker becomes a detectable condition. Darwin zombie detection closes a local reliability gap on macOS. /goal gives a run a named target. Checkpoint pruning and disk guardrails reduzem a desordem de persistência. Gateway auto-resume makes restarts less destructive. no_agent cron lets deterministic checks run without a model. Provider plugins make integration less hard-coded. MCP fixes around OAuth, SSE, keepalives, stale pipes, image results, and reconnects make tool calls less brittle. Platform allowlists, WhatsApp stranger rejection, Discord role scope, and redaction defaults tighten who can trigger work and what data leaks. The practical takeaway is a release test list: board state, worker health, resume, cron, plugin loading, MCP transport, and channel policy. Also mention the migration shape. After upgrading, the useful questions are concrete: does a running board show live ownership, does a dead worker get reclaimed, does a checkpoint resume with the latest task state, does pruning keep disk use bounded, does a gateway restart preserve user-visible work, does a script-only cron produce the expected notification, do provider plugins load cleanly, do MCP tools reconnect after auth refresh or transport interruption, and do channel allowlists block the wrong sender. That keeps the segment focused on new features and verification.
[19:00] Leitura de lançamento — Claude Code v2.1.141 até v2.1.129
As versões recentes do Claude Code adicionam gerenciamento de agente visível e superfícies de extensão mais limpas. O maior item para o ouvinte é claude agents, mais filtragem de projeto através de claude agents --cwd. Hooks ganham campos de saída JSON como terminalSequence, args direto e melhor comportamento de continuação em torno de uso de ferramenta bloqueada. Controles de fonte de plugin, clonagem de fonte HTTPS, migração de configuração gerenciada, CLAUDE_PROJECT_DIR, ANTHROPIC_WORKSPACE_ID, escopo de identidade de workload, preservação de servidor MCP após clear, melhorias.concurrent OAuth refresh, and background-agent permission inheritance all point to a tool that is becoming easier to operate in real projects. The practical test list is simple: can you see running and blocked agents, do hooks still enforce policy, do MCP servers survive expected lifecycle events, do plugin controls behave as configured, and do background agents inherit the intended permission mode?
[29:00] Atualização do Google ADK — estado persistido para agentes de pausa e retomada
O item do Google ADK é uma atualização de recurso sobre estado. O tutorial mostra um agente de longa execução usando current_step, ToolContext.state, um serviço de sessão, SQLite para desenvolvimento local, Cloud SQL para deployments mais duráveis e wakeups externos como webhooks. A importância é que um agente pode pausar para aprovação, pagamento, input do cliente ou outro sinal externo e retomar de estado explícito em vez de depender de uma transcrição enorme reproduzida. O episódio deve cobrir o mecanismo: ferramentas escrevem estado, instruções podem interpolar estado, um serviço de sessão apoiado por banco de dados mantém os campos importantes e o app pode testar se a próxima ação é segura.
[39:00] Tarefas de agente do GitHub Copilot — trabalho de codificação ganha superfície de API
A visualização pública da API REST de tarefas de agente do Copilot do GitHub transforma tarefas de codificação em nuvem em objetos endereçáveis. Os docs mostram criação de tarefa, escolha de modelo, contexto de repositório, saída de branch ou pull request, inspeção de status de tarefa e um ciclo de vida que pode ser controlado por revisão normal de repositório. A mudança importante não é que o Copilot pode escrever código; é que o trabalho de codificação do Copilot pode ser iniciado, rastreado e revisado através de uma API de plataforma. Mencione as restrições: versionamento de API, autenticação e escopo de token, política de empresa ou repositório, estados de status, artefatos de branch, verificações CI e revisão humana antes do merge.
[47:00] Encerramento — o que testar a seguir
O resumo é uma lista de verificação de teste concisa. Para Hermes, teste saúde de worker, recuperação de obsoletos, checkpoints, retomada de gateway, modo cron, allowlists de plataforma, redação e reconexões MCP. Para Claude Code, teste claude agents, --cwd, hooks, política de plugin, identidade de workload, ciclo de vida MCP e permissões de agente em segundo plano. Para ADK, teste estado persistido após um delay. Para tarefas Copilot, teste criação de tarefa, polling de status, criação de pull request e gating de CI/revisão. Estas são as superfícies novas que valem a pena verificar esta semana.