The Agent Watch

Briefing diário

21 jun 2026 · 5 itens (site) · 8 itens (base)

🔥 Destaques

Google DeepMind publica roteiro de controlo de IA — protegendo agentes por dentro

A Google DeepMind publicou o seu roteiro de controlo de IA (18 de junho), um quadro de defesa em profundidade que trata os agentes como potenciais ameaças internas. Define 15 medidas concretas, 4 níveis de deteção (D1-D4) e 3 níveis de resposta (R1-R3), indexados às capacidades crescentes dos modelos. Já em produção: 1 milhão de trajetórias de agentes de código analisadas, monitor ao vivo protege o Gemini Spark. O manual de cibersegurança aplicado aos LLM.

Saviynt fecha a lacuna de autorização de agentes — IARA (autorização runtime contextual)

A Saviynt apresentou o Agent Access Gateway com Intent-Aware Runtime Authorization (IARA), resolvendo a questão que ninguém fazia: o que pode um agente fazer depois de iniciar sessão? Os controlos clássicos (RBAC, OAuth) verificam o acesso à app — não as chamadas de ferramentas. O IARA avalia cada tool call em contexto: tarefa atribuída, utilizador representado, recursos relevantes, comportamento esperado. Quatro fases de implementação. Zero-trust para agentes: nunca confiar, sempre verificar o contexto.

Source: saviynt.com →

Fundo de $10M lançado para investigação em segurança multi-agente

A Google DeepMind, Schmidt Sciences, ARIA, Cooperative AI Foundation e Google.org abriram um concurso de $10 milhões para segurança multi-agente (11 de junho). Questão central: o que acontece quando milhões de agentes de diferentes organizações interagem autonomamente? Quatro eixos: sandboxes, ciência de redes de agentes, infraestrutura (identidade, reputação) e supervisão. Subsídios até $1M. Prazo: 8 de agosto de 2026.

Microsoft Agent Framework no BUILD 2026: Agent Harness, Hosted Agents, CodeAct

A Microsoft mostrou grandes atualizações do seu SDK agente open-source (MAF) no BUILD 2026. Agent Harness oferece padrões prontos para produção: shell, memória em ficheiros, rastreamento ToDo, modos plano/execução, injeção de skills, fan-out de sub-agentes paralelos e ToolApprovalAgent com regras persistentes. Hosted Agents executam no Foundry Agent Service com scale-to-zero, sandbox VM por sessão e observabilidade OpenTelemetry. CodeAct combina planeamento + execução Python em sandbox. MAF 1.0 GA une AutoGen + Semantic Kernel.

Explosão de ferramentas agentes open-source: OpenClaw 377k+ estrelas, smolagents, OpenHands

O resumo open-source de junho 2026 confirma a explosão do ecossistema agente. OpenClaw com 377.000+ estrelas GitHub (sandboxing Docker), Hermes Agent da Nous Research (compilador de skills), smolagents da Hugging Face (~1000 linhas Python — minimalismo agente), e OpenHands com 70.000+ estrelas (workspace de codificação autónomo). A mensagem: a infraestrutura agente está a comoditizar-se rapidamente.

📡 A vigiar

DeepSeek Code (equipa Harness): lançamento previsto H2 2026 — $7,3 mil milhões em caixa

A equipa Harness da DeepSeek está a recrutar ativamente em Pequim. Com a ronda de $7,3 mil milhões da CATL (avaliação $49 mil milhões), o DeepSeek Code está totalmente capitalizado. DeepSeek-TUI já tem 25.000+ estrelas GitHub. Com pesos MIT do V4-Pro e inferência 10-15× mais barata, é uma ameaça direta ao Claude Code e Cursor.

GPT-5.5 (Spud): janela de lançamento estreita-se — competição agêntica intensifica-se

Sam Altman confirmou o fim do pré-treino no final de março de 2026. Com o Fable 5 a 88% no FrontierMath tier 4 (vs. 75% para o GPT-5), DeepSeek V4-Pro com pesos MIT e o debate sobre controlo de agentes a aquecer, o timing do Spud torna-se crítico. O mercado aguarda para ver se consegue reconquistar a liderança agêntica.

Autorização de agentes: a próxima fronteira de segurança — da identidade à intenção

O IARA da Saviynt e o roteiro da DeepMind convergem na mesma perceção: a segurança agêntica não é sobre login mas sobre verificação de intenção em runtime. A camada de autorização está a formar-se como categoria autónoma mais rápido do que o esperado. Padrões para identidade, autorização runtime e trilhos de auditoria são esperados para H2 2026.

Governação multi-agente: fundo $10M abre — começa a corrida ao quadro de supervisão

O fundo de $10M liderado pela DeepMind marca o início formal da investigação em governação multi-agente. Quando os agentes negociam autonomamente (Coinbase for Agents), executam código (CodeAct) e operam entre organizações, quem supervisiona o ecossistema? Os quatro eixos do fundo mapeiam exatamente a stack que governará a economia agêntica.

📊 Tendência

A camada de segurança e controlo de agentes emerge como a questão crítica do verão 2026. O 21 de junho cristaliza quatro sinais convergentes: controlo (o roteiro da DeepMind trata agentes como ameaças internas — 15 medidas, 4 níveis de deteção, 1M trajetórias), autorização (IARA da Saviynt resolve o problema pós-login — verificação runtime contextual), escala (fundo $10M para segurança multi-agente — o que acontece com milhões de agentes?), e infraestrutura (Microsoft MAF 1.0 GA). A conversa sobre alinhamento muda de 'o modelo será amigável?' para 'como monitorizamos, autorizamos e contemos milhões de agentes autónomos em produção?'