The Agent Watch

Briefing giornaliero

21 giu 2026 · 5 notizie (sito) · 8 notizie (base)

🔥 In primo piano

Google DeepMind pubblica la roadmap di controllo IA — proteggere gli agenti dall'interno

Google DeepMind ha pubblicato la sua roadmap di controllo IA (18 giugno), un framework di difesa in profondità che tratta gli agenti come potenziali minacce interne. Definisce 15 misure concrete, 4 livelli di rilevamento (D1-D4) e 3 livelli di risposta (R1-R3), indicizzati sulle capacità crescenti dei modelli. Già in produzione: 1 milione di traiettorie di agenti di codice analizzate, monitor live per Gemini Spark. Il playbook della cybersecurity applicato agli LLM.

Saviynt colma il gap di autorizzazione degli agenti — IARA (autorizzazione runtime contestuale)

Saviynt ha presentato l'Agent Access Gateway con Intent-Aware Runtime Authorization (IARA), risolvendo la domanda che nessuno faceva: cosa può fare un agente dopo il login? I controlli classici (RBAC, OAuth) verificano l'accesso all'app — non le chiamate agli strumenti. IARA valuta ogni tool call nel contesto: task assegnato, utente rappresentato, risorse pertinenti, comportamento atteso. Quattro fasi di deployment. Zero-trust per gli agenti: mai fidarsi, sempre verificare il contesto.

Source: saviynt.com →

Fondo $10M lanciato per la ricerca sulla sicurezza multi-agente

Google DeepMind, Schmidt Sciences, ARIA, Cooperative AI Foundation e Google.org hanno aperto un bando da 10 milioni di dollari per la sicurezza multi-agente (11 giugno). Domanda centrale: cosa succede quando milioni di agenti di organizzazioni diverse interagiscono autonomamente? Quattro assi: sandbox, scienza delle reti di agenti, infrastruttura (identità, reputazione) e supervisione. Finanziamenti fino a $1M. Scadenza: 8 agosto 2026.

Microsoft Agent Framework al BUILD 2026: Agent Harness, Hosted Agents, CodeAct

Microsoft ha mostrato importanti aggiornamenti al suo SDK agente open-source (MAF) al BUILD 2026. Agent Harness offre pattern pronti per la produzione: shell, memoria su file, tracciamento ToDo, modalità pianifica/esegui, iniezione di skill, fan-out di sotto-agenti paralleli e ToolApprovalAgent con regole persistenti. Hosted Agents girano su Foundry Agent Service con scale-to-zero, sandbox VM per sessione e osservabilità OpenTelemetry. CodeAct combina pianificazione + esecuzione Python in sandbox. MAF 1.0 GA unisce AutoGen + Semantic Kernel.

Esplosione degli strumenti agenti open-source: OpenClaw 377k+ stelle, smolagents, OpenHands

Il roundup open-source di giugno 2026 conferma l'esplosione dell'ecosistema agente. OpenClaw a 377.000+ stelle GitHub (sandboxing Docker), Hermes Agent di Nous Research (compilatore di skill), smolagents di Hugging Face (~1000 righe Python — minimalismo agente), e OpenHands a 70.000+ stelle (workspace di codifica autonomo). Il messaggio: l'infrastruttura agente si sta commoditizzando rapidamente.

📡 Da tenere d'occhio

DeepSeek Code (team Harness): lancio previsto H2 2026 — $7,3 miliardi in cassa

Il team Harness di DeepSeek sta reclutando attivamente a Pechino. Con il round da $7,3 miliardi di CATL (valutazione $49 miliardi), DeepSeek Code è completamente capitalizzato. DeepSeek-TUI ha già 25.000+ stelle GitHub. Con i pesi MIT di V4-Pro e inferenza 10-15× più economica, DeepSeek Code è una minaccia diretta per Claude Code e Cursor.

GPT-5.5 (Spud): finestra di lancio si restringe — competizione agentica si intensifica

Sam Altman ha confermato la fine del pre-addestramento a fine marzo 2026. Con Fable 5 all'88% su FrontierMath tier 4 (vs. 75% per GPT-5), DeepSeek V4-Pro con pesi MIT e il dibattito sul controllo agenti che si surriscalda, il timing di Spud diventa critico. Il mercato attende di vedere se può riconquistare la leadership agentica.

Autorizzazione agenti: la prossima frontiera della sicurezza — dall'identità all'intento

IARA di Saviynt e la roadmap di DeepMind convergono sulla stessa intuizione: la sicurezza agentica non riguarda il login ma la verifica dell'intento a runtime. Il livello di autorizzazione si sta formando come categoria autonoma più velocemente del previsto. Standard per identità, autorizzazione runtime e audit trail sono attesi per H2 2026.

Governance multi-agente: fondo $10M apre — inizia la corsa al quadro di supervisione

Il fondo da $10M guidato da DeepMind segna l'inizio formale della ricerca sulla governance multi-agente. Quando gli agenti commerciano autonomamente (Coinbase for Agents), eseguono codice (CodeAct) e operano tra organizzazioni, chi supervisiona l'ecosistema? I quattro assi del fondo mappano esattamente lo stack che governerà l'economia agentica.

📊 Tendenza

Il livello di sicurezza e controllo degli agenti emerge come la questione critica dell'estate 2026. Il 21 giugno cristallizza quattro segnali convergenti: controllo (la roadmap di DeepMind tratta gli agenti come minacce interne — 15 misure, 4 livelli di rilevamento, 1M traiettorie), autorizzazione (IARA di Saviynt risolve il problema post-login — verifica runtime contestuale), scala (fondo $10M per sicurezza multi-agente — cosa succede con milioni di agenti?), e infrastruttura (Microsoft MAF 1.0 GA). La conversazione sull'allineamento si sposta da 'il modello sarà gentile?' a 'come monitoriamo, autorizziamo e conteniamo milioni di agenti autonomi in produzione?'