The Agent Watch
Briefing Articoli Strumenti Chi siamo EN FR DE ES 中文 IT PT SV FI DA

Briefing quotidiano

27 giugno 2026 · 5 notizie (sito) · 6 notizie (base)

🔥 In primo piano

01

Sail Research rende gli agenti di lunga durata dieci volte più economici da gestire

Immagina un agente che concatena centinaia di piccole attività per tre giorni per risolvere un problema. Oggi, far funzionare questo tipo di agente costa una fortuna: i server non sono progettati per questo lavoro. Sail Research ha raccolto 80 milioni di dollari (guidati da Sequoia e Kleiner Perkins) per affrontare esattamente questo problema. La loro promessa: un costo fino a dieci volte inferiore rispetto alle soluzioni standard per agenti che funzionano a lungo. In un test di riferimento difficile (ricerca web complessa su più giorni), Sail ha stabilito un nuovo record — 90,72% di risposte corrette — a un decimo del prezzo abituale. Per una piccola impresa che vuole mettere in produzione un agente che pensa davvero invece di rispondere in due secondi, questo è il segnale che la bolletta sta per diventare ragionevole. Come se Uber Pool avesse reso accessibile il taxi a lunga distanza: stesso tragitto, prezzo molto diverso.

02

Vercel rilascia un framework gratuito dove ogni agente è solo una cartella di file

Costruire oggi un agente IA è come impilare Lego al buio: un po' di codice, una libreria, un server, e nessuno sa dove sia finito l'agente una volta distribuito. Vercel (l'azienda dietro Next.js) ha presentato il 17 giugno un nuovo strumento gratuito, eve, che ribalta la logica. Qui un agente è solo una cartella: un file di istruzioni in testo semplice, piccoli strumenti, schede di competenze riutilizzabili — tutto leggibile e modificabile come qualsiasi file di codice. Tutto è incluso: uno spazio sicuro dove l'agente viene eseguito, un'agenda per svegliarlo in tempo e connessioni a Slack, Discord o GitHub per chattare. Un agente completo si crea in un minuto con un solo comando. È un po' come se WordPress avesse sostituito l'HTML artigianale per bloggare: ora si costruisce un agente in una cartella, non sparpagliato in 500 file.

03

Claude impara a svegliarsi da solo all'ora stabilita e a tenere le password fuori dalla vista

Fino ad ora, per far fare a un agente IA un lavoro ogni mattina alle 7, bisognava costruire un server-sveglia — cosa che pochissimi fuori dall'informatica sanno fare. Anthropic ha aggiunto il 9 giugno due funzioni molto richieste sulla sua piattaforma Claude. Prima: l'agente può essere programmato per partire da solo, a un'ora fissa, ogni giorno o ogni settimana — senza intervento umano. Seconda, ancora più importante: le password e le chiavi API (quei codici segreti che aprono i vostri account) sono ora conservate in una cassaforte separata. L'agente le usa all'ultimo momento, senza mai vederle visualizzate, e senza che compaiano nella cronologia della conversazione. In pratica, un agente può ora inviare ogni lunedì un rapporto finanziario, o fare ogni notte un backup, usando le vostre vere credenziali — senza rischio che finiscano in giro.

04

Scaled Cognition raccoglie 100 M$ per creare agenti che non inventano mai risposte in banca o sanità

Quando chiamate la vostra banca per contestare un bonifico, non volete sentire un agente che improvvisa. Eppure i modelli IA generalisti sbagliano circa una volta su tre in produzione — inaccettabile per banche, sanità o assicurazioni. Scaled Cognition ha raccolto 100 milioni di dollari il 25 giugno per costruire, da zero, un modello che si impegna a non produrre mai una risposta sbagliata. Invece di aggiungere un filtro di sicurezza a un modello esistente, l'azienda ha riscritto l'IA da zero per l'affidabilità. Risultato: un modello deliberatamente più piccolo e meno costoso, ma che rifiuta di rispondere quando non è sicuro — invece di inventare. La scommessa: sostituire nelle grandi aziende i call center esternalizzati (un mercato da 600 miliardi di dollari) con una forza lavoro IA che l'azienda possiede e gestisce da sé.

05

Patronus AI costruisce mondi virtuali dove gli agenti si allenano prima di toccare quello vero

Prima di mandare un'auto a guida autonoma su strada, la si fa prima allenare su milioni di chilometri simulati — pioggia, notte, pedone che sbuca. Patronus AI fa lo stesso per gli agenti IA. La startup ha raccolto 50 milioni di dollari il 25 giugno e lancia «Digital World Models»: repliche virtuali di siti web reali e software aziendali, dove gli agenti si allenano prima di agire per davvero. L'agente è premiato quando fa bene il suo lavoro, penalizzato quando bara — per esempio spuntando qualcosa a caso per finire in fretta un modulo. L'azienda ha moltiplicato per 15 il fatturato in un anno; quasi tutti i grandi laboratori IA sono oggi suoi clienti. Per un team che mette in produzione un agente, è la promessa di poterlo testare in piena scala — senza mettere a rischio i dati reali dei clienti reali.

📡 Da tenere d'occhio

Runlayer raccoglie 30 M$ per diventare il «pannello di controllo» degli agenti nelle grandi aziende

Quando qualsiasi dipendente può creare un agente che tocca Salesforce, codice di produzione o dati HR, serve qualcuno che dica sì o no, che sappia quanto costa e che tenga traccia di tutto. Runlayer ha raccolto 30 milioni di dollari il 24 giugno per diventare esattamente quel punto di controllo: un unico punto per mettere in sicurezza gli agenti, osservare cosa fanno e smascherare quelli che i dipendenti hanno distribuito di nascosto. Tra i clienti: Instacart, Gusto, Decagon, Lemonade. La governance degli agenti sta diventando un mercato a sé.

Governance degli agenti: lo strato che mancava si sta costruendo a tutta velocità

In quattro giorni, tre annunci sullo stesso tema: Vercel Passport (17 giugno), F5 che compra SurePath AI (24 giugno), Runlayer che raccoglie 30 M$ (24 giugno). Il segnale è chiaro: senza uno strato di identità, permessi e audit, gli agenti in produzione sono ingestibili. È la stessa svolta della cybersecurity negli anni 2010 — all'inizio vista come tema da informatici, poi funzione critica in ogni azienda.

Affidabilità «costruita dal primo giorno» contro affidabilità «aggiunta dopo»

Scaled Cognition scommette in modo radicale: non si può aggiungere l'affidabilità come un filtro sopra un modello generalista. Il loro modello è riscritto da zero per impegnarsi a non sbagliare sui workflow che copre. Se questo approccio mantiene le promesse in banca e sanità, potrebbe rimescolare le carte del mercato — oggi dominato da pochi modelli generalisti che brillano soprattutto nelle demo.

Il costo degli agenti sta diventando il nuovo campo di battaglia

Far lavorare un agente per una settimana costa oggi da 100 a 1000 volte di più di una chat normale. Sail Research affronta il problema di petto. Insieme a Baseten (che ha raccolto 1,5 mld la settimana scorsa) e Modal, l'infrastruttura per agenti sta diventando una categoria di investimento a sé. Una consolidazione tra runtime di inferenza, sandbox sicuri e piattaforme agenti è probabile nei prossimi dodici mesi.

📊 Tendenza

Il 27 giugno 2026 è il giorno in cui l'intera pila degli agenti IA si costruisce contemporaneamente. Tre pezzi mancanti sono apparsi questa settimana. (1) Costo: Sail Research dimostra che si può far girare un agente per giorni a un decimo del prezzo abituale. (2) Cassetta degli attrezzi: Vercel rende la costruzione di agenti semplice come fare un sito web, puntando su agenti che si presentano come semplici cartelle di file. (3) Fiducia: Scaled Cognition, Patronus AI e Runlayer affrontano ciascuno un pezzo dell'affidabilità — il modello che non sbaglia, l'addestramento che becca i furbi, il pannello di controllo che sorveglia tutto. Quando tutta la catena appare insieme, l'economia degli agenti diventa un vero settore — non più un esperimento da laboratorio.