The Agent Watch
Briefing Articoli Strumenti Chi siamo EN FR DE ES 中文 IT PT SV FI DA

Ultimo briefing

2 luglio 2026 · 5 voci (sito) · 5 voci (base)

Il 2 luglio 2026 convergono tre segnali: il ritorno di Claude Fable 5 dopo una sospensione di tre settimane, l'ufficializzazione del framework agentico open source di Microsoft, e 230 milioni di dollari raccolti da due specialisti dell'audit degli agenti. Lo stack agentico entra nella sua fase di maturità industriale.

🔥 In primo piano

01

Anthropic rimette in servizio nel mondo il suo assistente IA di fascia alta, sospeso tre settimane dopo una falla di sicurezza

Quando usi un assistente IA per scrivere codice, firmare documenti o fare ricerche, dai per scontato che rispetti le regole di sicurezza. A giugno, Amazon ha scoperto una falla in Claude Fable 5 — un modo per aggirare i filtri di sicurezza e fabbricare software malevolo. Il governo americano ha immediatamente tagliato l'accesso mondiale al modello, e l'intera catena di strumenti si è fermata. Il 30 giugno, Anthropic annuncia che Fable 5 è tornato: un nuovo filtro blocca oltre il 99 % dei tentativi di attacco, e le query sensibili vengono automaticamente dirottate verso un modello più blindato. Per compensare il disagio, gli abbonati paganti ricevono metà della loro quota settimanale gratis fino al 7 luglio. In pratica, finisce una parentesi di tre settimane in cui gli utenti professionali hanno dovuto arrangiarsi con modelli sostitutivi — ma il nuovo filtro crea più falsi positivi, quindi ci vorranno alcuni giorni per stabilizzare gli usi in produzione.

02

Microsoft pubblica un kit completo e gratuito per costruire agenti IA propri, compatibile con .NET e Python

Oggi, per assemblare un agente IA capace di cercare file, eseguire comandi e ricordare cosa ha fatto, bisogna impilare mezza dozzina di librerie che non si parlano. Microsoft pubblica Microsoft Agent Framework 1.0 GA: un'unica base open source, disponibile in .NET e Python, che raggruppa tutto — accesso al file system, sandbox per esecuzione di comandi, memoria a lungo termine, approvazione umana per azioni sensibili, e una modalità "piano" prima dell'esecuzione. L'intero stack è disponibile anche come servizio cloud gestito con scale-to-zero — non si paga nulla quando l'agente dorme. È il segnale che Microsoft prende sul serio il mercato agentico rispetto ad Anthropic e LangChain. Per un team che già costruisce agenti, è un'alternativa di diversificazione credibile — non necessariamente migliore, ma con un grande editore alle spalle e un ecosistema cloud integrato.

03

LangChain lancia un agente open source il cui unico compito è mantenere la documentazione di un progetto sincronizzata con il codice

In quasi tutti i team tech, la documentazione va indietro rispetto al codice: uno sviluppatore cambia il codice, dimentica il README, e tre mesi dopo nessuno capisce più l'API. LangChain Labs ha appena pubblicato OpenWiki, un agente open source che fa il lavoro inverso: scansiona il repo, individua cosa è cambiato nel codice, e propone un aggiornamento della documentazione come pull request. Quando il maintainer corregge la proposta, l'agente impara lo stile editoriale del team e lo applica la prossima volta. Per una piccola struttura che non può permettersi un redattore tecnico dedicato, è l'equivalente di un assistente che chiude il ciclo della documentazione — gratis, e senza rompere il flusso Git esistente. Il progetto usa una nuova memoria a lungo termine ("Wiki Memory") che ricorda le preferenze di ciascun progetto.

04

Patronus AI raccoglie 50 milioni di dollari per stress-testare gli agenti IA in mondi digitali simulati prima del deployment

I benchmark tradizionali misurano ciò che un modello sa fare su domande fisse. Non dicono nulla su ciò che succede quando un agente viene messo in un ambiente reale e deve gestire guasti, utenti ostili o istruzioni contraddittorie. Patronus AI, start-up newyorkese fondata da ex dipendenti di Meta, ha chiuso il 29 giugno una Series B da 50 milioni di dollari per diventare la specialista di questa nuova disciplina: la valutazione degli agenti in condizioni reali. La piattaforma costruisce "mondi digitali" — simulatori con utenti finti, API, guasti casuali e iniezioni di prompt — in cui l'agente viene immerso e osservato. Per un'azienda che vuole mettere un agente in produzione su temi sensibili (finanza, salute, diritto), è lo strato di garanzia della qualità che mancava. Per il grande pubblico, è la prova che gli agenti IA non sono più giocattoli: diventano software critici che richiedono test di resistenza come qualsiasi sistema industriale.

05

LeapXpert raccoglie 180 milioni di dollari per diventare la piattaforma di riferimento delle comunicazioni aziendali auditate dall'IA

In una banca o un'agenzia governativa, quando un consulente invia un messaggio WhatsApp a un cliente per discutere di un prestito, nessuno sa esattamente cosa sia stato detto — eppure la legge richiede che la conversazione sia archiviata e verificabile. LeapXpert, piattaforma newyorkese, ha chiuso il 30 giugno un round di crescita da 180 milioni di dollari per risolvere questo problema su larga scala. La sua piattaforma cattura le conversazioni su WhatsApp, iMessage, Signal e WeChat, le interpreta con uno strato di IA, e segnala in tempo reale i rischi di conformità — un po' come un revisore fiscale digitale che legge ogni messaggio e ti avverte se qualcosa supera il limite. Il capitale finanzia l'espansione verso il settore pubblico e le grandi aziende. Per chi pensa all'IA d'impresa, è un segnale: i clienti pagano ormai per la conformità e la tracciabilità tanto quanto per la potenza del modello.

📡 Da tenere d'occhio

Il nuovo quadro di classificazione della gravità dei jailbreak co-costruito da Anthropic, Amazon, Microsoft e Google può diventare uno standard mondiale

Con la rimessa in servizio di Fable 5, Anthropic e altri tre grandi editori hanno pubblicato un quadro comune per classificare la gravità dei jailbreak — le tecniche che aggirano le barriere di sicurezza. Se questo standard viene adottato da altri editori (OpenAI, Meta) e validato dai regolatori americani, diventa il riferimento mondiale per decidere quando un modello deve essere limitato. Da osservare: adesione di OpenAI e Meta, validazione del Dipartimento del Commercio, possibile applicazione ai modelli cinesi open-weight.

Microsoft Agent Framework diventerà l'alternativa di riferimento a Claude Code in Europa?

MAF è open source, supportato da Microsoft, e l'SDK Python funziona con la maggior parte degli stack esistenti. Se i deployment di Azure Foundry decollano in Europa — dove la regolamentazione spinge verso soluzioni cloud locali — MAF diventa un'alternativa credibile alla dipendenza esclusiva da Anthropic. Da osservare: deployment di Azure Foundry presso banche e amministrazioni europee.

Il mercato della valutazione degli agenti si consolida — chi sarà la "Moody's degli agenti IA" entro il 2027?

Patronus AI non è sola: LangSmith, Arize, Langfuse, Helicone, WhyLabs e Fiddler si posizionano anch'essi nel segmento della valutazione e dell'osservabilità degli agenti. Il mercato probabilmente si consoliderà attorno a due o tre leader. Da osservare: acquisizioni di editori, partnership ufficiali con OpenAI e Anthropic, progetti open source (OpenAI Evals, HuggingFace LightEval).

Microsoft, Notion, GitHub o Linear risponderanno a OpenWiki di LangChain?

OpenWiki è un agente il cui unico compito è mantenere la documentazione di un repo sincronizzata con il codice — un servizio che Microsoft, Notion, GitHub e Linear potrebbero integrare nativamente nei loro strumenti esistenti. Se uno di questi attori integra un agente equivalente come funzionalità standard nel proprio prodotto, il vantaggio di LangChain si scioglie. Da osservare: fork della community, integrazioni native in GitHub Copilot, Cursor o Linear.

📊 Tendenza

Il 2 luglio 2026 mostra che lo stack agentico entra nella sua fase di maturità industriale. Tre strati emergono simultaneamente: i modelli fondativi (Fable 5 torna dopo tre settimane di sospensione, segno che la regolamentazione diventa un parametro di produzione a sé stante), gli strumenti di orchestrazione (Microsoft Agent Framework e LangChain OpenWiki si posizionano sul segmento dei framework agentici open source, accanto a LangGraph e Anthropic Agent SDK), e lo strato di valutazione e governance (Patronus AI e LeapXpert raccolgono insieme 230 milioni di dollari sulla QA degli agenti e l'audit delle comunicazioni). Conseguenza per chi costruisce con l'IA: un prodotto agentico serio non può più fare a meno di un quadro di sicurezza verificato, di un livello di valutazione pre-deployment e di uno strato di audit per i settori regolamentati. Il "prototipo serale" diventa software critico che richiede le stesse garanzie di un sistema bancario.