Briefing
14 giugno 2026 · 8 notizie · 3 fonti
🔥 In primo piano
Claude Fable 5 stabilisce un nuovo record di benchmark di programmazione
Anthropic ha rilasciato Claude Fable 5, raggiungendo il 95% su SWE-bench — polverizzando il record precedente (Opus 4.8 all'88%). Contesto 1M token, output 128K, punteggio Senior Engineer 91/100. Prezzo: $10/$50 per milione di token. Rilascio simultaneo di Claude Mythos 5 per il ragionamento scientifico.
ChatGPT ottiene memoria persistente — architettura "Dreaming"
OpenAI ha implementato un nuovo sistema di memoria chiamato "Dreaming" (4 giugno) che sintetizza il contesto tra le sessioni di chat. La memoria diventa infrastruttura di prodotto, non un'impostazione. Il contesto obsoleto o contraddittorio viene ridotto.
Classifiche LLM open-source: Kimi K2.6 al primo posto, DeepSeek V4 Pro domina i compiti agentici
Classifiche di maggio 2026: Kimi K2.6 e MiMo-V2.5-Pro a pari merito con AA Index 54 — solo 3 punti sotto i leader closed-source. DeepSeek V4 Pro è n.1 per il lavoro agentico (GDPval-AA Elo 1554, SWE-Bench 80,6%). 9 modelli principali rilasciati in 6 settimane.
📡 Da tenere d'occhio
GitHub Copilot diventa una piattaforma
Microsoft ha rilasciato un'ondata densa intorno a Copilot: app (anteprima estesa), rinnovo CLI, SDK GA, sandbox cloud/locali. La codifica IA passa dall'autocompletamento a sessioni di lavoro gestite. Concorrenza diretta con Claude Code e Codex.
Nex N2-Pro — nuovo sfidante dallo stealth
Architettura transformer non standard mirata ai flussi di lavoro agentici. Troppo presto per la produzione, ma aggiunge pressione competitiva alla frontiera.
Cohere North Mini Code — codificatore open-source piccolo, gratuito
30B totali / 3B attivi (MoE), licenza Apache 2.0, contesto 256K. Funziona su hardware modesto. Migliore opzione per IA di codifica leggera self-hosted.
Holo3.1 — agenti locali per il controllo del computer
H Company ha pubblicato varianti da 0,8B a 35B su Hugging Face. Agenti di controllo dello schermo che girano localmente — vantaggio in privacy e latenza.
Apple Core AI — stack on-device
L'inferenza gira localmente su Apple Silicon, API native Swift. Privacy-first per app sanitarie/finanziarie. Solo ecosistema Apple.
📊 Tendenza
Il divario tra open-source e closed-source non è mai stato così ridotto: 3 punti indice. Il ritmo di rilascio sta accelerando (9 modelli principali in 6 settimane). La battaglia si sta spostando dal "miglior modello" al "miglior ecosistema di agenti".