Briefing

14 juni 2026 · 8 nyheter · 3 källor

🔥 Rubriker

Claude Fable 5 sätter nytt rekord i kodningsbenchmark

Anthropic släppte Claude Fable 5 och nådde 95% på SWE-bench — krossade det tidigare rekordet (Opus 4.8 på 88%). 1M token kontext, 128K utdata, Senior Engineer-poäng 91/100. Pris: $10/$50 per miljon tokens. Samtidigt släpptes Claude Mythos 5 för vetenskapligt resonemang.

Källa: aimadetools.com →

ChatGPT får beständigt minne — "Dreaming"-arkitektur

OpenAI implementerade ett nytt minnessystem kallat "Dreaming" (4 juni) som syntetiserar kontext över chattsessioner. Minnet blir produktinfrastruktur, inte en inställning. Föråldrad eller motsägelsefull kontext reduceras.

Källa: kingy.ai →

Open-source LLM-rankningar: Kimi K2.6 toppar, DeepSeek V4 Pro dominerar agentuppgifter

Rankningar maj 2026: Kimi K2.6 och MiMo-V2.5-Pro oavgjort med AA-index 54 — endast 3 poäng under closed-source-ledarna. DeepSeek V4 Pro är nr 1 för agentarbete (GDPval-AA Elo 1554, SWE-Bench 80,6%). 9 stora modeller släppta på 6 veckor.

Källa: codersera.com →

📡 Att bevaka

GitHub Copilot blir en plattform

Microsoft levererade en tät våg kring Copilot: app (utökad förhandsvisning), CLI-uppdatering, SDK GA, cloud/lokala sandlådor. AI-kodning går från autokomplettering till hanterade arbetssessioner. Direkt konkurrens med Claude Code och Codex.

Nex N2-Pro — ny utmanare från stealth

Icke-standardiserad transformerarkitektur inriktad på agentarbetsflöden. För tidigt för produktion, men ökar konkurrenstrycket vid frontlinjen.

Cohere North Mini Code — liten, gratis, open-source-kodare

30B totalt / 3B aktiva (MoE), Apache 2.0-licens, 256K kontext. Körs på blygsam hårdvara. Bästa alternativet för självhostad lättviktskodnings-AI.

Holo3.1 — lokala datorstyrningsagenter

H Company publicerade varianter från 0,8B till 35B på Hugging Face. Skärmstyrningsagenter som körs lokalt — fördel i integritet och latens.

Apple Core AI — enhetsbaserad stack

Inferens körs lokalt på Apple Silicon, Swift-native API:er. Integritet först för hälso-/finansappar. Endast Apple-ekosystem.

📊 Trend

Klyftan mellan open-source och closed-source har aldrig varit mindre: 3 indexpoäng. Utgivningstakten accelererar (9 stora modeller på 6 veckor). Kampen skiftar från "bästa modell" till "bästa agentekosystem".