Briefing
14 juni 2026 · 8 nyheter · 3 källor
🔥 Rubriker
Claude Fable 5 sätter nytt rekord i kodningsbenchmark
Anthropic släppte Claude Fable 5 och nådde 95% på SWE-bench — krossade det tidigare rekordet (Opus 4.8 på 88%). 1M token kontext, 128K utdata, Senior Engineer-poäng 91/100. Pris: $10/$50 per miljon tokens. Samtidigt släpptes Claude Mythos 5 för vetenskapligt resonemang.
ChatGPT får beständigt minne — "Dreaming"-arkitektur
OpenAI implementerade ett nytt minnessystem kallat "Dreaming" (4 juni) som syntetiserar kontext över chattsessioner. Minnet blir produktinfrastruktur, inte en inställning. Föråldrad eller motsägelsefull kontext reduceras.
Open-source LLM-rankningar: Kimi K2.6 toppar, DeepSeek V4 Pro dominerar agentuppgifter
Rankningar maj 2026: Kimi K2.6 och MiMo-V2.5-Pro oavgjort med AA-index 54 — endast 3 poäng under closed-source-ledarna. DeepSeek V4 Pro är nr 1 för agentarbete (GDPval-AA Elo 1554, SWE-Bench 80,6%). 9 stora modeller släppta på 6 veckor.
📡 Att bevaka
GitHub Copilot blir en plattform
Microsoft levererade en tät våg kring Copilot: app (utökad förhandsvisning), CLI-uppdatering, SDK GA, cloud/lokala sandlådor. AI-kodning går från autokomplettering till hanterade arbetssessioner. Direkt konkurrens med Claude Code och Codex.
Nex N2-Pro — ny utmanare från stealth
Icke-standardiserad transformerarkitektur inriktad på agentarbetsflöden. För tidigt för produktion, men ökar konkurrenstrycket vid frontlinjen.
Cohere North Mini Code — liten, gratis, open-source-kodare
30B totalt / 3B aktiva (MoE), Apache 2.0-licens, 256K kontext. Körs på blygsam hårdvara. Bästa alternativet för självhostad lättviktskodnings-AI.
Holo3.1 — lokala datorstyrningsagenter
H Company publicerade varianter från 0,8B till 35B på Hugging Face. Skärmstyrningsagenter som körs lokalt — fördel i integritet och latens.
Apple Core AI — enhetsbaserad stack
Inferens körs lokalt på Apple Silicon, Swift-native API:er. Integritet först för hälso-/finansappar. Endast Apple-ekosystem.
📊 Trend
Klyftan mellan open-source och closed-source har aldrig varit mindre: 3 indexpoäng. Utgivningstakten accelererar (9 stora modeller på 6 veckor). Kampen skiftar från "bästa modell" till "bästa agentekosystem".