The Agent Watch

Briefing

14. kesäkuuta 2026 · 8 uutista · 3 lähdettä

🔥 Otsikot

Claude Fable 5 tekee uuden koodausvertailuennätyksen

Anthropic julkaisi Claude Fable 5:n saavuttaen 95 % SWE-benchissä — murskaten aiemman ennätyksen (Opus 4.8 88 %). 1M tokenin konteksti, 128K tuloste, Senior Engineer -pisteet 91/100. Hinta: $10/$50 per miljoona tokenia. Samanaikaisesti julkaistiin Claude Mythos 5 tieteelliseen päättelyyn.

ChatGPT saa pysyvän muistin — "Dreaming"-arkkitehtuuri

OpenAI otti käyttöön uuden muistijärjestelmän nimeltä "Dreaming" (4. kesäkuuta), joka syntetisoi kontekstia keskusteluistuntojen välillä. Muistista tulee tuoteinfrastruktuuria, ei asetusta. Vanhentunut tai ristiriitainen konteksti vähenee.

Lähde: kingy.ai →

Avoimen lähdekoodin LLM-sijoitukset: Kimi K2.6 ykkösenä, DeepSeek V4 Pro hallitsee agenttitehtäviä

Toukokuun 2026 sijoitukset: Kimi K2.6 ja MiMo-V2.5-Pro tasoissa AA-indeksillä 54 — vain 3 pistettä suljetun lähdekoodin johtajia jäljessä. DeepSeek V4 Pro on ykkönen agenttityössä (GDPval-AA Elo 1554, SWE-Bench 80,6 %). 9 suurta mallia julkaistu 6 viikossa.

📡 Seurattavaa

GitHub Copilotista tulee alusta

Microsoft julkaisi tiiviin aallon Copilotin ympärillä: sovellus (laajennettu esikatselu), CLI-päivitys, SDK GA, cloud/paikalliset hiekkalaatikot. AI-koodaus siirtyy automaattisesta täydennyksestä hallittuihin työistuntoihin. Suora kilpailu Claude Coden ja Codexin kanssa.

Nex N2-Pro — uusi haastaja stealth-tilasta

Epästandardi transformer-arkkitehtuuri, joka tähtää agenttityönkulkuihin. Liian aikaista tuotantoon, mutta lisää kilpailupainetta eturintamassa.

Cohere North Mini Code — pieni, ilmainen, avoimen lähdekoodin koodari

30B yhteensä / 3B aktiivista (MoE), Apache 2.0 -lisenssi, 256K konteksti. Toimii vaatimattomalla laitteistolla. Paras vaihtoehto itseisännöidylle kevyelle koodaus-AI:lle.

Holo3.1 — paikalliset tietokoneenkäyttöagentit

H Company julkaisi variantteja 0,8B:stä 35B:hen Hugging Facessa. Näytönohjausagentteja, jotka toimivat paikallisesti — etu yksityisyydessä ja viiveessä.

Apple Core AI — laitekohtainen pino

Inferenssi tapahtuu paikallisesti Apple Siliconilla, Swift-natiivit API:t. Yksityisyys ensin terveys-/taloussovelluksille. Vain Apple-ekosysteemi.

📊 Trendi

Ero avoimen lähdekoodin ja suljetun lähdekoodin välillä ei ole koskaan ollut pienempi: 3 indeksipistettä. Julkaisutahti kiihtyy (9 suurta mallia 6 viikossa). Taistelu siirtyy "parhaasta mallista" "parhaaseen agenttiekosysteemiin".