The Agent Watch

Päivittäinen briefing

16.6.2026 · 6 uutista (sivusto) · 9 uutista (kanta)

🔥 Otsikot

Claude-hallitut agentit itseisännöidyssä hiekkalaatikossa

Anthropic sallii nyt hallittujen agenttien suorittaa työkaluja asiakkaan hallitsemassa kontissa, palomuurin takana. Vain lähtevät yhteydet. Yksityiset MCP-palvelimet tuetaan. Puuttuva palanen säännellyille aloille: terveydenhuolto, rahoitus, laki.

Claude Agent SDK — erillinen kuukausiluotto 15.6. alkaen

Agent SDK ja ei-vuorovaikutteinen claude -p kuluttavat nyt erillistä kuukausiluottoa: $20 (Pro), $100 (Max 5x), $200 (Max 20x). Käyttämätön luotto ei siirry. Rakenteellinen muutos Claudea käyttäville tiimeille.

Agenttikehyssota — tilanne kesäkuu 2026

Microsoft Agent Framework 1.0 GA (yhdistetty AutoGen + Semantic Kernel). CrewAI: 52,4k tähteä, 2 miljardia agenttisuoritusta 12 kuukaudessa. Google ADK 4 kielellä. MCP ylittää 200 palvelinta. ACP sulautuu A2A:han Linux Foundationin alla.

EVA-Bench Data 2.0 — ensimmäinen kattava agenttibenchmark

ServiceNow-AI julkaisee laajennetun benchmarkin AI-agenttien arviointiin: 3 aluetta, 121 työkalua, 213 skenaariota. Mittaa työkaluvalintaa, monivaiheista päättelyä, virheistä palautumista ja resurssitehokkuutta.

Source: dev.to →

Holo3.1 — täysin paikallinen tietokoneenkäyttöagentti, avoimet painot

H Company julkaisee agentin, joka ohjaa GUI:ta kokonaan kuluttajalaitteistolla — pilveä ei tarvita. Näppäimistö/hiiri-automaatio, näyttövuorovaikutus. Avoimet painot, variantit 0,8B–35B Hugging Facessa.

Source: dev.to →

IBM Research: agenttilogiikka merkitsee enemmän kuin raaka LLM-teho

IBM väittää, että tuotantomenestys riippuu vahvasta agenttilogiikasta, ei vain mallista. Neljä pilaria: monivaiheinen päättely varasuunnitelmalla, luotettava järjestelmävuorovaikutus, pitkän aikavälin tilanhallinta, elegantti virheenkäsittely.

Source: dev.to →

Gemma 4 12B — täysin paikallinen koodausagenttipino läpäisee testin

DevArt testasi Gemma 4 12B:tä Ollama + OpenCode -yhdistelmällä oikeissa tehtävissä: landing page, bugikorjaukset, UI-generointi, minipeli — kaikki paikallisesti, nolla API-avainta. Tekijä myöntää olleensa väärässä: tämä paikallinen pino todella toimii. Uskottava tietosuojaa kunnioittava vaihtoehto pilviagenttikoodaukselle.

📡 Seurattavaa

Anthropicin itseisännöity hiekkalaatikko — ensimmäiset signaalit

Seuraa käyttöönottoasteita rahoituksessa ja terveydenhuollossa. Jos itseisännöity hiekkalaatikko läpäisee vaatimustenmukaisuuden esteet, se voi avata yritysagenttien käyttöönoton laajassa mittakaavassa.

MiniMax M3 -avointen painojen julkaisu

Jos MiniMax julkaisee M3-painot luvatusti, se on ensimmäinen open-weight-malli, joka vastaa suljettuja frontier-malleja SWE-Bench Prossa (59 %). Mullistus avoimen lähdekoodin agenttikehitykselle.

📊 Trendi

Taistelu siirtyy "parhaasta mallista" "parhaaseen agenttiekosysteemiin". Itseisännöity infrastruktuuri, erillinen laskutus, kehyskonsolidointi ja agenttikohtaiset benchmarkit kypsyvät samanaikaisesti. Agenttipino muuttuu tuotekategoriaksi.