Päivittäinen briefing
16.6.2026 · 6 uutista (sivusto) · 9 uutista (kanta)
🔥 Otsikot
Claude-hallitut agentit itseisännöidyssä hiekkalaatikossa
Anthropic sallii nyt hallittujen agenttien suorittaa työkaluja asiakkaan hallitsemassa kontissa, palomuurin takana. Vain lähtevät yhteydet. Yksityiset MCP-palvelimet tuetaan. Puuttuva palanen säännellyille aloille: terveydenhuolto, rahoitus, laki.
Claude Agent SDK — erillinen kuukausiluotto 15.6. alkaen
Agent SDK ja ei-vuorovaikutteinen claude -p kuluttavat nyt erillistä kuukausiluottoa: $20 (Pro), $100 (Max 5x), $200 (Max 20x). Käyttämätön luotto ei siirry. Rakenteellinen muutos Claudea käyttäville tiimeille.
Agenttikehyssota — tilanne kesäkuu 2026
Microsoft Agent Framework 1.0 GA (yhdistetty AutoGen + Semantic Kernel). CrewAI: 52,4k tähteä, 2 miljardia agenttisuoritusta 12 kuukaudessa. Google ADK 4 kielellä. MCP ylittää 200 palvelinta. ACP sulautuu A2A:han Linux Foundationin alla.
EVA-Bench Data 2.0 — ensimmäinen kattava agenttibenchmark
ServiceNow-AI julkaisee laajennetun benchmarkin AI-agenttien arviointiin: 3 aluetta, 121 työkalua, 213 skenaariota. Mittaa työkaluvalintaa, monivaiheista päättelyä, virheistä palautumista ja resurssitehokkuutta.
Holo3.1 — täysin paikallinen tietokoneenkäyttöagentti, avoimet painot
H Company julkaisee agentin, joka ohjaa GUI:ta kokonaan kuluttajalaitteistolla — pilveä ei tarvita. Näppäimistö/hiiri-automaatio, näyttövuorovaikutus. Avoimet painot, variantit 0,8B–35B Hugging Facessa.
IBM Research: agenttilogiikka merkitsee enemmän kuin raaka LLM-teho
IBM väittää, että tuotantomenestys riippuu vahvasta agenttilogiikasta, ei vain mallista. Neljä pilaria: monivaiheinen päättely varasuunnitelmalla, luotettava järjestelmävuorovaikutus, pitkän aikavälin tilanhallinta, elegantti virheenkäsittely.
Gemma 4 12B — täysin paikallinen koodausagenttipino läpäisee testin
DevArt testasi Gemma 4 12B:tä Ollama + OpenCode -yhdistelmällä oikeissa tehtävissä: landing page, bugikorjaukset, UI-generointi, minipeli — kaikki paikallisesti, nolla API-avainta. Tekijä myöntää olleensa väärässä: tämä paikallinen pino todella toimii. Uskottava tietosuojaa kunnioittava vaihtoehto pilviagenttikoodaukselle.
📡 Seurattavaa
Anthropicin itseisännöity hiekkalaatikko — ensimmäiset signaalit
Seuraa käyttöönottoasteita rahoituksessa ja terveydenhuollossa. Jos itseisännöity hiekkalaatikko läpäisee vaatimustenmukaisuuden esteet, se voi avata yritysagenttien käyttöönoton laajassa mittakaavassa.
MiniMax M3 -avointen painojen julkaisu
Jos MiniMax julkaisee M3-painot luvatusti, se on ensimmäinen open-weight-malli, joka vastaa suljettuja frontier-malleja SWE-Bench Prossa (59 %). Mullistus avoimen lähdekoodin agenttikehitykselle.
📊 Trendi
Taistelu siirtyy "parhaasta mallista" "parhaaseen agenttiekosysteemiin". Itseisännöity infrastruktuuri, erillinen laskutus, kehyskonsolidointi ja agenttikohtaiset benchmarkit kypsyvät samanaikaisesti. Agenttipino muuttuu tuotekategoriaksi.