The Agent Watch
Briefing Artikkelit Työkalut Tietoja EN FR DE ES 中文 IT PT SV FI DA

Päivittäinen briefing

28. kesäkuuta 2026 · 5 uutista (sivusto) · 6 uutista (kanta)

🔥 Pääosassa

01

Alibaba julkaisee simulaattorin, joka ennustaa mitä tapahtuu ennen kuin agentti toimii

Ennen kuin itseohjautuva auto päästetään tielle, sitä ensin harjoitetaan miljoonilla simuloiduilla kilometreillä. Alibaba (Qwen) julkaisi tällä viikolla Qwen-AgentWorldin, joka tekee saman AI-agenteille. Järjestelmä arvaa etukäteen, mitä pääte, selain, Android-puhelin, kolmannen osapuolen työkalu tai koodivarasto vastaavat — ennen kuin agentti edes lähettää oikeaa komentoa. Tulos: agentti voi harjoitella, testata ja korjata itseään rikkomatta koskaan oikeaa järjestelmää. 397B-malli lyö jopa GPT-5.4:n tiimin omassa testissä, ja kaikki on julkaistu avoimena lähdekoodina (Apache 2.0 -lisenssi). Tiimille, joka haluaa viedä agentin tuotantoon, tämä on lupaus täysikokoisesta hiekkalaatikosta — ikään kuin jokaisella agentilla olisi oma testirata ennen avointa tietä.

02

Microsoft vaatii nyt ihmisen hyväksynnän ennen jokaista agentin toimintoa

Tähän asti yritysagentti saattoi poistaa tiedoston, lähettää sähköpostin tai muuttaa tietokantaa kenenkään huomaamatta. Microsoft päivitti 25. kesäkuuta Microsoft Agent Framework -kehyksensä versioon 1.11.1 ja muutti sääntöä: oletuksena jokainen agentin käyttämä työkalu vaatii nyt nimenomaisen ihmisen hyväksynnän. Käytännössä mikään arkaluonteinen toiminto ei voi enää käynnistyä itsestään. Myös listalla: Telegramista tulee virallinen kanava agentin isännöintiin, ja GitHub Copilot -integraatio siirtyy vakaaseen versioon. Projektilla on jo 11 700 tähteä GitHubissa, ja siitä on tulossa yksi yritysagenttien vertailupohjista. Se on vähän kuin tehtaisiin olisi vihdoin asennettu "vahvista"-painike jokaiseen sähköjohtoon — agentti pysyy tehokkaana, mutta mikään ei lähde itsestään.

03

Scaled Cognition kerää 100 miljoonaa rakentaakseen tekoälyn, joka vaikenee mieluummin kuin keksii

Kun soitat pankkiisi kiistääksesi tilisiirron, et halua kuulla improvisoivaa agenttia. Silti yleiskäyttöiset tekoälymallit erehtyvät tuotannossa noin joka kolmas kerta — mikä on mahdotonta pankeille, terveydenhuollolle ja vakuutuksille. Scaled Cognition keräsi 25. kesäkuuta 100 miljoonaa dollaria (johdossa Khosla Ventures) rakentaakseen alusta asti mallin, joka sitoutuu olemaan koskaan antamatta väärää vastausta. Sen sijaan, että olemassa olevaan malliin liimattaisiin turvasuodatin, yritys kirjoitti tekoälyn uusiksi luotettavuutta varten. Tulos: tahallaan pienempi ja halvempi malli, joka kieltäytyy vastaamasta, kun se ei ole varma — sen sijaan että keksisi. Genesys, joka hoitaa 8 000 organisaation asiakaspalvelun, käyttää sitä jo. Panostus: korvata ulkoistetut puhelinkeskukset (600 miljardin dollarin markkinat) yrityksen omistamalla ja ohjaamalla tekoälytyövoimalla.

04

Springin luoja julkaisee Embabelin, sillan 20 vuoden Java-koodin ja AI-agenttien välille

Jos työskentelet suuressa pankissa, vakuutusyhtiössä tai ministeriössä, IT:si pyörii lähes varmasti Javalla — ja on pyörittänyt pitkään. Rod Johnson, kuuluisan Spring-kehyksen luoja, esitteli 9. huhtikuuta Embabelin — uuden ilmaisen avoimen lähdekoodin työkalun (Apache 2.0), kirjoitettu Kotlinilla, täysin Java-yhteensopiva, jonka avulla nämä organisaatiot voivat rakentaa AI-agentteja kirjoittamatta kaikkea uusiksi. Idea: annetaan tekoälyn päättää vain siitä, mitä se osaa hyvin, ja pidetään loput klassisessa suunnittelussa — samassa, jota videopeleissä on käytetty 1990-luvulta lähtien. Jokainen agentin päätös pysyy selitettävänä ja auditoitavana, mikä on ratkaisevaa säännellyillä aloilla. Maailman 20 miljoonalle Java-kehittäjälle tämä on uskottavin tapa tuoda AI-agentit todellista taloutta pyörittäviin järjestelmiin — ilman että aloitetaan alusta.

05

Avoimen lähdekoodin tekoäly oppii itse järjestämään koodin kirjoittamistaan paremmin

Useimmat koodia kirjoittavat tekoälyt vain vastaavat esitettyyn kysymykseen. DeepReinforce, nuori startup, julkaisi 25. kesäkuuta Ornith-1.0-malliperheensä MIT-lisenssillä (ilmainen, rajoittamaton) — ja lähestymistapa on erilainen: koulutuksen aikana malli ei opi vain koodaamaan, vaan myös parantamaan tapaansa organisoida työnsä koodaamista varten. Mitä enemmän se harjoittelee, sitä parempia "tutkimuspolkuja" se löytää — vähän kuin opiskelija, joka lukuvuoden aikana oppii paitsi aineen myös paremman tavan kerrata. Suurin malli (397 miljardia parametriä) saavuttaa 82,4 % SWE-Bench Verified -viitotestissä, useimpia suljettuja malleja paremmin. Ja se toimii kehittäjien jo käyttämien työkalujen kanssa: OpenHands, Hermes Agent, OpenClaw. Tiimille, joka haluaa ajan myötä paranevan agentin, tämä on ilmainen ja ehdoton sisäänkäynti.

📡 Seurattavaa

Ympäristösimulaattoreista on tulossa oma infrastruktuurikategoriansa

Qwen-AgentWorld (Alibaba) tällä viikolla, Patronus Digital Worlds viime viikolla, ja jo oma vertailutesti: kategoria "simuloitu maailma agenttien kouluttamiseen" on muodostumassa omaksi markkinakseen. Signaali: agentin kouluttaminen suoraan oikeassa maailmassa on liian kallista, liian hidasta ja liian riskialtista. Seuraavien viikkojen aikana seurattavaa: mikä OpenAI:sta, Anthropicista tai Google DeepMindistä ilmoittaa omasta ympäristösimulaattoristaan.

Oletusarvoinen turvallisuus on tulossa yritysagenttien edellytykseksi

Neljässä päivässä kolme ilmoitusta samasta aiheesta: Microsoft vaatii oletuksena ihmisen hyväksynnän (25. kesäkuuta), Runlayer kerää 30 miljoonaa tullakseen agenttien ohjauspaneeliksi (24. kesäkuuta), F5 ostaa SurePath AI:n turvallisuutta varten (24. kesäkuuta). Signaali on selvä: ilman identiteetti-, käyttöoikeus- ja tarkastuskerrosta tuotannon agentit muuttuvat hallitsemattomiksi. Se on sama käänne kuin kyberturvallisuudessa 2010-luvulla — ensin IT-aihe, sitten kriittinen toiminto jokaisessa yrityksessä.

Luotettavuus "sisäänrakennettuna ensimmäisestä päivästä" vs. "jälkikäteen lisättynä"

Sekä Scaled Cognition (100 miljoonaa) että DeepReinforce (Ornith) lyövät vetoa siitä, ettei yleismalliin voi vain liimata turvasuodatinta. Heidän panoksensa: luotettavuus on suunniteltava alusta lähtien, ei lisättävä jälkikäteen. Jos jompikumpi pitää lupauksensa pankeissa, terveydenhuollossa tai vakuutuksissa, se voi sekoittaa markkinaa, jota tällä hetkellä hallitsevat muutama yleismalli.

Avoin lähdekoodi lyö suljetut mallit agenttitehtävissä

Ornith-1.0:n (MIT, 82,4 % SWE-Bench Verifiedissä 397B parametrilla) ja Qwen-AgentWorldin (Apache 2.0, ensimmäinen AgentWorldBenchissä) myötä avoin lähdekoodi on saavuttanut ja ohittanut suljetut mallit agenttikohtaisissa vertailutesteissä. Signaali teknologiajohtajille: agenttityönkuluissa erikoistuneet mallit voittavat nyt yleismallit. Budjettivaikutus: yksi syy lisää olla maksamatta huippuhintaa suljetusta mallista, kun ilmainen tekee tietyn tehtävän paremmin.

📊 Trendin

28. kesäkuuta 2026 on se viikko, jolloin agenttisen tekoälyn puuttuvat palat kootaan yhtä aikaa. (1) Kustannus ja realismi: Qwen-AgentWorldin avulla agentin voi kouluttaa simuloidussa maailmassa ennen oikeaan koskemista. (2) Turvallisuus: Microsoft vaatii oletuksena ihmisen hyväksynnän, ja samalla nousee esiin uusi "agenttien hallinto" -kategoria. (3) Luotettavuus: Scaled Cognition (100 miljoonaa) lyö vetoa tekoälystä, joka kieltäytyy vastaamasta ollessaan epävarma, keksimisen sijaan. (4) Silta olemassa olevaan: Rod Johnson tarjoaa Embabelilla miljoonille Java-kehittäjille tien agentteihin ilman kaiken uudelleenkirjoittamista. (5) Avoin lähökoodi voittaa: DeepReinforce osoittaa, että ilmainen malli voi voittaa suljetut agenttivertailutesteissä. Kun kaikki nämä palat ilmestyvät yhtä aikaa, agenttitalous lakkaa olemasta laboratorioexperimentti ja muuttuu oikeaksi teollisuudeksi.