The Agent Watch
Briefing Artikkelit Työkalut Tietoja EN FR DE ES 中文 IT PT SV FI DA

Viimeisin briefing

2. heinäkuuta 2026 · 5 kohdetta (sivusto) · 5 kohdetta (kanta)

2. heinäkuuta 2026 kolme signaalia yhdistyy: Claude Fable 5:n paluu kolmen viikon sulun jälkeen, Microsoftin avoimen lähdekoodin agenttikehyksen virallistaminen ja 230 miljoonan dollarin rahoitus kahdelle agenttien tarkastukseen erikoistuneelle toimijalle. Agenttinen stack siirtyy teolliseen kypsyysvaiheeseensa.

🔥 Pääosassa

01

Anthropic palauttaa käyttöön maailmanlaajuisesti lippulaiva-AI-assistentinsa kolmen viikon turvakatkon jälkeen

Kun käytät AI-assistenttia koodin kirjoittamiseen, asiakirjojen allekirjoittamiseen tai tutkimukseen, oleta sen noudattavan turvallisuussääntöjä. Kesäkuussa Amazon löysi Claude Fable 5:stä haavoittuvuuden — tavan kiertää turvasuodattimet ja valmistaa haittaohjelmia. Yhdysvaltain hallitus katkaisi välittömästi mallin maailmanlaajuisen käytön, ja koko työkaluketju pysähtyi. 30. kesäkuuta Anthropic ilmoittaa, että Fable 5 on palannut: uusi suodatin estää yli 99 % hyökkäysyrityksistä, ja arkaluontoiset kyselyt ohjataan automaattisesti tiukemmin lukittuun malliin. Häiriön hyvittämiseksi maksavat tilaajat saavat puolet viikkokiintiöstään ilmaiseksi 7. heinäkuuta asti. Käytännössä kolmen viikon jakso päättyy, jolloin ammattikäyttäjät joutuivat pärjäämään korvaavien mallien kanssa — mutta uusi suodatin tuottaa enemmän vääriä positiivisia, joten tuotantokuormien vakauttaminen vie muutaman päivän.

02

Microsoft julkaisee täydellisen ja ilmaisen työkalupakin omien AI-agenttien rakentamiseen, .NET- ja Python-tuella

Nykyään AI-agentin kokoamiseen, joka osaa hakea tiedostoja, suorittaa komentoja ja muistaa tekemisensä, täytyy pinota puoli tusinaa kirjastoa, jotka eivät puhu keskenään. Microsoft julkaisee Microsoft Agent Framework 1.0 GA:n: yksi avoimen lähdekoodin pohja, saatavilla .NET- ja Python-versioina, joka niputtaa kaiken — tiedostojärjestelmäkäyttö, komentojen suorituksen hiekkalaatikko, pitkäaikaismuisti, ihmisen hyväksyntä arkaluontoisille toiminnoille ja "suunnitelma"-tila ennen suoritusta. Koko stack on saatavilla myös hallinnoituna pilvipalveluna scale-to-zero-tuella — et maksa mitään, kun agentti nukkuu. Tämä on merkki siitä, että Microsoft ottaa agenttimarkkinat vakavasti Anthropicia ja LangChainia vastaan. Tiimille, joka jo rakentaa agenteja, tämä on uskottava hajautusvaihtoehto — ei välttämättä parempi, mutta suuren toimittajan tuella ja integroidulla pilviekosysteemillä.

03

LangChain julkaisee avoimen lähdekoodin agentin, jonka ainoa tehtävä on pitää projektin dokumentaatio ajan tasalla koodin kanssa

Lähes kaikissa tekniikan tiimeissä dokumentaatio laahaa koodin perässä: kehittäjä muuttaa koodin, unohtaa README:n, ja kolme kuukautta myöhemmin kukaan ei enää ymmärrä API:a. LangChain Labs julkaisi juuri OpenWikin, avoimen lähdekoodin agentin, joka tekee päinvastaisen työn: se skannaa repon, tunnistaa koodissa tapahtuneet muutokset ja ehdottaa dokumentaatiopäivitystä pull requestina. Kun ylläpitäjä korjaa ehdotuksen, agentti oppii tiimin toimituksellisen tyylin ja soveltaa sitä seuraavalla kerralla. Pienelle rakenteelle, jolla ei ole varaa palkattuun tekniseen kirjoittajaan, tämä on kuin assistentti joka sulkee dokumentaatiosilmukan — ilmaiseksi, ja rikkomatta nykyistä Git-vuota. Projekti käyttää uutta pitkäaikaismuistia ("Wiki Memory"), joka muistaa kunkin projektin mieltymykset.

04

Patronus AI kerää 50 miljoonaa dollaria stress-testatakseen AI-agentteja simuloiduissa digitaalisissa maailmoissa ennen käyttöönottoa

Perinteiset mittarit mittaavat, mitä malli osaa tehdä kiinteillä kysymyksillä. Ne eivät kerro mitään siitä, mitä tapahtuu, kun agentti pudotetaan todelliseen ympäristöön ja sen täytyy käsitellä katkoksia, vihamielisiä käyttäjiä tai ristiriitaisia ohjeita. Patronus AI, newyorkilainen startup, jonka perustivat entiset Meta-työntekijät, sulki 29. kesäkuuta 50 miljoonan dollarin Series B -kierroksen tullakseen tämän uuden tieteenalan — agenttien arvioinnin todellisissa oloissa — erikoismieheksi. Alusta rakentaa "digitaalisia maailmoja" — simulaattoreita, joissa on teko-käyttäjiä, rajapintoja, satunnaisia katkoksia ja prompt-injektioita — joihin agentti upotetaan ja jossa sitä tarkkaillaan. Yritykselle, joka haluaa ottaa agentin tuotantoon arkaluontoisilla aloilla (talous, terveys, oikeustieteet), tämä on se puuttuva laadunvarmistuskerros. Suurelle yleisölle tämä on todiste siitä, että AI-agentit eivät ole enää leluja: niistä tulee kriittistä ohjelmistoa, joka vaatii stressitestausta kuten mikä tahansa teollinen järjestelmä.

05

LeapXpert kerää 180 miljoonaa dollariа tullakseen AI-tarkastettujen yritysviestinnän referenssialustaksi

Pankissa tai viranomaisessa, kun neuvonantaja lähettää WhatsApp-viestin asiakkaalle keskustellakseen lainasta, kukaan ei tiedä tarkalleen mitä sanottiin — ja silti laki vaatii, että keskustelu arkistoidaan ja on tarkastettavissa. LeapXpert, newyorkilainen alusta, sulki 30. kesäkuuta 180 miljoonan dollarin kasvurahoituskierroksen ratkaistakseen tämän ongelman laajassa mittakaavassa. Sen alusta kaappaa keskusteluja WhatsAppissa, iMessagessa, Signalissa ja WeChatissa, tulkitsee niitä AI-kerroksella ja merkitsee compliance-riskit reaaliajassa — kuin digitaalinen verotarkastaja, joka lukee jokaisen viestin ja varoittaa, kun jokin ylittää rajan. Pääoma rahoittaa laajentumisen julkiselle sektorille ja suurille yrityksille. Yritys-AI:ta ajattelevalle tämä on signaali: asiakkaat maksavat nyt yhtä paljon vaatimustenmukaisuudesta ja jäljitettävyydestä kuin mallin tehosta.

📡 Seurattavaa

Anthropicin, Amazonin, Microsoftin ja Googlen yhdessä rakentama uusi jailbreak-vakavuuden pisteytyskehys voi nousta maailmanlaajuiseksi standardiksi

Fable 5:n uudelleenkäyttöönoton myötä Anthropic ja kolme muuta suurta julkaisijaa ovat julkaisseet yhteisen kehyksen jailbreakien vakavuuden luokitteluun — tekniikoille, jotka kiertävät turvaportteja. Jos muut julkaisijat (OpenAI, Meta) omaksuvat tämän standardin ja Yhdysvaltain sääntelijät vahvistavat sen, siitä tulee maailmanlaajuinen referenssi päätettäessä, milloin mallia täytyy rajoittaa. Seurattavaa: OpenAI:n ja Metan liittyminen, kauppaministeriön validointi, mahdollinen soveltaminen kiinalaisiin open-weight-malleihin.

Nouseeko Microsoft Agent Frameworkista Claude Code -vaihtoehtojen referenssi Euroopassa?

MAF on avointa lähdekoodia, Microsoftin tukema, ja Python-SDK toimii useimpien olemassa olevien stackien kanssa. Jos Azure Foundry -käyttöönotot lähtevät lentoon Euroopassa — missä sääntely työntää kohti paikallisia pilviratkaisuja — MAF:sta tulee uskottava vaihtoehto yksinomaiselle Anthropic-riippuvuudelle. Seurattavaa: Azure Foundry -käyttöönotot eurooppalaisissa pankeissa ja hallinnoissa.

Agenttien arviointimarkkinat tiivistyvät — kuka on "AI-agenttien Moody's" vuoteen 2027 mennessä?

Patronus AI ei ole yksin: LangSmith, Arize, Langfuse, Helicone, WhyLabs ja Fiddler asemoituvat myös agenttien arvioinnin ja havainnoitavuuden segmenttiin. Markkinat todennäköisesti tiivistyvät kahden tai kolmen johtajan ympärille. Seurattavaa: julkaisijoiden yritysostot, viralliset kumppanuudet OpenAI:n ja Anthropicin kanssa, avoimen lähdekoodin projektit (OpenAI Evals, HuggingFace LightEval).

Vastaavatko Microsoft, Notion, GitHub tai Linear LangChainin OpenWikiin?

OpenWiki on agentti, jonka ainoa tehtävä on pitää repon dokumentaatio ajan tasalla koodin kanssa — palvelu, jonka Microsoft, Notion, GitHub ja Linear voisivat integroida natiivisti olemassa oleviin työkaluihinsa. Jos jokin näistä toimijoista sisällyttää vastaavan agentin vakio-ominaisuudeksi tuotteeseensa, LangChainin etu sulaa. Seurattavaa: yhteisön forkaukset, natiivit integraatiot GitHub Copilotissa, Cursorissa tai Linearissa.

📊 Trendi

2. heinäkuuta 2026 osoittaa, että agenttinen stack siirtyy teolliseen kypsyysvaiheeseensa. Kolme kerrosta nousee samanaikaisesti: perustamallit (Fable 5 palaa kolmen viikon sulun jälkeen, merkki siitä että sääntelystä tulee tuotantoparametri sinänsä), orkestrointityökalut (Microsoft Agent Framework ja LangChain OpenWiki asemoituvat avoimen lähdekoodin agenttikehyssegmenttiin LangGraphin ja Anthropic Agent SDK:n rinnalle), ja arviointi- sekä hallintokerros (Patronus AI ja LeapXpert keräävät yhteensä 230 miljoonaa dollaria agenttien QA:han ja viestinnän tarkastukseen). Seuraus AI:lla rakentavalle: vakava agenttinen tuote ei voi enää tulla toimeen ilman vahvistettua turvallisuuskehystä, käyttöönottoa edeltävää arviointikerrosta tai tarkastuskerrosta säännellyille aloille. "Iltaprototyypistä" tulee kriittistä ohjelmistoa, joka vaatii samat suojatoimet kuin pankkijärjestelmä.