The Agent Watch
Briefing Artikel Werkzeuge Über uns EN FR ES 中文 IT PT SV FI DA

Letztes Briefing

3. Juli 2026 · 5 items (site) · 5 items (base)

Am 3. Juli 2026 wird der KI-Agent vom Prototyp zur Infrastruktur: 100.000 Agenten beim Pentagon im Einsatz, ein Mega-Deal zwischen SpaceX und Reflection über 6,3 Milliarden Dollar, ein Open-Source-Stack zur Prüfung von Agenten-Risiken — der agentische Stack wird erwachsen.

🔥 Auf der Eins

01

Das Pentagon vernetzt 100.000+ KI-Agenten, um Kommandeuren Entscheidungen in Sekunden zu ermöglichen

Wenn ein Militärkommandeur innerhalb weniger Minuten ein Ziel auswählen muss, zieht er heute Analysten, Satelliten, Drohnen und Feldberichte zusammen. Morgen wird er ein Netzwerk aus KI-Agenten fragen. Am 26. Juni kündigte das US-Kriegsministerium das „Agent Network" an, ein System operativer Agenten, das Rohdaten in Entscheidungsoptionen übersetzt — am Ende genehmigt ein Mensch. Es ist das zweite Großprojekt der KI-Beschleunigungsstrategie des Pentagons. Am 1. Juli bestätigte der KI-Chef des Pentagons, dass Agenten nun die Bürokratie zur Freigabe neuer Software automatisieren — bis zu zwei Jahre Papierarbeit schrumpfen auf wenige Stunden. 3,5 Millionen Menschen nutzen diese Werkzeuge bereits im Ministerium. Für die Allgemeinheit ist das der Beweis, dass wir das Zeitalter der „Agenten als Infrastruktur" erreicht haben: kein Werkzeug mehr, das man befragt, sondern ein Team digitaler Kollegen, das die Arbeit vorbereitet, während man schläft.

02

Exabeam veröffentlicht das erste Open-Source-Risikobewertungs-Framework für KI-Agenten, abgestimmt mit OWASP-Standards

Wenn Sie heute einer KI-Assistenz eine Aufgabe anvertrauen — eine E-Mail schreiben, Geld überweisen, eine Reise buchen —, prüft niemand, ob sie dazu berechtigt ist, bevor sie handelt. Exabeam, der weltweite Spezialist für Cyberangriffserkennung, veröffentlichte am 1. Juli zwei kostenlose Programme, die das ändern: Observra liest, was Claude Code, Codex, Gemini und Copilot tun, und ordnet ihre Aktionen in ein gemeinsames Format ein; Praxen prüft jede Berechtigung, bevor der Agent ausführt. Stellen Sie sich einen automatischen Anti-Betrugs-Filter vor, der in all Ihre Assistenten eingebaut ist. Fünfzig neue Überwachungsszenarien kommen zu den bestehenden vierzig hinzu, und jedes Verhalten wird nun gegen die zehn wichtigsten Agent-KI-Risiken aus dem OWASP-Standard bewertet. Für jedes Unternehmen, das ein agentenbasiertes Produkt auf den Markt bringen will, bestätigt das: Sicherheit wird eine Pflichtschicht — und ein Markt für den, der sie prüft.

03

SpaceX unterzeichnet 6,3-Milliarden-Dollar-Deal mit Reflection AI und wird zur dritten Supermacht im KI-Compute

SpaceX, das Unternehmen, das Falcon-Raketen startet, tut heute etwas Seltsames: Es vermietet seine eigenen KI-Server. Am 22. Juni unterzeichnete das Unternehmen einen Vertrag über 150 Millionen Dollar pro Monat — 6,3 Milliarden Dollar über drei Jahre — mit Reflection AI, einem amerikanischen Labor für „offene" KI-Modelle. Die neuesten Nvidia-GPUs sind im Colossus-2-Rechenzentrum in Memphis installiert. Es ist bereits der dritte Mega-Deal dieser Art, nach Anthropic und Google. Insgesamt nimmt SpaceX 27 Milliarden Dollar pro Jahr an Compute-Einnahmen ein, ohne sich jemals als KI-Unternehmen zu bezeichnen. Für die Allgemeinheit ergibt sich ein neues Bild: Ein Rechenzentrum kann zu einem eigenständigen Finanzvermögen werden, wie ein Büroturm im Stadtzentrum. Und amerikanische „offene" Modelle, bisher von chinesischen Modellen überschattet, haben plötzlich das nötige Kapital.

04

GitHub erlaubt erstmals ein offenes chinesisches KI-Modell als Code-Assistenten — eine Weltpremiere

Wenn Sie heute GitHub Copilot zum Schreiben von Code nutzen, wählen Sie zwischen geschlossenen amerikanischen Modellen. Seit dem 1. Juli können zahlende Abonnenten auch Kimi K2.7 Code wählen, ein offenes Modell des chinesischen Startups Moonshot. Eine Billion Parameter insgesamt, 32 Milliarden aktiv pro Anfrage, ein Kontextfenster von 256.000 Zeichen — und die Möglichkeit, bis zu 300 Unteragenten zu starten, um eine komplexe Aufgabe zu zerlegen. Das Modell läuft auf Microsoft Azure, was eine diskrete diplomatische Geste inmitten der Spannungen zwischen Washington und Peking ist. Für europäische oder kanadische Entwickler, die ihren Stack diversifizieren wollen, ohne nur von Claude oder GPT abzuhängen, ist das eine glaubwürdige Option. Für den Markt zeigt es: Die Grenze „chinesisch vs. amerikanisch" beginnt sich aufzulösen, sobald eine neutrale Cloud beide beherbergt.

05

Ory veröffentlicht Identitäts-Plugins, die direkt in Claude Code, Codex und Gemini eingebunden werden — Authentifizierung wird unsichtbar

Heute muss ein KI-Agent, der auf Ihre Bankdaten zugreift, wie jeder Mitarbeiter authentifiziert werden. Problem: Niemand hat das Feld „Roboter" auf Identitätsformularen vorgesehen. Ory, das bereits 2,5 Milliarden digitale Konten weltweit verwaltet, veröffentlichte am 10. Juni Agent DX, eine Sammlung kostenloser Plugins, die Authentifizierung, Berechtigungen und Rückverfolgbarkeit automatisch in die meistgenutzten Code-Assistenten einspeisen. Die Installation erfolgt mit einer einzigen Befehlszeile; den Rest erzeugt die KI selbst. Für ein Startup, das ein agentenbasiertes Produkt entwickelt, ist das wie ein vorkonfigurierter Zugangsausweis ab Tag eins, statt später zur IT-Sicherheit zu rennen. Für die Branche ist das ein Signal: Digitale Identität für Agenten wird ein eigener Standard, und wer ihn setzt, bestimmt die Regeln für das nächste Jahrzehnt.

📡 Im Auge behalten

Das Chip-Embargo treibt China zur Software-Innovation: das Inferenz-Rennen hat begonnen

DeepSeek veröffentlichte am 27. Juni DSpark, eine freie Software, die seine Modelle um 60 bis 85 Prozent beschleunigt. In Kombination mit MiMo-V2.5 (über 1.000 Tokens pro Sekunde) bestätigt das: China setzt nun auf Code-Effizienz, um den eingeschränkten Zugang zu High-End-GPUs auszugleichen. Beobachten: Adoption in Europa über vLLM und SGLang, erste unabhängige Benchmarks, Reaktion westlicher Akteure.

Der Markt für Agent-Bewertung konsolidiert sich — wer wird bis 2027 das „Moody's der Agenten"?

Exabeam Observra/Praxen steht nicht allein da: LangSmith, Arize, Langfuse, Helicone, WhyLabs und Fiddler positionieren sich im selben Segment. Der Markt wird sich wahrscheinlich auf zwei oder drei Leader konzentrieren. Beobachten: Übernahmen von Anbietern, offizielle Partnerschaften mit OpenAI und Anthropic, konkurrierende Open-Source-Projekte (OpenAI Evals, HuggingFace LightEval).

Microsoft hostet Kimi auf Azure: ein politisches Signal ebenso wie ein kommerzieller Vertrag

Mitten in den chinesisch-amerikanischen Spannungen ist es ein Signal, ein Moonshot-Modell auf Microsoft-Servern laufen zu sehen. Falls weitere chinesische Modelle (GLM, Qwen, DeepSeek) folgen, verblasst die Grenze „chinesisch vs. amerikanisch" in der Cloud. Beobachten: Microsofts offizielle Politik zu chinesischen Workloads, Reaktion der US- und EU-Regulierer, erster europäischer Enterprise-Kunde mit Azure+GLM.

100.000 Agenten in 5 Wochen von Nicht-Entwicklern beim Pentagon erstellt: die Einstiegshürde sinkt auf null

Das Pentagon hat in fünf Wochen mehr als 100.000 Agenten durch „Vibe-Coding" erstellt (in natürlicher Sprache beschreiben, was man will). Wenn sich dieses Muster in Bildung, Gesundheit oder Kommunen verbreitet, wird aus „KI-Nutzer" ein „Agent-Ersteller". Für Agent Wealthy validiert das den Zielmarkt: Menschen, die nie programmiert haben, können jetzt ihr eigenes automatisiertes Mikro-SaaS starten.

📊 Trend

Der 3. Juli 2026 markiert einen Meilenstein: Der KI-Agent wird zu einer Schicht nationaler Infrastruktur. Das Pentagon übernimmt ihn im großen Stil zur Unterstützung militärischer Entscheidungen, Microsoft macht ihn über Azure zur Massenware, SpaceX macht ihn zu einem 27-Milliarden-Dollar-Finanzvermögen pro Jahr, und Sicherheit — lange das Stiefkind — wird mit Exabeam und Ory ein vollwertiges Open-Source-Produkt. Folge für jeden, der mit KI baut: Ein ernsthafter Agent im Jahr 2026 kommt nicht mehr ohne Identitäts-Framework, Verhaltensüberwachung und adversariellen Pre-Deployment-Test aus. Der Wochenend-Prototyp wird zu kritischer Software, die dieselben Schutzmaßnahmen verlangt wie ein Bankensystem.