Agentic Weekly #013 — Der Staat greift nach den Modellen

Juli 05, 2026

Fable 5 ist zurück, GPT-5.6 kommt nur für zwanzig Auserwählte, und OpenAI bietet Washington eine fünfprozentige Beteiligung an — in einer Woche wird sichtbar, wie eng Frontier-KI und Regierung inzwischen verwoben sind. Dazu ein neues Standardmodell zum halben Preis, mit Sternchen, und eine Open-Source-Stiftung, die zu alldem laut Nein sagt.

Juli 2026 · Lesezeit ~7 Min.

Der Staat und die Frontier-Modelle

Der Bogen, der sich seit Ausgabe #010 über drei Wochen zog, schließt sich: Fable 5 und Mythos 5 sind wieder freigeschaltet. Am 1. Juli hat Anthropic beide Modelle neu ausgerollt, nachdem die US-Regierung die am 12. Juni verhängte Exportkontrolle am 30. Juni aufgehoben hatte — per Brief von Handelsminister Howard Lutnick, nicht per Präsidentenerlass.

Der Preis der Rückkehr ist ein Rahmen. Anthropic veröffentlicht die Freigabe zusammen mit einem Jailbreak Severity Framework — einem Schema, das die Schwere eines „Jailbreaks” (einer Umgehung der Modell-Schutzmechanismen) an vier Kriterien misst: dem Fähigkeitszuwachs, dessen Breite, wie leicht er sich für einen Angriff nutzen lässt, und der Auffindbarkeit. Dazu kommt ein neuer Safety-Classifier gegen genau die von Amazon gemeldete Technik — Forscher hatten Fable 5 per Jailbreak dazu gebracht, Software-Schwachstellen aufzuspüren und in einem Fall Code zu schreiben, der zeigt, wie sich eine davon ausnutzen ließe. Denselben Prompt beantworten laut Anthropic auch schwächere Modelle wie Opus 4.8 oder GPT-5.5, weshalb man von routinemäßiger Defensive-Security-Arbeit spricht, nicht von einer versteckten Superfähigkeit. Der Classifier blockt die Technik nach Anthropics Angaben in über 99 % der Fälle. Mythos 5, die stärkere Variante, bleibt auf eine Reihe US-Organisationen beschränkt. Lutnick dazu: „I have determined that appropriate safeguards are in place to permit certain trusted partners to access the Claude Mythos 5 Model.” — man habe, so der Handelsminister, angemessene Schutzvorkehrungen festgestellt, um bestimmten vertrauenswürdigen Partnern Zugang zu Mythos 5 zu gewähren.

Zwei Labs, ein Muster. Es ist nicht bei Anthropic geblieben. Wenige Tage zuvor zeigte OpenAI eine erste Vorschau der GPT-5.6-Familie (Sol, Terra, Luna) — und zwar auf Wunsch der US-Regierung zunächst nur für rund zwanzig „trusted partner”-Organisationen, mit Verweis auf nationale Sicherheit. Wo das Regierungsmuster Fable erst nach dem Rollout traf und zurückdrehte, trifft es den nächsten großen Launch schon präventiv. Aus dem Einzelfall wird ein Verfahren.

Und der Staat will mehr als das Türschloss. In derselben Woche berichtet die Financial Times, OpenAI habe der US-Regierung angeboten, 5 % am Unternehmen zu übernehmen — bei einer Bewertung von 852 Mrd. $ (Rekordrunde im März) entspricht das rund 42,6 Mrd. $. Sam Altman wirbt für ein Modell nach dem Vorbild des Alaska Permanent Fund, jenes Fonds, der Alaskas Öl-Einnahmen als jährliche Dividende an die Einwohner ausschüttet — jedes führende US-KI-Labor solle denselben Eigenkapitalanteil einbringen. Die Gespräche mit Trump, Lutnick und Finanzminister Scott Bessent gelten als „konzeptuell”; ein Vollzug bräuchte womöglich ein Gesetz des Kongresses.

Drei Bewegungen, ein Befund: Der Staat gibt beim einen Anbieter ein Modell frei, hält beim anderen den nächsten Launch klein — und will sich an ebendiesem beteiligen. Frontier-KI ist in Washington von der regulierten Branche zum strategischen Aktivposten geworden — Zugang ist zur Verhandlungsmasse und Beteiligung zur Option geworden. Für alle, die auf diesen Modellen bauen, heißt das: Verfügbarkeit ist keine rein technische Größe mehr.

Sonnet 5: das neue Standardmodell — mit Sternchen

Am 30. Juni hat Anthropic Claude Sonnet 5 gestartet und zum Standardmodell für Free- und Pro-Nutzer gemacht. Native 1M Token Kontext, ein Einführungspreis von 2 $ / 10 $ pro Million Tokens (Ein- und Ausgabe) bis zum 31. August, danach 3 $ / 15 $. TechCrunch fasst den Launch als „cheaper way to run agents” — den günstigeren Weg, Agenten laufen zu lassen.

Das Sternchen liefert Simon Willison. Er zeigt, dass der neue Tokenizer — der Baustein, der Text in die abgerechneten Tokens zerlegt — rund 30 % mehr Tokens pro Text erzeugt: der reale Preis liegt beim 1,42-fachen für englischen Text und beim 1,28-fachen für Python-Code. Der Rabatt schrumpft, sobald man ihn gegen die tatsächliche Abrechnungseinheit hält.

Und der Praxistest fällt verhalten aus. Katie Parrott vom Every-Team fasst ihren „Vibe Check” so zusammen: Sonnet 5 könne kompetent entwerfen, coden und analysieren — aber „every use case has a cheaper, faster, or smarter alternative.” Für jeden Anwendungsfall gebe es etwas Billigeres, Schnelleres oder Klügeres. Ein günstigeres Default heißt nicht automatisch das beste Default.

Anthropic zieht die geheimen Marker aus Claude Code

Leiser, aber symbolträchtig: Anthropic entfernt die Steganographie-Marker aus Claude Code — versteckte Wasserzeichen, die im März in den System-Kontext eingebaut worden waren, um Missbrauch und Distillation nachzuweisen (Distillation = das Nachtrainieren eines eigenen Modells auf den Ausgaben eines fremden). Der Rückbau landete am 1. Juli per Pull Request. Thariq Shihipar, Ingenieur im Claude-Code-Team, begründet ihn mit „stronger mitigations since then” — man habe inzwischen bessere Schutzmechanismen.

Das Timing ist bemerkenswert: Es fällt in dieselbe Woche, in der Anthropic Alibaba den bislang größten bekannten Distillation-Angriff vorwirft (siehe #012). Der eine Verteidigungsweg wird also zurückgebaut, während der Vorwurf, genau davor schützen zu müssen, öffentlich verhandelt wird.

Claude Code: Die Highlights der Woche

Für alle, die Claude Code täglich nutzen

Gestapelte Skill-Aufrufe — v2.1.199 lädt bei verketteten Slash-Befehlen (/skill-a /skill-b do XYZ) jetzt alle führenden Skills (bis zu fünf) auf einmal. Kleiner Handgriff, spürbarer Gewinn für alle, die mehrere Skills kombinieren.
„Claude in Chrome” ist GA — die Browser-Integration verlässt mit v2.1.198 den Preview-Status und ist allgemein verfügbar.

Für Multi-Agent- und Automation-Workflows

Subagents laufen jetzt standardmäßig im Hintergrund (v2.1.198), und Background-Agenten erstellen selbstständig einen Commit, laden ihn hoch und öffnen einen Draft-PR, statt vorher zu fragen. Die Richtung ist deutlich: Der Agent arbeitet weiter, ohne an jeder Weggabelung stehenzubleiben.

Für Sicherheits- und Team-Admins

Default Permission Mode wechselt auf „Manual” — v2.1.200 stellt CLI, VS Code und JetBrains einheitlich so um, dass Aktionen wieder explizit bestätigt werden müssen. Ein bewusster Gegenzug zum autonomeren Verhalten oben.
MCP-Sicherheits-Fix — v2.1.196 verhindert, dass sich selbst-genehmigte MCP-Server (Model Context Protocol, der Standard, über den Agenten externe Tools und Datenquellen anbinden) in nicht vertrauenswürdigen Workspaces automatisch starten. Dazu: org-weite Default-Modelle für Admins.

Agentic Coding

Erstes Open-Weight-Modell in Copilot. GitHub nimmt Kimi K2.7 Code von Moonshot AI in den Modell-Picker auf — das erste frei herunterladbare Modell (Open-Weight = die Modellgewichte sind öffentlich verfügbar) überhaupt in Copilot. Rollout startet bei Pro, Pro+ und Max. Bemerkenswert, weil damit ein Open-Weight-Modell in ein Enterprise-Coding-Tool einzieht, das bislang proprietären Modellen vorbehalten war.
Copilot-GA-Welle. Parallel schaltet GitHub eine Reihe kleinerer Bausteine frei: Vision GA, Browser-Tools in VS Code GA, Agent-Session-Streaming (Public Preview) und automatische Modellauswahl für Enterprises. Einzeln unspektakulär, in Summe eine hohe Release-Kadenz.

Trend der Woche: Der Trend teilt sich

Zwei Beobachtungen aus derselben Woche ziehen in entgegengesetzte Richtungen.

Gergely Orosz beschreibt nach Vor-Ort-Besuchen bei OpenAI, Anthropic und Cursor eine strukturelle Verschiebung: Cloud-Agenten seien zum Standardwerkzeug geworden — bei OpenAI nutzten laut seinem Bericht über 95 % der Non-Engineers den Coding-Agenten Codex statt ChatGPT. Der nächste große Hebel sei „Environments-Building für Agents”, also das Bauen von Umgebungen, in denen Agenten zuverlässig arbeiten können.

Aus der anderen Ecke kommt ein hartes Nein. Die Godot Foundation verbietet KI-generierten Code und KI-Text in Pull Requests und Kommunikation — die erste große Open-Source-Institution mit einer klaren Absage: „AI cannot take responsibility, and we can’t trust heavy users of AI to understand their code enough to fix it.” KI könne keine Verantwortung übernehmen, und man traue Vielnutzern nicht zu, ihren Code gut genug zu verstehen, um ihn zu reparieren.

Dazwischen liegt die eigentliche Frage: nicht ob, sondern wie viel Autonomie. Addy Osmani (Google) schlägt dafür ein sechsstufiges Raster von „Agentic Autonomy Levels” vor, mit Metriken wie der mittleren Zeit zwischen menschlichen Eingriffen. Und Kent Beck, Pionier des Test-Driven Development, bringt den Kern auf den Punkt: In der neuen Ära wachse das Vertrauen bei weitem nicht so schnell wie der Code selbst.

Tipp der Woche

Simon Willison zitiert einen Rat aus dem Claude-Code-Team, der in die Preisdebatte dieser Woche passt: teure Modelle für die Arbeit mit hohem Urteilsanteil reservieren, Routine-Coding per Anweisung an günstigere Subagents delegieren. Wer den Executor-Advisor-Gedanken ernst nimmt — ein starkes Modell entscheidet die Richtung, günstigere Modelle führen aus — spart Tokens schneller, als man erwartet.

Warum das hier steht: Sonnet 5 macht das billigere Modell zum Default, aber der Willison-Tokenizer-Fund zeigt, dass „billiger” trügt. Die Ersparnis liegt nicht im Modellpreis, sondern darin, welches Modell welche Aufgabe bekommt.

Kurz notiert

Anthropics Recruiting-Serie geht weiter: Jelani Nelson, Chair der Computer Science Division im EECS-Department der UC Berkeley, nimmt eine Beurlaubung und wechselt als Member of Technical Staff zu Anthropic — nach Karpathy, Jumper, Adler und Pritzel der nächste prominente Zugang binnen weniger Wochen.
Anthropic sondiert mit Samsung einen eigenen KI-Chip — Zweck, Server-Integration und Leistungsdaten noch offen. Passt in die Compute-Diversifizierung aus #012 (Micron-Deal, Broadcom-ASIC).
Etched verlässt den Stealth-Modus mit funktionierendem Inferenz-Chip: insgesamt 800 Mio. $ Funding bei 5 Mrd. $ Post-Money-Bewertung, über 1 Mrd. $ an Kundenverträgen. Auf der Investorenliste stehen Karpathy, Hinton, Fei-Fei Li, Arthur Mensch und Scott Wu.
„Agentjacking” breitet sich aus: Der Angriff kapert einen Agenten über eine manipulierte Tool-Anbindung. Die MCP-Vertrauens-Schwachstelle, die ursprünglich über Sentry Claude Code kompromittierte (85 % Erfolgsquote in Tests, 2.388 exponierte Organisationen), betrifft laut Update dieselbe Architektur bei Datadog, PagerDuty und Jira. Die Cloud Security Alliance stuft es inzwischen als systemische MCP-Schwachstellenklasse ein.
X bietet jetzt einen gehosteten, read-only MCP-Server und reiht sich neben GitHub, Slack, Notion und Stripe ein — autonomes Posten ist nicht möglich.

Quellen

Der Staat und die Frontier-Modelle: Anthropic — Redeploying Fable 5 · Anthropic — Jailbreak Severity Framework · heise (EN) — US government lifts ban · OpenAI — GPT-5.6 Sol · VentureBeat — GPT-5.6 Preview · CNBC — OpenAI proposes 5% government stake · Forbes — OpenAI pitches US government 5% stake

Sonnet 5: Anthropic — Claude Sonnet 5 · TechCrunch — cheaper way to run agents · Simon Willison — Claude Sonnet 5 · Every — Vibe Check: Sonnet 5

Steganographie-Marker: The Register — Removing covert code

Claude Code: Changelog · v2.1.199 Release

Agentic Coding: GitHub Changelog — Kimi K2.7 in Copilot · GitHub Changelog

Trend der Woche: Pragmatic Engineer — Impressions from visiting OpenAI, Anthropic & Cursor · The New Stack — Godot bans AI coding agents · Addy Osmani — Agentic Autonomy Levels · Pragmatic Engineer — How Kent Beck shapes software

Tipp der Woche: Simon Willison — Judgement

Kurz notiert: AddisInsight — Jelani Nelson zu Anthropic · TechCrunch — Anthropic × Samsung Chip · DCD — Etched verlässt Stealth · Etched — Pressemitteilung (GlobeNewswire) · VentureBeat — Agentjacking spreads · TechCrunch — X MCP-Server

Das war Agentic Weekly #013. Danke fürs Lesen — die nächste Ausgabe kommt am Samstag, 11. Juli 2026.

Hinter Agentic Weekly steckt Martin Gross: wöchentlich ein kompakter, meinungsstarker Überblick zu Agentic Engineering, Agentic Coding und Claude Code.

Hat dir die Ausgabe gefallen? Leite sie gerne weiter oder empfiehl den Newsletter.

fluxum engineering

Diskussion über diese Post

Sind Sie bereit für mehr?