Agentic Weekly #008 — Anthropics großer Tag: Opus 4.8, 65 Milliarden und der Mythos-Start

Mai 30, 2026

Opus 4.8, die größte Finanzierungsrunde der Firmengeschichte und der öffentliche Mythos-Start — alles an einem 28. Mai; und während Cognition 48 Stunden zuvor eine zweite Milliardenrunde nachlegt, wird sichtbar, wohin das Kapital fließt: in die Schicht, die Code inzwischen selbst schreibt.

Samstag, 30. Mai 2026 — Lesezeit: ~7 Min.

Diesen Newsletter wöchentlich per Mail bekommen: blog.fluxum.net/s/agentic-weekly

Die große Nachricht der Woche

Anthropics großer Tag: ein Modell, 65 Milliarden und der Mythos-Start

Der 28. Mai war für Anthropic kein gewöhnlicher Release-Tag, sondern ein gebündelter Aufschlag: ein neues Frontier-Modell, die größte Finanzierungsrunde der Firmengeschichte und die Ankündigung, dass die nächste Modellgeneration in Kürze öffentlich wird — alles am selben Tag. Drei Bausteine lohnen den Blick.

Opus 4.8 — der Modell-Baustein.

Nur 42 Tage nach Opus 4.7 steht das nächste Flaggschiff. Auf SWE-bench Pro klettert Opus 4.8 auf 69,2 % (von 64,3 % bei 4.7), auf dem stärker gesättigten SWE-bench Verified auf 88,6 % — der größere Sprung liegt erwartbar auf dem härteren, weniger ausgereizten Set. Der 1-Million-Token-Context ist jetzt Default, die Preise bleiben mit $5 / $25 pro Mio. Tokens identisch zu 4.7, der Knowledge-Cutoff bleibt Januar 2026.

Der eigentliche Pitch ist aber nicht der Benchmark, sondern Ehrlichkeit: Opus 4.8 lässt laut Anthropic rund viermal seltener Fehler im selbst geschriebenen Code unmarkiert durchgehen als sein Vorgänger. Dazu kommen feinere Effort-Controls (bis /effort xhigh für die härtesten Aufgaben), und der Fast Mode kostet jetzt nur noch das Doppelte der Standardrate — statt wie bisher ein Vielfaches — bei 2,5-facher Geschwindigkeit.

Series H — der Kapital-Baustein.

Am selben Tag schließt Anthropic die größte Runde seiner Geschichte: $65 Mrd. eingesammelt, $965 Mrd. Post-Money-Bewertung — und überholt damit OpenAI als wertvollstes KI-Startup der Welt, knapp unter der Billionen-Marke und noch vor jedem IPO. Im Mai überschritt die Run-Rate-Revenue $47 Mrd. Co-Lead waren Altimeter, Dragoneer, Greenoaks und Sequoia; rund $15 Mrd. davon sind bereits zuvor zugesagte Hyperscaler-Investments. Auffällig ist, wofür das Geld reserviert ist: Compute-Verträge mit Amazon und einem Google-Broadcom-TPU-Verbund über jeweils 5 Gigawatt, dazu GPU-Kapazität von SpaceX. In #006 standen hier noch Gespräche im Raum — jetzt ist die Runde geschlossen, und deutlich größer.

Mythos — der Ausblick-Baustein.

Eingebettet in die Opus-Ankündigung meldet Anthropic „swift progress” bei den Safety-Safeguards und will „Mythos-class models” in den kommenden Wochen für alle Kunden freigeben. Opus 4.8 wird als Brücke positioniert — als Beleg, dass sich auch das schwächere Modell „honest enough to be safe” machen lässt.

Warum das relevant ist: Modell, Kapital und Sicherheits-Roadmap am selben Tag zu stapeln ist kein Zufall, sondern Signal. Anthropic koppelt die Botschaft „wir sind das wertvollste KI-Startup” direkt an „und wir liefern technisch” — und reserviert das frische Kapital sichtbar für Compute, die Ressource, an der die nächste Wettbewerbsrunde hängt.

Claude Code: Die Highlights der Woche

Für Multi-Agent-Workflows: Dynamic Workflows (Research Preview). Mit v2.1.154 schreibt Claude jetzt selbst Orchestrierungs-Skripte, die zehn bis hunderte Subagents parallel fahren — gedeckelt auf 16 gleichzeitig und 1.000 pro Lauf. Der Clou: Der Plan wandert in den Code statt in den Context, Zwischenergebnisse leben in Skript-Variablen. Ausgelöst wird das durch das Wort „workflow” im Prompt oder das Setting ultracode (= xhigh-Effort plus Auto-Orchestrierung plus Self-Verify). Als Beispiel führt Anthropic an, wie Bun-Autor Jarred Sumner Bun mit hunderten Agents von Zig nach Rust portierte — zwei Reviewer pro Datei. Verfügbar als Research Preview in CLI, Desktop und VS-Code für Max, Team und Enterprise. Das ist die nächste Stufe über klassische Multiagent-Orchestrierung: nicht mehr du orchestrierst die Agents, das Modell tut es.

Für alle, die Claude Code täglich nutzen: /code-review --fix (v2.1.152). Der in #007 eingeführte /code-review wendet seine Reuse-, Simplify- und Efficiency-Vorschläge jetzt direkt im Working Tree an, statt sie nur aufzulisten. Dazu öffnet / im NORMAL-Mode jetzt eine Reverse-History-Suche (wie Ctrl+R), und claude plugin marketplace remove versteht --scope user|project|local.

Agentic Coding

Cognition holt $1 Mrd. — und schreibt fast seinen ganzen Code selbst. Cognition ist die Firma hinter Devin, dem autonomen KI-„Software-Engineer”, der eigenständig Tickets von der Spec bis zum Pull Request abarbeitet; zu Cognition gehört zudem der Coding-Editor Windsurf. Zwei Tage vor Anthropics großem Tag sammelt das Unternehmen $1 Mrd. bei $26 Mrd. Bewertung ein (Series D, Co-Lead Lux Capital, General Catalyst, 8VC). Die eigentliche Schlagzeile steckt aber in einer Betriebszahl: mehr als 90 % des bei Cognition committeten Codes stammen inzwischen von Devin — im Dezember 2025 waren es noch 13 %. Die ARR sprang im selben Zeitraum von $37 Mio. auf $492 Mio. Kundenliste: Citi, Goldman Sachs, Mercedes-Benz, Dell, US Army und Navy. Ein Anbieter, der seine eigene These am eigenen Code vorführt.

Opus 4.8 am Launch-Tag in GitHub Copilot. Anthropics neues Modell war Tag eins in Copilot generell verfügbar (je nach Tier für Business, Enterprise und Pro). Bemerkenswert vor dem Hintergrund, dass Microsoft seine Claude-Code-Lizenzen einzieht (#007) — beim Modell greift man trotzdem sofort zu.

Codex CLI v0.134 und v0.135. OpenAI pflegt seine CLI im Tagestakt weiter: v0.134 bringt Conversation-History-Suche, --profile als kanonischen Selektor und per-Server-MCP-Env-Targeting; v0.135 ein codex doctor-Diagnose-Kommando (prüft Env, Git, Terminal, App-Server) sowie Vim-Text-Objects und benannte Profile in /permissions. Inkrementell, aber konsequent.

Trend der Woche

Async-Agents werden Normalbetrieb

Walden Yan von Cognition hat diese Woche einen Begriff geprägt, der die beiden Geld-Stories oben verbindet: „The Age of Async Agents”. Die Idee — Agents laufen nicht mehr interaktiv neben dir, sondern asynchron in eigenen Umgebungen, von Spec zu Pull Request, mit eigenem Gedächtnis, und der Mensch kommt erst beim Review wieder ins Spiel.

Diesen Sprung machen die Releases der Woche von zwei Seiten greifbar. Cognition zeigt am eigenen Betrieb, dass ein Agent den Großteil des produktiven Codes schreiben kann, wenn man ihn lässt. Und Anthropics Dynamic Workflows verlagern die Orchestrierung ins Modell: Wer hunderte Subagents fährt, plant nicht mehr jeden Schritt von Hand, sondern lässt Code den Plan halten.

Beides zusammen markiert die Verschiebung vom Agent-als-Assistent zum Agent-als-Default-Ausführungsschicht. Die spannende Frage der nächsten Quartale ist nicht mehr, ob Agents Code schreiben, sondern wie viel menschliche Aufsicht pro tausend Zeilen übrig bleibt — und ob die Review-Schicht damit Schritt hält.

Tipp der Woche

Skill Distillation — Tomasz Tunguz (Theory Ventures) beschreibt ein Teacher-Student-Setup, das gut zur Skills-Welt von Claude Code passt: Ein Frontier-Modell schreibt und testet SKILL.md-Playbooks, ein kleines lokales Modell (Qwen 35B, Gemma 26B) führt sie aus; ein nächtlicher Loop destilliert aus den Logs neue Skills. Das Ergebnis ist inspizierbar, versionierbar und hot-swappable — und es entkoppelt das institutionelle Wissen einer Firma vom jeweils teuersten Modell.

Warum das hier steht: Es dreht die übliche „das größte Modell”-Logik um — Skills werden zum dauerhaften Asset, das Modell zur austauschbaren Laufzeit. Wer Skills ohnehin pflegt, hat hier ein konkretes Muster, das sich übertragen lässt. Bezugspunkte: Pi (github.com/earendil-works/pi) und QMD (github.com/tobi/qmd).

Kurz notiert

Nachtrag: Google zeigte bereits am 19./20. Mai Gemini 3.5 Flash und Antigravity 2.0 — ein schnelleres, günstigeres Modell für Agents und Coding.
GitHub Copilot stellt Pro und Pro+ zum 1. Juni auf AI-Credits-Flex-Billing um — gleiche Preise ($10 / $39), neue Credit-Pools.
v2.1.156 (29. Mai) behebt einen Fehler, bei dem modifizierte Thinking-Blöcke unter Opus 4.8 zu API-Errors führten.

Quellen

Die große Nachricht der Woche: Anthropic — Opus 4.8 · Anthropic — Series H · TechCrunch · Simon Willison · The Register — Mythos · heise

Claude Code: DevelopersIO v2.1.154 · MarkTechPost · DevelopersIO v2.1.152 · Changelog

Agentic Coding: Bloomberg — Cognition · TheNextWeb · GitHub Changelog — Copilot · Codex Changelog

Trend der Woche: Latent Space — The Age of Async Agents

Tipp der Woche: tomtunguz.com

Kurz notiert: MarkTechPost — Gemini 3.5 Flash · GitHub Releases (v2.1.156)

Nächste Ausgabe: Samstag, 6. Juni 2026.

Feedback? Einfach kommentieren/antworten.

Diesen Newsletter regelmäßig lesen — per Mail?
Vollständige Ausgaben mit allen Quellen, direkt in dein Postfach.
Auf blog.fluxum.net abonnieren

fluxum engineering

Diskussion über diese Post

Sind Sie bereit für mehr?