<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:googleplay="http://www.google.com/schemas/play-podcasts/1.0"><channel><title><![CDATA[fluxum engineering: Agentic Weekly]]></title><description><![CDATA["Agentic Weekly" Newsletter — wöchentlicher Überblick zu Agentic Engineering, Agentic Coding & Claude Code.]]></description><link>https://blog.fluxum.net/s/agentic-weekly</link><image><url>https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png</url><title>fluxum engineering: Agentic Weekly</title><link>https://blog.fluxum.net/s/agentic-weekly</link></image><generator>Substack</generator><lastBuildDate>Wed, 17 Jun 2026 03:58:42 GMT</lastBuildDate><atom:link href="https://blog.fluxum.net/feed" rel="self" type="application/rss+xml"/><copyright><![CDATA[Martin Gross]]></copyright><language><![CDATA[de]]></language><webMaster><![CDATA[fluxum@substack.com]]></webMaster><itunes:owner><itunes:email><![CDATA[fluxum@substack.com]]></itunes:email><itunes:name><![CDATA[Martin Gross]]></itunes:name></itunes:owner><itunes:author><![CDATA[Martin Gross]]></itunes:author><googleplay:owner><![CDATA[fluxum@substack.com]]></googleplay:owner><googleplay:email><![CDATA[fluxum@substack.com]]></googleplay:email><googleplay:author><![CDATA[Martin Gross]]></googleplay:author><itunes:block><![CDATA[Yes]]></itunes:block><item><title><![CDATA[Agentic Weekly #009 — Anthropic geht aufs Parkett, Microsoft baut eigene Modelle, der Zähler läuft]]></title><description><![CDATA[Anthropic reicht S-1 ein, Microsoft stellt sieben eigene MAI-Modelle gegen die Anthropic-Abh&#228;ngigkeit, und Uber deckelt das KI-Budget bei $1.500 pro Tool &#8212; die Woche, in der das Coding-Layer erwachsen wird und die subventionierte Gratis-Schleife endet.]]></description><link>https://blog.fluxum.net/p/agentic-weekly-009-anthropic-geht</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-009-anthropic-geht</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Sat, 06 Jun 2026 12:47:32 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!zRcZ!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><strong>Anthropic reicht S-1 ein, Microsoft stellt sieben eigene MAI-Modelle gegen die Anthropic-Abh&#228;ngigkeit, und Uber deckelt das KI-Budget bei $1.500 pro Tool &#8212; die Woche, in der das Coding-Layer erwachsen wird und die subventionierte Gratis-Schleife endet.</strong></p><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!zRcZ!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!zRcZ!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!zRcZ!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!zRcZ!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!zRcZ!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!zRcZ!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png" width="1456" height="819" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/c401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:819,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1776151,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/200885716?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!zRcZ!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!zRcZ!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!zRcZ!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!zRcZ!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fc401ab98-08e7-430e-99a9-e584efce5b3e_1672x941.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p>Samstag, 6. Juni 2026 &#8212; Lesezeit: ~8 Min.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">fluxum engineering ist eine von Leser unterst&#252;tzte Publikation. Um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen, ziehen Sie in Betracht, ein Free- oder Paid-Abonnent zu werden.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Der KI-Coding-Layer formiert sich</h3><p>An zwei aufeinanderfolgenden Tagen wird sichtbar, wie sich die Schicht, die Code schreibt, marktwirtschaftlich verfestigt: Anthropic bereitet den Gang an die B&#246;rse vor, Microsoft baut sich aus der Abh&#228;ngigkeit von fremden Modellen heraus. Zwei Achsen lohnen den Blick.</p><p><strong>Anthropic geht aufs Parkett</strong> &#8212; die Kapitalmarkt-Achse.</p><p>Am <strong>1. Juni</strong> hat Anthropic vertraulich einen Entwurf der <strong>Form S-1</strong> bei der SEC eingereicht &#8212; der erste Schritt eines m&#246;glichen B&#246;rsengangs. Die Mitteilung ist betont n&#252;chtern (Rule 135): Zahl und Preis der Aktien stehen nicht fest, der Gang aufs Parkett &#8222;h&#228;ngt von Marktbedingungen und anderen Faktoren ab&#8221; und wird erst nach Abschluss der SEC-Pr&#252;fung zur Option.</p><p>Die Gr&#246;&#223;enordnung liefert die Berichterstattung, nicht Anthropic: Laut TechCrunch tr&#228;gt die Firma die rund <strong>$965 Mrd. Bewertung</strong> aus der Series H (#008) in das Verfahren, und die Run-Rate ist von <strong>$9 Mrd. Ende 2025 auf &#252;ber $47 Mrd.</strong> gesprungen. Das Bemerkenswerte ist weniger die Zahl als der Schritt selbst: Anthropic ist das erste Frontier-Lab, das den Weg an die &#246;ffentliche B&#246;rse formal er&#246;ffnet &#8212; vor OpenAI, vor xAI.</p><p><strong>Microsoft baut sich um Agents herum</strong> &#8212; die Stack-Achse.</p><p>Auf der <strong>Build 2026</strong> (2./3. Juni) stellt Microsoft <strong>sieben neue MAI-Modelle</strong> vor &#8212; und das Signal sitzt in der Positionierung. Das Coding-Flaggschiff <strong>MAI-Code-1-Flash</strong> ist ein bewusst kleines Modell (5 Mrd. aktive Parameter), das Microsoft als &#8222;comparable to Haiku but cheaper&#8221; beschreibt &#8212; also gegen Anthropics <em>g&#252;nstigstes</em> Modell, nicht gegen die Spitze. Es ist im Copilot-Model-Picker in VS Code w&#228;hlbar, vorerst als limitierter Rollout.</p><p>Das zieht sich durch die Modellfamilie: Das neue Reasoning-Modell <strong>MAI-Thinking-1</strong> wird laut Microsoft &#8222;in blind side-by-sides&#8221; gegen&#252;ber <strong>Sonnet 4.6</strong> bevorzugt &#8212; Anthropics Mittelklasse. Ein Head-to-Head gegen GPT-5.5, Opus 4.8 oder Gemini taucht nirgends auf. Microsoft baut hier kein Frontier-Modell, sondern die billige Arbeitspferd-Schicht: effizienz-first (das Excel-getunte MAI &#8222;matches GPT-5.4 while being up to 10&#215; more efficient&#8221;), w&#228;hrend die Spitze weiter eingekauft wird &#8212; Opus und GPT bleiben in Copilot w&#228;hlbar.</p><p>Dazu zwei Bausteine, die zeigen, wie ernst der Umbau ist. <strong>Rayfin</strong> ist ein Open-Source-Backend-as-a-Service, mit dem Entwickler <em>und</em> Coding-Agents ein komplettes App-Backend in Code definieren und nach <strong>Microsoft Fabric</strong> deployen &#8212; Microsofts Br&#252;cke von &#8222;Vibe Coding&#8221; zur produktionstauglichen App (Launch-Partner: Replit). Und die <strong>GitHub Copilot App</strong> (Desktop-Preview) startet aus einer Idee heraus mehrere Agent-Sessions parallel. Nadella klammert das unter eine angek&#252;ndigte &#8222;Copilot Super App&#8221; aus Chat, Cowork und Code.</p><p><strong>Warum das relevant ist:</strong> CNBC brachte die Woche auf die Formel, Microsoft und Google seien &#8222;late to AI coding&#8221; &#8212; und genau das adressiert Build. Microsoft reduziert mit eigenen Modellen die Abh&#228;ngigkeit von OpenAI und Anthropic, ohne den Anspruch zu erheben, die Frontier zu schlagen; die Strategie ist Kosten und Kontrolle, nicht Capability-Maximierung.</p><div><hr></div><h2>Project Glasswing skaliert auf kritische Infrastruktur</h2><p>Am <strong>2. Juni</strong> weitet Anthropic <strong>Project Glasswing</strong> drastisch aus: rund <strong>150 neue Organisationen</strong> in mehr als <strong>15 L&#228;ndern</strong> kommen hinzu &#8212; Power, Water, Healthcare, Communications und Hardware-Hersteller. Damit sind rund <strong>200 Organisationen</strong> an Bord. Die bisherigen Partner haben mit der <strong>Claude Mythos Preview</strong> <strong>mehr als 10.000 high- oder critical-severity-Schwachstellen</strong> gefunden. Anthropic sch&#228;tzt, dass bei den meisten dieser Partner ein gr&#246;&#223;erer Angriff <strong>&#252;ber 100 Millionen Menschen</strong> treffen k&#246;nnte.</p><p>Das ist der Skalierungs-Beleg f&#252;r die Mythos-Linie: Was in #007 als &#246;ffentlicher Disclosure-Z&#228;hler startete, wird hier zum Programm f&#252;r kritische Infrastruktur. Flankierend macht Anthropic <strong>Claude Security</strong> allgemein verf&#252;gbar &#8212; bisher als &#8222;Claude Code Security&#8221; in Limited Preview, jetzt GA f&#252;r Enterprise. Geplante und gezielte Scans, Audit-Integration, ein Confidence-Rating pro Finding und mehrstufige Validierung gegen False Positives sollen den Weg vom Scan zum eingespielten Patch &#8222;in einem Sitting&#8221; tragen. Die Offensiv-Seite (Mythos findet L&#252;cken) und die Defensiv-Seite (Security patcht sie) werden damit zur selben Produktlinie.</p><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Mehrere Releases zwischen 29. Mai und 6. Juni, von <strong>v2.1.157 bis v2.1.167</strong>. Schwerpunkt: Plugin-Autoloading, Ausfallsicherheit und Enterprise-Versionskontrolle.</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><code>fallbackModel</code><strong> &#8212; sanfte Degradierung bei &#220;berlast</strong> (v2.1.166, 6. Juni) &#8212; Ein neues Setting konfiguriert bis zu drei Fallback-Modelle, die der Reihe nach versucht werden, wenn das prim&#228;re Modell &#252;berlastet oder nicht erreichbar ist; <code>--fallback-model</code> greift jetzt in interaktiven Sessions, und Claude wiederholt einen Turn auf dem Fallback, wenn die API einen unerwarteten Fehler wirft. F&#252;r alle, die produktiv auf Opus angewiesen sind und Peak-Hour-Ausf&#228;lle kennen, ist das der bisher fehlende Resilienz-Baustein.</p><p><code>/plugin list</code><strong> mit Filtern</strong> (v2.1.163, 4. Juni) &#8212; Listet installierte Plugins mit <code>--enabled</code>/<code>--disabled</code>. Dazu kleine Alltagshilfen: <code>c</code> kopiert die Markdown-Antwort aus <code>/btw</code>, Hooks k&#246;nnen &#252;ber <code>hookSpecificOutput.additionalContext</code> Kontext zur&#252;ckgeben.</p><h3>F&#252;r Plugin- und Skill-Workflows</h3><p><strong>Plugins laden automatisch aus </strong><code>.claude/skills</code> (v2.1.157, 29. Mai) &#8212; Plugins in <code>.claude/skills</code>-Verzeichnissen werden jetzt ohne Marketplace geladen, <code>claude plugin init &lt;name&gt;</code> scaffoldet ein neues Plugin direkt, und die Autocomplete kennt <code>/plugin</code>-Subkommandos sowie installierte Plugin-Namen. Die H&#252;rde, eigene Skills zu paketieren und zu teilen, sinkt damit weiter &#8212; passend zur Skill-Welle der letzten Wochen.</p><h3>F&#252;r CI/CD und Plattform</h3><p><strong>Auto Mode auf Bedrock, Vertex und Foundry</strong> (v2.1.158, 30. Mai) &#8212; Der Auto Mode ist jetzt auf allen drei Enterprise-Cloud-Tiers verf&#252;gbar (f&#252;r Opus 4.7 und 4.8), Opt-in via <code>CLAUDE_CODE_ENABLE_AUTO_MODE=1</code>. Damit ist das Setup f&#252;r Cloud-gebundene Enterprise-Kunden geschlossen.</p><p><strong>Versionskontrolle und geh&#228;rtetes Cross-Session-Messaging</strong> (v2.1.163 / v2.1.166) &#8212; Neue Managed Settings <code>requiredMinimumVersion</code> und <code>requiredMaximumVersion</code> erlauben Org-Admins, die erlaubte Claude-Code-Version zu pinnen. Sicherheitsseitig tragen &#252;ber <code>SendMessage</code> weitergereichte Nachrichten zwischen Sessions keine User-Autorit&#228;t mehr &#8212; eine ganze Klasse von Privilege-Confusion-Bugs in Multi-Agent-Setups f&#228;llt damit weg.</p><div><hr></div><h2>Agentic Coding</h2><p><strong>Cursor 3.7</strong> (4. Juni) &#8212; Zwei Neuerungen tragen die Story, nachdem Composer 2.5 zuletzt im Mittelpunkt stand. Der <strong>Design Mode f&#252;r Canvas</strong> l&#228;sst UI-Elemente direkt im Canvas selektieren und annotieren, statt sie in Prosa zu beschreiben &#8212; der Agent bekommt die &#196;nderung gezeigt, nicht erz&#228;hlt. Und der <strong>Context Explorer</strong> macht sichtbar, wie sich die Tokens auf System-Prompt, Tool-Definitionen, Rules und Skills verteilen &#8212; eine direkte Antwort auf das Context-Visibility-Problem, das Power-User seit Monaten umtreibt. Dazu: <strong>Organizations</strong> f&#252;r Enterprise sind GA, und <strong>Bugbot</strong> wechselt von der Seat-Fee auf Usage-Based Billing.</p><p><strong>Windsurf wird Devin Desktop</strong> (2. Juni) &#8212; Cognition integriert die Windsurf-&#220;bernahme operativ: Beim Rebrand ersetzt <strong>Devin Local</strong> das bisherige Cascade als Default-Surface, das Agent Command Center wird zur Startfl&#228;che, und <strong>ACP</strong> (Agent Client Protocol) ist an Bord. Parallel kommt <strong>Devin 2.2</strong> mit Self-Verify, Auto-Fix und Computer-Use f&#252;r Test-Workflows. Der Anbieter, der 90 % seines eigenen Codes von Devin schreiben l&#228;sst, baut die Oberfl&#228;che konsequent um den Agenten herum, nicht umgekehrt.</p><p><strong>Codex Sites &#8212; und ein Muster, das diese Woche dreimal auftaucht</strong> (Preview) &#8212; OpenAI gibt Codex eine Deploy-Schicht: Aus dem Codex heraus lassen sich Sites, Dashboards und interne Tools erstellen und ausspielen, der Schritt nach drau&#223;en zu eigener Infrastruktur entf&#228;llt (vorerst Preview). Das ist kein Einzelfall: Microsofts Rayfin &#8594; Fabric (siehe oben) und Anthropics self-hosted Sandboxes vom Mai gehen in dieselbe Richtung. Drei Frontier-Anbieter, eine Woche, dieselbe Bewegung &#8212; vom Modell zur vollst&#228;ndigen, &#246;kosystem-internen Wertsch&#246;pfungskette. Der Effekt ist Bindung durch reduzierte Reibung: Der Workflow muss das Haus nicht mehr verlassen.</p><div><hr></div><h2>Trend der Woche</h2><h3>Usage-Based Billing wird zum Normalbetrieb</h3><p>Drei Bewegungen dieser Woche markieren das Ende der subventionierten Gratis-Schleife &#8212; und sie verbinden sich zu einer These: Wer Agents im gro&#223;en Stil laufen l&#228;sst, zahlt ab jetzt nach Verbrauch.</p><p><strong>Uber</strong> liefert die Schlagzeile. Nachdem das Unternehmen sein gesamtes Jahres-KI-Budget in vier Monaten verbrannt hatte, deckelt es das Tool-Spending auf <strong>$1.500 pro Mitarbeiter pro Tool und Monat</strong> &#8212; getrennt je Werkzeug (Claude Code und Cursor z&#228;hlen separat), &#252;berschreitbar nur mit Genehmigung. Das ist die erste konkrete Cap-Zahl eines b&#246;rsennotierten Gro&#223;konzerns, und sie wird der Benchmark, an dem sich andere messen.</p><p><strong>GitHub</strong> zieht strukturell nach: Zum 1. Juni stellt Copilot auf Usage-Based Billing um &#8212; alle Pl&#228;ne migrieren auf AI-Credits, dazu ein neuer <strong>Copilot Max</strong> f&#252;r $100/Monat f&#252;r anhaltende agentische Workflows. Und <strong>Anthropic</strong> zieht ab dem 15. Juni eine Trennlinie durch die eigenen Abos: Programmatische Nutzung (Agent SDK, <code>claude -p</code>, GitHub Actions, Third-Party-Apps) wandert aus dem Subscription-Pool in einen separaten, zu API-Preisen abgerechneten Credit Pool &#8212; der interaktive Gebrauch (claude.ai, Claude Code interaktiv, Cowork) bleibt unver&#228;ndert.</p><p>Damit bekommt das Token-Spend-Problem, das <em>Pragmatic Engineer</em> in #005 als erstes vermessen hat, seine &#246;konomische Antwort. Die Logik der drei Bewegungen ist dieselbe: Interaktives Arbeiten am Menschen bleibt im Flatrate-Komfort, der Dauerlauf im Hintergrund bekommt einen Z&#228;hler. Wer Async-Agents als Default-Ausf&#252;hrungsschicht plant, muss diese Rechnung jetzt explizit aufmachen &#8212; die Frage ist nicht mehr <em>ob</em> der Loop l&#228;uft, sondern was er pro Monat kostet.</p><div><hr></div><h2>Tipp der Woche</h2><p><strong>Best Claude Code Plugins, June 2026</strong> &#8212; Composio hat eine annotierte &#220;bersicht der meistgenutzten Claude-Code-Plugins ver&#246;ffentlicht (1. Juni), sortiert nach Installs: <strong>Frontend Design</strong> (829k), <strong>Superpowers</strong> (752k), <strong>Context7</strong> (349k), dazu Code Review, Code Simplifier und Skill Creator. Statt &#8222;installier alles&#8221; r&#228;t der Beitrag zu einem fokussierten Stack je Workflow.</p><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Claude Partner Network</strong> (3. Juni) &#8212; Services Track plus Partner Hub, $100 Mio. in Partner-Training. Seit M&#228;rz &#252;ber <strong>40.000 Bewerbungen</strong> und mehr als <strong>10.000 Claude-zertifizierte Consultants</strong>. Der Hub zeigt den Tier-Status t&#228;glich aktualisiert &#8212; die Vertriebsmaschine, die unter dem IPO-Filing sichtbar wird.</p></li><li><p><strong>Codex CLI 0.137.0</strong> (4. Juni) &#8212; OpenAI iteriert im Tagestakt weiter: monatliche Credit-Limits f&#252;r Enterprise, Remote-Control-Pairing, Multi-Agent-v2-Verbesserungen. Inkrementell, aber konsequent.</p></li><li><p><strong>Vorschau: Code w/ Claude Tokyo</strong> (10./11. Juni) &#8212; Anthropics erste Entwicklerkonferenz im asiatisch-pazifischen Raum, Englisch mit japanischer Live-&#220;bersetzung, plus ein Extended-Tag f&#252;r Indie-Devs und Gr&#252;nder.</p></li></ul><div><hr></div><h2>Quellen</h2><p><strong>Die gro&#223;e Nachricht der Woche:</strong> <a href="https://www.anthropic.com/news/confidential-draft-s1-sec">Anthropic &#8212; Confidential S-1</a> &#183; <a href="https://techcrunch.com/2026/06/01/anthropic-files-to-go-public/">TechCrunch &#8212; IPO-Filing</a> &#183; <a href="https://www.cnbc.com/2026/06/01/microsoft-and-google-take-on-anthropic-and-openai-in-ai-coding-models.html">CNBC &#8212; late to AI coding</a> &#183; <a href="https://microsoft.ai/news/building-a-hillclimbing-machine-launching-seven-new-mai-models/">Microsoft AI &#8212; seven new MAI models</a> &#183; <a href="https://github.blog/changelog/2026-06-02-mai-code-1-flash-is-now-available-for-github-copilot/">GitHub Changelog &#8212; MAI-Code-1-Flash</a> &#183; <a href="https://www.heise.de/en/news/Microsoft-Build-2026-AI-development-with-under-and-for-Windows-11315701.html">heise &#8212; Microsoft Build 2026</a></p><p><strong>Project Glasswing:</strong> <a href="https://www.anthropic.com/news/expanding-project-glasswing">Anthropic &#8212; Expanding Project Glasswing</a> &#183; <a href="https://techcrunch.com/2026/06/02/anthropic-scales-claude-mythos-to-critical-infrastructure-in-15-countries/">TechCrunch &#8212; Glasswing in 15 countries</a> &#183; <a href="https://www.anthropic.com/news/claude-code-security">Anthropic &#8212; Claude Security</a></p><p><strong>Claude Code:</strong> <a href="https://code.claude.com/docs/en/changelog">Changelog</a> &#183; <a href="https://github.com/anthropics/claude-code/releases">Releases (GitHub)</a></p><p><strong>Agentic Coding:</strong> <a href="https://cursor.com/changelog">Cursor Changelog</a> &#183; <a href="https://aicoderscope.com/blog/windsurf-devin-desktop-rebrand-acp-2026/">AICoderscope &#8212; Windsurf Devin Desktop</a> &#183; <a href="https://cognition.ai/blog/introducing-devin-2-2">Devin 2.2</a> &#183; <a href="https://developers.openai.com/codex/changelog">Codex Changelog</a></p><p><strong>Trend der Woche:</strong> <a href="https://techcrunch.com/2026/06/02/uber-caps-employee-ai-spending-after-blowing-through-budget-in-four-months/">TechCrunch &#8212; Uber-Cap</a> &#183; <a href="https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/">GitHub Blog &#8212; Usage-Based Billing</a> &#183; <a href="https://the-decoder.com/claude-subscriptions-get-separate-budgets-for-programmatic-use-billed-at-full-api-prices/">The Decoder &#8212; Anthropic Subscription Credits</a></p><p><strong>Tipp der Woche:</strong> <a href="https://composio.dev/content/top-claude-code-plugins">Composio &#8212; Top Claude Code Plugins</a></p><p><strong>Kurz notiert:</strong> <a href="https://www.anthropic.com/news/services-track-partner-hub">Anthropic &#8212; Services Track &amp; Partner Hub</a> &#183; <a href="https://github.com/openai/codex/releases">Codex Releases (GitHub)</a> &#183; <a href="https://claude.com/code-with-claude/tokyo">Code w/ Claude Tokyo</a></p><div><hr></div><p>N&#228;chste Ausgabe: Samstag, 13. Juni 2026.</p><p><em>Feedback? Einfach kommentieren/antworten.</em></p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">fluxum engineering ist eine von Leser unterst&#252;tzte Publikation. Um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen, ziehen Sie in Betracht, ein Free- oder Paid-Abonnent zu werden.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #008 — Anthropics großer Tag: Opus 4.8, 65 Milliarden und der Mythos-Start]]></title><description><![CDATA[Opus 4.8, die gr&#246;&#223;te Finanzierungsrunde der Firmengeschichte und der &#246;ffentliche Mythos-Start &#8212; alles an einem 28.]]></description><link>https://blog.fluxum.net/p/agentic-weekly-008-anthropics-groer</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-008-anthropics-groer</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Sat, 30 May 2026 17:15:19 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!C5Nr!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><strong>Opus 4.8, die gr&#246;&#223;te Finanzierungsrunde der Firmengeschichte und der &#246;ffentliche Mythos-Start &#8212; alles an einem 28. Mai; und w&#228;hrend Cognition 48 Stunden zuvor eine zweite Milliardenrunde nachlegt, wird sichtbar, wohin das Kapital flie&#223;t: in die Schicht, die Code inzwischen selbst schreibt.</strong></p><p>Samstag, 30. Mai 2026 &#8212; Lesezeit: ~7 Min.</p><p><em>Diesen Newsletter w&#246;chentlich per Mail bekommen: <a href="https://blog.fluxum.net/s/agentic-weekly">blog.fluxum.net/s/agentic-weekly</a></em></p><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!C5Nr!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!C5Nr!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!C5Nr!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!C5Nr!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!C5Nr!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!C5Nr!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png" width="1456" height="819" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/17280526-830f-4e8a-8574-47495b77809e_1672x941.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:819,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1776151,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/199890117?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!C5Nr!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!C5Nr!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!C5Nr!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!C5Nr!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F17280526-830f-4e8a-8574-47495b77809e_1672x941.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p></p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Anthropics gro&#223;er Tag: ein Modell, 65 Milliarden und der Mythos-Start</h3><p>Der <strong>28. Mai</strong> war f&#252;r Anthropic kein gew&#246;hnlicher Release-Tag, sondern ein geb&#252;ndelter Aufschlag: ein neues Frontier-Modell, die gr&#246;&#223;te Finanzierungsrunde der Firmengeschichte und die Ank&#252;ndigung, dass die n&#228;chste Modellgeneration in K&#252;rze &#246;ffentlich wird &#8212; alles am selben Tag. Drei Bausteine lohnen den Blick.</p><p><strong>Opus 4.8</strong> &#8212; der Modell-Baustein.</p><p>Nur <strong>42 Tage</strong> nach Opus 4.7 steht das n&#228;chste Flaggschiff. Auf <strong>SWE-bench Pro</strong> klettert Opus 4.8 auf <strong>69,2 %</strong> (von 64,3 % bei 4.7), auf dem st&#228;rker ges&#228;ttigten <strong>SWE-bench Verified</strong> auf <strong>88,6 %</strong> &#8212; der gr&#246;&#223;ere Sprung liegt erwartbar auf dem h&#228;rteren, weniger ausgereizten Set. Der <strong>1-Million-Token-Context</strong> ist jetzt Default, die Preise bleiben mit <strong>$5 / $25 pro Mio. Tokens</strong> identisch zu 4.7, der Knowledge-Cutoff bleibt Januar 2026.</p><p>Der eigentliche Pitch ist aber nicht der Benchmark, sondern Ehrlichkeit: Opus 4.8 l&#228;sst laut Anthropic rund <strong>viermal seltener</strong> Fehler im selbst geschriebenen Code unmarkiert durchgehen als sein Vorg&#228;nger. Dazu kommen feinere <strong>Effort-Controls</strong> (bis <code>/effort xhigh</code> f&#252;r die h&#228;rtesten Aufgaben), und der Fast Mode kostet jetzt nur noch das Doppelte der Standardrate &#8212; statt wie bisher ein Vielfaches &#8212; bei 2,5-facher Geschwindigkeit.</p><p><strong>Series H</strong> &#8212; der Kapital-Baustein.</p><p>Am selben Tag schlie&#223;t Anthropic die <strong>gr&#246;&#223;te Runde seiner Geschichte: $65 Mrd. eingesammelt, $965 Mrd. Post-Money-Bewertung</strong> &#8212; und &#252;berholt damit OpenAI als wertvollstes KI-Startup der Welt, knapp unter der Billionen-Marke und noch vor jedem IPO. Im Mai &#252;berschritt die Run-Rate-Revenue <strong>$47 Mrd.</strong> Co-Lead waren Altimeter, Dragoneer, Greenoaks und Sequoia; rund <strong>$15 Mrd.</strong> davon sind bereits zuvor zugesagte Hyperscaler-Investments. Auff&#228;llig ist, wof&#252;r das Geld reserviert ist: Compute-Vertr&#228;ge mit Amazon und einem Google-Broadcom-TPU-Verbund &#252;ber jeweils 5 Gigawatt, dazu GPU-Kapazit&#228;t von SpaceX. In #006 standen hier noch Gespr&#228;che im Raum &#8212; jetzt ist die Runde geschlossen, und deutlich gr&#246;&#223;er.</p><p><strong>Mythos</strong> &#8212; der Ausblick-Baustein.</p><p>Eingebettet in die Opus-Ank&#252;ndigung meldet Anthropic &#8222;swift progress&#8221; bei den Safety-Safeguards und will &#8222;Mythos-class models&#8221; in den kommenden Wochen f&#252;r alle Kunden freigeben. Opus 4.8 wird als Br&#252;cke positioniert &#8212; als Beleg, dass sich auch das schw&#228;chere Modell &#8222;honest enough to be safe&#8221; machen l&#228;sst.</p><p><strong>Warum das relevant ist:</strong> Modell, Kapital und Sicherheits-Roadmap am selben Tag zu stapeln ist kein Zufall, sondern Signal. Anthropic koppelt die Botschaft &#8222;wir sind das wertvollste KI-Startup&#8221; direkt an &#8222;und wir liefern technisch&#8221; &#8212; und reserviert das frische Kapital sichtbar f&#252;r Compute, die Ressource, an der die n&#228;chste Wettbewerbsrunde h&#228;ngt.</p><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p><strong>F&#252;r Multi-Agent-Workflows: Dynamic Workflows (Research Preview).</strong> Mit v2.1.154 schreibt Claude jetzt selbst Orchestrierungs-Skripte, die zehn bis hunderte Subagents parallel fahren &#8212; gedeckelt auf <strong>16 gleichzeitig und 1.000 pro Lauf</strong>. Der Clou: Der Plan wandert in den Code statt in den Context, Zwischenergebnisse leben in Skript-Variablen. Ausgel&#246;st wird das durch das Wort &#8222;workflow&#8221; im Prompt oder das Setting <code>ultracode</code> (= xhigh-Effort plus Auto-Orchestrierung plus Self-Verify). Als Beispiel f&#252;hrt Anthropic an, wie Bun-Autor <strong>Jarred Sumner</strong> Bun mit hunderten Agents von Zig nach Rust portierte &#8212; zwei Reviewer pro Datei. Verf&#252;gbar als Research Preview in CLI, Desktop und VS-Code f&#252;r Max, Team und Enterprise. Das ist die n&#228;chste Stufe &#252;ber klassische Multiagent-Orchestrierung: nicht mehr du orchestrierst die Agents, das Modell tut es.</p><p><strong>F&#252;r alle, die Claude Code t&#228;glich nutzen: </strong><code>/code-review --fix</code><strong> (v2.1.152).</strong> Der in #007 eingef&#252;hrte <code>/code-review</code> wendet seine Reuse-, Simplify- und Efficiency-Vorschl&#228;ge jetzt direkt im Working Tree an, statt sie nur aufzulisten. Dazu &#246;ffnet <code>/</code> im NORMAL-Mode jetzt eine Reverse-History-Suche (wie Ctrl+R), und <code>claude plugin marketplace remove</code> versteht <code>--scope user|project|local</code>.</p><div><hr></div><h2>Agentic Coding</h2><p><strong>Cognition holt $1 Mrd. &#8212; und schreibt fast seinen ganzen Code selbst.</strong> <strong>Cognition</strong> ist die Firma hinter <strong>Devin</strong>, dem autonomen KI-&#8222;Software-Engineer&#8221;, der eigenst&#228;ndig Tickets von der Spec bis zum Pull Request abarbeitet; zu Cognition geh&#246;rt zudem der Coding-Editor <strong>Windsurf</strong>. Zwei Tage vor Anthropics gro&#223;em Tag sammelt das Unternehmen <strong>$1 Mrd. bei $26 Mrd. Bewertung</strong> ein (Series D, Co-Lead Lux Capital, General Catalyst, 8VC). Die eigentliche Schlagzeile steckt aber in einer Betriebszahl: <strong>mehr als 90 % des bei Cognition committeten Codes stammen inzwischen von Devin</strong> &#8212; im Dezember 2025 waren es noch 13 %. Die ARR sprang im selben Zeitraum von $37 Mio. auf <strong>$492 Mio.</strong> Kundenliste: Citi, Goldman Sachs, Mercedes-Benz, Dell, US Army und Navy. Ein Anbieter, der seine eigene These am eigenen Code vorf&#252;hrt.</p><p><strong>Opus 4.8 am Launch-Tag in GitHub Copilot.</strong> Anthropics neues Modell war Tag eins in Copilot generell verf&#252;gbar (je nach Tier f&#252;r Business, Enterprise und Pro). Bemerkenswert vor dem Hintergrund, dass Microsoft seine Claude-Code-Lizenzen einzieht (#007) &#8212; beim Modell greift man trotzdem sofort zu.</p><p><strong>Codex CLI v0.134 und v0.135.</strong> OpenAI pflegt seine CLI im Tagestakt weiter: v0.134 bringt Conversation-History-Suche, <code>--profile</code> als kanonischen Selektor und per-Server-MCP-Env-Targeting; v0.135 ein <code>codex doctor</code>-Diagnose-Kommando (pr&#252;ft Env, Git, Terminal, App-Server) sowie Vim-Text-Objects und benannte Profile in <code>/permissions</code>. Inkrementell, aber konsequent.</p><div><hr></div><h2>Trend der Woche</h2><h3>Async-Agents werden Normalbetrieb</h3><p>Walden Yan von Cognition hat diese Woche einen Begriff gepr&#228;gt, der die beiden Geld-Stories oben verbindet: &#8222;The Age of Async Agents&#8221;. Die Idee &#8212; Agents laufen nicht mehr interaktiv neben dir, sondern asynchron in eigenen Umgebungen, von Spec zu Pull Request, mit eigenem Ged&#228;chtnis, und der Mensch kommt erst beim Review wieder ins Spiel.</p><p>Diesen Sprung machen die Releases der Woche von zwei Seiten greifbar. Cognition zeigt am eigenen Betrieb, dass ein Agent den Gro&#223;teil des produktiven Codes schreiben kann, wenn man ihn l&#228;sst. Und Anthropics Dynamic Workflows verlagern die Orchestrierung ins Modell: Wer hunderte Subagents f&#228;hrt, plant nicht mehr jeden Schritt von Hand, sondern l&#228;sst Code den Plan halten.</p><p>Beides zusammen markiert die Verschiebung vom Agent-als-Assistent zum Agent-als-Default-Ausf&#252;hrungsschicht. Die spannende Frage der n&#228;chsten Quartale ist nicht mehr, ob Agents Code schreiben, sondern wie viel menschliche Aufsicht pro tausend Zeilen &#252;brig bleibt &#8212; und ob die Review-Schicht damit Schritt h&#228;lt.</p><div><hr></div><h2>Tipp der Woche</h2><p><strong>Skill Distillation</strong> &#8212; Tomasz Tunguz (Theory Ventures) beschreibt ein Teacher-Student-Setup, das gut zur Skills-Welt von Claude Code passt: Ein Frontier-Modell schreibt und testet <code>SKILL.md</code>-Playbooks, ein kleines lokales Modell (Qwen 35B, Gemma 26B) f&#252;hrt sie aus; ein n&#228;chtlicher Loop destilliert aus den Logs neue Skills. Das Ergebnis ist inspizierbar, versionierbar und hot-swappable &#8212; und es entkoppelt das institutionelle Wissen einer Firma vom jeweils teuersten Modell.</p><p><em>Warum das hier steht:</em> Es dreht die &#252;bliche &#8222;das gr&#246;&#223;te Modell&#8221;-Logik um &#8212; Skills werden zum dauerhaften Asset, das Modell zur austauschbaren Laufzeit. Wer Skills ohnehin pflegt, hat hier ein konkretes Muster, das sich &#252;bertragen l&#228;sst. Bezugspunkte: Pi (<code>github.com/earendil-works/pi</code>) und QMD (<code>github.com/tobi/qmd</code>).</p><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Nachtrag:</strong> Google zeigte bereits am 19./20. Mai <strong>Gemini 3.5 Flash</strong> und <strong>Antigravity 2.0</strong> &#8212; ein schnelleres, g&#252;nstigeres Modell f&#252;r Agents und Coding.</p></li><li><p><strong>GitHub Copilot</strong> stellt Pro und Pro+ zum <strong>1. Juni</strong> auf AI-Credits-Flex-Billing um &#8212; gleiche Preise ($10 / $39), neue Credit-Pools.</p></li><li><p><strong>v2.1.156</strong> (29. Mai) behebt einen Fehler, bei dem modifizierte Thinking-Bl&#246;cke unter Opus 4.8 zu API-Errors f&#252;hrten.</p></li></ul><div><hr></div><h2>Quellen</h2><p><strong>Die gro&#223;e Nachricht der Woche:</strong> <a href="https://www.anthropic.com/news/claude-opus-4-8">Anthropic &#8212; Opus 4.8</a> &#183; <a href="https://www.anthropic.com/news/series-h">Anthropic &#8212; Series H</a> &#183; <a href="https://techcrunch.com/2026/05/28/anthropic-raises-65-billion-nears-1t-valuation-ahead-of-ipo/">TechCrunch</a> &#183; <a href="https://simonwillison.net/2026/May/28/claude-opus-4-8/">Simon Willison</a> &#183; <a href="https://www.theregister.com/security/2026/05/25/anthropic-to-release-mythos-class-models-to-the-public/">The Register &#8212; Mythos</a> &#183; <a href="https://www.heise.de/en/news/Anthropic-brings-more-honest-Claude-Opus-4-8-and-announces-Mythos-11310650.html">heise</a></p><p><strong>Claude Code:</strong> <a href="https://dev.classmethod.jp/en/articles/20260529-claude-code-updates-v2-1-154/">DevelopersIO v2.1.154</a> &#183; <a href="https://www.marktechpost.com/2026/05/28/anthropic-ships-claude-opus-4-8-alongside-dynamic-workflows-and-cheaper-fast-mode-with-workflows-capped-at-1000-subagents/">MarkTechPost</a> &#183; <a href="https://dev.classmethod.jp/en/articles/20260524-claude-code-updates-v2-1-152/">DevelopersIO v2.1.152</a> &#183; <a href="https://code.claude.com/docs/en/changelog">Changelog</a></p><p><strong>Agentic Coding:</strong> <a href="https://www.bloomberg.com/news/articles/2026-05-27/ai-coding-startup-cognition-raises-1-billion-at-26-billion-value">Bloomberg &#8212; Cognition</a> &#183; <a href="https://thenextweb.com/news/cognition-just-raised-1-billion-at-a-26-billion-valuation-and-90-of-its-own-code-is-written-by-its-ai">TheNextWeb</a> &#183; <a href="https://github.blog/changelog/2026-05-28-claude-opus-4-8-is-generally-available-for-github-copilot/">GitHub Changelog &#8212; Copilot</a> &#183; <a href="https://developers.openai.com/codex/changelog">Codex Changelog</a></p><p><strong>Trend der Woche:</strong> <a href="https://www.latent.space/">Latent Space &#8212; The Age of Async Agents</a></p><p><strong>Tipp der Woche:</strong> <a href="https://www.tomtunguz.com/the-pi-agent-skill-distillation/">tomtunguz.com</a></p><p><strong>Kurz notiert:</strong> <a href="https://www.marktechpost.com/2026/05/20/google-introduces-gemini-3-5-flash-at-i-o-2026-a-faster-and-cheaper-model-for-ai-agents-and-coding/">MarkTechPost &#8212; Gemini 3.5 Flash</a> &#183; <a href="https://github.com/anthropics/claude-code/releases">GitHub Releases (v2.1.156)</a></p><div><hr></div><p>N&#228;chste Ausgabe: Samstag, 6. Juni 2026.</p><p><em>Feedback? Einfach kommentieren/antworten.</em></p><div><hr></div><blockquote><p><strong>Diesen Newsletter regelm&#228;&#223;ig lesen &#8212; per Mail?</strong></p><p>Vollst&#228;ndige Ausgaben mit allen Quellen, direkt in dein Postfach.</p><p><a href="https://blog.fluxum.net/s/agentic-weekly">Auf blog.fluxum.net abonnieren</a></p></blockquote>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #007 — Karpathy zu Anthropic, Stainless im Konzern, Cursor schlägt mit Composer 2.5 zurück]]></title><description><![CDATA[Anthropic baut die Plattform breiter aus &#8212; Karpathy ins Pretraining-Team, Stainless gekauft, in London Sandboxes und MCP-Tunnel &#8212; und Cursor unterbietet die Premium-Preise mit Composer 2.5 um den Faktor 60.]]></description><link>https://blog.fluxum.net/p/agentic-weekly-007-karpathy-zu-anthropic</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-007-karpathy-zu-anthropic</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Sat, 23 May 2026 17:31:00 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!84vX!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><strong>Anthropic baut die Plattform breiter aus &#8212; Karpathy ins Pretraining-Team, Stainless gekauft, in London Sandboxes und MCP-Tunnel &#8212; und Cursor unterbietet die Premium-Preise mit Composer 2.5 um den Faktor 60.</strong></p><p>Samstag, 23. Mai 2026 &#8212; Lesezeit: ~12 Min.</p><p><em>Diesen Newsletter w&#246;chentlich per Mail bekommen: <a href="https://blog.fluxum.net/s/agentic-weekly">blog.fluxum.net/s/agentic-weekly</a></em></p><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!84vX!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!84vX!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!84vX!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!84vX!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!84vX!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!84vX!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png" width="1456" height="819" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:819,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:2093165,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/199891640?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!84vX!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!84vX!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!84vX!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!84vX!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F738194e5-b6b9-402f-b862-f0e789e22efb_1672x941.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p></p>
      <p>
          <a href="https://blog.fluxum.net/p/agentic-weekly-007-karpathy-zu-anthropic">
              Read more
          </a>
      </p>
   ]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #006 — Anthropic schaltet hoch: Dreaming, Doppellimits und 300 MW von SpaceX]]></title><description><![CDATA[Eine Konferenz, drei neue Agent-Bausteine und der Deal, der vor einer Woche noch undenkbar war &#8212; Anthropic kauft sich diese Woche aus dem Compute-Engpass frei.]]></description><link>https://blog.fluxum.net/p/agentic-weekly-006-anthropic-schaltet</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-006-anthropic-schaltet</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Sat, 16 May 2026 11:55:33 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!loxo!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!loxo!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!loxo!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!loxo!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!loxo!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!loxo!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!loxo!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png" width="1456" height="819" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:819,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1776151,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/197985406?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!loxo!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!loxo!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!loxo!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!loxo!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p></p><h3>Code with Claude 2026 &#8212; Agents lernen tr&#228;umen, Limits fallen, Musk liefert Strom</h3><p>Am 6. Mai hat Anthropic in San Francisco <strong>Code with Claude 2026</strong> veranstaltet &#8212; die zweite Auflage der Entwicklerkonferenz und zugleich einer der dichtesten Produktrelease-Tage, die Anthropic bisher hatte.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um ne&#8230;</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>
      <p>
          <a href="https://blog.fluxum.net/p/agentic-weekly-006-anthropic-schaltet">
              Read more
          </a>
      </p>
   ]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #005 — Long-running Agents werden zur Architektur, Token-Budgets brechen weg]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-005-long-running-agents</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-005-long-running-agents</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 07 May 2026 19:59:58 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!s2EH!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!s2EH!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!s2EH!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!s2EH!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png" width="1456" height="819" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:819,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1776151,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/196823642?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!s2EH!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p>7.Mai 2026 &#8212; Lesezeit: ~6 Min.</p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Long-running Agents bekommen ihre Architektur &#8212; Brain, Hands, Session</h3><p>Am 30. April hat <strong>Addy Osmani</strong> in einem Long-Read sortiert, was unter &#8222;long-running agents&#8221; eigentlich gemeint ist &#8212; und dabei die Architektur sichtbar gemacht, auf die unabh&#228;ngig voneinander Anthropic, Cursor und Google zulaufen. Drei verschiedene Bedeutungen, sauber getrennt: <strong>Long-horizon reasoning</strong> (Modellqualit&#228;t &#8212; die METR-Metrik f&#252;rs erfolgreich abgeschlossene Task-Horizon verdoppelt sich seit 2019 alle ~7 Monate, das j&#252;ngste TH1.1-Update hat die Anzahl der 8-Stunden-plus-Tasks im Eval-Set verdoppelt), <strong>long-running execution</strong> (das Modell wird hundert- bis tausendfach &#252;ber die Laufzeit aufgerufen) und <strong>persistent agency</strong> (Identit&#228;t &#252;ber Tasks hinweg).</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><p>Drei W&#228;nde, an die jeder Agent l&#228;uft: endlicher Context plus &#8222;context rot&#8221; (Degradation lange vor dem harten Limit), kein persistenter State (Anthropics eigenes Bild: &#8222;Engineers, die in Schichten arbeiten &#8212; jeder neue ohne Erinnerung an die vorige Schicht&#8221;) und keine verl&#228;ssliche Self-Verification (Modelle bewerten ihre eigene Arbeit konsistent zu positiv).</p><p>Spannender als die W&#228;nde ist die Konvergenz: Anthropics <strong>Brain / Hands / Session</strong>-Split, Cursors <strong>Planner / Worker / Judge</strong> und Googles <strong>Agent Runtime / Agent Sandbox / Agent Sessions</strong> sind drei Namen f&#252;r dasselbe Muster. Brain = Modell plus Harness-Loop. Hands = sandboxed, ephemere Execution-Umgebungen. Session = append-only Event-Log, das den Lauf rekonstruierbar macht. Praktisch hei&#223;t das: State wandert aus dem Modell-Context heraus ins Filesystem oder in eine Datenbank &#8212; die <code>Ralph Loop</code> von Geoffrey Huntley und Ryan Carson zeigt das in 30 Zeilen Bash mit <code>prd.json</code>, <code>progress.txt</code>, <code>AGENTS.md</code>. Anthropic berichtet aus internen Tests von <strong>30+ Stunden autonomem Coding</strong>, ein Lauf produzierte einen 11.000-Zeilen-Slack-Klon.</p><p><strong>Warum das relevant ist:</strong> Wer Agents jenseits der Stundenmarke baut, kommt um diesen Split nicht herum. Osmanis Test ist ehrlich: &#8222;If you can&#8217;t reconstruct what the agent did in the last 24 hours from durable storage, what you have is a long-running shell script that happens to call an LLM, not a long-running agent.&#8221; &#8212; Eine Ebene weiter raus zoomt <strong>Jack Clark</strong>, Anthropic-Mitgr&#252;nder, in <em>Import AI #455</em> (4. Mai): Er taxiert die Wahrscheinlichkeit auf 60+ %, dass AI-Systeme bis Ende 2028 autonom R&amp;D betreiben und ihre Nachfolger trainieren. SWE-Bench-Progression von ~2 % (Claude 2, Ende 2023) auf 93,9 % (Claude Mythos Preview); Task-Horizon von ~30 Sekunden 2022 auf ~12 Stunden 2026, Forecaster Ajeya Cotra projiziert ~100 Stunden bis Jahresende. Wer die Architektur-Arbeit dieser Woche zusammen mit Clarks Kurve liest, sieht, warum die Anthropic-K&#246;pfe die Zeitachse f&#252;r eng halten.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://addyo.substack.com/p/long-running-agents">Addy Osmani: Long-running agents &#8212; building the architecture for agents that work for hours, days, and weeks</a></p></li><li><p><a href="https://importai.substack.com/p/import-ai-455-automating-ai-research">Jack Clark / Import AI #455: AI systems are about to start building themselves</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Vier Releases in einer ruhigeren Woche: <strong>v2.1.126, v2.1.128, v2.1.129, v2.1.131</strong>. Schwerpunkt: Plugin-Distribution, OAuth-Polish, eine Reihe handfester Subprozess- und Cache-Fixes.</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><code>claude project purge</code><strong> ist da</strong> &#8212; v2.1.126 r&#228;umt alle Claude-Code-Spuren aus einem Projekt: Transcripts, Tasks, File-History, Config. Mit <code>--dry-run</code>, <code>--interactive</code>, <code>--all</code> f&#252;r mehrere Projekte. Vorher musste man drei Verzeichnisse von Hand kennen.</p><p><code>/context</code><strong> verschwendet keine Tokens mehr</strong> &#8212; v2.1.129 fixt einen alten &#196;rger: Der ASCII-Visualisierungs-Block landete bisher in der Konversation und kostete pro Aufruf rund 1.600 Tokens.</p><p><code>/model</code><strong> zeigt nur noch ein Opus-Eintrag</strong> &#8212; Die Doppelung &#8222;Opus 4.7&#8221; und &#8222;Opus&#8221; im Picker ist weg, der aktuelle Opus hei&#223;t jetzt schlicht &#8222;Opus&#8221; (v2.1.128).</p><h3>F&#252;r Plugin- und MCP-Workflows</h3><p><code>--plugin-url</code><strong> und </strong><code>--plugin-dir</code><strong> mit Zip</strong> &#8212; v2.1.128/129 erlauben das Laden von Plugin-Archiven direkt aus URL oder lokaler <code>.zip</code>. Saubere L&#246;sung f&#252;r Air-Gapped-Setups und ad-hoc-Tests, ohne Marketplace-Eintrag.</p><p><strong>MCP-Reconnects fluten die Konversation nicht mehr</strong> &#8212; v2.1.128: Wenn ein Server seine Tools re-announced, kommt nur noch eine Server-Prefix-Zusammenfassung statt der vollen Tool-Liste. Wer mit f&#252;nf+ MCP-Servern arbeitet, merkt das sofort.</p><p><code>/mcp</code><strong> zeigt Tool-Counts</strong> &#8212; v2.1.128 markiert Server mit 0 Tools &#8212; ein simpler Blick reicht jetzt, um stille Misskonfigurationen zu sehen.</p><h3>F&#252;r Performance und Plattform</h3><p><strong>Subagent-Summaries nutzen wieder Prompt-Cache</strong> &#8212; v2.1.128 fixt eine Regression, die <code>cache_creation</code> ungef&#228;hr verdreifacht hatte. Wer Subagents heavy nutzt, sollte den Token-Verbrauch nach dem Update direkt vergleichen.</p><p><strong>Parallel Tool-Calls brechen sich nicht mehr gegenseitig ab</strong> &#8212; Ein fehlgeschlagener Read-Only-Befehl (<code>grep</code>, <code>git diff</code>, <code>ls</code>) cancelte bisher die Geschwister-Calls. Behoben in v2.1.128.</p><p><strong>OAuth h&#228;rtet sich</strong> &#8212; Eine Race Condition zwischen Wake-from-Sleep und Token-Refresh, die laufende Sessions ausloggte, ist gefixt (v2.1.129). Au&#223;erdem: <code>claude auth login</code> akzeptiert jetzt einen OAuth-Code per Paste, wenn der Browser-Callback localhost nicht erreicht (v2.1.126) &#8212; endlich sauber f&#252;r WSL2, SSH-Sessions, DevContainer.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code Mai 2026</a></p></li></ul><div><hr></div><h2>Agentic Coding: Cursor mit eigenem SDK und Security-Review, Codex baut Plugin-Disziplin aus</h2><p><strong>Cursor SDK</strong> (29. April) &#8212; Cursor &#246;ffnet seine Agent-Plattform f&#252;r programmatischen Zugriff: TypeScript-SDK, lokal oder gegen Cursors Cloud-VMs ausf&#252;hrbar, freie Modellwahl. Dazu reworked Cloud-Agents-API mit SSE-Streaming und expliziten Lifecycle-Controls. Damit ist Cursor das n&#228;chste Tool nach Claude Code, das nicht nur als IDE/Terminal, sondern als API f&#252;r Agent-Pipelines auftritt.</p><p><strong>Cursor Security Review</strong> (30. April, Beta f&#252;r Teams/Enterprise) &#8212; Zwei Always-On-Agenten: ein <strong>Security Reviewer</strong>, der jede PR auf Security-Vulnerabilities, Auth-Regressionen und Privacy-/Data-Handling-Risiken pr&#252;ft, plus ein <strong>Vulnerability Scanner</strong> mit geplanten Codebase-Scans gegen bekannte Vulnerabilities und veraltete Dependencies. Direkter Konkurrent zu Claude Codes <code>/security-review</code>-Skill &#8212; und ein klares Signal, dass Review-Workloads in Pull Requests die n&#228;chste Schicht sind, in der die Agent-Hosts gegeneinander antreten.</p><p><strong>Cursor Spend Management</strong> (4. Mai) &#8212; Granulare Allow-/Blocklists pro Modell und Provider, Soft-Spend-Limits mit Alerts bei 50/80/100 %. Liest sich wie eine direkte Antwort auf das Engineering-Budget-Problem, das diese Woche separat dokumentiert wurde (siehe Trend unten).</p><p><strong>OpenAI Codex CLI</strong> legt zweimal nach: <strong>0.128.0</strong> (30. April) bringt <strong>Goals-Workflows</strong>, <strong>Permission Profiles</strong>, Plugin-Management und Support f&#252;r externe Agent-Sessions. <strong>0.129.0</strong> (7. Mai) folgt mit TUI-Polish: redesigned Resume/Fork Picker, workspace-aware <code>/diff</code>, Plugin-Workspace-Sharing und Lifecycle-Hooks. Damit zieht Codex bei Plugin-Disziplin und Session-Handling sichtbar nach.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://cursor.com/changelog">Cursor Changelog: SDK &#183; Security Review &#183; Spend Management</a></p></li><li><p><a href="https://developers.openai.com/codex/changelog">Codex Changelog (OpenAI Developers)</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Token-Spend bricht Engineering-Budgets &#8212; und die Strategie spaltet sich</h3><p><strong>Gergely Orosz</strong> hat f&#252;r <em>The Pragmatic Engineer</em> (30. April) <strong>15 Firmen</strong> zwischen Seed-Stage und 10.000+ Mitarbeiter anonym befragt. Das Bild ist eindeutig und unbequem: Bei einem AI-Infra-Startup stieg Token-Spend pro Entwickler in sechs Monaten <strong>von $200 auf $3.000 pro Monat &#8212; 15-fach</strong>. Bei einem Healthcare-Konzern verbrauchte ein einzelner Engineer in <strong>einer Claude-Code-Session $1.400</strong>. In einem US-/EU-Fintech laufen Heavy-User auf Claude Code bei <strong>$500 pro Tag</strong>. Bei einem E-Commerce-Konzern mit ~2.000 Devs ist nur <strong>Opus 4.7 zum Coden zugelassen</strong>: &#8222;leichte Fehler in Produktion kosten Stunden&#8221;. Vendor-Verhandlungen klaffen weit auseinander: Cursor gew&#228;hrt Rabatte ab ~$1 Mio. Spend, Anthropic auch bei $5 Mio.+ pro Jahr nicht.</p><p>Die Firmen teilen sich grob 50/50 in zwei Lager: &#8222;Let it rip and start measuring&#8221; (laufen lassen, Impact messen) und &#8222;Curb spending&#8221; (Default auf billigere Modelle, Caps, Consent-Gates). Ein Engineering Manager im Healthcare-Sektor mit f&#252;nfzehn Jahren Branchenerfahrung sagt, einen so dramatischen Wandel habe er noch nie erlebt &#8212; vergleichbar nur mit dem Sprung zu h&#246;heren Programmiersprachen.</p><p>Das Bemerkenswerte ist, wie schnell die Tools darauf antworten: Cursors Spend-Management dieser Woche ist genau die Telemetrie, die in den befragten Firmen bisher gefehlt hat. Wer 2026 ernsthaft Agentic Engineering betreibt, braucht eine Antwort auf die Kostenseite &#8212; nicht in zw&#246;lf Monaten, sondern f&#252;r den n&#228;chsten Sprint.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://newsletter.pragmaticengineer.com/p/the-pulse-token-spend-breaks-budgets">Pragmatic Engineer: Token spend breaks budgets</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Background Agents Summit</strong> (6./7. Mai, virtuell) &#8212; Ona richtet das nach eigener Beschreibung erste Event aus, das ausschlie&#223;lich Background Agents gewidmet ist; Sprecher unter anderem von Stripe, Harvey, Uber, Monzo, AWS und WorkOS. Wer in den n&#228;chsten Monaten selbst eine Background-Agent-Infrastruktur aufbauen will, bekommt hier kompakt das, was sonst &#252;ber mehrere Engineering-Blogs verteilt ist. <a href="https://background-agents.com/summit">background-agents.com/summit</a></p></li><li><p><strong>Sierra holt $950 Mio.</strong> (4. Mai) &#8212; Bret Taylors Agent-Plattform f&#252;r Enterprise-Customer-Service ist nach der von Tiger Global und GV angef&#252;hrten Runde mit &#252;ber $15 Mrd. bewertet. Das Rennen um Enterprise-Agents wird teurer, je breiter die Anwendungsfelder werden. <a href="https://techcrunch.com/2026/05/04/sierra-raises-950m-as-the-race-to-own-enterprise-ai-gets-serious/">TechCrunch</a></p></li><li><p><strong>OpenAI: &#8222;Automated AI research intern bis September 2026&#8221;</strong> &#8212; Jack Clark zitiert dieses &#246;ffentlich kommunizierte Ziel von OpenAI in <em>Import AI #455</em>. Recursive Superintelligence (Startup) hat $500 Mio. spezifisch f&#252;r AI-R&amp;D-Automatisierung eingesammelt. <a href="https://importai.substack.com/p/import-ai-455-automating-ai-research">Import AI #455</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Donnerstag, 14. Mai 2026</em></p><p><em>Feedback? Einfach kommentieren/antworten.</em></p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #004 — Drei Bugs, sechs Wochen, 40 Milliarden Dollar]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-004-drei-bugs-sechs</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-004-drei-bugs-sechs</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Fri, 01 May 2026 20:09:38 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>1.Mai 2026 &#8212; Lesezeit: ~7 Min.</p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Anthropic legt offen, was Claude Code kaputt gemacht hat</h3><p>Am 23. April hat Anthropic einen <strong>detaillierten Postmortem</strong> ver&#246;ffentlicht &#8212; und damit beendet, was seit Februar Foren, Substacks und Tech-Presse besch&#228;ftigt hat: die Frage, ob Claude &#8222;d&#252;mmer&#8221; geworden ist.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><p>Antwort: ja, aber nicht weil Anthropic das Modell absichtlich heruntergedreht h&#228;tte, sondern weil <strong>drei separate Bugs</strong> sich zeitlich &#252;berlappten und sich gegenseitig verschleierten.</p><ol><li><p><strong>Reasoning-Effort-Downgrade</strong> (4. M&#228;rz &#8594; zur&#252;ckgenommen am 7. April): Default f&#252;r Opus 4.6 und Sonnet 4.6 von <code>high</code> auf <code>medium</code> gesenkt &#8212; als Reaktion auf User-Beschwerden &#252;ber lange Latenzen. Falscher Trade-off, wie sich herausstellte.</p></li><li><p><strong>Caching-Bug</strong> (26. M&#228;rz &#8594; gefixt 10. April): Eine Optimierung sollte alte Thinking-Bl&#246;cke nach &gt;1h Idle entfernen. Ein Bug lie&#223; sie <strong>bei jedem Turn</strong> entfernen &#8212; Ergebnis: Cache-Misses, vermeintliches &#8222;Vergessen&#8221;, schneller verbrauchte Limits.</p></li><li><p><strong>Verbosity-Prompt</strong> (16. April &#8594; zur&#252;ckgenommen am 20. April): Eine System-Prompt-Anweisung sollte die Verbosity zwischen Tool-Calls reduzieren. In Kombination mit anderen &#196;nderungen: 3 Prozent Performance-Drop bei Opus 4.6 und 4.7 in Ablation-Tests (Sonnet 4.6 ebenfalls betroffen), nicht in den urspr&#252;nglichen Evals erkannt.</p></li></ol><p>Alle drei Issues sind seit v2.1.116 (20. April) behoben. Anthropic hat zus&#228;tzlich <strong>Usage Limits aller Subscriber zur&#252;ckgesetzt</strong> und Default-Effort auf <code>xhigh</code> (Opus 4.7) bzw. <code>high</code> (alle anderen) angehoben. Die API war nicht betroffen &#8212; nur Claude Code.</p><p><strong>Warum das relevant ist:</strong></p><p>Das ist die transparenteste &#246;ffentliche Aufarbeitung, die ein Frontier-Lab bislang zu einem Quality-Drop geliefert hat.</p><p>Drei wichtige Lehren stecken drin:</p><ol><li><p>Evaluation-Suiten erkennen interagierende Regressionen schlecht &#8212; keine der drei &#196;nderungen war f&#252;r sich genommen problematisch.</p></li><li><p>Caching- und Harness-Verhalten sind genauso modellrelevant wie Gewichte; wer Coding-Agents baut, muss das mitmessen.</p></li><li><p>Vertrauen kommt zur&#252;ck, wenn Postmortems so detailliert sind wie dieses &#8212; und nicht, wenn man stillschweigend zur&#252;ckrollt.</p></li></ol><p>Der Wermutstropfen: Sechs Wochen Schaden waren entstanden, bevor die Aufkl&#228;rung kam.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.anthropic.com/engineering/april-23-postmortem">Anthropic: An update on recent Claude Code quality reports</a></p></li><li><p><a href="https://venturebeat.com/technology/mystery-solved-anthropic-reveals-changes-to-claudes-harnesses-and-operating-instructions-likely-caused-degradation">VentureBeat: Anthropic reveals harness changes likely caused degradation</a></p></li><li><p><a href="https://www.theregister.com/2026/04/23/anthropic_says_it_has_fixed/">The Register: Anthropic admits it dumbed down Claude with &#8216;upgrades&#8217;</a></p></li><li><p><a href="https://stackfutures.com/blog/anthropic-claude-code-postmortem-three-bugs-six-weeks-april-2026/">Stack Futures: Three Overlapping Changes, Six Weeks of Degradation</a></p></li><li><p><a href="https://machinelearningatscale.substack.com/p/anthropic-shipped-three-regressions">Machine Learning at Scale: Three regressions and the evals that didn&#8217;t catch them</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Sieben Releases in sieben Tagen: <strong>v2.1.117 bis v2.1.123</strong>. Schwerpunkt diesmal: Polishing, Memory-Hygiene und Vim-Power-User-Features.</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><strong>Vim Visual Mode endlich da</strong> &#8212; v2.1.118 bringt vollwertige Visual-Selection (<code>v</code>) und Visual-Line (<code>V</code>) inklusive Operatoren. Wer Claude Code aus Vim-Reflex bedient, hatte bisher nur einen Kr&#252;ppelmodus. Jetzt: voller Selection-Workflow, Operator-Pending, visuelles Feedback.</p><p><code>/cost</code><strong> und </strong><code>/stats</code><strong> werden zu </strong><code>/usage</code> &#8212; Konsolidierter Tabbed-View mit Billing und Verbrauch in einem Command. Kleines Detail, aber spart die st&#228;ndige &#8222;welcher Command war&#8217;s nochmal?&#8221;-Frage.</p><p><strong>Custom Themes</strong> &#8212; Per <code>/theme</code> benannte Themes anlegen oder direkt JSON in <code>~/.claude/themes/</code> editieren. Plugins k&#246;nnen Themes &#252;ber ein <code>themes/</code>-Verzeichnis ausliefern. Endlich konfigurierbar ohne Hack.</p><p><code>/resume</code><strong> aus PR-URL</strong> &#8212; v2.1.122: PR-URL aus GitHub, GitHub Enterprise, GitLab oder Bitbucket in die <code>/resume</code>-Suche pasten und die Session finden, die diesen PR erzeugt hat. Wer mit vielen parallelen Worktrees jongliert: Game-Changer.</p><h3>F&#252;r Multi-Agent- und Plugin-Workflows</h3><p><code>alwaysLoad</code><strong> f&#252;r MCP-Tools</strong> &#8212; MCP-Server k&#246;nnen einzelne Tools aus dem Tool-Search-Deferral ausschlie&#223;en. Wer Latenz-kritische Tools hat, sollte das setzen.</p><p><code>PostToolUse</code><strong>-Hooks d&#252;rfen Tool-Output ersetzen</strong> &#8212; Bisher nur f&#252;r MCP-Tools m&#246;glich, jetzt f&#252;r alle Tools via <code>hookSpecificOutput.updatedToolOutput</code>. Er&#246;ffnet sauberere Output-Sanitizer und Redaction-Pipelines.</p><p><strong>Hooks k&#246;nnen MCP-Tools aufrufen</strong> &#8212; v2.1.118 erlaubt <code>type: "mcp_tool"</code> direkt aus Hook-Konfiguration. Neue Komposition: Lifecycle-Events l&#246;sen Tool-Aufrufe ohne Wrapper-Skript aus.</p><p><code>claude plugin prune</code><strong> und </strong><code>tag</code> &#8212; Verwaiste auto-installierte Dependencies entfernen; Release-Tags mit Versionsvalidierung erzeugen. Plugin-Hygiene wird langsam zu echtem Package-Management.</p><h3>F&#252;r CI/CD und Automation</h3><p><code>claude ultrareview [target]</code> &#8212; <code>/ultrareview</code> jetzt non-interaktiv aus CI/Skripten. Damit ist Cloud-basierter Tiefen-Review als Pipeline-Step nutzbar, nicht nur als interaktiver Slash-Command.</p><p><code>AI_AGENT</code><strong> Environment Variable</strong> &#8212; Wird f&#252;r Subprozesse gesetzt; GitHub und andere Hosts k&#246;nnen damit Agent-Attribution korrekt taggen. Ein kleiner, aber wichtiger Baustein f&#252;r saubere Audit-Trails.</p><p><strong>Windows ohne Git Bash</strong> &#8212; v2.1.120 nutzt PowerShell als Default-Shell, wenn Git for Windows fehlt. PowerShell-Tool-Permissions k&#246;nnen auto-genehmigt werden. Schluss mit dem Workaround-Setup f&#252;r Windows-only-Teams.</p><h3>Performance und Plattform</h3><p><strong>Memory-Leaks gefixt</strong> &#8212; v2.1.121 schlie&#223;t mehrere Speicherlecks: Multi-GB-RSS bei vielen Bildern, ~2 GB Leak in <code>/usage</code> bei gro&#223;en Transcripts, Leaks in long-running Tools. Wer Sessions tagelang offen l&#228;sst, merkt das sofort.</p><p><strong>Skill-Suche und Effort-Placeholder</strong> &#8212; Filter-Suchbox in <code>/skills</code>, Skills k&#246;nnen <code>${CLAUDE_EFFORT}</code> referenzieren. Die Skill-Plattform reift in kleinen, n&#252;tzlichen Schritten.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code April 2026</a></p></li><li><p><a href="https://ton-technotes.com/en/blog/2026-04-25-claude-code-weekly-update-v2119/">Ton Technotes: v2.1.115&#8211;119 Polish Inside</a></p></li></ul><div><hr></div><h2>Agentic Coding: Cursor 3.1, Copilot Inline-Agent und der Stack-Mix wird Standard</h2><p><strong>Cursor 3.1</strong> (Nachtrag, Mitte April: 3.1 am 13. April, Interactive Canvases am 15.) erg&#228;nzt das Agents-Window aus 3.0 um <strong>Interactive Canvases</strong>: durable Side-Panel-Artefakte mit Tabellen, Diagrammen, Diffs und Custom-Components. Cursor antwortet jetzt nicht mehr nur mit Text und Code, sondern baut Dashboards und Mini-Interfaces, die neben Terminal und Browser im Side-Panel persistent leben. Das ist die richtige Antwort auf eine Beobachtung, die mehrere Hosts gerade machen: Der Output eines l&#228;ngeren Agent-Laufs vertr&#228;gt mehr als nur Markdown.</p><p><strong>GitHub Copilot Inline Agent Mode</strong> (24. April) &#8212; Public Preview f&#252;r JetBrains-IDEs. Agent-Capabilities aus dem Inline-Chat heraus, ohne in das Chat-Panel zu wechseln. Copilot positioniert sich klar in der &#8222;im IDE bleiben&#8221;-Ecke, w&#228;hrend Claude Code Terminal-first und Cursor IDE-Rebuilt f&#228;hrt.</p><p><strong>The New Stack berichtet</strong>, dass Teams zunehmend <strong>alle drei parallel</strong> nutzen &#8212; Cursor f&#252;r IDE-native Edits, Claude Code f&#252;r Terminal-Workflows und Headless-Routinen, Codex f&#252;r Browser- und Computer-Use. Das ist neu: Vor sechs Monaten war die Tooling-Frage &#8222;wer gewinnt?&#8221;. Jetzt ist sie &#8222;wie kombiniere ich?&#8221;.</p><p><strong>Warum das relevant ist:</strong> Wer noch versucht, ein Tool f&#252;r alles zu w&#228;hlen, optimiert in die falsche Richtung. Die spannenden Setups bauen jetzt <strong>portable Skills, Hooks und Routines</strong>, die zwischen Hosts wandern k&#246;nnen &#8212; genau dort, wo <code>gh skill</code> (siehe #003) ansetzt.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://releasebot.io/updates/cursor">Cursor Release Notes</a></p></li><li><p><a href="https://github.blog/changelog/2026-04-24-inline-agent-mode-in-preview-and-more-in-github-copilot-for-jetbrains-ides/">GitHub Changelog: Inline agent mode in JetBrains</a></p></li><li><p><a href="https://thenewstack.io/ai-coding-tool-stack/">The New Stack: Cursor, Claude Code, Codex are merging into one stack</a></p></li><li><p><a href="https://devtoolpicks.com/blog/cursor-3-agents-window-review-2026">DevTool Picks: Cursor 3 Review</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Big Tech doppelt nach: Googles 40-Milliarden-Wette auf Anthropic</h3><p>Am 24. April hat <strong>Google bis zu 40 Mrd. $ Investment</strong> in Anthropic angek&#252;ndigt &#8212; 10 Mrd. $ jetzt cash bei einer 350-Mrd.-$-Bewertung, weitere 30 Mrd. $ an Performance-Targets gekoppelt. Dazu: <strong>5 Gigawatt Compute</strong> &#252;ber f&#252;nf Jahre via Google Cloud, mit Option auf weitere Gigawatt. Das passiert nur vier Tage, nachdem Amazon zus&#228;tzliche bis zu 25 Mrd. $ committet hatte (5 Mrd. cash, 20 Mrd. an Milestones gekoppelt).</p><p>Die Choreographie ist bemerkenswert: Anthropic und Google sind gleichzeitig Partner und Konkurrenten &#8212; Gemini 3.1 Pro misst sich offen an Opus 4.7. Trotzdem zieht Google nach. Der Grund: Wer in der Coding-Agent-Schicht des Stacks f&#252;hrend bleiben will, muss die Compute-Allokation f&#252;r die Modelle sichern, die Entwickler tats&#228;chlich t&#228;glich benutzen. Anthropic ist genau das geworden &#8212; auch dank Claude Code.</p><p>Parallel hat Anthropic in der Woche <strong>drei weitere Expansionssignale</strong> gesetzt: Sydney als vierter APAC-Standort (27. April, Theo Hourmouzis von Snowflake als ANZ-GM), eine <strong>NEC-Partnerschaft in Japan</strong> mit Rollout an 30.000 Mitarbeiter und Aufbau einer der gr&#246;&#223;ten AI-native Engineering-Organisationen Japans (24. April), sowie Memorandum mit der australischen Regierung. Das zusammen mit den Investments ergibt das Bild: Anthropic positioniert sich f&#252;r IPO <strong>als globale Plattform</strong>, nicht nur als Modell-Anbieter.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.bloomberg.com/news/articles/2026-04-24/google-plans-to-invest-up-to-40-billion-in-anthropic">Bloomberg: Google plans up to $40B in Anthropic</a></p></li><li><p><a href="https://techcrunch.com/2026/04/24/google-to-invest-up-to-40b-in-anthropic-in-cash-and-compute/">TechCrunch: Google to invest up to $40B in cash and compute</a></p></li><li><p><a href="https://www.axios.com/2026/04/24/google-amazon-anthropic-investment">Axios: Google&#8217;s $40B Anthropic move is Big Tech&#8217;s latest huge bet</a></p></li><li><p><a href="https://www.anthropic.com/news/theo-hourmouzis-general-manager-australia-new-zealand">Anthropic: Theo Hourmouzis als General Manager Australia &amp; New Zealand</a></p></li><li><p><a href="https://www.anthropic.com/news/anthropic-nec">Anthropic + NEC: Building Japan&#8217;s largest AI engineering workforce</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Google Cloud Next 2026</strong> (22. April) &#8212; Konferenz unter dem Banner &#8222;Agentic Era&#8221;. Kevin Ichhpurani (President Global Partner Ecosystem) k&#252;ndigt 750 Mio. $ f&#252;r das 120k-Partner-&#214;kosystem an, um agentische Use-Cases zu beschleunigen. <a href="https://www.googlecloudpresscorner.com/2026-04-22-Google-Cloud-Commits-750-Million-to-Accelerate-Partners-Agentic-AI-Development">Google Cloud Press</a> &#183; <a href="https://biztechmagazine.com/article/2026/04/google-cloud-next-2026-businesses-are-moving-agentic-era">BizTech</a></p></li><li><p><strong>Cloudflare Agents Week</strong> (Nachtrag, 12.&#8211;20. April) &#8212; Vollst&#228;ndiger Stack-Push: Workers AI, AI Gateway, MCP-Hosting, Browser-Rendering. Im internen Engineering-Stack laufen pro Monat 241 Mrd. Tokens und 20 Mio. AI-Gateway-Requests durch die eigenen Produkte &#8212; gebaut auf dem, was sie auch verkaufen. Plattform-Konkurrenz f&#252;r Anthropic und Google bekommt eine Edge-native Variante. <a href="https://blog.cloudflare.com/agents-week-in-review/">Cloudflare Blog</a> &#183; <a href="https://blog.cloudflare.com/internal-ai-engineering-stack/">Internal Stack-Daten</a></p></li><li><p><strong>MIT Technology Review zu Agent Orchestration</strong> &#8212; Lesenswerter &#220;berblick: Multi-Agent-Systeme als &#8222;Flie&#223;band-Moment&#8221; f&#252;r White-Collar-Arbeit. Konkret namentlich erw&#228;hnt sind Claude Code (mit &#8222;a couple of dozen subagents&#8221; im Einsatz) und Claude Cowork (in zehn Tagen gebaut). Hauptsorge: unvorhersehbares LLM-Verhalten, sobald die Agenten aus dem Browser-Fenster heraus mit der echten Welt interagieren. <a href="https://www.technologyreview.com/2026/04/21/1135654/agent-orchestration-ai-artificial-intelligence/">MIT Tech Review</a></p></li><li><p><strong>Simon Willison &#252;ber Qwen3.6-27B</strong> &#8212; Alibabas neues 27-Mrd.-Dense-Modell erreicht Flagship-Coding-Performance lokal und schl&#228;gt das vorherige Open-Source-Flaggschiff Qwen3.5-397B-A17B. Open-Weight-Druck auf die Frontier-Labs steigt weiter. <a href="https://simonwillison.net/2026/Apr/22/qwen36-27b/">simonwillison.net</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Donnerstag, 7. Mai 2026</em></p><p><em>Feedback? Einfach kommentieren/antworten.</em></p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #003 — Opus 4.7, Pro-Verwirrung und Skills als neuer Standard]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-003-opus-47-pro-verwirrung</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-003-opus-47-pro-verwirrung</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 23 Apr 2026 08:01:00 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><em>23. April 2026 &#8212; Lesezeit: ~6 Min.</em></p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Claude Opus 4.7: Der erste klare Sprung &#252;ber 60 % auf SWE-bench Pro</h3><p>Am 16. April hat Anthropic <strong>Claude Opus 4.7</strong> general-available gemacht. Das eigentliche Signal ist weniger ein weiterer Benchmark-Gewinn als der Sprung auf <strong>SWE-bench Pro</strong> 53,4 &#8594; <strong>64,3 %</strong> &#8212; also auf dem h&#228;rteren Engineering-Benchmark, der l&#228;ngere, realistischere Software-Aufgaben abbildet. Dazu <strong>SWE-bench Verified</strong> 80,8 &#8594; <strong>87,6 %</strong>, <strong>Terminal-Bench 2.0</strong> 65,4 &#8594; 69,4 %, <strong>CursorBench</strong> 58 &#8594; 70 %. Auf SWE-bench Pro liegt Opus 4.7 vor GPT-5.4 (57,7 %) und Gemini 3.1 Pro (54,2 %). Dazu <strong>High-Res-Vision</strong> bis 3,75 Megapixel (3&#215; Opus 4.6) und Pricing unver&#228;ndert bei <strong>5 $ / 25 $ pro Million In-/Output-Tokens</strong>.</p><p>Die Reaktionen darauf sind trotzdem nicht einhellig. In der Community gab es Berichte &#252;ber einen <strong>h&#246;heren Tokenverbrauch bei vergleichbaren Prompts</strong> &#8212; wichtig, weil ein st&#228;rkeres Modell in der Praxis nur dann ein klarer Gewinn ist, wenn die realen Kosten im eigenen Workflow mitziehen. Ein feststehendes Faktum ist das noch nicht, aber ein Community-Signal, das Teams in eigenen L&#228;ufen messen sollten. Anthropic hat zeitgleich an den Effort-Defaults gedreht: <code>high</code><strong> ist jetzt Default</strong> f&#252;r Opus 4.6 und Sonnet 4.6 bei Pro- und Max-Subscribern (vorher <code>medium</code>); <code>xhigh</code> steht als neue Stufe exklusiv f&#252;r Opus 4.7 bereit. Direkte Antwort auf die Nerfing-Debatte der Vorwoche.</p><p><strong>Warum das relevant ist:</strong> Opus 4.7 ist der erste allgemein verf&#252;gbare Release, der auf SWE-bench Pro sichtbar Abstand gewinnt. Das macht ihn nicht automatisch zum Gewinner in jedem Stack, verschiebt aber die Messlatte f&#252;r l&#228;ngere agentische Coding-L&#228;ufe, Review-Workloads und komplexere Tool-Use-Szenarien. Wer Opus im Stack hat, sollte die Upgrade-Pr&#252;fung jetzt machen &#8212; inklusive echter Token- und Laufzeitmessung im eigenen Kontext.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.anthropic.com/news/claude-opus-4-7">Anthropic: Introducing Claude Opus 4.7</a></p></li><li><p><a href="https://venturebeat.com/technology/anthropic-releases-claude-opus-4-7-narrowly-retaking-lead-for-most-powerful-generally-available-llm">VentureBeat: Opus 4.7 narrowly retakes the lead</a></p></li><li><p><a href="https://www.vellum.ai/blog/claude-opus-4-7-benchmarks-explained">Vellum: Opus 4.7 Benchmarks Explained</a></p></li><li><p><a href="https://thenextweb.com/news/anthropic-claude-opus-4-7-coding-agentic-benchmarks-release">TheNextWeb: Opus 4.7 Agentic Benchmarks</a></p></li><li><p><a href="https://github.blog/changelog/2026-04-16-claude-opus-4-7-is-generally-available/">GitHub Changelog: Opus 4.7 GA</a></p></li></ul><div><hr></div><h2>Die unbequeme Debatte: Claude Code und die Pro-Verwirrung</h2><p>Am 21. April tauchte Claude Code auf &#246;ffentlichen Anthropic-Seiten zeitweise nicht mehr im <strong>20-$-Pro-Plan</strong> auf; Support-Dokumente sprachen nur noch von Max. Kritik auf X und Reddit folgte unmittelbar, ein paar Stunden sp&#228;ter war die Darstellung wieder korrigiert. Anthropics Amol Avasare kl&#228;rte auf: <strong>&#8222;a small test on ~2 % of new prosumer signups&#8221;</strong> &#8212; bestehende Abonnenten seien nicht betroffen, die &#246;ffentlichen Seiten &#8222;versehentlich&#8221; aktualisiert. Das Experiment l&#228;uft unter der Haube weiter.</p><p><strong>Simon Willison</strong> ordnet n&#252;chtern ein: Vertrauensverlust durch die intransparente &#196;nderung, strategisches Fragezeichen (Codex kostet weiterhin weniger), und die Frage, ob man Lehrmaterial um ein Tool baut, das sich Leser nicht leisten k&#246;nnen. Die eigentliche Story ist deshalb weniger &#8222;Claude Code ist raus&#8221;, sondern eher: Schon kleine, intransparente &#196;nderungen an Limits und Zug&#228;ngen erzeugen sofort Vertrauensverlust.</p><p><strong>Warum das relevant ist:</strong> Derselbe Reflex wie bei der Effort-Debatte &#8212; still an wirtschaftlichen Stellschrauben drehen, erst kommunizieren, wenn die Community rebelliert. Wer Claude Code in Team-Workflows oder Trainingsmaterial einplant, sollte nicht nur auf Modellleistung schauen, sondern auch auf die Frage: Bleibt das Setup f&#252;r Leser, Teilnehmer oder Teams bezahlbar und stabil erreichbar?</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.wheresyoured.at/news-anthropic-removes-pro-cc/">Where&#8217;s Your Ed At: Anthropic (Briefly) Removes Claude Code From Pro</a></p></li><li><p><a href="https://www.theregister.com/2026/04/22/anthropic_removes_claude_code_pro/">The Register: Anthropic tests reaction to yanking Claude Code from Pro</a></p></li><li><p><a href="https://simonwillison.net/2026/Apr/22/claude-code-confusion/">Simon Willison: Is Claude Code going to cost $100/month?</a></p></li><li><p><a href="https://thenewstack.io/anthropic-claude-code-limits/">The New Stack: Claude Code Limits</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Sieben Releases in sieben Tagen: <strong>v2.1.111 bis v2.1.117</strong>. Neben Opus-4.7-Support bringt die Woche einen Architekturwechsel.</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><strong>Native Binary statt bundled JavaScript</strong> &#8212; v2.1.113 schaltet auf macOS und Linux auf einen nativen Claude-Code-Binary um. <code>Glob</code> und <code>Grep</code> laufen &#252;ber eingebettetes <code>bfs</code> und <code>ugrep</code> via Bash. Sp&#252;rbar schnellere Kaltstarts, weniger Node-Overhead, weniger Abh&#228;ngigkeit von globalem npm.</p><p><code>/ultrareview</code> &#8212; Seit v2.1.111, in v2.1.113 parallelisiert mit Diffstat-Ausgabe: umfassende Code-Reviews in der Cloud. F&#252;r PR-Pr&#252;fungen, die lokal zu lange dauern, wird das der neue Default.</p><p><strong>Opus 4.7 </strong><code>xhigh</code><strong>-Effort und interaktiver Effort-Slider</strong> &#8212; Neue Stufe zwischen <code>high</code> und <code>max</code>, exklusiv f&#252;r Opus 4.7. <code>/effort</code> ohne Argument &#246;ffnet jetzt einen Slider &#8212; endlich ein Interface f&#252;r den Trade-off zwischen Geschwindigkeit und Tiefe.</p><h3>F&#252;r Multi-Agent- und Plugin-Workflows</h3><p><strong>Agent-Frontmatter endlich vollst&#228;ndig</strong> &#8212; <code>mcpServers</code> und <code>hooks</code> aus dem Agent-Frontmatter werden jetzt auch f&#252;r Main-Thread-Sessions geladen, wenn per <code>--agent</code> gestartet wird. Kleines Detail, gro&#223;er Effekt f&#252;r alle, die Agents als First-Class in Workflows behandeln.</p><p><strong>Plugin-Dependencies auto-resolved</strong> &#8212; <code>plugin install</code>, <code>/reload-plugins</code> und Auto-Update l&#246;sen fehlende Abh&#228;ngigkeiten eigenst&#228;ndig auf. <code>blockedMarketplaces</code> und <code>strictKnownMarketplaces</code> werden durchgesetzt &#8212; Enterprise-Admins bekommen ihre Plugin-Kontrolle zur&#252;ck.</p><p><code>/fewer-permission-prompts</code><strong>-Skill</strong> &#8212; Scannt Transcripts nach h&#228;ufigen read-only Bash- und MCP-Calls und schl&#228;gt eine priorisierte Allow-List f&#252;r <code>.claude/settings.json</code> vor. Der Endgegner der st&#228;ndigen Permission-Dialoge.</p><h3>F&#252;r CI/CD und Sicherheit</h3><p><strong>Sandbox-H&#228;rtung</strong> &#8212; <code>sandbox.network.deniedDomains</code> blockt Domains auch innerhalb weit gefasster Allow-Patterns. Deny-Rules greifen jetzt bei <code>env</code>-, <code>sudo</code>-, <code>watch</code>-, <code>ionice</code>- und <code>setsid</code>-gewrappten Kommandos; <code>find:*</code>-Allow-Regeln lassen nicht mehr automatisch <code>-exec</code>/<code>-delete</code> durch. Dazu ein gefixter Edge-Case, in dem <code>dangerouslyDisableSandbox</code> Kommandos <strong>ohne Sandbox und ohne Permission-Prompt</strong> laufen lie&#223;. Wer &#228;ltere 2.1er in Pipelines hat: jetzt updaten.</p><h3>Performance und Plattform</h3><p><code>/resume</code><strong> bis zu 67 % schneller</strong> auf Sessions &gt;40 MB (v2.1.116), parallelisierter MCP-Startup (v2.1.117), PowerShell-Tool progressiv auf Windows via <code>CLAUDE_CODE_USE_POWERSHELL_TOOL</code>. OpenTelemetry bekommt <code>effort</code>-Attribute auf Cost-, Token- und API-Metriken &#8212; Billing-Analysen nach Effort-Level werden endlich m&#246;glich.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code April 2026</a></p></li><li><p><a href="https://github.com/anthropics/claude-code/releases">GitHub: Claude Code Releases</a></p></li></ul><div><hr></div><h2>Agentic Coding: Codex &#246;ffnet den Mac &#8212; und GitHub standardisiert Skills</h2><p><strong>OpenAI Codex &#8222;for (almost) everything&#8221;</strong> (16. April): <strong>Computer Use auf dem Mac</strong>, ein In-App-Browser mit Kommentar-Funktion direkt auf Webseiten, <strong>90+ neue Plugins</strong> (Atlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon, Render u. a.), Memory und proaktive Task-Vorschl&#228;ge. Parallele Agents dr&#228;ngen sich nicht ins Foreground-Fenster. OpenAI nennt <strong>3 Mio. weekly active Developer</strong>, npm-Downloads wuchsen von 82k (April 2025) auf 14,5 Mio. (M&#228;rz 2026). Die Bewegung spiegelt Anthropics Desktop-Routines aus #002 &#8212; Codex holt strategisch auf.</p><p><code>gh skill</code><strong> Public Preview</strong> (16. April, GitHub CLI v2.90.0): Ein einziger Befehl, um <strong>Agent Skills</strong> &#252;ber alle gro&#223;en Agent-Hosts hinweg zu installieren, zu versionieren, zu suchen und zu publizieren &#8212; Claude Code, Copilot, Cursor, Codex, Gemini. Skills folgen einer offenen Spezifikation, jede Installation tr&#228;gt die Git-Tree-SHA ihres Source-Verzeichnisses, Updates vergleichen echte Content-&#196;nderungen. Das ist im Stillen der gr&#246;&#223;te Schritt in Richtung Interoperabilit&#228;t, den das &#214;kosystem seit MCP gesehen hat.</p><p><strong>Warum das relevant ist:</strong> Die Frontline verschiebt sich. Codex schlie&#223;t den Desktop-Gap zu Claude Code, GitHub liefert das fehlende Paketformat &#252;ber alle Hosts hinweg. Wer Tooling-Entscheidungen trifft, sollte ab jetzt davon ausgehen, dass Skills portabel sind &#8212; und Lock-in auf einzelne Agent-Hosts wird zur strategischen Altlast.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://openai.com/index/codex-for-almost-everything/">OpenAI: Codex for (almost) everything</a></p></li><li><p><a href="https://www.macrumors.com/2026/04/16/openai-codex-mac-update/">MacRumors: Codex Mac Update</a></p></li><li><p><a href="https://github.blog/changelog/2026-04-16-manage-agent-skills-with-github-cli/">GitHub Changelog: gh skill</a></p></li><li><p><a href="https://groundy.com/articles/github-clis-gh-skill-command-one-standard-to-rule-claude-code-copilot-cursor/">Groundy: gh skill command analysis</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Agent Skills werden zum neuen npm</h3><p>Drei Bewegungen zeigen in dieselbe Richtung: <code>gh skill</code> macht Skills portabel &#252;ber Hosts, <strong>Claude Code v2.1.111</strong> erlaubt, built-in Slash-Commands (<code>/init</code>, <code>/review</code>, <code>/security-review</code>) via Skill-Tool zu discovern, und <strong>OpenAI Codex</strong> baut rund um Skills, Plugins und MCP-Server ein modulareres &#214;kosystem aus. Noch ist das kein vollst&#228;ndig konsolidierter Standard &#8212; aber es ist gut m&#246;glich, dass wir gerade den Moment sehen, in dem &#8222;Skill&#8221; vom Prompt-Schnipsel zum versionierten, signierten, cross-kompatiblen Artefakt wird. Wer Agentic Engineering ernsthaft baut, sollte aufh&#246;ren, Wissen in Prompts und Repo-Wikis zu verstreuen, und <strong>Skills als First-Class-Artefakt</strong> versionieren. Genau dort d&#252;rfte sich in den n&#228;chsten Monaten entscheiden, welche Teams nur mit Agenten experimentieren &#8212; und welche daraus echte Produktivit&#228;t ziehen.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://github.blog/changelog/2026-04-16-manage-agent-skills-with-github-cli/">GitHub: Manage agent skills with GitHub CLI</a></p></li><li><p><a href="https://code.claude.com/docs/en/changelog">Anthropic Claude Code: Skills in changelog</a></p></li><li><p><a href="https://www.bighatgroup.com/blog/gh-skill-github-cli-agent-skills-management/">Big Hat Group: gh skill Deep Dive</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Claude Design</strong> (17. April) &#8212; Anthropic Labs launcht Research Preview f&#252;r Prototypen, Slides, One-Pager. Powered by Opus 4.7, liest Codebase und Design-Systeme, Export zu Canva, PDF, PPTX oder als Handoff-Bundle an Claude Code. Figmas Aktie reagierte sofort negativ. <a href="https://www.anthropic.com/news/claude-design-anthropic-labs">Anthropic</a> &#183; <a href="https://techcrunch.com/2026/04/17/anthropic-launches-claude-design-a-new-product-for-creating-quick-visuals/">TechCrunch</a></p></li><li><p><strong>Mythos-Leak-Report</strong> &#8212; TechCrunch berichtete am 21. April, eine unautorisierte Gruppe habe Zugriff auf Anthropics exklusives Cyber-Modell Mythos erlangt. Das Modell war nur im Rahmen von Project Glasswing an AWS, Apple, Google, JPMorgan, Microsoft und Nvidia verteilt. Anthropic hat bislang nicht offiziell kommentiert. <a href="https://techcrunch.com/2026/04/21/unauthorized-group-has-gained-access-to-anthropics-exclusive-cyber-tool-mythos-report-claims/">TechCrunch</a></p></li><li><p><strong>Simon Willison zur Agent-Definition</strong> &#8212; Nach monatelangem Herumschlagen gibt es jetzt eine konsensf&#228;hige: &#8222;An LLM agent runs tools in a loop to achieve a goal.&#8221; <a href="https://simonw.substack.com/p/i-think-agent-may-finally-have-a">simonw.substack.com</a></p></li><li><p><strong>GitHub Copilot Individual Plan-&#196;nderungen</strong> &#8212; Am selben Tag wie das Anthropic-Pricing-Drama k&#252;ndigt GitHub Usage-basierte Limits f&#252;r Copilot-Agenten-Workflows an. Agentic Coding knirscht an den R&#228;ndern der alten Flatrate-Modelle. <a href="https://simonwillison.net/2026/Apr/22/changes-to-github-copilot/">simonwillison.net</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Donnerstag, 30. April 2026</em></p><p><em>Feedback? Einfach kommentieren/antworten.</em></p>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #002 — Claude wird autonom (und die Community nervös)]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-002-claude-wird-autonom</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-002-claude-wird-autonom</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 16 Apr 2026 08:44:00 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><em>16. April 2026 &#8212; Lesezeit: ~4 Min.</em></p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Claude Code Desktop bekommt Routines &#8212; und wird zur Agent-Plattform</h3><p>Am 14. April hat Anthropic die Claude Code Desktop App von Grund auf neu gebaut. Das ist kein kosmetisches Update, sondern ein Architekturwechsel: Die App ist jetzt um <strong>parallele Sessions</strong> herum organisiert, mit einer Sidebar zum Managen mehrerer gleichzeitiger Agent-L&#228;ufe, Drag-and-Drop-Layout, integriertem Terminal und File-Editor.</p><p>Das eigentliche Highlight hei&#223;t <strong>Routines</strong> &#8212; eine neue Automatisierungsschicht, die Claude Code ohne aktive Session laufen l&#228;sst. Eine Routine b&#252;ndelt Prompt, Repository und Connectors in eine Konfiguration, die auf drei Arten triggern kann: nach <strong>Zeitplan</strong>, per <strong>API-Call</strong> oder durch ein <strong>GitHub-Event</strong> (z.B. neuer Pull Request). Routines laufen auf Anthropics Web-Infrastruktur, nicht lokal. Daily Caps nach Plan: Pro 5, Max 15, Team/Enterprise 25 (weitere zukaufbar).</p><p>Dazu kommt: Claude Code kann jetzt den <strong>Mac fernsteuern</strong> &#8212; wenn kein direkter Connector existiert (Slack, Google Calendar), navigiert Claude &#252;ber den Bildschirm wie ein Mensch. Drei View Modes (Verbose, Normal, Summary) lassen Nutzer steuern, wie viel von Claudes Tool-Aktivit&#228;t sie sehen wollen.</p><p><strong>Warum das relevant ist:</strong> Wer letzte Woche das Conway-Leak verfolgt hat (immer noch unbest&#228;tigt), sieht hier die offizielle Version: Claude bewegt sich von einem reaktiven Tool zu einem persistent laufenden, event-gesteuerten Agent. Routines sind der erste produktionsreife Schritt dahin.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.macrumors.com/2026/04/15/anthropic-rebuilds-claude-code-desktop-app/">MacRumors: Anthropic Rebuilds Claude Code Desktop</a></p></li><li><p><a href="https://venturebeat.com/orchestration/we-tested-anthropics-redesigned-claude-code-desktop-app-and-routines-heres-what-enterprises-should-know">VentureBeat: Routines Hands-On</a></p></li><li><p><a href="https://9to5mac.com/2026/04/14/anthropic-adds-repeatable-routines-feature-to-claude-code-heres-how-it-works/">9to5Mac: Routines Feature</a></p></li><li><p><a href="https://siliconangle.com/2026/04/14/anthropics-claude-code-gets-automated-routines-desktop-makeover/">SiliconANGLE: Routines &amp; Desktop Makeover</a></p></li></ul><div><hr></div><h2>Die unbequeme Debatte: Wird Claude schlechter?</h2><p>Es ist das Thema der Woche in der Community: Eine wachsende Zahl von Power-Usern beklagt, dass Claude &#8212; insbesondere Opus 4.6 &#8212; seit Februar sp&#252;rbar schw&#228;cher geworden ist. Weniger gr&#252;ndliche Analysen, mehr Abk&#252;rzungen, h&#228;ufigeres vorzeitiges Abbrechen.</p><p>Die Ursache ist bekannt: Anthropic hat das Default-<strong>Effort-Level</strong> von Opus 4.6 am 9. Februar auf Adaptive Thinking umgestellt und am 3. M&#228;rz auf <strong>Medium Effort (Level 85)</strong> gesenkt. Weniger Tokens pro Anfrage, schnellere Antworten &#8212; aber auch weniger Tiefe.</p><p><strong>Stella Laurenzo</strong>, Senior Director bei AMDs AI-Gruppe, hat die Debatte mit einer datengest&#252;tzten Analyse auf GitHub befeuert: 6.852 Sessions, 17.871 Thinking Blocks, 234.760 Tool Calls. Ihr Befund: Die Reasoning-Tiefe fiel ab Februar messbar, w&#228;hrend &#8222;Simplest Fix&#8221;-Verhalten, Premature Stopping und Edit-first statt Research-first zunahmen.</p><p>Die Community-Reaktion ist deutlich. Fortune, VentureBeat, Axios und The Register haben berichtet. Der Vorwurf: Anthropic habe die &#196;nderung nicht transparent genug kommuniziert &#8212; sie stand im Changelog, wurde aber nicht prominent angek&#252;ndigt. Die Spekulation, dass Anthropic unter Compute-Knappheit leidet, h&#228;lt sich hartn&#228;ckig.</p><p><strong>Anthropics Antwort:</strong> Teams und Enterprise-Nutzer sollen k&#252;nftig standardm&#228;&#223;ig auf High Effort laufen, auch wenn das mehr Tokens und Latenz kostet. F&#252;r alle anderen bleibt <code>/effort max</code> der Workaround.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://fortune.com/2026/04/14/anthropic-claude-performance-decline-user-complaints-backlash-lack-of-transparency-accusations-compute-crunch/">Fortune: Anthropic Performance Backlash</a></p></li><li><p><a href="https://www.axios.com/2026/04/16/anthropic-claude-power-user-complaints">Axios: Anthropic&#8217;s AI Downgrade Stings Power Users</a></p></li><li><p><a href="https://venturebeat.com/technology/is-anthropic-nerfing-claude-users-increasingly-report-performance">VentureBeat: Is Anthropic &#8216;Nerfing&#8217; Claude?</a></p></li><li><p><a href="https://www.theregister.com/2026/04/13/claude_outage_quality_complaints/">The Register: Claude Is Getting Worse, According to Claude</a></p></li><li><p><a href="https://scortier.substack.com/p/claude-code-drama-6852-sessions-prove">Stella Laurenzo: 6,852 Sessions Analysis</a></p></li></ul><div><hr></div><h2>Claude Code CLI: Die Highlights der Woche</h2><p>Sieben Releases in sieben Tagen &#8212; von <strong>v2.1.96 bis v2.1.108</strong>. Hier die Highlights, sortiert danach, wen sie betreffen:</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><code>/recap</code> &#8212; Beim Zur&#252;ckkehren in eine Session liefert Claude jetzt automatisch einen Kontext-&#220;berblick. Konfigurierbar in <code>/config</code>, manuell aufrufbar mit <code>/recap</code>. Wer viele parallele Sessions jongliert und nach einem Kontextwechsel erst mal &#8222;Wo war ich?&#8221; denkt, spart damit sp&#252;rbar Zeit.</p><p><strong>Prompt Caching wird steuerbar</strong> &#8212; Zwei neue Environment-Variablen: <code>ENABLE_PROMPT_CACHING_1H</code> f&#252;r eine einst&#252;ndige Cache-TTL, <code>FORCE_PROMPT_CACHING_5M</code> f&#252;r f&#252;nf Minuten. Relevant f&#252;r alle, die ihre API-Kosten optimieren oder auf langsamen Backends arbeiten. Ein Bug, bei dem Subscriber mit <code>DISABLE_TELEMETRY</code> auf 5 Minuten statt 1 Stunde zur&#252;ckfielen, wurde gefixt.</p><h3>F&#252;r Multi-Agent- und MCP-Workflows</h3><p><strong>Background Monitors</strong> &#8212; Plugins k&#246;nnen jetzt &#252;ber den <code>monitors</code> Manifest-Key automatisch mit der Session starten. Wer Monitoring-Tools f&#252;r Builds, Tests oder Deployments als Plugin betreibt, bekommt damit eine hands-off L&#246;sung. Dazu: <code>/reload-plugins</code> erkennt neue Skills ohne Neustart.</p><p><strong>PreCompact Hook</strong> &#8212; Hooks k&#246;nnen Compaction blockieren (Exit-Code 2 oder <code>{"decision":"block"}</code>). N&#252;tzlich f&#252;r Agents, die mitten in einer langen Analyse stecken und ihren Kontext nicht verlieren d&#252;rfen.</p><h3>F&#252;r CI/CD und Automation</h3><p><strong>Security-Fixes</strong> &#8212; Mehrere Bash-Tool-Permission-Bypasses gefixt in v2.1.97/98: Backslash-Escaping umging Auto-Allow-Regeln, Redirects &#252;ber <code>/dev/tcp</code> und <code>/dev/udp</code> wurden nicht abgefangen, Env-Var-Prefixes tricksten die Permission-Pr&#252;fung aus. Wer &#228;ltere Versionen in Pipelines nutzt: jetzt updaten.</p><h3>Enterprise und Plattform</h3><p><strong>Google Vertex AI Setup Wizard</strong> &#8212; Interaktiver Wizard f&#252;r GCP-Authentifizierung, Projekt- und Regionskonfiguration, direkt vom Login-Screen aus. OS-CA-Zertifikate werden jetzt standardm&#228;&#223;ig vertraut &#8212; Schluss mit manueller Zertifikats-Konfiguration f&#252;r Enterprise-TLS-Proxies. Dazu <strong>PID Namespace Isolation</strong> f&#252;r Subprocess-Sandboxing auf Linux und ein neuer <code>/team-onboarding</code>-Command, der Onboarding-Guides f&#252;r Teammitglieder aus der eigenen Claude-Code-Nutzung generiert.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code</a></p></li><li><p><a href="https://github.com/anthropics/claude-code/releases">GitHub: Claude Code Releases</a></p></li></ul><div><hr></div><h2>Agentic Coding: Cursor 3 und der Drei-Wege-Kampf</h2><p><strong>Cursor 3</strong> markiert einen Paradigmenwechsel: Das Interface wurde komplett um die Idee herum neu gebaut, dass der Gro&#223;teil des Codes von AI Agents geschrieben wird. Highlights: <strong>Agents Window</strong>, <strong>Design Mode</strong>, <strong>Cloud Agents</strong>. Composer 2 erreicht 61,3 auf CursorBench (+37 %) und 73,7 auf SWE-bench Multilingual. Anysphere hat &#252;ber 3 Milliarden Dollar eingesammelt bei einer ARR von 2 Milliarden.</p><p>Der Markt teilt sich in drei Philosophien: <strong>Cursor</strong> setzt auf IDE-native Deep Integration, <strong>GitHub Copilot</strong> auf Reichweite und Enterprise (Agent Mode GA, agentic Code Review seit M&#228;rz), <strong>Claude Code</strong> auf Terminal-first mit Routines und maximaler Flexibilit&#228;t. Die Wahl des Stacks ist jetzt eine Architekturentscheidung.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://dev.to/devtoolpicks/cursor-3-just-launched-with-an-ai-agents-window-what-changed-and-is-it-still-worth-it-496f">DEV Community: Cursor 3 Launch</a></p></li><li><p><a href="https://www.nxcode.io/resources/news/cursor-vs-claude-code-vs-github-copilot-2026-ultimate-comparison">NxCode: Cursor vs Claude Code vs Copilot</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Anthropic auf dem Weg zum B&#246;rsengang &#8212; die 800-Milliarden-Frage</h3><p>Anthropic zieht Investoren-Angebote an, die das Unternehmen mit bis zu <strong>800 Milliarden Dollar</strong> bewerten &#8212; mehr als das Doppelte der Bewertung von 380 Milliarden aus dem Februar. Annualisierte Revenue: &#252;ber 30 Milliarden Dollar. IPO wird f&#252;r Oktober 2026 erwartet.</p><p><strong>Vas Narasimhan</strong>, CEO von Novartis, wurde am 14. April in den Board berufen &#8212; erstes Pharma-Schwergewicht, klares Signal Richtung Healthcare. Trust-berufene Direktoren stellen jetzt die Board-Mehrheit. Ein IPO-bereites Anthropic wird Claude Code aggressiver kommerzialisieren &#8212; die Enterprise-Features und Routines der letzten Woche passen ins Bild.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.bloomberg.com/news/articles/2026-04-14/anthropic-attracts-investor-offers-at-a-800-billion-valuation">Bloomberg: Anthropic $800B Valuation</a></p></li><li><p><a href="https://www.anthropic.com/news/narasimhan-board">Anthropic: Narasimhan Board</a></p></li><li><p><a href="https://www.benzinga.com/markets/tech/26/04/51821987/anthropic-800b-valuation-claude-growth-ipo-openai-rivalry">Benzinga: Anthropic IPO</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Conway-Leak</strong> &#8212; Anfang April tauchten 512.000 Zeilen Claude-Code-Quellcode auf, darin Details zu einer Always-On-Agent-Plattform namens Conway. Anthropic hat weder best&#228;tigt noch dementiert. Routines k&#246;nnten die offizielle Antwort sein. <a href="https://www.mindstudio.ai/blog/what-is-conway-agent-anthropic-always-on-background-ai">MindStudio</a></p></li><li><p><strong>Claude-Outage am 15. April</strong> &#8212; Erhebliche St&#246;rung bei Claude.ai, API und Claude Code von ~10:53 bis 13:42 ET. Wer Production-Workloads laufen hat: Redundanz einplanen. <a href="https://www.cnbc.com/2026/04/15/anthropic-outage-elevated-errors-claude-chatbot-code-api.html">CNBC</a></p></li><li><p><strong>Simon Willison &#252;ber Cybersecurity als &#8222;Proof of Work&#8221;</strong> &#8212; AI-Modelle wie Mythos ver&#228;ndern Vulnerability Research fundamental. <a href="https://simonwillison.net/2026/Apr/14/cybersecurity-proof-of-work/">simonwillison.net</a></p></li><li><p><strong>Anthropic Agentic Coding Trends Report 2026</strong> &#8212; Umfassender Bericht dar&#252;ber, wie Coding Agents Workflows ver&#228;ndern. Pflichtlekt&#252;re. <a href="https://resources.anthropic.com/2026-agentic-coding-trends-report">Anthropic Resources</a></p></li><li><p><strong>ICSE 2026: Workshop Agentic Engineering</strong> &#8212; Die f&#252;hrende Software-Engineering-Konferenz widmet dem Thema erstmals einen eigenen Workshop. <a href="https://conf.researchr.org/home/icse-2026/agent-2026">ICSE 2026</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Donnerstag, 23. April 2026</em></p>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #001]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-001</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-001</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 09 Apr 2026 08:47:00 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><em>9. April 2026 &#8212; Lesezeit: ~4 Min.</em></p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Anthropic stellt Claude Mythos vor &#8212; und sperrt das Modell sofort weg</h3><p>Am Montag hat Anthropic mit Claude Mythos Preview ein neues Frontier-Modell vorgestellt, das vor allem durch eine F&#228;higkeit auff&#228;llt: Es findet und exploitet Zero-Day-Schwachstellen in allen gro&#223;en Betriebssystemen und Browsern. In internen Tests identifizierte Mythos tausende bisher unbekannte Sicherheitsl&#252;cken, viele davon in Code, der ein bis zwei Jahrzehnte alt ist.</p><p>Der Clou: Anthropic ver&#246;ffentlicht das Modell nicht frei, sondern nur &#252;ber <strong>Project Glasswing</strong> &#8212; eine neue Initiative f&#252;r defensive Cybersecurity. Zw&#246;lf Launch-Partner, darunter AWS, Apple, Google, Microsoft, CrowdStrike und die Linux Foundation, erhalten kontrollierten Zugang. Anthropic stellt daf&#252;r bis zu 100 Millionen Dollar an Usage Credits und 4 Millionen Dollar an Direktspenden f&#252;r Open-Source-Security bereit.</p><p>Simon Willison kommentierte treffend: Die Entscheidung, ein derart m&#228;chtiges Modell zun&#228;chst nur f&#252;r Sicherheitsforscher zug&#228;nglich zu machen, sei &#8222;notwendig&#8221;. Platformer berichtet gleichzeitig, dass einige Security-Experten beunruhigt sind &#8212; die Frage, wie lange der Vorsprung der Verteidiger h&#228;lt, steht im Raum.</p><p><strong>Warum das relevant ist:</strong> Agentic Security ist der logische n&#228;chste Schritt &#8212; wenn AI Agents Code schreiben, m&#252;ssen andere AI Agents ihn absichern. Mythos zeigt, wohin die Reise geht.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.anthropic.com/glasswing">Anthropic: Project Glasswing</a></p></li><li><p><a href="https://techcrunch.com/2026/04/07/anthropic-mythos-ai-model-preview-security/">TechCrunch: Anthropic Mythos Preview</a></p></li><li><p><a href="https://simonwillison.net/2026/Apr/7/project-glasswing/">Simon Willison&#8217;s Take</a></p></li><li><p><a href="https://thehackernews.com/2026/04/anthropics-claude-mythos-finds.html">The Hacker News: Zero-Day Findings</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Die Versionen <strong>v2.1.89 bis v2.1.92</strong> brachten eine dichte Folge an Updates &#8212; hier die Highlights, sortiert danach, wen sie betreffen:</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><strong>Flicker-free Rendering</strong> &#8212; Mit <code>CLAUDE_CODE_NO_FLICKER=1</code> gibt es eine Alt-Screen-Rendering-Option mit virtualisiertem Scrollback. Wer l&#228;ngere Agent-Sessions laufen l&#228;sst und vom Flackern bei schnellen Ausgaben genervt war, bekommt endlich eine saubere Terminal-Erfahrung.</p><p><code>/powerup</code><strong> Command</strong> &#8212; Interaktive Lektionen mit animierten Demos, die Claude-Code-Features Schritt f&#252;r Schritt erkl&#228;ren. Besonders n&#252;tzlich f&#252;r Einsteiger, aber auch f&#252;r erfahrene Nutzer, die versteckte Features entdecken wollen.</p><p><strong>Bessere </strong><code>/cost</code><strong>-Transparenz</strong> &#8212; Per-Model- und Cache-Hit-Aufschl&#252;sselung zeigt jetzt genau, wohin das Budget flie&#223;t. Relevant f&#252;r alle, die ihre API-Kosten im Blick behalten m&#252;ssen.</p><h3>F&#252;r Multi-Agent- und MCP-Workflows</h3><p><strong>MCP 500K</strong> &#8212; Die maximale Tool-Result-Gr&#246;&#223;e springt auf 500.000 Zeichen. Wer MCP-Server baut, die gro&#223;e Datenmengen zur&#252;ckgeben &#8212; etwa Datenbank-Dumps, lange Logs oder umfangreiche API-Responses &#8212; ist damit nicht mehr so schnell am Limit.</p><p><strong>Named Subagents</strong> &#8212; Subagents tauchen namentlich in den @-Mention-Vorschl&#228;gen auf. F&#252;r Teams, die mit spezialisierten Agents arbeiten (z.B. ein Test-Agent, ein Review-Agent, ein Deploy-Agent), wird die Orchestrierung damit deutlich intuitiver.</p><h3>F&#252;r CI/CD und Automation</h3><p><strong>Permission Deferral f&#252;r Headless Mode</strong> &#8212; PreToolUse Hooks k&#246;nnen Sessions jetzt pausieren und extern wieder aufnehmen. Der Use Case: Ein Agent in einer CI-Pipeline st&#246;&#223;t auf eine Aktion, die menschliche Freigabe braucht &#8212; statt abzubrechen, wartet er, bis jemand gr&#252;nes Licht gibt.</p><p><strong>PermissionDenied Hook</strong> &#8212; Neuer Hook, der nach Ablehnungen durch den Auto-Mode-Classifier feuert. Mit <code>{retry: true}</code> kann der Agent automatisch einen alternativen Weg einschlagen. N&#252;tzlich f&#252;r robustere autonome Workflows, die nicht beim ersten &#8222;Nein&#8221; aufgeben sollen.</p><h3>Performance und Plattform</h3><p>Schnellere Write-Tool-Diffs f&#252;r gro&#223;e Dateien (<strong>60 % schneller</strong>, besonders bei Dateien mit Tabs und Sonderzeichen), SSE-Transport jetzt in O(n) statt O(n&#178;) &#8212; sp&#252;rbar bei langen Sessions mit vielen Tool-Calls. Dazu ein interaktiver <strong>Bedrock Setup Wizard</strong> f&#252;r AWS-Nutzer und eine <strong>Windows PowerShell Preview</strong> f&#252;r das wachsende Windows-Lager.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://github.com/anthropics/claude-code/releases">GitHub Releases</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code</a></p></li></ul><div><hr></div><h2>Agentic Coding: Die Branche sortiert sich</h2><p><strong>Cursor launcht Agent Experience</strong> &#8212; Cursor hat eine neue Agent-Erfahrung vorgestellt, die explizit gegen Claude Code und Codex positioniert ist. Der Agent kann Dateien lesen/schreiben, Tests im Terminal ausf&#252;hren, Fehler iterativ beheben und das gesamte Repository per RAG indexieren.</p><p><strong>GitHub Copilot trainiert auf euren Daten</strong> &#8212; Ab dem 24. April nutzt GitHub Interaktionsdaten von Free-, Pro- und Pro+-Nutzern zum Modelltraining &#8212; inklusive Code-Snippets, Dateinamen und Repository-Strukturen. Opt-out ist m&#246;glich, aber nicht der Default. Business- und Enterprise-Kunden sind ausgenommen. Die Community-Reaktion ist eindeutig: 59 Thumbs-down, 3 Rockets. Wer nicht mitmachen will, sollte jetzt unter <code>/settings/copilot/features</code> die Option deaktivieren.</p><p><strong>GitHub Agent HQ</strong> &#8212; Claude und OpenAI Codex sind jetzt als w&#228;hlbare Agents in Public Preview verf&#252;gbar &#8212; direkt in GitHub, GitHub Mobile und VS Code. Die Multi-Agent-Zukunft wird konkret: Man w&#228;hlt seinen Agent je nach Task.</p><p><strong>CodeSignal: Agentic Coding Assessments</strong> &#8212; CodeSignal hat eine neue Kategorie technischer Assessments eingef&#252;hrt, die misst, wie gut Entwickler <em>mit</em> AI-Agents arbeiten. Laut deren Umfrage nutzen bereits 91 % der befragten US-Entwickler Agentic-AI-Tools bei der Arbeit, 75 % haben in den letzten sechs Monaten zumindest teilweise AI-generierten Code in Production deployed.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://explore.n1n.ai/blog/cursor-ai-agent-experience-claude-code-codex-2026-04-03">Cursor Agent Experience</a></p></li><li><p><a href="https://github.blog/news-insights/company-news/updates-to-github-copilot-interaction-data-usage-policy/">GitHub Blog: Copilot Data Policy</a></p></li><li><p><a href="https://github.blog/news-insights/company-news/pick-your-agent-use-claude-and-codex-on-agent-hq/">GitHub Blog: Agent HQ</a></p></li><li><p><a href="https://www.theregister.com/2026/03/26/github_ai_training_policy_changes/">The Register: GitHub Training</a></p></li><li><p><a href="https://www.prnewswire.com/news-releases/codesignal-launches-industry-first-agentic-coding-assessments-for-ai-era-engineering-hiring-302732265.html">CodeSignal: Agentic Assessments</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Von Vibe Coding zu Agentic Engineering &#8212; die Reifephase</h3><p>Das Buzzword &#8222;Vibe Coding&#8221; aus 2025 &#8212; locker prompten und schauen, was passiert &#8212; weicht einer strukturierteren Disziplin. Medium-Autor ESA Engineering beschreibt den &#220;bergang treffend: Agentic Coding ist f&#252;r Produktions-CI/CD-Pipelines und gro&#223;e Refactors gebaut, Vibe Coding f&#252;r Hackathon-Prototypen.</p><p>Gartner prognostiziert, dass 40 % der Enterprise-Anwendungen bis Ende 2026 aufgabenspezifische AI-Agents enthalten werden (2025: unter 5 %). Anfragen zu Multi-Agent-Systemen stiegen um <strong>1.445 %</strong> von Q1 2024 bis Q2 2025. Multi-Model-Routing wird dabei zur Pflicht: Das Plan-and-Execute-Pattern &#8212; ein starkes Modell plant, g&#252;nstigere Modelle f&#252;hren aus &#8212; senkt die Kosten um bis zu 90 %.</p><p>Gleichzeitig w&#228;chst die Skepsis: 80 % der Entwickler nutzen AI Coding Agents, aber das Vertrauen in deren Accuracy ist von 40 % auf 29 % gefallen. Die zentrale Herausforderung 2026: Agents, denen man <em>vertrauen</em> kann &#8212; nicht nur welche, die beeindruckend aussehen. Die Branche konsolidiert sich um das Muster <em>human-prompted &#8594; agent-executed &#8594; human-reviewed</em>.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://medium.com/technologai/from-vibe-to-agentic-the-2026-maturation-of-ai-driven-development-1bfb0844b5a6">Medium: From Vibe to Agentic</a></p></li><li><p><a href="https://www.openpr.com/news/4447249/gartner-s-2026-multi-agent-systems-boom-why-enterprises-need">Gartner&#8217;s Multi-Agent Systems Boom</a></p></li><li><p><a href="https://thenewstack.io/5-key-trends-shaping-agentic-development-in-2026/">The New Stack: 5 Key Trends</a></p></li><li><p><a href="https://letsdatascience.com/news/ai-agents-increase-developer-preparatory-workload-b890e82a">Let&#8217;s Data Science: Developer Trust</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Anthropic sichert sich 3,5 GW Compute</strong> &#8212; Neuer Deal mit Google und Broadcom, TPU-Kapazit&#228;t ab 2027. Run-Rate-Revenue liegt bei &#252;ber 30 Mrd. Dollar. <a href="https://techcrunch.com/2026/04/07/anthropic-compute-deal-google-broadcom-tpus/">TechCrunch</a> &#183; <a href="https://www.cnbc.com/2026/04/06/broadcom-agrees-to-expanded-chip-deals-with-google-anthropic.html">CNBC</a></p></li><li><p><strong>1M-Token-Context-Beta wird eingestellt</strong> &#8212; Ab 30. April hat der <code>context-1m-2025-08-07</code> Beta-Header keine Wirkung mehr f&#252;r Sonnet 4.5 und Sonnet 4. <a href="https://releasebot.io/updates/anthropic">Anthropic Release Notes</a></p></li><li><p><strong>OpenAI, Anthropic und Google gegen Model-Distillation</strong> &#8212; Die drei arbeiten &#252;ber das Frontier Model Forum zusammen, um adversariale Distillationsversuche aus China zu erkennen. <a href="https://www.bloomberg.com/news/articles/2026-04-06/openai-anthropic-google-unite-to-combat-model-copying-in-china">Bloomberg</a></p></li><li><p><strong>Xcode 26.3 mit Agentic Coding</strong> &#8212; Apple integriert Claude Agent und OpenAI Codex &#252;ber MCP in Xcode. <a href="https://www.apple.com/newsroom/2026/02/xcode-26-point-3-unlocks-the-power-of-agentic-coding/">Apple Newsroom</a></p></li><li><p><strong>Coefficient Bio Akquisition</strong> &#8212; Anthropic kauft AI-Biotech-Startup f&#252;r ~400M Dollar, Team geht in die Healthcare &amp; Life Sciences Gruppe.</p></li><li><p><strong>Claude-Ausf&#228;lle</strong> &#8212; Am 6. und 8. April gab es Outages bei Claude &#8212; relevant f&#252;r alle, die Production Workloads darauf laufen haben. <a href="https://www.techradar.com/news/live/claude-anthropic-down-outage-april-6-2026">TechRadar</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Mittwoch, 15. April 2026</em><br><em>Feedback? Einfach antworten &#8212; ich justiere gerne Fokus, Tiefe und Quellen.</em></p>]]></content:encoded></item></channel></rss>