<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:googleplay="http://www.google.com/schemas/play-podcasts/1.0"><channel><title><![CDATA[fluxum engineering]]></title><description><![CDATA[Value Streams, KI-Agenten, Teamarbeit, Technologie und neue Formen der agilen Zusammenarbeit]]></description><link>https://blog.fluxum.net</link><image><url>https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png</url><title>fluxum engineering</title><link>https://blog.fluxum.net</link></image><generator>Substack</generator><lastBuildDate>Tue, 19 May 2026 03:48:50 GMT</lastBuildDate><atom:link href="https://blog.fluxum.net/feed" rel="self" type="application/rss+xml"/><copyright><![CDATA[Martin Gross]]></copyright><language><![CDATA[de]]></language><webMaster><![CDATA[fluxum@substack.com]]></webMaster><itunes:owner><itunes:email><![CDATA[fluxum@substack.com]]></itunes:email><itunes:name><![CDATA[Martin Gross]]></itunes:name></itunes:owner><itunes:author><![CDATA[Martin Gross]]></itunes:author><googleplay:owner><![CDATA[fluxum@substack.com]]></googleplay:owner><googleplay:email><![CDATA[fluxum@substack.com]]></googleplay:email><googleplay:author><![CDATA[Martin Gross]]></googleplay:author><itunes:block><![CDATA[Yes]]></itunes:block><item><title><![CDATA[Agentic Weekly #006 — Anthropic schaltet hoch: Dreaming, Doppellimits und 300 MW von SpaceX]]></title><description><![CDATA[Eine Konferenz, drei neue Agent-Bausteine und der Deal, der vor einer Woche noch undenkbar war &#8212; Anthropic kauft sich diese Woche aus dem Compute-Engpass frei.]]></description><link>https://blog.fluxum.net/p/agentic-weekly-006-anthropic-schaltet</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-006-anthropic-schaltet</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Sat, 16 May 2026 11:55:33 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!loxo!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!loxo!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!loxo!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!loxo!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!loxo!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!loxo!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!loxo!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png" width="1456" height="819" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:819,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1776151,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/197985406?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!loxo!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!loxo!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!loxo!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!loxo!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F932379d3-9d40-412a-bfb5-157c27a02fbe_1672x941.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p></p><h3>Code with Claude 2026 &#8212; Agents lernen tr&#228;umen, Limits fallen, Musk liefert Strom</h3><p>Am 6. Mai hat Anthropic in San Francisco <strong>Code with Claude 2026</strong> veranstaltet &#8212; die zweite Auflage der Entwicklerkonferenz und zugleich einer der dichtesten Produktrelease-Tage, die Anthropic bisher hatte.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><p>Drei Achsen lohnen den Blick:</p><p><strong>Managed-Agents-Features</strong> &#8212; die erste Achse:</p><p><strong>Dreaming</strong> ist ein geplanter Hintergrund-Prozess, der zwischen Sessions die bisherigen Agent-Transkripte und den Memory-Store durchgeht. Harvey berichtet aus dem Pilot eine grobe Versechsfachung der Task-Completion-Rate &#8212; Anthropics Headline-Zahl, ohne externe Benchmark.</p><p><strong>Outcomes</strong> legt einen eigenst&#228;ndigen Evaluator-Loop um den Agent: Eine getrennte Claude-Session bewertet den Output gegen ein Bewertungsraster und gibt zur&#252;ck, was zu fixen ist &#8212; auf docx-Tasks +8,4 %, auf pptx +10,1 % Task-Success in Anthropics internen Tests.</p><p><strong>Multiagent Orchestration</strong> l&#228;sst ein Lead-Agent-Modell parallel Subagenten auf einem gemeinsamen Filesystem aufspannen. Netflix nutzt das Pattern, um Build-Logs aus hunderten Quellen parallel zu analysieren.</p><p><strong>Rate-Limits und Compute</strong> &#8212; die zweite Achse:</p><p>Die <strong>5-Stunden-Limits in Claude Code wurden permanent verdoppelt</strong> f&#252;r Pro, Max, Team und seat-basierte Enterprise-Pl&#228;ne; die <strong>Peak-Hour-Drosselung</strong>, die seit Ende M&#228;rz auf Pro- und Max-Accounts lag, <strong>ist weg</strong>. API-Rate-Limits f&#252;r Opus-Modelle wurden &#8222;erheblich&#8221; angehoben.</p><p>Dahinter steht ein Deal, der vor einer Woche noch undenkbar gewesen w&#228;re: Anthropic mietet die <strong>gesamte Kapazit&#228;t von SpaceX&#8217; Colossus-1-Datacenter in Memphis</strong> &#8212; &#252;ber <strong>300 Megawatt</strong> und mehr als <strong>220.000 Nvidia-GPUs</strong>, online innerhalb des Monats.</p><p>Warum diese drastische Kehrtwende?</p><ul><li><p>Rechenkapazit&#228;tsengp&#228;sse: Anthropic verzeichnete eine massive Nachfrage nach seiner KI, stie&#223; jedoch aufgrund begrenzter Rechenkapazit&#228;ten an erhebliche Grenzen.</p></li><li><p>Der &#220;berschuss bei SpaceX: Musk hatte f&#252;r sein eigenes xAI-Projekt &#252;berdimensionierte Infrastruktur aufgebaut und verf&#252;gte somit &#252;ber sofort nutzbare Rechenzentrumskapazit&#228;ten.</p></li></ul><p>Elon Musk, der Anthropic im Februar noch &#246;ffentlich als &#8222;evil&#8221; bezeichnet hatte, schrieb nach einem Meeting mit Anthropic:</p><blockquote><p>&#8222;Everyone I met was highly competent and cared a great deal about doing the right thing. No one set off my evil detector.&#8221;</p></blockquote><p>SpaceX habe sich vertraglich das Recht gesichert, Kapazit&#228;t zur&#252;ckzuziehen, falls Anthropics AI &#8222;Handlungen ausf&#252;hrt, die der Menschheit schaden&#8221;.</p><p><strong>Claude Code, Code Review, Add-ins</strong> &#8212; die dritte Achse.</p><p>Anthropic stellt <strong>Code Review</strong> als Research Preview f&#252;r Team- und Enterprise-Pl&#228;ne vor: Ein Team von Agenten pr&#252;ft jeden PR, token-basiert abgerechnet, <strong>15&#8211;25 $ pro Review im Schnitt</strong>.</p><p>Eigener Use-Case-Beleg: Bei Anthropic intern bekamen vor dem Tool nur 16 % der PRs substanzielle Review-Kommentare &#8212; nach Rollout 54 %.</p><p>Dazu kommen <strong>Microsoft-365-Add-ins</strong> (Excel, PowerPoint, Word ; Outlook als Preview), Agent-Templates f&#252;r Financial Services (Pitchbook-Builder, KYC-Screener, Month-End-Closer u. a.), und das <strong>Claude Agent SDK</strong> ist offiziell f&#252;r externe Entwickler freigegeben &#8212; dasselbe SDK, auf dem IDE und Desktop-App gebaut sind.</p><p><strong>Und der Vertikalisierungs-Push l&#228;uft direkt weiter.</strong></p><p>Am 13. Mai folgt <strong>Claude for Small Business</strong> &#8212; 15 vorgefertigte Workflows, 15 Skills, Connectoren zu QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace und Microsoft 365 &#8212; flankiert von einer 10-St&#228;dte-Tour (Start in Chicago) mit halbt&#228;gigen AI-Fluency-Trainings f&#252;r je 100 lokale Business-Leader.</p><p>Am 14. Mai dann zwei Schwergewichte parallel:</p><p><strong>PwC</strong> k&#252;ndigt einen breiten Claude-Einsatz an &#8212; f&#252;r Tech-Entwicklung, Deal-Execution und Enterprise-Transformation.</p><p>Und Anthropic k&#252;ndigt eine <strong>200-Mio.-Dollar-Partnerschaft mit der Gates Foundation</strong> &#252;ber vier Jahre an &#8212; Global Health, Bildung und Economic Mobility.</p><p><strong>Warum das relevant ist:</strong> <br>Vor einem Monat hat Anthropic Routines vorgestellt; jetzt liefert die Konferenz die Schicht darunter &#8212; Dreaming als Memory-Konsolidierung zwischen L&#228;ufen, Outcomes als externe Evaluator-Loop, Multi-Agent-Orchestrierung als Lead/Subagent-Pattern.</p><p>Das ist nicht zuf&#228;llig: Es ist exakt der <strong>Brain/Hands/Session-Split</strong>, den Addy Osmani vor zwei Wochen sortiert hat (siehe #005) &#8212; nur jetzt als geliefertes Produkt-Set, nicht mehr als Konvergenz-Beobachtung.</p><p>Mercado Libre, das mit 23.000 Engineers auf Code with Claude angek&#252;ndigt hat, <strong>90 % autonomes Coding bis Q3 2026</strong> als Ziel zu setzen, gibt den Ma&#223;stab vor, an dem sich die n&#228;chsten Quartale messen lassen.</p><p>Und der SpaceX-Deal verschiebt die geopolitische Frage, ob ein einzelner Anbieter sich aus dem Compute-Engpass freikaufen kann, mit einem Schlag in die Gegenwart.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://claude.com/blog/code-review">Anthropic Blog: Code Review for Claude Code</a></p></li><li><p><a href="https://www.anthropic.com/news/finance-agents">Anthropic: Agents for financial services</a></p></li><li><p><a href="https://simonwillison.net/2026/May/6/code-w-claude-2026/">Simon Willison: Live blog Code w/ Claude 2026</a></p></li><li><p><a href="https://letsdatascience.com/blog/anthropic-dreaming-claude-managed-agents-self-improving-may-6">Let&#8217;s Data Science: Dreaming for Claude Managed Agents</a></p></li><li><p><a href="https://blakecrosley.com/blog/code-with-claude-sf-2026-recap">Blake Crosley: Code with Claude SF 2026 Recap</a></p></li><li><p><a href="https://capacityglobal.com/news/anthropic-secures-full-capacity-of-spacex-data-centre/">Capacity Global: Anthropic secures full capacity of SpaceX Colossus 1</a></p></li><li><p><a href="https://www.anthropic.com/news/claude-for-small-business">Anthropic: Introducing Claude for Small Business</a></p></li><li><p><a href="https://www.anthropic.com/news/gates-foundation-partnership">Anthropic: $200M Partnership with the Gates Foundation</a></p></li><li><p><a href="https://www.anthropic.com/news">Anthropic News: PwC deploying Claude</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Sieben Releases zwischen 8. und 14. Mai (<strong>v2.1.136 bis v2.1.142</strong>).</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><code>claude agents</code><strong> &#8212; Agent View als CLI-Dashboard</strong> (Research Preview) &#8212; Eine einzige &#220;bersicht f&#252;r alle Sessions: laufend, wartend, fertig. Session-ID, Wartet-auf-User-Status, letzte Antwort, Timestamp. Via Linkspfeil aus aktiver Session erreichbar. F&#252;r alle, die parallele Worktrees managen, ist das der lange erwartete Supervisions-View.<br>Mein Fazit: Ich hab&#8217;s getestet. Extrem praktisch.</p><p><code>/goal</code><strong> &#8212; Completion-Conditions statt nur Prompts</strong> &#8212; Ein objektiv definiertes Ziel, das Claude &#252;ber mehrere Turns hinweg verfolgt. Ein <strong>separater Evaluator</strong> pr&#252;ft nach jedem Turn die Bedingung; entschieden wird nicht vom Modell, das gerade arbeitet. Funktioniert in Interactive, <code>-p</code>-Flag und Remote Control.</p><p><strong>Plugin-Details</strong> &#8212; <code>claude plugin details &lt;name&gt;</code> listet Token-Kosten und Inventar pro Plugin. Plus: Transkript-Navigation per <code>?</code>, <code>{</code>, <code>}</code>, <code>v</code>.</p><h3>F&#252;r Hook- und MCP-Workflows</h3><p><code>CLAUDE_PROJECT_DIR</code><strong> f&#252;r MCP-Stdio-Server</strong> &#8212; Stdio-MCP-Server bekommen den Projekt-Pfad jetzt als Environment-Variable mitgereicht. Wer Server schreibt, die kontextabh&#228;ngig arbeiten m&#252;ssen, spart sich den Workaround.</p><p><strong>Subagent-Header </strong><code>x-claude-code-agent-id</code><strong> und </strong><code>x-claude-code-parent-agent-id</code> &#8212; API-Requests aus Subagents tragen jetzt ihre Identit&#228;t und die ihres Parent-Agents im Header. Saubere Telemetrie und Audit-Trail &#252;ber verschachtelte Agent-B&#228;ume &#8212; Voraussetzung f&#252;r Multi-Agent-Debugging, das jenseits eines Levels nicht mehr von Hand geht.</p><h3>F&#252;r Sicherheit und Plattform</h3><p><strong>Fast Mode l&#228;uft jetzt auf Opus 4.7</strong> (v2.1.142, 14. Mai) &#8212; Fast Mode in Claude Code nutzt standardm&#228;&#223;ig <strong>Opus 4.7</strong> statt 4.6; wer beim alten Verhalten bleiben will, setzt <code>CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1</code>.</p><p>Gleicher Release: <strong>acht neue Flags f&#252;r </strong><code>claude agents</code> (<code>--add-dir</code>, <code>--settings</code>, <code>--mcp-config</code>, <code>--plugin-dir</code>, <code>--permission-mode</code>, <code>--model</code>, <code>--effort</code>, <code>--dangerously-skip-permissions</code>), um die im Hintergrund angesto&#223;enen Sessions zu konfigurieren.</p><p><strong>MCP-Hygiene</strong> (v2.1.136 und Folge-Releases) &#8212; Server verschwinden nicht mehr stillschweigend nach <code>/clear</code>. OAuth-Refresh-Tokens gehen bei parallelen Servern nicht mehr verloren. HTTP/SSE-Server haben kein unbounded Memory-Growth mehr.</p><p><strong>Code Review f&#252;r Team/Enterprise</strong> &#8212; die gr&#246;&#223;te Neuerung kommt nicht &#252;ber den CLI-Changelog, sondern als eigenes Produkt: Multi-Agent-PR-Reviews, token-basiert abgerechnet, 15&#8211;25 $ pro Review, optimiert auf Tiefe statt Latenz. Direkter Wettbewerber zu Cursors Security Reviewer aus #005.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://claude.com/blog/agent-view-in-claude-code">Anthropic Blog: Agent view in Claude Code</a></p></li><li><p><a href="https://code.claude.com/docs/en/goal">Claude Code Docs: Keep Claude working toward a goal</a></p></li><li><p><a href="https://github.com/anthropics/claude-code/releases/tag/v2.1.142">Claude Code v2.1.142 Release Notes</a></p></li></ul><div><hr></div><h2>Agentic Coding: Cursor parallelisiert, Codex aufs Handy, xAI tritt in den CLI-Markt ein</h2><p><strong>Cursor 3.3</strong> (7. Mai) &#8212; Drei sp&#252;rbare Schritte: ein <strong>redesignter PR-Review-View</strong> mit getrennten Reviews/Commits/Changes-Tabs, <strong>Build in Parallel</strong> (async Subagenten arbeiten gleichzeitig an unabh&#228;ngigen Plan-Slices) und <strong>PR-Splitting</strong> &#252;ber den Chat-Kontext. Cursor kopiert hier nicht den Anthropic-Push, sondern parallelisiert prim&#228;r die Ausf&#252;hrung &#8212; die Antwort eines IDE-zentrierten Hosts auf die Lead/Subagent-Konvergenz.</p><p><strong>Cursor in Microsoft Teams</strong> (11. Mai) &#8212; <code>@Cursor</code> in jedem Teams-Channel: delegierter Cloud-Agent oder Pull aus Cursor in Teams. Repository- und Modellwahl automatisch. Liest den ganzen Thread f&#252;r Kontext, erstellt einen PR zur Review. Damit ist Cursor der erste Coding-Agent-Host, der nativ in der prim&#228;ren Enterprise-Kollaborationsschicht sitzt.</p><p><strong>Cursor Bugbot mit Effort-Levels</strong> (11. Mai) &#8212; Default/High/Custom f&#252;r PR-Reviews, Usage-basierte Abrechnung. Bekanntes Muster: Tiefere Reviews kosten mehr, billigere reichen f&#252;r offensichtliche Issues.</p><p><strong>OpenAI Codex CLI v0.130.0</strong> (8. Mai) &#8212; <code>codex remote-control</code> als simpler Entry-Point f&#252;r einen headless app-server, der von anderen Prozessen aus gesteuert wird. v0.131.0 l&#228;uft seit 9. Mai in Alpha mit mehreren Builds pro Tag &#8212; Codex zieht bei Headless-Architektur sichtbar nach.</p><p><strong>Codex in der ChatGPT Mobile App</strong> (14. Mai) &#8212; OpenAI bringt Codex in der ChatGPT-App auf iOS und Android, &#8222;in Preview, jetzt f&#252;r alle Pl&#228;ne&#8221;. Vom Handy aus alle Threads sehen, Outputs pr&#252;fen, Commands genehmigen, Modelle wechseln, Neues ansto&#223;en. Mobile als Approval-Surface ist die Antwort auf die Lead/Subagent-Realit&#228;t: Wer den ganzen Tag an verteilten Hintergrund-Agenten arbeitet, will nicht f&#252;r jeden Approval ans Notebook.</p><p><strong>xAI Grok Build &#8212; erster CLI-Coding-Agent von xAI</strong> (15. Mai, Beta) &#8212; Damit ist xAI der dritte Frontier-Lab-Player im Terminal-CLI-Markt nach Anthropic (Claude Code) und OpenAI (Codex CLI). <strong>Plan Mode</strong> mit Step-by-Step-Approval und Diffs vor jeder &#196;nderung, parallele <strong>Sub-Agents</strong> f&#252;r gr&#246;&#223;ere Tasks, <strong>Headless Mode</strong> (<code>-p</code>) f&#252;r Skripte, Support f&#252;r <code>AGENTS.md</code>, Plugins, Hooks und MCP-Server, <code>/feedback</code>-Command. Beta zun&#228;chst exklusiv f&#252;r SuperGrok-Heavy-Abos. Inhaltlich keine &#220;berraschung &#8212; die Konvergenz auf das Claude-Code-/Codex-Pattern ist bemerkenswert deutlich.</p><p><strong>GitHub Copilot &#8212; vier Updates 14./15. Mai</strong> &#8212; Der <strong>Cloud-Agent unterst&#252;tzt Auto-Modell-Auswahl</strong> (kein manuelles Vorgeben mehr), <strong>Team-Level-Usage-Metrics</strong> sind &#252;ber die API verf&#252;gbar (Org-Visibility), die <strong>Copilot-Desktop-App geht in Tech Preview</strong> (Copilot l&#246;st sich aus der IDE), und Memory respektiert nun <strong>User-Preferences f&#252;r Pro/Pro+</strong>. Plus weiterhin g&#252;ltig aus #005-Linie: <strong>Cloud-Agent-Secrets auf Org-Ebene</strong> (8. Mai) &#8212; Geteilte Secrets und Variablen f&#252;r Agents-Workflows, getrennt von normalen Actions-Secrets.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://cursor.com/changelog">Cursor Changelog</a></p></li><li><p><a href="https://github.com/openai/codex/releases">OpenAI Codex Releases (GitHub)</a></p></li><li><p><a href="https://techcrunch.com/2026/05/14/openai-says-codex-is-coming-to-your-phone/">TechCrunch: OpenAI says Codex is coming to your phone</a></p></li><li><p><a href="https://the-decoder.com/x-ai-plays-catch-up-with-grok-build-its-first-terminal-based-coding-agent/">The Decoder: xAI plays catch-up with Grok Build</a></p></li><li><p><a href="https://github.blog/changelog/">GitHub Changelog</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>&#8222;Act 2&#8221; &#8212; GitLab restrukturiert sich um Agents, und der n&#228;chste Org-Umbau steht an</h3><p>Am 11. Mai hat <strong>GitLab</strong> unter dem Titel <strong>&#8222;GitLab Act 2&#8221;</strong> einen Komplettumbau angek&#252;ndigt: Verkleinerung des Country-Footprints um bis zu 30 %, Abbau von bis zu drei Management-Layern, Reorganisation in rund 60 kleinere R&amp;D-Teams mit End-to-End-Ownership &#8212; plus eine Workforce-Reduktion, deren finaler Umfang erst auf dem Earnings-Call am 2. Juni bekanntgegeben wird (Bloomberg und mehrere Outlets berichten unter Verweis auf das SEC-8-K-Filing von rund 7 Prozent).</p><p>CEO Bill Staples begr&#252;ndet das nicht mit makro&#246;konomischem Druck, sondern explizit mit &#8222;der agentischen &#196;ra&#8221;: Interne Reviews, Approvals und Handoffs sollen durch AI-Agents ersetzt, Rollen entsprechend zugeschnitten werden. Die Aktie verlor nach Bekanntgabe knapp zehn Prozent.</p><p>Das ist die erste <strong>b&#246;rsennotierte Devtools-Firma</strong>, die ihre Restrukturierung offen als &#8222;Wir bauen uns um Agents herum neu&#8221; begr&#252;ndet &#8212; und es ist erst der Anfang.</p><p>Cloudflares interner Engineering-Stack aus #004, Anthropics Sprung der substanziellen PR-Review-Quote von 16 auf 54 Prozent, Mercado Libres 90-Prozent-Autonomous-Coding-Ziel &#8212; sie alle deuten in dieselbe Richtung: Es geht nicht mehr um &#8222;AI als Tool f&#252;r bestehende Workflows&#8221;, sondern um die Frage, wie sich <strong>Org-Designs ver&#228;ndern</strong>, wenn weite Teile der Software-Wertsch&#246;pfungskette von Agents getragen werden.</p><p>Die unbequeme Seite ist ebenso wichtig. GitLab erntet bereits den Vorwurf des <strong>&#8222;AI Washings&#8221; &#8212; Layoffs in agentischer Sprache verpackt</strong>. Ob die 60 autonomen R&amp;D-Teams in zw&#246;lf Monaten schneller liefern oder ob die Restrukturierung prim&#228;r eine Margen-Story f&#252;r Anleger ist, l&#228;sst sich heute nicht beantworten. Worauf Teams jetzt achten sollten: Welche Aufgaben automatisieren sich tats&#228;chlich agentisch, welche bekommen nur einen neuen Namen &#8212; und welche Restrukturierung ist eigentlich nur eine herk&#246;mmliche Kostenk&#252;rzung mit Hochglanz-Vokabular.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://about.gitlab.com/blog/gitlab-act-2/">GitLab Blog: GitLab Act 2</a></p></li><li><p><a href="https://www.bloomberg.com/news/articles/2026-05-11/gitlab-says-will-cut-jobs-to-spend-on-growth-in-agentic-era">Bloomberg: GitLab to Cut Jobs, Reinvest in AI Agent Growth Strategy</a></p></li><li><p><a href="https://thenextweb.com/news/gitlab-layoffs-agentic-era-devops-ai">TheNextWeb: GitLab layoffs and the agentic era</a></p></li></ul><div><hr></div><h2>Tipp der Woche</h2><h3>&#8222;Deliberate Skill Development&#8221; &#8212; gegen die Fluency-Illusion beim AI-Coding</h3><p>Cat Hicks (Psychological Scientist mit Fokus auf Software-Teams) und Michael Mullarkey haben einen <strong>Skill f&#252;r Claude Code und Codex</strong> ver&#246;ffentlicht: <code>learning-opportunities</code> auf GitHub. Idee: w&#228;hrend des AI-assisted Codings schiebt der Skill kurze, an Lerntheorie orientierte &#220;bungen ein &#8212; Prediction, Retrieval Practice, Spaced Repetition. Optional als <code>learning-opportunities-auto</code> mit automatischem Trigger.</p><p><strong>Warum das hier steht:</strong> Sauber generierter Code wird leicht als verstandener Code wahrgenommen &#8212; die klassische <em>fluency illusion</em>. Wer den ganzen Tag mit Coding-Agents arbeitet, baut sich dar&#252;ber unbemerkt Wissensl&#252;cken in genau den Stellen, die sp&#228;ter das Debug-Limit setzen. Das Skill ist die seltene Spezies eines AI-Tools, das nicht mehr Output verspricht, sondern verlangsamt &#8212; und das ist der Punkt.</p><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Anthropic in Gespr&#228;chen &#252;ber 30-Mrd.-Runde bei 900-Mrd.-Bewertung</strong> (12. Mai) &#8212; Fr&#252;he Investorengespr&#228;che, Abschluss m&#246;glicherweise noch im Mai. Die Vorrunde im Februar lag bei 350 Mrd. &#8212; eine knappe Verdreifachung in drei Monaten. <a href="https://www.bloomberg.com/news/articles/2026-05-12/anthropic-in-talks-to-raise-30-billion-at-900-billion-valuation">Bloomberg</a></p></li><li><p><strong>Akamai-Compute-Deal &#252;ber 1,8 Mrd. $</strong> (Bloomberg, 8. Mai) &#8212; Sieben Jahre, laut Akamai der gr&#246;&#223;te Vertrag in Firmengeschichte. Akamai-Aktie sprang um 27 % auf 148 $. Revenue beginnt im Q4 2026 mit 20&#8211;25 Mio. $ anzulaufen. <a href="https://www.bloomberg.com/news/articles/2026-05-08/anthropic-inks-1-8-billion-computing-deal-with-akamai">Bloomberg</a></p></li><li><p><strong>Claude Platform auf AWS</strong> (13. Mai, GA) &#8212; Erster Cloud-Provider mit nativem Zugriff auf Anthropics Platform-Stack: Managed Agents (Beta), Skills (Beta), MCP-Connector, Files API, prompt caching &#8212; alles via AWS-IAM und CloudTrail-Audit. Verf&#252;gbar in acht Regionen inklusive Frankfurt, Dublin und London. <a href="https://aws.amazon.com/blogs/machine-learning/introducing-claude-platform-on-aws-anthropics-native-platform-through-your-aws-account/">AWS Machine Learning Blog</a></p></li><li><p><strong>Simon Willison &#252;ber Shopify River</strong> (11. Mai) &#8212; Internes Coding-Agent-Tool, das ausschlie&#223;lich in &#246;ffentlichen Slack-Channels operiert; auf Direktnachrichten antwortet River mit dem Vorschlag, einen Channel zu erstellen. Such- und Lernbarkeit by design. Lesenswertes Gegenmodell zu &#8222;Agent l&#228;uft im stillen DM&#8221;. <a href="https://simonwillison.net/2026/May/11/learning-on-the-shop-floor/">simonwillison.net</a></p></li><li><p><strong>Anthropic Engineering: &#8222;How Claude Code works in large codebases&#8221;</strong> (14. Mai) &#8212; Best-Practices-Post zu Multi-Million-Line-Monorepos: CLAUDE.md-Hierarchie, <code>.ignore</code>-Files, <code>permissions.deny</code>, f&#252;nf Extension-Points (CLAUDE.md, Hooks, Skills, Plugins, MCP-Server) plus LSP-Integration und Subagents. Kernsatz: &#8222;The harness matters as much as the model&#8221; &#8212; und: RAG-basierte Coding-Tools skalieren in gro&#223;en Monorepos schlecht, weil die Embedding-Pipelines mit aktiven Engineering-Teams nicht mithalten. <a href="https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start">claude.com/blog</a></p></li><li><p><strong>Microsoft schiebt Engineers von Claude Code zu GitHub Copilot CLI</strong> (14. Mai) &#8212; Tom Warren (The Verge) berichtet, dass Microsoft seine Entwickler von Claude Code auf die hauseigene GitHub Copilot CLI umzieht &#8212; Claude Code hatte intern hohe Verbreitung gefunden und untergrub den eigenen Tool-Push. Frist und betroffene Microsoft-Gruppe siehe Verge-Original; finanzielle Motivation laut Reporting. Kontrapunkt zur Code-with-Claude-Welle: Plattform-Politik schl&#228;gt Tool-Ergonomie. <a href="https://www.windowscentral.com/microsoft/microsoft-cancels-claude-code-licenses-shifting-developers-to-github-copilot-cli-a-move-likely-driven-by-financial-motives">Windows Central</a></p></li></ul><div><hr></div><p><em>Bisher erschein der &#8218;Agentic Weekly&#8216; donnerstags. Ich bin am &#220;berlegen, ob es besser w&#228;re, ihn am Wochenende zu ver&#246;ffentlichen.</em></p><p><em>Feedback? Einfach kommentieren/antworten.</em></p><div><hr></div><p></p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #005 — Long-running Agents werden zur Architektur, Token-Budgets brechen weg]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-005-long-running-agents</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-005-long-running-agents</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 07 May 2026 19:59:58 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!s2EH!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!s2EH!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!s2EH!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!s2EH!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png" width="1456" height="819" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:819,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1776151,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/196823642?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!s2EH!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 424w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 848w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 1272w, https://substackcdn.com/image/fetch/$s_!s2EH!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F098ee9d8-2a54-4c8f-9479-034ed773acda_1672x941.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p>7.Mai 2026 &#8212; Lesezeit: ~6 Min.</p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Long-running Agents bekommen ihre Architektur &#8212; Brain, Hands, Session</h3><p>Am 30. April hat <strong>Addy Osmani</strong> in einem Long-Read sortiert, was unter &#8222;long-running agents&#8221; eigentlich gemeint ist &#8212; und dabei die Architektur sichtbar gemacht, auf die unabh&#228;ngig voneinander Anthropic, Cursor und Google zulaufen. Drei verschiedene Bedeutungen, sauber getrennt: <strong>Long-horizon reasoning</strong> (Modellqualit&#228;t &#8212; die METR-Metrik f&#252;rs erfolgreich abgeschlossene Task-Horizon verdoppelt sich seit 2019 alle ~7 Monate, das j&#252;ngste TH1.1-Update hat die Anzahl der 8-Stunden-plus-Tasks im Eval-Set verdoppelt), <strong>long-running execution</strong> (das Modell wird hundert- bis tausendfach &#252;ber die Laufzeit aufgerufen) und <strong>persistent agency</strong> (Identit&#228;t &#252;ber Tasks hinweg).</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><p>Drei W&#228;nde, an die jeder Agent l&#228;uft: endlicher Context plus &#8222;context rot&#8221; (Degradation lange vor dem harten Limit), kein persistenter State (Anthropics eigenes Bild: &#8222;Engineers, die in Schichten arbeiten &#8212; jeder neue ohne Erinnerung an die vorige Schicht&#8221;) und keine verl&#228;ssliche Self-Verification (Modelle bewerten ihre eigene Arbeit konsistent zu positiv).</p><p>Spannender als die W&#228;nde ist die Konvergenz: Anthropics <strong>Brain / Hands / Session</strong>-Split, Cursors <strong>Planner / Worker / Judge</strong> und Googles <strong>Agent Runtime / Agent Sandbox / Agent Sessions</strong> sind drei Namen f&#252;r dasselbe Muster. Brain = Modell plus Harness-Loop. Hands = sandboxed, ephemere Execution-Umgebungen. Session = append-only Event-Log, das den Lauf rekonstruierbar macht. Praktisch hei&#223;t das: State wandert aus dem Modell-Context heraus ins Filesystem oder in eine Datenbank &#8212; die <code>Ralph Loop</code> von Geoffrey Huntley und Ryan Carson zeigt das in 30 Zeilen Bash mit <code>prd.json</code>, <code>progress.txt</code>, <code>AGENTS.md</code>. Anthropic berichtet aus internen Tests von <strong>30+ Stunden autonomem Coding</strong>, ein Lauf produzierte einen 11.000-Zeilen-Slack-Klon.</p><p><strong>Warum das relevant ist:</strong> Wer Agents jenseits der Stundenmarke baut, kommt um diesen Split nicht herum. Osmanis Test ist ehrlich: &#8222;If you can&#8217;t reconstruct what the agent did in the last 24 hours from durable storage, what you have is a long-running shell script that happens to call an LLM, not a long-running agent.&#8221; &#8212; Eine Ebene weiter raus zoomt <strong>Jack Clark</strong>, Anthropic-Mitgr&#252;nder, in <em>Import AI #455</em> (4. Mai): Er taxiert die Wahrscheinlichkeit auf 60+ %, dass AI-Systeme bis Ende 2028 autonom R&amp;D betreiben und ihre Nachfolger trainieren. SWE-Bench-Progression von ~2 % (Claude 2, Ende 2023) auf 93,9 % (Claude Mythos Preview); Task-Horizon von ~30 Sekunden 2022 auf ~12 Stunden 2026, Forecaster Ajeya Cotra projiziert ~100 Stunden bis Jahresende. Wer die Architektur-Arbeit dieser Woche zusammen mit Clarks Kurve liest, sieht, warum die Anthropic-K&#246;pfe die Zeitachse f&#252;r eng halten.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://addyo.substack.com/p/long-running-agents">Addy Osmani: Long-running agents &#8212; building the architecture for agents that work for hours, days, and weeks</a></p></li><li><p><a href="https://importai.substack.com/p/import-ai-455-automating-ai-research">Jack Clark / Import AI #455: AI systems are about to start building themselves</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Vier Releases in einer ruhigeren Woche: <strong>v2.1.126, v2.1.128, v2.1.129, v2.1.131</strong>. Schwerpunkt: Plugin-Distribution, OAuth-Polish, eine Reihe handfester Subprozess- und Cache-Fixes.</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><code>claude project purge</code><strong> ist da</strong> &#8212; v2.1.126 r&#228;umt alle Claude-Code-Spuren aus einem Projekt: Transcripts, Tasks, File-History, Config. Mit <code>--dry-run</code>, <code>--interactive</code>, <code>--all</code> f&#252;r mehrere Projekte. Vorher musste man drei Verzeichnisse von Hand kennen.</p><p><code>/context</code><strong> verschwendet keine Tokens mehr</strong> &#8212; v2.1.129 fixt einen alten &#196;rger: Der ASCII-Visualisierungs-Block landete bisher in der Konversation und kostete pro Aufruf rund 1.600 Tokens.</p><p><code>/model</code><strong> zeigt nur noch ein Opus-Eintrag</strong> &#8212; Die Doppelung &#8222;Opus 4.7&#8221; und &#8222;Opus&#8221; im Picker ist weg, der aktuelle Opus hei&#223;t jetzt schlicht &#8222;Opus&#8221; (v2.1.128).</p><h3>F&#252;r Plugin- und MCP-Workflows</h3><p><code>--plugin-url</code><strong> und </strong><code>--plugin-dir</code><strong> mit Zip</strong> &#8212; v2.1.128/129 erlauben das Laden von Plugin-Archiven direkt aus URL oder lokaler <code>.zip</code>. Saubere L&#246;sung f&#252;r Air-Gapped-Setups und ad-hoc-Tests, ohne Marketplace-Eintrag.</p><p><strong>MCP-Reconnects fluten die Konversation nicht mehr</strong> &#8212; v2.1.128: Wenn ein Server seine Tools re-announced, kommt nur noch eine Server-Prefix-Zusammenfassung statt der vollen Tool-Liste. Wer mit f&#252;nf+ MCP-Servern arbeitet, merkt das sofort.</p><p><code>/mcp</code><strong> zeigt Tool-Counts</strong> &#8212; v2.1.128 markiert Server mit 0 Tools &#8212; ein simpler Blick reicht jetzt, um stille Misskonfigurationen zu sehen.</p><h3>F&#252;r Performance und Plattform</h3><p><strong>Subagent-Summaries nutzen wieder Prompt-Cache</strong> &#8212; v2.1.128 fixt eine Regression, die <code>cache_creation</code> ungef&#228;hr verdreifacht hatte. Wer Subagents heavy nutzt, sollte den Token-Verbrauch nach dem Update direkt vergleichen.</p><p><strong>Parallel Tool-Calls brechen sich nicht mehr gegenseitig ab</strong> &#8212; Ein fehlgeschlagener Read-Only-Befehl (<code>grep</code>, <code>git diff</code>, <code>ls</code>) cancelte bisher die Geschwister-Calls. Behoben in v2.1.128.</p><p><strong>OAuth h&#228;rtet sich</strong> &#8212; Eine Race Condition zwischen Wake-from-Sleep und Token-Refresh, die laufende Sessions ausloggte, ist gefixt (v2.1.129). Au&#223;erdem: <code>claude auth login</code> akzeptiert jetzt einen OAuth-Code per Paste, wenn der Browser-Callback localhost nicht erreicht (v2.1.126) &#8212; endlich sauber f&#252;r WSL2, SSH-Sessions, DevContainer.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code Mai 2026</a></p></li></ul><div><hr></div><h2>Agentic Coding: Cursor mit eigenem SDK und Security-Review, Codex baut Plugin-Disziplin aus</h2><p><strong>Cursor SDK</strong> (29. April) &#8212; Cursor &#246;ffnet seine Agent-Plattform f&#252;r programmatischen Zugriff: TypeScript-SDK, lokal oder gegen Cursors Cloud-VMs ausf&#252;hrbar, freie Modellwahl. Dazu reworked Cloud-Agents-API mit SSE-Streaming und expliziten Lifecycle-Controls. Damit ist Cursor das n&#228;chste Tool nach Claude Code, das nicht nur als IDE/Terminal, sondern als API f&#252;r Agent-Pipelines auftritt.</p><p><strong>Cursor Security Review</strong> (30. April, Beta f&#252;r Teams/Enterprise) &#8212; Zwei Always-On-Agenten: ein <strong>Security Reviewer</strong>, der jede PR auf Security-Vulnerabilities, Auth-Regressionen und Privacy-/Data-Handling-Risiken pr&#252;ft, plus ein <strong>Vulnerability Scanner</strong> mit geplanten Codebase-Scans gegen bekannte Vulnerabilities und veraltete Dependencies. Direkter Konkurrent zu Claude Codes <code>/security-review</code>-Skill &#8212; und ein klares Signal, dass Review-Workloads in Pull Requests die n&#228;chste Schicht sind, in der die Agent-Hosts gegeneinander antreten.</p><p><strong>Cursor Spend Management</strong> (4. Mai) &#8212; Granulare Allow-/Blocklists pro Modell und Provider, Soft-Spend-Limits mit Alerts bei 50/80/100 %. Liest sich wie eine direkte Antwort auf das Engineering-Budget-Problem, das diese Woche separat dokumentiert wurde (siehe Trend unten).</p><p><strong>OpenAI Codex CLI</strong> legt zweimal nach: <strong>0.128.0</strong> (30. April) bringt <strong>Goals-Workflows</strong>, <strong>Permission Profiles</strong>, Plugin-Management und Support f&#252;r externe Agent-Sessions. <strong>0.129.0</strong> (7. Mai) folgt mit TUI-Polish: redesigned Resume/Fork Picker, workspace-aware <code>/diff</code>, Plugin-Workspace-Sharing und Lifecycle-Hooks. Damit zieht Codex bei Plugin-Disziplin und Session-Handling sichtbar nach.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://cursor.com/changelog">Cursor Changelog: SDK &#183; Security Review &#183; Spend Management</a></p></li><li><p><a href="https://developers.openai.com/codex/changelog">Codex Changelog (OpenAI Developers)</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Token-Spend bricht Engineering-Budgets &#8212; und die Strategie spaltet sich</h3><p><strong>Gergely Orosz</strong> hat f&#252;r <em>The Pragmatic Engineer</em> (30. April) <strong>15 Firmen</strong> zwischen Seed-Stage und 10.000+ Mitarbeiter anonym befragt. Das Bild ist eindeutig und unbequem: Bei einem AI-Infra-Startup stieg Token-Spend pro Entwickler in sechs Monaten <strong>von $200 auf $3.000 pro Monat &#8212; 15-fach</strong>. Bei einem Healthcare-Konzern verbrauchte ein einzelner Engineer in <strong>einer Claude-Code-Session $1.400</strong>. In einem US-/EU-Fintech laufen Heavy-User auf Claude Code bei <strong>$500 pro Tag</strong>. Bei einem E-Commerce-Konzern mit ~2.000 Devs ist nur <strong>Opus 4.7 zum Coden zugelassen</strong>: &#8222;leichte Fehler in Produktion kosten Stunden&#8221;. Vendor-Verhandlungen klaffen weit auseinander: Cursor gew&#228;hrt Rabatte ab ~$1 Mio. Spend, Anthropic auch bei $5 Mio.+ pro Jahr nicht.</p><p>Die Firmen teilen sich grob 50/50 in zwei Lager: &#8222;Let it rip and start measuring&#8221; (laufen lassen, Impact messen) und &#8222;Curb spending&#8221; (Default auf billigere Modelle, Caps, Consent-Gates). Ein Engineering Manager im Healthcare-Sektor mit f&#252;nfzehn Jahren Branchenerfahrung sagt, einen so dramatischen Wandel habe er noch nie erlebt &#8212; vergleichbar nur mit dem Sprung zu h&#246;heren Programmiersprachen.</p><p>Das Bemerkenswerte ist, wie schnell die Tools darauf antworten: Cursors Spend-Management dieser Woche ist genau die Telemetrie, die in den befragten Firmen bisher gefehlt hat. Wer 2026 ernsthaft Agentic Engineering betreibt, braucht eine Antwort auf die Kostenseite &#8212; nicht in zw&#246;lf Monaten, sondern f&#252;r den n&#228;chsten Sprint.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://newsletter.pragmaticengineer.com/p/the-pulse-token-spend-breaks-budgets">Pragmatic Engineer: Token spend breaks budgets</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Background Agents Summit</strong> (6./7. Mai, virtuell) &#8212; Ona richtet das nach eigener Beschreibung erste Event aus, das ausschlie&#223;lich Background Agents gewidmet ist; Sprecher unter anderem von Stripe, Harvey, Uber, Monzo, AWS und WorkOS. Wer in den n&#228;chsten Monaten selbst eine Background-Agent-Infrastruktur aufbauen will, bekommt hier kompakt das, was sonst &#252;ber mehrere Engineering-Blogs verteilt ist. <a href="https://background-agents.com/summit">background-agents.com/summit</a></p></li><li><p><strong>Sierra holt $950 Mio.</strong> (4. Mai) &#8212; Bret Taylors Agent-Plattform f&#252;r Enterprise-Customer-Service ist nach der von Tiger Global und GV angef&#252;hrten Runde mit &#252;ber $15 Mrd. bewertet. Das Rennen um Enterprise-Agents wird teurer, je breiter die Anwendungsfelder werden. <a href="https://techcrunch.com/2026/05/04/sierra-raises-950m-as-the-race-to-own-enterprise-ai-gets-serious/">TechCrunch</a></p></li><li><p><strong>OpenAI: &#8222;Automated AI research intern bis September 2026&#8221;</strong> &#8212; Jack Clark zitiert dieses &#246;ffentlich kommunizierte Ziel von OpenAI in <em>Import AI #455</em>. Recursive Superintelligence (Startup) hat $500 Mio. spezifisch f&#252;r AI-R&amp;D-Automatisierung eingesammelt. <a href="https://importai.substack.com/p/import-ai-455-automating-ai-research">Import AI #455</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Donnerstag, 14. Mai 2026</em></p><p><em>Feedback? Einfach kommentieren/antworten.</em></p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #004 — Drei Bugs, sechs Wochen, 40 Milliarden Dollar]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-004-drei-bugs-sechs</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-004-drei-bugs-sechs</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Fri, 01 May 2026 20:09:38 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>1.Mai 2026 &#8212; Lesezeit: ~7 Min.</p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Anthropic legt offen, was Claude Code kaputt gemacht hat</h3><p>Am 23. April hat Anthropic einen <strong>detaillierten Postmortem</strong> ver&#246;ffentlicht &#8212; und damit beendet, was seit Februar Foren, Substacks und Tech-Presse besch&#228;ftigt hat: die Frage, ob Claude &#8222;d&#252;mmer&#8221; geworden ist.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><p>Antwort: ja, aber nicht weil Anthropic das Modell absichtlich heruntergedreht h&#228;tte, sondern weil <strong>drei separate Bugs</strong> sich zeitlich &#252;berlappten und sich gegenseitig verschleierten.</p><ol><li><p><strong>Reasoning-Effort-Downgrade</strong> (4. M&#228;rz &#8594; zur&#252;ckgenommen am 7. April): Default f&#252;r Opus 4.6 und Sonnet 4.6 von <code>high</code> auf <code>medium</code> gesenkt &#8212; als Reaktion auf User-Beschwerden &#252;ber lange Latenzen. Falscher Trade-off, wie sich herausstellte.</p></li><li><p><strong>Caching-Bug</strong> (26. M&#228;rz &#8594; gefixt 10. April): Eine Optimierung sollte alte Thinking-Bl&#246;cke nach &gt;1h Idle entfernen. Ein Bug lie&#223; sie <strong>bei jedem Turn</strong> entfernen &#8212; Ergebnis: Cache-Misses, vermeintliches &#8222;Vergessen&#8221;, schneller verbrauchte Limits.</p></li><li><p><strong>Verbosity-Prompt</strong> (16. April &#8594; zur&#252;ckgenommen am 20. April): Eine System-Prompt-Anweisung sollte die Verbosity zwischen Tool-Calls reduzieren. In Kombination mit anderen &#196;nderungen: 3 Prozent Performance-Drop bei Opus 4.6 und 4.7 in Ablation-Tests (Sonnet 4.6 ebenfalls betroffen), nicht in den urspr&#252;nglichen Evals erkannt.</p></li></ol><p>Alle drei Issues sind seit v2.1.116 (20. April) behoben. Anthropic hat zus&#228;tzlich <strong>Usage Limits aller Subscriber zur&#252;ckgesetzt</strong> und Default-Effort auf <code>xhigh</code> (Opus 4.7) bzw. <code>high</code> (alle anderen) angehoben. Die API war nicht betroffen &#8212; nur Claude Code.</p><p><strong>Warum das relevant ist:</strong></p><p>Das ist die transparenteste &#246;ffentliche Aufarbeitung, die ein Frontier-Lab bislang zu einem Quality-Drop geliefert hat.</p><p>Drei wichtige Lehren stecken drin:</p><ol><li><p>Evaluation-Suiten erkennen interagierende Regressionen schlecht &#8212; keine der drei &#196;nderungen war f&#252;r sich genommen problematisch.</p></li><li><p>Caching- und Harness-Verhalten sind genauso modellrelevant wie Gewichte; wer Coding-Agents baut, muss das mitmessen.</p></li><li><p>Vertrauen kommt zur&#252;ck, wenn Postmortems so detailliert sind wie dieses &#8212; und nicht, wenn man stillschweigend zur&#252;ckrollt.</p></li></ol><p>Der Wermutstropfen: Sechs Wochen Schaden waren entstanden, bevor die Aufkl&#228;rung kam.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.anthropic.com/engineering/april-23-postmortem">Anthropic: An update on recent Claude Code quality reports</a></p></li><li><p><a href="https://venturebeat.com/technology/mystery-solved-anthropic-reveals-changes-to-claudes-harnesses-and-operating-instructions-likely-caused-degradation">VentureBeat: Anthropic reveals harness changes likely caused degradation</a></p></li><li><p><a href="https://www.theregister.com/2026/04/23/anthropic_says_it_has_fixed/">The Register: Anthropic admits it dumbed down Claude with &#8216;upgrades&#8217;</a></p></li><li><p><a href="https://stackfutures.com/blog/anthropic-claude-code-postmortem-three-bugs-six-weeks-april-2026/">Stack Futures: Three Overlapping Changes, Six Weeks of Degradation</a></p></li><li><p><a href="https://machinelearningatscale.substack.com/p/anthropic-shipped-three-regressions">Machine Learning at Scale: Three regressions and the evals that didn&#8217;t catch them</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Sieben Releases in sieben Tagen: <strong>v2.1.117 bis v2.1.123</strong>. Schwerpunkt diesmal: Polishing, Memory-Hygiene und Vim-Power-User-Features.</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><strong>Vim Visual Mode endlich da</strong> &#8212; v2.1.118 bringt vollwertige Visual-Selection (<code>v</code>) und Visual-Line (<code>V</code>) inklusive Operatoren. Wer Claude Code aus Vim-Reflex bedient, hatte bisher nur einen Kr&#252;ppelmodus. Jetzt: voller Selection-Workflow, Operator-Pending, visuelles Feedback.</p><p><code>/cost</code><strong> und </strong><code>/stats</code><strong> werden zu </strong><code>/usage</code> &#8212; Konsolidierter Tabbed-View mit Billing und Verbrauch in einem Command. Kleines Detail, aber spart die st&#228;ndige &#8222;welcher Command war&#8217;s nochmal?&#8221;-Frage.</p><p><strong>Custom Themes</strong> &#8212; Per <code>/theme</code> benannte Themes anlegen oder direkt JSON in <code>~/.claude/themes/</code> editieren. Plugins k&#246;nnen Themes &#252;ber ein <code>themes/</code>-Verzeichnis ausliefern. Endlich konfigurierbar ohne Hack.</p><p><code>/resume</code><strong> aus PR-URL</strong> &#8212; v2.1.122: PR-URL aus GitHub, GitHub Enterprise, GitLab oder Bitbucket in die <code>/resume</code>-Suche pasten und die Session finden, die diesen PR erzeugt hat. Wer mit vielen parallelen Worktrees jongliert: Game-Changer.</p><h3>F&#252;r Multi-Agent- und Plugin-Workflows</h3><p><code>alwaysLoad</code><strong> f&#252;r MCP-Tools</strong> &#8212; MCP-Server k&#246;nnen einzelne Tools aus dem Tool-Search-Deferral ausschlie&#223;en. Wer Latenz-kritische Tools hat, sollte das setzen.</p><p><code>PostToolUse</code><strong>-Hooks d&#252;rfen Tool-Output ersetzen</strong> &#8212; Bisher nur f&#252;r MCP-Tools m&#246;glich, jetzt f&#252;r alle Tools via <code>hookSpecificOutput.updatedToolOutput</code>. Er&#246;ffnet sauberere Output-Sanitizer und Redaction-Pipelines.</p><p><strong>Hooks k&#246;nnen MCP-Tools aufrufen</strong> &#8212; v2.1.118 erlaubt <code>type: "mcp_tool"</code> direkt aus Hook-Konfiguration. Neue Komposition: Lifecycle-Events l&#246;sen Tool-Aufrufe ohne Wrapper-Skript aus.</p><p><code>claude plugin prune</code><strong> und </strong><code>tag</code> &#8212; Verwaiste auto-installierte Dependencies entfernen; Release-Tags mit Versionsvalidierung erzeugen. Plugin-Hygiene wird langsam zu echtem Package-Management.</p><h3>F&#252;r CI/CD und Automation</h3><p><code>claude ultrareview [target]</code> &#8212; <code>/ultrareview</code> jetzt non-interaktiv aus CI/Skripten. Damit ist Cloud-basierter Tiefen-Review als Pipeline-Step nutzbar, nicht nur als interaktiver Slash-Command.</p><p><code>AI_AGENT</code><strong> Environment Variable</strong> &#8212; Wird f&#252;r Subprozesse gesetzt; GitHub und andere Hosts k&#246;nnen damit Agent-Attribution korrekt taggen. Ein kleiner, aber wichtiger Baustein f&#252;r saubere Audit-Trails.</p><p><strong>Windows ohne Git Bash</strong> &#8212; v2.1.120 nutzt PowerShell als Default-Shell, wenn Git for Windows fehlt. PowerShell-Tool-Permissions k&#246;nnen auto-genehmigt werden. Schluss mit dem Workaround-Setup f&#252;r Windows-only-Teams.</p><h3>Performance und Plattform</h3><p><strong>Memory-Leaks gefixt</strong> &#8212; v2.1.121 schlie&#223;t mehrere Speicherlecks: Multi-GB-RSS bei vielen Bildern, ~2 GB Leak in <code>/usage</code> bei gro&#223;en Transcripts, Leaks in long-running Tools. Wer Sessions tagelang offen l&#228;sst, merkt das sofort.</p><p><strong>Skill-Suche und Effort-Placeholder</strong> &#8212; Filter-Suchbox in <code>/skills</code>, Skills k&#246;nnen <code>${CLAUDE_EFFORT}</code> referenzieren. Die Skill-Plattform reift in kleinen, n&#252;tzlichen Schritten.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code April 2026</a></p></li><li><p><a href="https://ton-technotes.com/en/blog/2026-04-25-claude-code-weekly-update-v2119/">Ton Technotes: v2.1.115&#8211;119 Polish Inside</a></p></li></ul><div><hr></div><h2>Agentic Coding: Cursor 3.1, Copilot Inline-Agent und der Stack-Mix wird Standard</h2><p><strong>Cursor 3.1</strong> (Nachtrag, Mitte April: 3.1 am 13. April, Interactive Canvases am 15.) erg&#228;nzt das Agents-Window aus 3.0 um <strong>Interactive Canvases</strong>: durable Side-Panel-Artefakte mit Tabellen, Diagrammen, Diffs und Custom-Components. Cursor antwortet jetzt nicht mehr nur mit Text und Code, sondern baut Dashboards und Mini-Interfaces, die neben Terminal und Browser im Side-Panel persistent leben. Das ist die richtige Antwort auf eine Beobachtung, die mehrere Hosts gerade machen: Der Output eines l&#228;ngeren Agent-Laufs vertr&#228;gt mehr als nur Markdown.</p><p><strong>GitHub Copilot Inline Agent Mode</strong> (24. April) &#8212; Public Preview f&#252;r JetBrains-IDEs. Agent-Capabilities aus dem Inline-Chat heraus, ohne in das Chat-Panel zu wechseln. Copilot positioniert sich klar in der &#8222;im IDE bleiben&#8221;-Ecke, w&#228;hrend Claude Code Terminal-first und Cursor IDE-Rebuilt f&#228;hrt.</p><p><strong>The New Stack berichtet</strong>, dass Teams zunehmend <strong>alle drei parallel</strong> nutzen &#8212; Cursor f&#252;r IDE-native Edits, Claude Code f&#252;r Terminal-Workflows und Headless-Routinen, Codex f&#252;r Browser- und Computer-Use. Das ist neu: Vor sechs Monaten war die Tooling-Frage &#8222;wer gewinnt?&#8221;. Jetzt ist sie &#8222;wie kombiniere ich?&#8221;.</p><p><strong>Warum das relevant ist:</strong> Wer noch versucht, ein Tool f&#252;r alles zu w&#228;hlen, optimiert in die falsche Richtung. Die spannenden Setups bauen jetzt <strong>portable Skills, Hooks und Routines</strong>, die zwischen Hosts wandern k&#246;nnen &#8212; genau dort, wo <code>gh skill</code> (siehe #003) ansetzt.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://releasebot.io/updates/cursor">Cursor Release Notes</a></p></li><li><p><a href="https://github.blog/changelog/2026-04-24-inline-agent-mode-in-preview-and-more-in-github-copilot-for-jetbrains-ides/">GitHub Changelog: Inline agent mode in JetBrains</a></p></li><li><p><a href="https://thenewstack.io/ai-coding-tool-stack/">The New Stack: Cursor, Claude Code, Codex are merging into one stack</a></p></li><li><p><a href="https://devtoolpicks.com/blog/cursor-3-agents-window-review-2026">DevTool Picks: Cursor 3 Review</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Big Tech doppelt nach: Googles 40-Milliarden-Wette auf Anthropic</h3><p>Am 24. April hat <strong>Google bis zu 40 Mrd. $ Investment</strong> in Anthropic angek&#252;ndigt &#8212; 10 Mrd. $ jetzt cash bei einer 350-Mrd.-$-Bewertung, weitere 30 Mrd. $ an Performance-Targets gekoppelt. Dazu: <strong>5 Gigawatt Compute</strong> &#252;ber f&#252;nf Jahre via Google Cloud, mit Option auf weitere Gigawatt. Das passiert nur vier Tage, nachdem Amazon zus&#228;tzliche bis zu 25 Mrd. $ committet hatte (5 Mrd. cash, 20 Mrd. an Milestones gekoppelt).</p><p>Die Choreographie ist bemerkenswert: Anthropic und Google sind gleichzeitig Partner und Konkurrenten &#8212; Gemini 3.1 Pro misst sich offen an Opus 4.7. Trotzdem zieht Google nach. Der Grund: Wer in der Coding-Agent-Schicht des Stacks f&#252;hrend bleiben will, muss die Compute-Allokation f&#252;r die Modelle sichern, die Entwickler tats&#228;chlich t&#228;glich benutzen. Anthropic ist genau das geworden &#8212; auch dank Claude Code.</p><p>Parallel hat Anthropic in der Woche <strong>drei weitere Expansionssignale</strong> gesetzt: Sydney als vierter APAC-Standort (27. April, Theo Hourmouzis von Snowflake als ANZ-GM), eine <strong>NEC-Partnerschaft in Japan</strong> mit Rollout an 30.000 Mitarbeiter und Aufbau einer der gr&#246;&#223;ten AI-native Engineering-Organisationen Japans (24. April), sowie Memorandum mit der australischen Regierung. Das zusammen mit den Investments ergibt das Bild: Anthropic positioniert sich f&#252;r IPO <strong>als globale Plattform</strong>, nicht nur als Modell-Anbieter.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.bloomberg.com/news/articles/2026-04-24/google-plans-to-invest-up-to-40-billion-in-anthropic">Bloomberg: Google plans up to $40B in Anthropic</a></p></li><li><p><a href="https://techcrunch.com/2026/04/24/google-to-invest-up-to-40b-in-anthropic-in-cash-and-compute/">TechCrunch: Google to invest up to $40B in cash and compute</a></p></li><li><p><a href="https://www.axios.com/2026/04/24/google-amazon-anthropic-investment">Axios: Google&#8217;s $40B Anthropic move is Big Tech&#8217;s latest huge bet</a></p></li><li><p><a href="https://www.anthropic.com/news/theo-hourmouzis-general-manager-australia-new-zealand">Anthropic: Theo Hourmouzis als General Manager Australia &amp; New Zealand</a></p></li><li><p><a href="https://www.anthropic.com/news/anthropic-nec">Anthropic + NEC: Building Japan&#8217;s largest AI engineering workforce</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Google Cloud Next 2026</strong> (22. April) &#8212; Konferenz unter dem Banner &#8222;Agentic Era&#8221;. Kevin Ichhpurani (President Global Partner Ecosystem) k&#252;ndigt 750 Mio. $ f&#252;r das 120k-Partner-&#214;kosystem an, um agentische Use-Cases zu beschleunigen. <a href="https://www.googlecloudpresscorner.com/2026-04-22-Google-Cloud-Commits-750-Million-to-Accelerate-Partners-Agentic-AI-Development">Google Cloud Press</a> &#183; <a href="https://biztechmagazine.com/article/2026/04/google-cloud-next-2026-businesses-are-moving-agentic-era">BizTech</a></p></li><li><p><strong>Cloudflare Agents Week</strong> (Nachtrag, 12.&#8211;20. April) &#8212; Vollst&#228;ndiger Stack-Push: Workers AI, AI Gateway, MCP-Hosting, Browser-Rendering. Im internen Engineering-Stack laufen pro Monat 241 Mrd. Tokens und 20 Mio. AI-Gateway-Requests durch die eigenen Produkte &#8212; gebaut auf dem, was sie auch verkaufen. Plattform-Konkurrenz f&#252;r Anthropic und Google bekommt eine Edge-native Variante. <a href="https://blog.cloudflare.com/agents-week-in-review/">Cloudflare Blog</a> &#183; <a href="https://blog.cloudflare.com/internal-ai-engineering-stack/">Internal Stack-Daten</a></p></li><li><p><strong>MIT Technology Review zu Agent Orchestration</strong> &#8212; Lesenswerter &#220;berblick: Multi-Agent-Systeme als &#8222;Flie&#223;band-Moment&#8221; f&#252;r White-Collar-Arbeit. Konkret namentlich erw&#228;hnt sind Claude Code (mit &#8222;a couple of dozen subagents&#8221; im Einsatz) und Claude Cowork (in zehn Tagen gebaut). Hauptsorge: unvorhersehbares LLM-Verhalten, sobald die Agenten aus dem Browser-Fenster heraus mit der echten Welt interagieren. <a href="https://www.technologyreview.com/2026/04/21/1135654/agent-orchestration-ai-artificial-intelligence/">MIT Tech Review</a></p></li><li><p><strong>Simon Willison &#252;ber Qwen3.6-27B</strong> &#8212; Alibabas neues 27-Mrd.-Dense-Modell erreicht Flagship-Coding-Performance lokal und schl&#228;gt das vorherige Open-Source-Flaggschiff Qwen3.5-397B-A17B. Open-Weight-Druck auf die Frontier-Labs steigt weiter. <a href="https://simonwillison.net/2026/Apr/22/qwen36-27b/">simonwillison.net</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Donnerstag, 7. Mai 2026</em></p><p><em>Feedback? Einfach kommentieren/antworten.</em></p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #003 — Opus 4.7, Pro-Verwirrung und Skills als neuer Standard]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-003-opus-47-pro-verwirrung</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-003-opus-47-pro-verwirrung</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 23 Apr 2026 08:01:00 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><em>23. April 2026 &#8212; Lesezeit: ~6 Min.</em></p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Claude Opus 4.7: Der erste klare Sprung &#252;ber 60 % auf SWE-bench Pro</h3><p>Am 16. April hat Anthropic <strong>Claude Opus 4.7</strong> general-available gemacht. Das eigentliche Signal ist weniger ein weiterer Benchmark-Gewinn als der Sprung auf <strong>SWE-bench Pro</strong> 53,4 &#8594; <strong>64,3 %</strong> &#8212; also auf dem h&#228;rteren Engineering-Benchmark, der l&#228;ngere, realistischere Software-Aufgaben abbildet. Dazu <strong>SWE-bench Verified</strong> 80,8 &#8594; <strong>87,6 %</strong>, <strong>Terminal-Bench 2.0</strong> 65,4 &#8594; 69,4 %, <strong>CursorBench</strong> 58 &#8594; 70 %. Auf SWE-bench Pro liegt Opus 4.7 vor GPT-5.4 (57,7 %) und Gemini 3.1 Pro (54,2 %). Dazu <strong>High-Res-Vision</strong> bis 3,75 Megapixel (3&#215; Opus 4.6) und Pricing unver&#228;ndert bei <strong>5 $ / 25 $ pro Million In-/Output-Tokens</strong>.</p><p>Die Reaktionen darauf sind trotzdem nicht einhellig. In der Community gab es Berichte &#252;ber einen <strong>h&#246;heren Tokenverbrauch bei vergleichbaren Prompts</strong> &#8212; wichtig, weil ein st&#228;rkeres Modell in der Praxis nur dann ein klarer Gewinn ist, wenn die realen Kosten im eigenen Workflow mitziehen. Ein feststehendes Faktum ist das noch nicht, aber ein Community-Signal, das Teams in eigenen L&#228;ufen messen sollten. Anthropic hat zeitgleich an den Effort-Defaults gedreht: <code>high</code><strong> ist jetzt Default</strong> f&#252;r Opus 4.6 und Sonnet 4.6 bei Pro- und Max-Subscribern (vorher <code>medium</code>); <code>xhigh</code> steht als neue Stufe exklusiv f&#252;r Opus 4.7 bereit. Direkte Antwort auf die Nerfing-Debatte der Vorwoche.</p><p><strong>Warum das relevant ist:</strong> Opus 4.7 ist der erste allgemein verf&#252;gbare Release, der auf SWE-bench Pro sichtbar Abstand gewinnt. Das macht ihn nicht automatisch zum Gewinner in jedem Stack, verschiebt aber die Messlatte f&#252;r l&#228;ngere agentische Coding-L&#228;ufe, Review-Workloads und komplexere Tool-Use-Szenarien. Wer Opus im Stack hat, sollte die Upgrade-Pr&#252;fung jetzt machen &#8212; inklusive echter Token- und Laufzeitmessung im eigenen Kontext.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.anthropic.com/news/claude-opus-4-7">Anthropic: Introducing Claude Opus 4.7</a></p></li><li><p><a href="https://venturebeat.com/technology/anthropic-releases-claude-opus-4-7-narrowly-retaking-lead-for-most-powerful-generally-available-llm">VentureBeat: Opus 4.7 narrowly retakes the lead</a></p></li><li><p><a href="https://www.vellum.ai/blog/claude-opus-4-7-benchmarks-explained">Vellum: Opus 4.7 Benchmarks Explained</a></p></li><li><p><a href="https://thenextweb.com/news/anthropic-claude-opus-4-7-coding-agentic-benchmarks-release">TheNextWeb: Opus 4.7 Agentic Benchmarks</a></p></li><li><p><a href="https://github.blog/changelog/2026-04-16-claude-opus-4-7-is-generally-available/">GitHub Changelog: Opus 4.7 GA</a></p></li></ul><div><hr></div><h2>Die unbequeme Debatte: Claude Code und die Pro-Verwirrung</h2><p>Am 21. April tauchte Claude Code auf &#246;ffentlichen Anthropic-Seiten zeitweise nicht mehr im <strong>20-$-Pro-Plan</strong> auf; Support-Dokumente sprachen nur noch von Max. Kritik auf X und Reddit folgte unmittelbar, ein paar Stunden sp&#228;ter war die Darstellung wieder korrigiert. Anthropics Amol Avasare kl&#228;rte auf: <strong>&#8222;a small test on ~2 % of new prosumer signups&#8221;</strong> &#8212; bestehende Abonnenten seien nicht betroffen, die &#246;ffentlichen Seiten &#8222;versehentlich&#8221; aktualisiert. Das Experiment l&#228;uft unter der Haube weiter.</p><p><strong>Simon Willison</strong> ordnet n&#252;chtern ein: Vertrauensverlust durch die intransparente &#196;nderung, strategisches Fragezeichen (Codex kostet weiterhin weniger), und die Frage, ob man Lehrmaterial um ein Tool baut, das sich Leser nicht leisten k&#246;nnen. Die eigentliche Story ist deshalb weniger &#8222;Claude Code ist raus&#8221;, sondern eher: Schon kleine, intransparente &#196;nderungen an Limits und Zug&#228;ngen erzeugen sofort Vertrauensverlust.</p><p><strong>Warum das relevant ist:</strong> Derselbe Reflex wie bei der Effort-Debatte &#8212; still an wirtschaftlichen Stellschrauben drehen, erst kommunizieren, wenn die Community rebelliert. Wer Claude Code in Team-Workflows oder Trainingsmaterial einplant, sollte nicht nur auf Modellleistung schauen, sondern auch auf die Frage: Bleibt das Setup f&#252;r Leser, Teilnehmer oder Teams bezahlbar und stabil erreichbar?</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.wheresyoured.at/news-anthropic-removes-pro-cc/">Where&#8217;s Your Ed At: Anthropic (Briefly) Removes Claude Code From Pro</a></p></li><li><p><a href="https://www.theregister.com/2026/04/22/anthropic_removes_claude_code_pro/">The Register: Anthropic tests reaction to yanking Claude Code from Pro</a></p></li><li><p><a href="https://simonwillison.net/2026/Apr/22/claude-code-confusion/">Simon Willison: Is Claude Code going to cost $100/month?</a></p></li><li><p><a href="https://thenewstack.io/anthropic-claude-code-limits/">The New Stack: Claude Code Limits</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Sieben Releases in sieben Tagen: <strong>v2.1.111 bis v2.1.117</strong>. Neben Opus-4.7-Support bringt die Woche einen Architekturwechsel.</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><strong>Native Binary statt bundled JavaScript</strong> &#8212; v2.1.113 schaltet auf macOS und Linux auf einen nativen Claude-Code-Binary um. <code>Glob</code> und <code>Grep</code> laufen &#252;ber eingebettetes <code>bfs</code> und <code>ugrep</code> via Bash. Sp&#252;rbar schnellere Kaltstarts, weniger Node-Overhead, weniger Abh&#228;ngigkeit von globalem npm.</p><p><code>/ultrareview</code> &#8212; Seit v2.1.111, in v2.1.113 parallelisiert mit Diffstat-Ausgabe: umfassende Code-Reviews in der Cloud. F&#252;r PR-Pr&#252;fungen, die lokal zu lange dauern, wird das der neue Default.</p><p><strong>Opus 4.7 </strong><code>xhigh</code><strong>-Effort und interaktiver Effort-Slider</strong> &#8212; Neue Stufe zwischen <code>high</code> und <code>max</code>, exklusiv f&#252;r Opus 4.7. <code>/effort</code> ohne Argument &#246;ffnet jetzt einen Slider &#8212; endlich ein Interface f&#252;r den Trade-off zwischen Geschwindigkeit und Tiefe.</p><h3>F&#252;r Multi-Agent- und Plugin-Workflows</h3><p><strong>Agent-Frontmatter endlich vollst&#228;ndig</strong> &#8212; <code>mcpServers</code> und <code>hooks</code> aus dem Agent-Frontmatter werden jetzt auch f&#252;r Main-Thread-Sessions geladen, wenn per <code>--agent</code> gestartet wird. Kleines Detail, gro&#223;er Effekt f&#252;r alle, die Agents als First-Class in Workflows behandeln.</p><p><strong>Plugin-Dependencies auto-resolved</strong> &#8212; <code>plugin install</code>, <code>/reload-plugins</code> und Auto-Update l&#246;sen fehlende Abh&#228;ngigkeiten eigenst&#228;ndig auf. <code>blockedMarketplaces</code> und <code>strictKnownMarketplaces</code> werden durchgesetzt &#8212; Enterprise-Admins bekommen ihre Plugin-Kontrolle zur&#252;ck.</p><p><code>/fewer-permission-prompts</code><strong>-Skill</strong> &#8212; Scannt Transcripts nach h&#228;ufigen read-only Bash- und MCP-Calls und schl&#228;gt eine priorisierte Allow-List f&#252;r <code>.claude/settings.json</code> vor. Der Endgegner der st&#228;ndigen Permission-Dialoge.</p><h3>F&#252;r CI/CD und Sicherheit</h3><p><strong>Sandbox-H&#228;rtung</strong> &#8212; <code>sandbox.network.deniedDomains</code> blockt Domains auch innerhalb weit gefasster Allow-Patterns. Deny-Rules greifen jetzt bei <code>env</code>-, <code>sudo</code>-, <code>watch</code>-, <code>ionice</code>- und <code>setsid</code>-gewrappten Kommandos; <code>find:*</code>-Allow-Regeln lassen nicht mehr automatisch <code>-exec</code>/<code>-delete</code> durch. Dazu ein gefixter Edge-Case, in dem <code>dangerouslyDisableSandbox</code> Kommandos <strong>ohne Sandbox und ohne Permission-Prompt</strong> laufen lie&#223;. Wer &#228;ltere 2.1er in Pipelines hat: jetzt updaten.</p><h3>Performance und Plattform</h3><p><code>/resume</code><strong> bis zu 67 % schneller</strong> auf Sessions &gt;40 MB (v2.1.116), parallelisierter MCP-Startup (v2.1.117), PowerShell-Tool progressiv auf Windows via <code>CLAUDE_CODE_USE_POWERSHELL_TOOL</code>. OpenTelemetry bekommt <code>effort</code>-Attribute auf Cost-, Token- und API-Metriken &#8212; Billing-Analysen nach Effort-Level werden endlich m&#246;glich.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code April 2026</a></p></li><li><p><a href="https://github.com/anthropics/claude-code/releases">GitHub: Claude Code Releases</a></p></li></ul><div><hr></div><h2>Agentic Coding: Codex &#246;ffnet den Mac &#8212; und GitHub standardisiert Skills</h2><p><strong>OpenAI Codex &#8222;for (almost) everything&#8221;</strong> (16. April): <strong>Computer Use auf dem Mac</strong>, ein In-App-Browser mit Kommentar-Funktion direkt auf Webseiten, <strong>90+ neue Plugins</strong> (Atlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon, Render u. a.), Memory und proaktive Task-Vorschl&#228;ge. Parallele Agents dr&#228;ngen sich nicht ins Foreground-Fenster. OpenAI nennt <strong>3 Mio. weekly active Developer</strong>, npm-Downloads wuchsen von 82k (April 2025) auf 14,5 Mio. (M&#228;rz 2026). Die Bewegung spiegelt Anthropics Desktop-Routines aus #002 &#8212; Codex holt strategisch auf.</p><p><code>gh skill</code><strong> Public Preview</strong> (16. April, GitHub CLI v2.90.0): Ein einziger Befehl, um <strong>Agent Skills</strong> &#252;ber alle gro&#223;en Agent-Hosts hinweg zu installieren, zu versionieren, zu suchen und zu publizieren &#8212; Claude Code, Copilot, Cursor, Codex, Gemini. Skills folgen einer offenen Spezifikation, jede Installation tr&#228;gt die Git-Tree-SHA ihres Source-Verzeichnisses, Updates vergleichen echte Content-&#196;nderungen. Das ist im Stillen der gr&#246;&#223;te Schritt in Richtung Interoperabilit&#228;t, den das &#214;kosystem seit MCP gesehen hat.</p><p><strong>Warum das relevant ist:</strong> Die Frontline verschiebt sich. Codex schlie&#223;t den Desktop-Gap zu Claude Code, GitHub liefert das fehlende Paketformat &#252;ber alle Hosts hinweg. Wer Tooling-Entscheidungen trifft, sollte ab jetzt davon ausgehen, dass Skills portabel sind &#8212; und Lock-in auf einzelne Agent-Hosts wird zur strategischen Altlast.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://openai.com/index/codex-for-almost-everything/">OpenAI: Codex for (almost) everything</a></p></li><li><p><a href="https://www.macrumors.com/2026/04/16/openai-codex-mac-update/">MacRumors: Codex Mac Update</a></p></li><li><p><a href="https://github.blog/changelog/2026-04-16-manage-agent-skills-with-github-cli/">GitHub Changelog: gh skill</a></p></li><li><p><a href="https://groundy.com/articles/github-clis-gh-skill-command-one-standard-to-rule-claude-code-copilot-cursor/">Groundy: gh skill command analysis</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Agent Skills werden zum neuen npm</h3><p>Drei Bewegungen zeigen in dieselbe Richtung: <code>gh skill</code> macht Skills portabel &#252;ber Hosts, <strong>Claude Code v2.1.111</strong> erlaubt, built-in Slash-Commands (<code>/init</code>, <code>/review</code>, <code>/security-review</code>) via Skill-Tool zu discovern, und <strong>OpenAI Codex</strong> baut rund um Skills, Plugins und MCP-Server ein modulareres &#214;kosystem aus. Noch ist das kein vollst&#228;ndig konsolidierter Standard &#8212; aber es ist gut m&#246;glich, dass wir gerade den Moment sehen, in dem &#8222;Skill&#8221; vom Prompt-Schnipsel zum versionierten, signierten, cross-kompatiblen Artefakt wird. Wer Agentic Engineering ernsthaft baut, sollte aufh&#246;ren, Wissen in Prompts und Repo-Wikis zu verstreuen, und <strong>Skills als First-Class-Artefakt</strong> versionieren. Genau dort d&#252;rfte sich in den n&#228;chsten Monaten entscheiden, welche Teams nur mit Agenten experimentieren &#8212; und welche daraus echte Produktivit&#228;t ziehen.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://github.blog/changelog/2026-04-16-manage-agent-skills-with-github-cli/">GitHub: Manage agent skills with GitHub CLI</a></p></li><li><p><a href="https://code.claude.com/docs/en/changelog">Anthropic Claude Code: Skills in changelog</a></p></li><li><p><a href="https://www.bighatgroup.com/blog/gh-skill-github-cli-agent-skills-management/">Big Hat Group: gh skill Deep Dive</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Claude Design</strong> (17. April) &#8212; Anthropic Labs launcht Research Preview f&#252;r Prototypen, Slides, One-Pager. Powered by Opus 4.7, liest Codebase und Design-Systeme, Export zu Canva, PDF, PPTX oder als Handoff-Bundle an Claude Code. Figmas Aktie reagierte sofort negativ. <a href="https://www.anthropic.com/news/claude-design-anthropic-labs">Anthropic</a> &#183; <a href="https://techcrunch.com/2026/04/17/anthropic-launches-claude-design-a-new-product-for-creating-quick-visuals/">TechCrunch</a></p></li><li><p><strong>Mythos-Leak-Report</strong> &#8212; TechCrunch berichtete am 21. April, eine unautorisierte Gruppe habe Zugriff auf Anthropics exklusives Cyber-Modell Mythos erlangt. Das Modell war nur im Rahmen von Project Glasswing an AWS, Apple, Google, JPMorgan, Microsoft und Nvidia verteilt. Anthropic hat bislang nicht offiziell kommentiert. <a href="https://techcrunch.com/2026/04/21/unauthorized-group-has-gained-access-to-anthropics-exclusive-cyber-tool-mythos-report-claims/">TechCrunch</a></p></li><li><p><strong>Simon Willison zur Agent-Definition</strong> &#8212; Nach monatelangem Herumschlagen gibt es jetzt eine konsensf&#228;hige: &#8222;An LLM agent runs tools in a loop to achieve a goal.&#8221; <a href="https://simonw.substack.com/p/i-think-agent-may-finally-have-a">simonw.substack.com</a></p></li><li><p><strong>GitHub Copilot Individual Plan-&#196;nderungen</strong> &#8212; Am selben Tag wie das Anthropic-Pricing-Drama k&#252;ndigt GitHub Usage-basierte Limits f&#252;r Copilot-Agenten-Workflows an. Agentic Coding knirscht an den R&#228;ndern der alten Flatrate-Modelle. <a href="https://simonwillison.net/2026/Apr/22/changes-to-github-copilot/">simonwillison.net</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Donnerstag, 30. April 2026</em></p><p><em>Feedback? Einfach kommentieren/antworten.</em></p>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #002 — Claude wird autonom (und die Community nervös)]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-002-claude-wird-autonom</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-002-claude-wird-autonom</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 16 Apr 2026 08:44:00 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><em>16. April 2026 &#8212; Lesezeit: ~4 Min.</em></p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Claude Code Desktop bekommt Routines &#8212; und wird zur Agent-Plattform</h3><p>Am 14. April hat Anthropic die Claude Code Desktop App von Grund auf neu gebaut. Das ist kein kosmetisches Update, sondern ein Architekturwechsel: Die App ist jetzt um <strong>parallele Sessions</strong> herum organisiert, mit einer Sidebar zum Managen mehrerer gleichzeitiger Agent-L&#228;ufe, Drag-and-Drop-Layout, integriertem Terminal und File-Editor.</p><p>Das eigentliche Highlight hei&#223;t <strong>Routines</strong> &#8212; eine neue Automatisierungsschicht, die Claude Code ohne aktive Session laufen l&#228;sst. Eine Routine b&#252;ndelt Prompt, Repository und Connectors in eine Konfiguration, die auf drei Arten triggern kann: nach <strong>Zeitplan</strong>, per <strong>API-Call</strong> oder durch ein <strong>GitHub-Event</strong> (z.B. neuer Pull Request). Routines laufen auf Anthropics Web-Infrastruktur, nicht lokal. Daily Caps nach Plan: Pro 5, Max 15, Team/Enterprise 25 (weitere zukaufbar).</p><p>Dazu kommt: Claude Code kann jetzt den <strong>Mac fernsteuern</strong> &#8212; wenn kein direkter Connector existiert (Slack, Google Calendar), navigiert Claude &#252;ber den Bildschirm wie ein Mensch. Drei View Modes (Verbose, Normal, Summary) lassen Nutzer steuern, wie viel von Claudes Tool-Aktivit&#228;t sie sehen wollen.</p><p><strong>Warum das relevant ist:</strong> Wer letzte Woche das Conway-Leak verfolgt hat (immer noch unbest&#228;tigt), sieht hier die offizielle Version: Claude bewegt sich von einem reaktiven Tool zu einem persistent laufenden, event-gesteuerten Agent. Routines sind der erste produktionsreife Schritt dahin.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.macrumors.com/2026/04/15/anthropic-rebuilds-claude-code-desktop-app/">MacRumors: Anthropic Rebuilds Claude Code Desktop</a></p></li><li><p><a href="https://venturebeat.com/orchestration/we-tested-anthropics-redesigned-claude-code-desktop-app-and-routines-heres-what-enterprises-should-know">VentureBeat: Routines Hands-On</a></p></li><li><p><a href="https://9to5mac.com/2026/04/14/anthropic-adds-repeatable-routines-feature-to-claude-code-heres-how-it-works/">9to5Mac: Routines Feature</a></p></li><li><p><a href="https://siliconangle.com/2026/04/14/anthropics-claude-code-gets-automated-routines-desktop-makeover/">SiliconANGLE: Routines &amp; Desktop Makeover</a></p></li></ul><div><hr></div><h2>Die unbequeme Debatte: Wird Claude schlechter?</h2><p>Es ist das Thema der Woche in der Community: Eine wachsende Zahl von Power-Usern beklagt, dass Claude &#8212; insbesondere Opus 4.6 &#8212; seit Februar sp&#252;rbar schw&#228;cher geworden ist. Weniger gr&#252;ndliche Analysen, mehr Abk&#252;rzungen, h&#228;ufigeres vorzeitiges Abbrechen.</p><p>Die Ursache ist bekannt: Anthropic hat das Default-<strong>Effort-Level</strong> von Opus 4.6 am 9. Februar auf Adaptive Thinking umgestellt und am 3. M&#228;rz auf <strong>Medium Effort (Level 85)</strong> gesenkt. Weniger Tokens pro Anfrage, schnellere Antworten &#8212; aber auch weniger Tiefe.</p><p><strong>Stella Laurenzo</strong>, Senior Director bei AMDs AI-Gruppe, hat die Debatte mit einer datengest&#252;tzten Analyse auf GitHub befeuert: 6.852 Sessions, 17.871 Thinking Blocks, 234.760 Tool Calls. Ihr Befund: Die Reasoning-Tiefe fiel ab Februar messbar, w&#228;hrend &#8222;Simplest Fix&#8221;-Verhalten, Premature Stopping und Edit-first statt Research-first zunahmen.</p><p>Die Community-Reaktion ist deutlich. Fortune, VentureBeat, Axios und The Register haben berichtet. Der Vorwurf: Anthropic habe die &#196;nderung nicht transparent genug kommuniziert &#8212; sie stand im Changelog, wurde aber nicht prominent angek&#252;ndigt. Die Spekulation, dass Anthropic unter Compute-Knappheit leidet, h&#228;lt sich hartn&#228;ckig.</p><p><strong>Anthropics Antwort:</strong> Teams und Enterprise-Nutzer sollen k&#252;nftig standardm&#228;&#223;ig auf High Effort laufen, auch wenn das mehr Tokens und Latenz kostet. F&#252;r alle anderen bleibt <code>/effort max</code> der Workaround.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://fortune.com/2026/04/14/anthropic-claude-performance-decline-user-complaints-backlash-lack-of-transparency-accusations-compute-crunch/">Fortune: Anthropic Performance Backlash</a></p></li><li><p><a href="https://www.axios.com/2026/04/16/anthropic-claude-power-user-complaints">Axios: Anthropic&#8217;s AI Downgrade Stings Power Users</a></p></li><li><p><a href="https://venturebeat.com/technology/is-anthropic-nerfing-claude-users-increasingly-report-performance">VentureBeat: Is Anthropic &#8216;Nerfing&#8217; Claude?</a></p></li><li><p><a href="https://www.theregister.com/2026/04/13/claude_outage_quality_complaints/">The Register: Claude Is Getting Worse, According to Claude</a></p></li><li><p><a href="https://scortier.substack.com/p/claude-code-drama-6852-sessions-prove">Stella Laurenzo: 6,852 Sessions Analysis</a></p></li></ul><div><hr></div><h2>Claude Code CLI: Die Highlights der Woche</h2><p>Sieben Releases in sieben Tagen &#8212; von <strong>v2.1.96 bis v2.1.108</strong>. Hier die Highlights, sortiert danach, wen sie betreffen:</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><code>/recap</code> &#8212; Beim Zur&#252;ckkehren in eine Session liefert Claude jetzt automatisch einen Kontext-&#220;berblick. Konfigurierbar in <code>/config</code>, manuell aufrufbar mit <code>/recap</code>. Wer viele parallele Sessions jongliert und nach einem Kontextwechsel erst mal &#8222;Wo war ich?&#8221; denkt, spart damit sp&#252;rbar Zeit.</p><p><strong>Prompt Caching wird steuerbar</strong> &#8212; Zwei neue Environment-Variablen: <code>ENABLE_PROMPT_CACHING_1H</code> f&#252;r eine einst&#252;ndige Cache-TTL, <code>FORCE_PROMPT_CACHING_5M</code> f&#252;r f&#252;nf Minuten. Relevant f&#252;r alle, die ihre API-Kosten optimieren oder auf langsamen Backends arbeiten. Ein Bug, bei dem Subscriber mit <code>DISABLE_TELEMETRY</code> auf 5 Minuten statt 1 Stunde zur&#252;ckfielen, wurde gefixt.</p><h3>F&#252;r Multi-Agent- und MCP-Workflows</h3><p><strong>Background Monitors</strong> &#8212; Plugins k&#246;nnen jetzt &#252;ber den <code>monitors</code> Manifest-Key automatisch mit der Session starten. Wer Monitoring-Tools f&#252;r Builds, Tests oder Deployments als Plugin betreibt, bekommt damit eine hands-off L&#246;sung. Dazu: <code>/reload-plugins</code> erkennt neue Skills ohne Neustart.</p><p><strong>PreCompact Hook</strong> &#8212; Hooks k&#246;nnen Compaction blockieren (Exit-Code 2 oder <code>{"decision":"block"}</code>). N&#252;tzlich f&#252;r Agents, die mitten in einer langen Analyse stecken und ihren Kontext nicht verlieren d&#252;rfen.</p><h3>F&#252;r CI/CD und Automation</h3><p><strong>Security-Fixes</strong> &#8212; Mehrere Bash-Tool-Permission-Bypasses gefixt in v2.1.97/98: Backslash-Escaping umging Auto-Allow-Regeln, Redirects &#252;ber <code>/dev/tcp</code> und <code>/dev/udp</code> wurden nicht abgefangen, Env-Var-Prefixes tricksten die Permission-Pr&#252;fung aus. Wer &#228;ltere Versionen in Pipelines nutzt: jetzt updaten.</p><h3>Enterprise und Plattform</h3><p><strong>Google Vertex AI Setup Wizard</strong> &#8212; Interaktiver Wizard f&#252;r GCP-Authentifizierung, Projekt- und Regionskonfiguration, direkt vom Login-Screen aus. OS-CA-Zertifikate werden jetzt standardm&#228;&#223;ig vertraut &#8212; Schluss mit manueller Zertifikats-Konfiguration f&#252;r Enterprise-TLS-Proxies. Dazu <strong>PID Namespace Isolation</strong> f&#252;r Subprocess-Sandboxing auf Linux und ein neuer <code>/team-onboarding</code>-Command, der Onboarding-Guides f&#252;r Teammitglieder aus der eigenen Claude-Code-Nutzung generiert.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code</a></p></li><li><p><a href="https://github.com/anthropics/claude-code/releases">GitHub: Claude Code Releases</a></p></li></ul><div><hr></div><h2>Agentic Coding: Cursor 3 und der Drei-Wege-Kampf</h2><p><strong>Cursor 3</strong> markiert einen Paradigmenwechsel: Das Interface wurde komplett um die Idee herum neu gebaut, dass der Gro&#223;teil des Codes von AI Agents geschrieben wird. Highlights: <strong>Agents Window</strong>, <strong>Design Mode</strong>, <strong>Cloud Agents</strong>. Composer 2 erreicht 61,3 auf CursorBench (+37 %) und 73,7 auf SWE-bench Multilingual. Anysphere hat &#252;ber 3 Milliarden Dollar eingesammelt bei einer ARR von 2 Milliarden.</p><p>Der Markt teilt sich in drei Philosophien: <strong>Cursor</strong> setzt auf IDE-native Deep Integration, <strong>GitHub Copilot</strong> auf Reichweite und Enterprise (Agent Mode GA, agentic Code Review seit M&#228;rz), <strong>Claude Code</strong> auf Terminal-first mit Routines und maximaler Flexibilit&#228;t. Die Wahl des Stacks ist jetzt eine Architekturentscheidung.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://dev.to/devtoolpicks/cursor-3-just-launched-with-an-ai-agents-window-what-changed-and-is-it-still-worth-it-496f">DEV Community: Cursor 3 Launch</a></p></li><li><p><a href="https://www.nxcode.io/resources/news/cursor-vs-claude-code-vs-github-copilot-2026-ultimate-comparison">NxCode: Cursor vs Claude Code vs Copilot</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Anthropic auf dem Weg zum B&#246;rsengang &#8212; die 800-Milliarden-Frage</h3><p>Anthropic zieht Investoren-Angebote an, die das Unternehmen mit bis zu <strong>800 Milliarden Dollar</strong> bewerten &#8212; mehr als das Doppelte der Bewertung von 380 Milliarden aus dem Februar. Annualisierte Revenue: &#252;ber 30 Milliarden Dollar. IPO wird f&#252;r Oktober 2026 erwartet.</p><p><strong>Vas Narasimhan</strong>, CEO von Novartis, wurde am 14. April in den Board berufen &#8212; erstes Pharma-Schwergewicht, klares Signal Richtung Healthcare. Trust-berufene Direktoren stellen jetzt die Board-Mehrheit. Ein IPO-bereites Anthropic wird Claude Code aggressiver kommerzialisieren &#8212; die Enterprise-Features und Routines der letzten Woche passen ins Bild.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.bloomberg.com/news/articles/2026-04-14/anthropic-attracts-investor-offers-at-a-800-billion-valuation">Bloomberg: Anthropic $800B Valuation</a></p></li><li><p><a href="https://www.anthropic.com/news/narasimhan-board">Anthropic: Narasimhan Board</a></p></li><li><p><a href="https://www.benzinga.com/markets/tech/26/04/51821987/anthropic-800b-valuation-claude-growth-ipo-openai-rivalry">Benzinga: Anthropic IPO</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Conway-Leak</strong> &#8212; Anfang April tauchten 512.000 Zeilen Claude-Code-Quellcode auf, darin Details zu einer Always-On-Agent-Plattform namens Conway. Anthropic hat weder best&#228;tigt noch dementiert. Routines k&#246;nnten die offizielle Antwort sein. <a href="https://www.mindstudio.ai/blog/what-is-conway-agent-anthropic-always-on-background-ai">MindStudio</a></p></li><li><p><strong>Claude-Outage am 15. April</strong> &#8212; Erhebliche St&#246;rung bei Claude.ai, API und Claude Code von ~10:53 bis 13:42 ET. Wer Production-Workloads laufen hat: Redundanz einplanen. <a href="https://www.cnbc.com/2026/04/15/anthropic-outage-elevated-errors-claude-chatbot-code-api.html">CNBC</a></p></li><li><p><strong>Simon Willison &#252;ber Cybersecurity als &#8222;Proof of Work&#8221;</strong> &#8212; AI-Modelle wie Mythos ver&#228;ndern Vulnerability Research fundamental. <a href="https://simonwillison.net/2026/Apr/14/cybersecurity-proof-of-work/">simonwillison.net</a></p></li><li><p><strong>Anthropic Agentic Coding Trends Report 2026</strong> &#8212; Umfassender Bericht dar&#252;ber, wie Coding Agents Workflows ver&#228;ndern. Pflichtlekt&#252;re. <a href="https://resources.anthropic.com/2026-agentic-coding-trends-report">Anthropic Resources</a></p></li><li><p><strong>ICSE 2026: Workshop Agentic Engineering</strong> &#8212; Die f&#252;hrende Software-Engineering-Konferenz widmet dem Thema erstmals einen eigenen Workshop. <a href="https://conf.researchr.org/home/icse-2026/agent-2026">ICSE 2026</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Donnerstag, 23. April 2026</em></p>]]></content:encoded></item><item><title><![CDATA[Agentic Weekly #001]]></title><description><![CDATA[W&#246;chentlicher &#220;berblick zu Agentic Engineering, Agentic Coding & Claude Code]]></description><link>https://blog.fluxum.net/p/agentic-weekly-001</link><guid isPermaLink="false">https://blog.fluxum.net/p/agentic-weekly-001</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 09 Apr 2026 08:47:00 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><em>9. April 2026 &#8212; Lesezeit: ~4 Min.</em></p><div><hr></div><h2>Die gro&#223;e Nachricht der Woche</h2><h3>Anthropic stellt Claude Mythos vor &#8212; und sperrt das Modell sofort weg</h3><p>Am Montag hat Anthropic mit Claude Mythos Preview ein neues Frontier-Modell vorgestellt, das vor allem durch eine F&#228;higkeit auff&#228;llt: Es findet und exploitet Zero-Day-Schwachstellen in allen gro&#223;en Betriebssystemen und Browsern. In internen Tests identifizierte Mythos tausende bisher unbekannte Sicherheitsl&#252;cken, viele davon in Code, der ein bis zwei Jahrzehnte alt ist.</p><p>Der Clou: Anthropic ver&#246;ffentlicht das Modell nicht frei, sondern nur &#252;ber <strong>Project Glasswing</strong> &#8212; eine neue Initiative f&#252;r defensive Cybersecurity. Zw&#246;lf Launch-Partner, darunter AWS, Apple, Google, Microsoft, CrowdStrike und die Linux Foundation, erhalten kontrollierten Zugang. Anthropic stellt daf&#252;r bis zu 100 Millionen Dollar an Usage Credits und 4 Millionen Dollar an Direktspenden f&#252;r Open-Source-Security bereit.</p><p>Simon Willison kommentierte treffend: Die Entscheidung, ein derart m&#228;chtiges Modell zun&#228;chst nur f&#252;r Sicherheitsforscher zug&#228;nglich zu machen, sei &#8222;notwendig&#8221;. Platformer berichtet gleichzeitig, dass einige Security-Experten beunruhigt sind &#8212; die Frage, wie lange der Vorsprung der Verteidiger h&#228;lt, steht im Raum.</p><p><strong>Warum das relevant ist:</strong> Agentic Security ist der logische n&#228;chste Schritt &#8212; wenn AI Agents Code schreiben, m&#252;ssen andere AI Agents ihn absichern. Mythos zeigt, wohin die Reise geht.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://www.anthropic.com/glasswing">Anthropic: Project Glasswing</a></p></li><li><p><a href="https://techcrunch.com/2026/04/07/anthropic-mythos-ai-model-preview-security/">TechCrunch: Anthropic Mythos Preview</a></p></li><li><p><a href="https://simonwillison.net/2026/Apr/7/project-glasswing/">Simon Willison&#8217;s Take</a></p></li><li><p><a href="https://thehackernews.com/2026/04/anthropics-claude-mythos-finds.html">The Hacker News: Zero-Day Findings</a></p></li></ul><div><hr></div><h2>Claude Code: Die Highlights der Woche</h2><p>Die Versionen <strong>v2.1.89 bis v2.1.92</strong> brachten eine dichte Folge an Updates &#8212; hier die Highlights, sortiert danach, wen sie betreffen:</p><h3>F&#252;r alle, die Claude Code t&#228;glich nutzen</h3><p><strong>Flicker-free Rendering</strong> &#8212; Mit <code>CLAUDE_CODE_NO_FLICKER=1</code> gibt es eine Alt-Screen-Rendering-Option mit virtualisiertem Scrollback. Wer l&#228;ngere Agent-Sessions laufen l&#228;sst und vom Flackern bei schnellen Ausgaben genervt war, bekommt endlich eine saubere Terminal-Erfahrung.</p><p><code>/powerup</code><strong> Command</strong> &#8212; Interaktive Lektionen mit animierten Demos, die Claude-Code-Features Schritt f&#252;r Schritt erkl&#228;ren. Besonders n&#252;tzlich f&#252;r Einsteiger, aber auch f&#252;r erfahrene Nutzer, die versteckte Features entdecken wollen.</p><p><strong>Bessere </strong><code>/cost</code><strong>-Transparenz</strong> &#8212; Per-Model- und Cache-Hit-Aufschl&#252;sselung zeigt jetzt genau, wohin das Budget flie&#223;t. Relevant f&#252;r alle, die ihre API-Kosten im Blick behalten m&#252;ssen.</p><h3>F&#252;r Multi-Agent- und MCP-Workflows</h3><p><strong>MCP 500K</strong> &#8212; Die maximale Tool-Result-Gr&#246;&#223;e springt auf 500.000 Zeichen. Wer MCP-Server baut, die gro&#223;e Datenmengen zur&#252;ckgeben &#8212; etwa Datenbank-Dumps, lange Logs oder umfangreiche API-Responses &#8212; ist damit nicht mehr so schnell am Limit.</p><p><strong>Named Subagents</strong> &#8212; Subagents tauchen namentlich in den @-Mention-Vorschl&#228;gen auf. F&#252;r Teams, die mit spezialisierten Agents arbeiten (z.B. ein Test-Agent, ein Review-Agent, ein Deploy-Agent), wird die Orchestrierung damit deutlich intuitiver.</p><h3>F&#252;r CI/CD und Automation</h3><p><strong>Permission Deferral f&#252;r Headless Mode</strong> &#8212; PreToolUse Hooks k&#246;nnen Sessions jetzt pausieren und extern wieder aufnehmen. Der Use Case: Ein Agent in einer CI-Pipeline st&#246;&#223;t auf eine Aktion, die menschliche Freigabe braucht &#8212; statt abzubrechen, wartet er, bis jemand gr&#252;nes Licht gibt.</p><p><strong>PermissionDenied Hook</strong> &#8212; Neuer Hook, der nach Ablehnungen durch den Auto-Mode-Classifier feuert. Mit <code>{retry: true}</code> kann der Agent automatisch einen alternativen Weg einschlagen. N&#252;tzlich f&#252;r robustere autonome Workflows, die nicht beim ersten &#8222;Nein&#8221; aufgeben sollen.</p><h3>Performance und Plattform</h3><p>Schnellere Write-Tool-Diffs f&#252;r gro&#223;e Dateien (<strong>60 % schneller</strong>, besonders bei Dateien mit Tabs und Sonderzeichen), SSE-Transport jetzt in O(n) statt O(n&#178;) &#8212; sp&#252;rbar bei langen Sessions mit vielen Tool-Calls. Dazu ein interaktiver <strong>Bedrock Setup Wizard</strong> f&#252;r AWS-Nutzer und eine <strong>Windows PowerShell Preview</strong> f&#252;r das wachsende Windows-Lager.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://code.claude.com/docs/en/changelog">Claude Code Changelog</a></p></li><li><p><a href="https://github.com/anthropics/claude-code/releases">GitHub Releases</a></p></li><li><p><a href="https://releasebot.io/updates/anthropic/claude-code">Releasebot: Claude Code</a></p></li></ul><div><hr></div><h2>Agentic Coding: Die Branche sortiert sich</h2><p><strong>Cursor launcht Agent Experience</strong> &#8212; Cursor hat eine neue Agent-Erfahrung vorgestellt, die explizit gegen Claude Code und Codex positioniert ist. Der Agent kann Dateien lesen/schreiben, Tests im Terminal ausf&#252;hren, Fehler iterativ beheben und das gesamte Repository per RAG indexieren.</p><p><strong>GitHub Copilot trainiert auf euren Daten</strong> &#8212; Ab dem 24. April nutzt GitHub Interaktionsdaten von Free-, Pro- und Pro+-Nutzern zum Modelltraining &#8212; inklusive Code-Snippets, Dateinamen und Repository-Strukturen. Opt-out ist m&#246;glich, aber nicht der Default. Business- und Enterprise-Kunden sind ausgenommen. Die Community-Reaktion ist eindeutig: 59 Thumbs-down, 3 Rockets. Wer nicht mitmachen will, sollte jetzt unter <code>/settings/copilot/features</code> die Option deaktivieren.</p><p><strong>GitHub Agent HQ</strong> &#8212; Claude und OpenAI Codex sind jetzt als w&#228;hlbare Agents in Public Preview verf&#252;gbar &#8212; direkt in GitHub, GitHub Mobile und VS Code. Die Multi-Agent-Zukunft wird konkret: Man w&#228;hlt seinen Agent je nach Task.</p><p><strong>CodeSignal: Agentic Coding Assessments</strong> &#8212; CodeSignal hat eine neue Kategorie technischer Assessments eingef&#252;hrt, die misst, wie gut Entwickler <em>mit</em> AI-Agents arbeiten. Laut deren Umfrage nutzen bereits 91 % der befragten US-Entwickler Agentic-AI-Tools bei der Arbeit, 75 % haben in den letzten sechs Monaten zumindest teilweise AI-generierten Code in Production deployed.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://explore.n1n.ai/blog/cursor-ai-agent-experience-claude-code-codex-2026-04-03">Cursor Agent Experience</a></p></li><li><p><a href="https://github.blog/news-insights/company-news/updates-to-github-copilot-interaction-data-usage-policy/">GitHub Blog: Copilot Data Policy</a></p></li><li><p><a href="https://github.blog/news-insights/company-news/pick-your-agent-use-claude-and-codex-on-agent-hq/">GitHub Blog: Agent HQ</a></p></li><li><p><a href="https://www.theregister.com/2026/03/26/github_ai_training_policy_changes/">The Register: GitHub Training</a></p></li><li><p><a href="https://www.prnewswire.com/news-releases/codesignal-launches-industry-first-agentic-coding-assessments-for-ai-era-engineering-hiring-302732265.html">CodeSignal: Agentic Assessments</a></p></li></ul><div><hr></div><h2>Trend der Woche</h2><h3>Von Vibe Coding zu Agentic Engineering &#8212; die Reifephase</h3><p>Das Buzzword &#8222;Vibe Coding&#8221; aus 2025 &#8212; locker prompten und schauen, was passiert &#8212; weicht einer strukturierteren Disziplin. Medium-Autor ESA Engineering beschreibt den &#220;bergang treffend: Agentic Coding ist f&#252;r Produktions-CI/CD-Pipelines und gro&#223;e Refactors gebaut, Vibe Coding f&#252;r Hackathon-Prototypen.</p><p>Gartner prognostiziert, dass 40 % der Enterprise-Anwendungen bis Ende 2026 aufgabenspezifische AI-Agents enthalten werden (2025: unter 5 %). Anfragen zu Multi-Agent-Systemen stiegen um <strong>1.445 %</strong> von Q1 2024 bis Q2 2025. Multi-Model-Routing wird dabei zur Pflicht: Das Plan-and-Execute-Pattern &#8212; ein starkes Modell plant, g&#252;nstigere Modelle f&#252;hren aus &#8212; senkt die Kosten um bis zu 90 %.</p><p>Gleichzeitig w&#228;chst die Skepsis: 80 % der Entwickler nutzen AI Coding Agents, aber das Vertrauen in deren Accuracy ist von 40 % auf 29 % gefallen. Die zentrale Herausforderung 2026: Agents, denen man <em>vertrauen</em> kann &#8212; nicht nur welche, die beeindruckend aussehen. Die Branche konsolidiert sich um das Muster <em>human-prompted &#8594; agent-executed &#8594; human-reviewed</em>.</p><p><strong>Quellen:</strong></p><ul><li><p><a href="https://medium.com/technologai/from-vibe-to-agentic-the-2026-maturation-of-ai-driven-development-1bfb0844b5a6">Medium: From Vibe to Agentic</a></p></li><li><p><a href="https://www.openpr.com/news/4447249/gartner-s-2026-multi-agent-systems-boom-why-enterprises-need">Gartner&#8217;s Multi-Agent Systems Boom</a></p></li><li><p><a href="https://thenewstack.io/5-key-trends-shaping-agentic-development-in-2026/">The New Stack: 5 Key Trends</a></p></li><li><p><a href="https://letsdatascience.com/news/ai-agents-increase-developer-preparatory-workload-b890e82a">Let&#8217;s Data Science: Developer Trust</a></p></li></ul><div><hr></div><h2>Kurz notiert</h2><ul><li><p><strong>Anthropic sichert sich 3,5 GW Compute</strong> &#8212; Neuer Deal mit Google und Broadcom, TPU-Kapazit&#228;t ab 2027. Run-Rate-Revenue liegt bei &#252;ber 30 Mrd. Dollar. <a href="https://techcrunch.com/2026/04/07/anthropic-compute-deal-google-broadcom-tpus/">TechCrunch</a> &#183; <a href="https://www.cnbc.com/2026/04/06/broadcom-agrees-to-expanded-chip-deals-with-google-anthropic.html">CNBC</a></p></li><li><p><strong>1M-Token-Context-Beta wird eingestellt</strong> &#8212; Ab 30. April hat der <code>context-1m-2025-08-07</code> Beta-Header keine Wirkung mehr f&#252;r Sonnet 4.5 und Sonnet 4. <a href="https://releasebot.io/updates/anthropic">Anthropic Release Notes</a></p></li><li><p><strong>OpenAI, Anthropic und Google gegen Model-Distillation</strong> &#8212; Die drei arbeiten &#252;ber das Frontier Model Forum zusammen, um adversariale Distillationsversuche aus China zu erkennen. <a href="https://www.bloomberg.com/news/articles/2026-04-06/openai-anthropic-google-unite-to-combat-model-copying-in-china">Bloomberg</a></p></li><li><p><strong>Xcode 26.3 mit Agentic Coding</strong> &#8212; Apple integriert Claude Agent und OpenAI Codex &#252;ber MCP in Xcode. <a href="https://www.apple.com/newsroom/2026/02/xcode-26-point-3-unlocks-the-power-of-agentic-coding/">Apple Newsroom</a></p></li><li><p><strong>Coefficient Bio Akquisition</strong> &#8212; Anthropic kauft AI-Biotech-Startup f&#252;r ~400M Dollar, Team geht in die Healthcare &amp; Life Sciences Gruppe.</p></li><li><p><strong>Claude-Ausf&#228;lle</strong> &#8212; Am 6. und 8. April gab es Outages bei Claude &#8212; relevant f&#252;r alle, die Production Workloads darauf laufen haben. <a href="https://www.techradar.com/news/live/claude-anthropic-down-outage-april-6-2026">TechRadar</a></p></li></ul><div><hr></div><p><em>N&#228;chste Ausgabe: Mittwoch, 15. April 2026</em><br><em>Feedback? Einfach antworten &#8212; ich justiere gerne Fokus, Tiefe und Quellen.</em></p>]]></content:encoded></item><item><title><![CDATA[How Secure Is the Claude Code Sandbox on the Mac?]]></title><description><![CDATA[A Look Under the Hood of Claude Code and Cowork]]></description><link>https://blog.fluxum.net/p/how-secure-is-the-claude-code-sandbox</link><guid isPermaLink="false">https://blog.fluxum.net/p/how-secure-is-the-claude-code-sandbox</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Sun, 01 Mar 2026 14:43:15 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!Jelx!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p><em>AI agents execute commands on your machine &#8212; but how well do the sandboxes of Claude Code and Cowork actually protect you? Both promise isolation, yet rely on entirely different mechanisms. I didn&#8217;t just read the documentation &#8212; I examined both systems from the inside using standard Linux tools. The result: the isolation is real, verifiable, and surprisingly well thought out.</em></p><div><hr></div><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!Jelx!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!Jelx!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png 424w, https://substackcdn.com/image/fetch/$s_!Jelx!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png 848w, https://substackcdn.com/image/fetch/$s_!Jelx!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png 1272w, https://substackcdn.com/image/fetch/$s_!Jelx!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!Jelx!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png" width="1024" height="1024" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/d664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:1024,&quot;width&quot;:1024,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1813962,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/189551969?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!Jelx!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png 424w, https://substackcdn.com/image/fetch/$s_!Jelx!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png 848w, https://substackcdn.com/image/fetch/$s_!Jelx!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png 1272w, https://substackcdn.com/image/fetch/$s_!Jelx!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd664dcb5-f88c-4c6e-9660-865ba0af7747_1024x1024.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p></p><blockquote><p>&#8220;If Claude decides to delete all my files: no big deal &#8212; but only inside an isolated VM.&#8221;</p></blockquote><p>Anyone who uses Claude Code in the terminal with default settings knows the drill: many commands require approval before Claude Code executes them. You constantly have to weigh whether a given command is safe or not.</p><blockquote><p>&#8220;Allow this? Allow once? Allow always?&#8221;</p></blockquote><p>You keep checking: is this harmless, or could this command cause problems? Cognitive load from reading command lines.</p><p>There are essentially two extremes: either you review every single permission request yourself, or you use the <code>--dangerously-skip-permissions</code> option, which allows everything. In between, there are many gradations. You can define your permissions with fine granularity, but that&#8217;s almost as much effort.</p><p>How nice would it be if you could simply allow everything while still being certain that nothing unwanted happens on your machine. Then agentic coding could proceed unhindered and you&#8217;d get results fast.</p><p>That&#8217;s exactly what an isolated system promises &#8212; one that runs shielded from your actual computer. Such an isolated system reduces the blast radius &#8212; the maximum damage a misguided command can cause &#8212; immensely. If something goes wrong, you simply restart and return to the last stable state. There are many ways to implement this.</p><p>One of them is the <code>/sandbox</code> command built into Claude Code. It activates a sandbox that restricts Claude Code at the OS level &#8212; file access and networking. You can let commands run automatically without confirming each one, because the sandbox limits what can happen. But how secure is it really?</p><p>And then there&#8217;s <strong>Cowork</strong> in the desktop version of the Claude app. Cowork is aimed more at knowledge workers than developers. It can access folders, create and modify files, install packages &#8212; all autonomously. At first glance, it&#8217;s not obvious how the protection works. There&#8217;s no <code>/sandbox</code> command you&#8217;d need to activate. The isolation happens in the background.</p><p>I was curious about both: how does the sandbox work in Claude Code? And how does Cowork protect me from unwanted changes on my machine?</p><p>I didn&#8217;t want to rely on the documentation alone &#8212; instead, I examined both systems from the inside. Here&#8217;s what I found.</p><h2>Two Products, Two Audiences, Two Security Models</h2><p>Before I dive into the technical details, an important distinction:</p><p><strong>Claude Code</strong> is a terminal tool for developers. It executes commands on your machine &#8212; in the same context where you work. The sandbox must be manually activated (<code>/sandbox</code>), making it opt-in. That makes sense: developers need as few restrictions as possible to be productive. They want to run commands that a restrictive sandbox would block. But with great power comes great responsibility. You need to understand what you&#8217;re approving.</p><p><strong>Cowork</strong> is part of the Claude Desktop app and is aimed at users who don&#8217;t want to deal with the command line. When someone asks Claude to create an Excel spreadsheet from five PDFs, they expect a result &#8212; not a discussion about file permissions. Cowork therefore needs to provide stronger protection, without requiring the user to configure anything.</p><p>The result: two different isolation models for two different risk profiles.</p><p>Let&#8217;s get into the details.</p><div><hr></div><h2>Cowork: A Linux Inside Your Mac</h2><p>Cowork launches a lightweight Linux VM via Apple&#8217;s Virtualization.framework. Not a container, but a real virtual machine with its own kernel.</p><p>What does the VM say about itself?</p><pre><code><code>$ cat /etc/os-release
PRETTY_NAME="Ubuntu 22.04.5 LTS"

$ uname -r
6.8.0-94-generic

$ uname -m
aarch64

$ nproc
4

$ free -h
              total    used    free
Mem:          3.8Gi   564Mi   1.8Gi
Swap:            0B      0B      0B

$ df -h /
Filesystem      Size  Used Avail Use%
/dev/nvme0n1p1  9.6G  7.2G  2.4G  75%
</code></code></pre><p>Ubuntu 22.04 on ARM64, 4 cores, 3.8 GB RAM, a 10 GB disk. No swap. Lean enough for document processing and scripts, but not meant for machine learning training.</p><p>On the macOS host, the VM files live at <code>~/Library/Application Support/Claude/vm_bundles/claudevm.bundle/</code>. The root image (<code>rootfs.img</code>) is 10 GB as a sparse file but only occupies about 7.5 GB on disk.</p><p>Alongside it sits a compressed backup (<code>rootfs.img.zst</code>, ~2 GB) and a few configuration files: <code>efivars.fd</code>, <code>macAddress</code>, <code>machineIdentifier</code>.</p><div><hr></div><h2>How Three Layers Work Together to Secure the Isolation</h2><p>The VM alone would already be a solid boundary. But Anthropic stacks three layers on top of each other.</p><h3>Layer 1: The VM</h3><p>Apple&#8217;s Virtualization.framework provides hardware isolation. The guest has its own kernel. Even an <code>rm -rf /</code> inside the VM leaves the host untouched.</p><h3>Layer 2: bubblewrap + seccomp</h3><p>Inside the VM, Claude doesn&#8217;t run directly &#8212; first comes <strong>bubblewrap</strong> (short: <code>bwrap</code>). Bubblewrap is a sandboxing tool that uses Linux namespaces to isolate processes from each other &#8212; similar to what containers do, but more lightweight.</p><p>It restricts what a process can see and do: which files, which network interfaces, which other processes.</p><p>In the Cowork VM, bubblewrap is PID 1 &#8212; the very first process:</p><pre><code><code>$ cat /proc/1/status | head -2
Name:   bwrap
State:  S (sleeping)
</code></code></pre><p>The bwrap command line (readable via <code>/proc/1/cmdline</code>) shows the key restrictions at a glance:</p><ul><li><p><code>--unshare-net</code> &#8212; separate network namespace, no direct network access</p></li><li><p><code>--unshare-pid</code> &#8212; separate PID namespace, other processes invisible</p></li><li><p><code>--ro-bind / /</code> &#8212; root filesystem mounted read-only</p></li><li><p><code>--die-with-parent</code> &#8212; if the parent process dies, the sandbox dies with it</p></li><li><p><code>--tmpfs /etc/ssh/ssh_config.d</code> &#8212; SSH configuration overlaid with an empty tmpfs</p></li></ul><p>Additionally, a <strong>seccomp filter</strong> is loaded. Seccomp (Secure Computing Mode) is a Linux kernel mechanism that determines which system calls a process is allowed to make. System calls are the interface between a program and the operating system &#8212; opening files, establishing network connections, starting processes.</p><p>A seccomp filter can selectively block individual system calls, drastically limiting a process&#8217;s radius of action.</p><pre><code><code>$ grep Seccomp /proc/self/status
Seccomp:         2
Seccomp_filters: 2
</code></code></pre><p><code>Seccomp: 2</code> means filter mode &#8212; there&#8217;s an active allowlist for permitted syscalls. The filter file is called <code>unix-block.bpf</code> and is loaded via a dedicated binary (<code>apply-seccomp</code>).</p><h3>Layer 3: Network Isolation</h3><p>No process in the sandbox has direct internet access. All traffic goes through a local proxy:</p><pre><code><code>$ env | grep HTTP_PROXY
HTTP_PROXY=http://localhost:3128

$ env | grep ALL_PROXY
ALL_PROXY=socks5h://localhost:1080
</code></code></pre><p>The proxy runs via <code>socat</code>, which tunnels TCP connections into Unix sockets that lead out of the VM. On the host side, an <strong>allowlist</strong> decides which domains may pass through.</p><p>I tested it:</p><pre><code><code>$ curl -s -o /dev/null -w "%{http_code}" https://registry.npmjs.org
200

$ curl -s -o /dev/null -w "%{http_code}" https://pypi.org
200

$ curl -sv https://evil-exfiltration-test.example.org 2&gt;&amp;1 | grep "HTTP/1.1"
&lt; HTTP/1.1 403 Forbidden

$ curl -sv https://evil-exfiltration-test.example.org 2&gt;&amp;1 | grep "X-Proxy"
&lt; X-Proxy-Error: blocked-by-allowlist
</code></code></pre><p>npm and PyPI get through. Everything else receives a <code>403 Forbidden</code> with the header <code>X-Proxy-Error: blocked-by-allowlist</code>. Direct DNS lookups also fail:</p><pre><code><code>$ nslookup google.com
socket(): Operation not permitted
;; no servers could be reached
</code></code></pre><p>This is consistent: even if a prompt injection attack were to trick Claude into sending data to an external server &#8212; the proxy would block it.</p><div><hr></div><h2>Which Files Does the VM See?</h2><p>Files enter the VM via <strong>VirtioFS</strong> &#8212; a filesystem protocol designed specifically for communication between a VM and its host. Instead of simulating real hardware, host and guest cooperate deliberately (paravirtualization). This makes file access fast and low-overhead.</p><pre><code><code>$ mount | grep virtiofs
/mnt/.virtiofs-root/shared/Work/.../Marketing on
  /sessions/elegant-adoring-brown/mnt/Marketing type fuse (rw,...)
</code></code></pre><p>Only the folder I selected in the Desktop app is mounted. Not my home directory, not my Desktop, not my Downloads &#8212; just the one folder I explicitly shared.</p><p>Plugins and Skills are additionally mounted via <strong>bindfs</strong>. Bindfs is a FUSE filesystem that remounts an existing folder at a different location &#8212; similar to a symlink, but with the ability to change permissions. This way, Skills can be mounted read-only even though they&#8217;re writable on the host. Uploads also land in a separate, read-only mount.</p><p>One detail reveals that the VM serves multiple conversations simultaneously: the <code>/sessions/</code> directory contains different sessions side by side:</p><pre><code><code>$ ls -la /sessions/
drwxr-x--- elegant-adoring-brown  elegant-adoring-brown  ...
drwxr-x--- nobody                 nogroup                awesome-epic-mccarthy
drwxr-x--- nobody                 nogroup                dazzling-vibrant-carson
</code></code></pre><p>Each session gets its own Linux user with its own UID. My user is called <code>elegant-adoring-brown</code> (uid 1005). The other sessions are listed under <code>nobody</code> &#8212; I can&#8217;t read their files.</p><div><hr></div><h2>How Does Claude Code Protect Without a VM?</h2><p>Claude Code in the terminal uses a different approach on macOS: Apple&#8217;s <strong>Seatbelt</strong> (also known as <code>sandbox-exec</code>). Instead of a VM, a dynamically generated sandbox profile restricts the process at the OS level. Important: the sandbox must be manually activated with <code>/sandbox</code> &#8212; without this step, Claude Code runs without OS-level isolation.</p><p>The profile starts with <code>(deny default)</code> &#8212; everything is forbidden unless explicitly allowed. The sandbox runtime is open source and available on GitHub. I downloaded the npm package <code>@anthropic-ai/sandbox-runtime</code> and analyzed the <code>macos-sandbox-utils.js</code>:</p><ul><li><p><strong>59 sysctl entries</strong> are made readable (hardware info like CPU count, memory size)</p></li><li><p><strong>14 Mach IPC services</strong> on the whitelist (Fonts, Logging, Security Server)</p></li><li><p><strong>Mandatory denies</strong> for <code>.env</code>, <code>.ssh</code>, <code>.aws</code>, <code>.git/hooks</code>, <code>.git/config</code> &#8212; even when the working directory has write access</p></li><li><p><strong>Move blocking</strong>: <code>file-write-rename</code> and <code>file-write-unlink</code> are blocked for protected paths, preventing circumvention of the denies via <code>mv</code></p></li></ul><p>The network isolation works the same way as with Cowork: all traffic goes through the same proxy with an allowlist. The difference: with Seatbelt, this happens at the process level (same kernel); with Cowork, at the VM level (separate kernel).</p><h3>Why Two Models?</h3><p>Claude Code is aimed at developers who need fast feedback in the terminal. The Seatbelt overhead is in the low single-digit millisecond range &#8212; I measured it on the host, no perceptible difference from a command without sandbox. Developers can selectively activate the sandbox when they want to give an agent more autonomy without having to approve every command.</p><p>Cowork gives Claude significantly more autonomy: it runs longer, creates files independently, installs packages. And it&#8217;s aimed at users who can&#8217;t assess (and don&#8217;t need to assess) which commands are being executed at the operating system level. The potential damage from an agent with local file access, code generation, and network egress is greater &#8212; and users are less able to evaluate it. Full VM isolation is appropriate here.</p><div><hr></div><h2>What I Take Away From This</h2><p>The isolation is real. Not just on paper, but verifiable.</p><p>Three things convinced me in particular:</p><p>First, the <strong>proxy allowlist with the explicit </strong><code>X-Proxy-Error: blocked-by-allowlist</code><strong> header</strong>. This isn&#8217;t a silent error message but a deliberate architectural decision. You can immediately see why a connection fails.</p><p>Second, the <strong>layering</strong>. The VM alone would be good. With bubblewrap and seccomp, it gets better. All three together make it significantly harder to break out of the sandbox. An exploit would have to simultaneously bypass the seccomp filter, escape the bwrap namespace, and then break out of the VM &#8212; on a system with no direct network access.</p><p>Third, the <strong>transparency</strong>. The sandbox runtime is open source. I downloaded the <code>macos-sandbox-utils.js</code> code &#8212; the 59 sysctl entries, the 14 Mach services, and the mandatory denies for <code>.env</code>, <code>.ssh</code>, and <code>.aws</code> are all there in black and white. The Seatbelt profile is dynamically generated, but the generating code is inspectable. The VM architecture can be examined from the inside. You don&#8217;t have to take anyone&#8217;s word for it &#8212; you can look for yourself.</p><p>If you want to look for yourself: the <a href="https://github.com/anthropic-experimental/sandbox-runtime">sandbox runtime is on GitHub</a>. An <code>npm pack</code> and a look at <code>macos-sandbox-utils.js</code> is all it takes to understand the Seatbelt profile.</p><div><hr></div><h2>What You Can Do Now</h2><p>If you&#8217;re using Claude Code and haven&#8217;t tried the sandbox yet: start a session and type <code>/sandbox</code>. That alone significantly reduces the effort of approving commands one by one. For everyday use, that&#8217;s often enough.</p><p>If you want to go deeper:</p><ul><li><p><strong>Inspect the sandbox runtime</strong>: <code>npm pack @anthropic-ai/sandbox-runtime</code>, unpack, read <code>macos-sandbox-utils.js</code>. There you&#8217;ll see exactly what&#8217;s allowed and what&#8217;s blocked.</p></li><li><p><strong>Examine Cowork from the inside</strong>: Launch Cowork and ask it to run <code>cat /proc/1/cmdline | tr '\0' '\n'</code>. The bubblewrap flags reveal the isolation in detail.</p></li><li><p><strong>Test the network</strong>: A <code>curl https://evil-exfiltration-test.example.org</code> inside the sandbox immediately shows you whether the allowlist is working.</p></li></ul><h2>What&#8217;s Next?</h2><p>The current state is clear. But one question remains: will it stay this way? Claude Code and Cowork already share the agentic architecture &#8212; and there are concrete signals that the security models are converging as well:</p><ul><li><p><strong>Docker</strong> is delivering MicroVM sandboxes with <code>docker-model-runner</code>, specifically designed for AI agents.</p></li><li><p><strong>Apple</strong> is bringing its own Containerization framework with macOS 26 &#8212; native container support on the Mac for the first time.</p></li><li><p><strong>Anthropic</strong> documents DevContainers as the official path toward stronger isolation in Claude Code.</p></li></ul><p>Three players, three approaches, one goal: agents should be able to do more without being able to cause more damage. In the next article, I&#8217;ll examine the pros and cons of each path &#8212; and why I consider one of them the most likely.</p><p>If you want to be notified when the next article is published:</p><p class="button-wrapper" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Jetzt abonnieren&quot;,&quot;action&quot;:null,&quot;class&quot;:null}" data-component-name="ButtonCreateButton"><a class="button primary" href="https://blog.fluxum.net/subscribe?"><span>Jetzt abonnieren</span></a></p><p></p><p>Subscribe to my Substack &#8212; free, no spam, just substance.</p><div><hr></div><h2>Sources</h2><ul><li><p><a href="https://code.claude.com/docs/en/sandboxing">Sandboxing &#8212; Claude Code Docs</a></p></li><li><p><a href="https://github.com/anthropic-experimental/sandbox-runtime">sandbox-runtime (GitHub)</a></p></li><li><p><a href="https://pvieito.com/2026/01/inside-claude-cowork">Inside Claude Cowork (Pedro Jos&#233; Pereira Vieito)</a> &#8212; Reverse engineering analysis of the VM architecture</p></li><li><p><a href="https://developer.apple.com/documentation/virtualization">Apple Virtualization Framework</a></p></li></ul>]]></content:encoded></item><item><title><![CDATA[Wie sicher ist die Claude Code Sandbox auf dem Mac?]]></title><description><![CDATA[Ein Blick unter die Haube von Claude Code und Cowork]]></description><link>https://blog.fluxum.net/p/wie-sicher-ist-die-claude-code-sandbox</link><guid isPermaLink="false">https://blog.fluxum.net/p/wie-sicher-ist-die-claude-code-sandbox</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Sun, 01 Mar 2026 14:28:29 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!jZwS!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<div><hr></div><p><em>KI-Agenten f&#252;hren Befehle auf deinem Rechner aus &#8212; aber wie gut sch&#252;tzen dich die Sandboxes von Claude Code und Cowork? Beide versprechen Isolation, setzen aber auf unterschiedliche Mechanismen. Ich habe nicht nur die Dokumentation gelesen, sondern beide Systeme mit Linux-Tools von innen untersucht. Das Ergebnis: Die Isolation ist real, nachpr&#252;fbar und &#252;berraschend durchdacht.</em></p><div><hr></div><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!jZwS!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!jZwS!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png 424w, https://substackcdn.com/image/fetch/$s_!jZwS!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png 848w, https://substackcdn.com/image/fetch/$s_!jZwS!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png 1272w, https://substackcdn.com/image/fetch/$s_!jZwS!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!jZwS!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png" width="1024" height="1024" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/e9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:1024,&quot;width&quot;:1024,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1813962,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/189546259?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!jZwS!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png 424w, https://substackcdn.com/image/fetch/$s_!jZwS!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png 848w, https://substackcdn.com/image/fetch/$s_!jZwS!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png 1272w, https://substackcdn.com/image/fetch/$s_!jZwS!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9a668d0-c3b9-446b-b6b9-56b009b1664c_1024x1024.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p></p><blockquote><p>&#8222;Falls sich Claude entscheidet, alle meine Dateien zu l&#246;schen: Halb so wild. Aber bitte nur innerhalb einer isolierten VM !&#8220;</p></blockquote><p>Wer Claude Code im Terminal mit den Standardeinstellungen nutzt, kennt das: Viele Befehle ben&#246;tigen eine Freigabe, bevor Claude Code sie ausf&#252;hrt. </p><p>Immer wieder muss man abw&#228;gen, ob der jeweilige Befehl in Ordnung geht oder nicht:</p><blockquote><p>&#8222;Allow this? Allow once? Allow always?&#8220;</p></blockquote><p>St&#228;ndig pr&#252;ft man: Ist das ungef&#228;hrlich oder k&#246;nnte dieser Befehl zu Problemen f&#252;hren? Cognitive Load durch Kommandozeilen lesen.</p><p>Im Grunde gibt es zwei extreme Ans&#228;tze: Entweder man pr&#252;ft jede einzelne Freigabeanfrage selbst oder setzt auf die Option <code>--dangerously-skip-permissions</code>, wodurch alles erlaubt ist. Dazwischen gibt es viele Abstufungen. Man kann seine Permissions feingranular definieren, aber das ist fast genauso aufwendig.</p><p>Wie sch&#246;n w&#228;re es, wenn man einfach alles erlauben k&#246;nnte und dennoch sicher sein k&#246;nnte, dass nichts Unerw&#252;nschtes auf dem eigenen Rechner passiert. Dann k&#246;nnte Agentic Coding ungebremst stattfinden und man k&#228;me schnell zu Ergebnissen.</p><p>Genau das verspricht ein isoliertes System, das abgeschirmt vom eigenen Computer l&#228;uft. So ein isoliertes System verringert den Blast Radius &#8212; also den Schaden, den ein fehlgeleiteter Befehl maximal anrichten kann &#8212; immens. Wenn etwas schief geht, startet man einfach neu und geht zum letzten stabilen Ausgangszustand zur&#252;ck. Es gibt viele M&#246;glichkeiten, das umzusetzen.</p><p>Eine davon ist der in Claude Code eingebaute <code>/sandbox</code>-Befehl. Er aktiviert eine Sandbox, die Claude Code auf OS-Ebene einschr&#228;nkt &#8212; Dateizugriffe und Netzwerk. Man kann Commands automatisch laufen lassen, ohne jedes Mal zu best&#228;tigen, weil die Sandbox begrenzt, was passieren kann. Aber wie sicher ist das wirklich?</p><p>Und dann gibt es noch <strong>Cowork</strong> in der Desktop-Variante der Claude-App. Cowork richtet sich eher an Wissensarbeiter, nicht direkt an Entwickler. Es darf auf Ordner zugreifen, Dateien erstellen und ver&#228;ndern, Pakete installieren &#8212; und das alles autonom. Auf den ersten Blick ist dabei nicht ersichtlich, wie die Absicherung funktioniert. Es gibt keinen <code>/sandbox</code>-Befehl, den man aktivieren m&#252;sste. Die Isolation passiert im Hintergrund.</p><p>Mich hat beides interessiert: Wie funktioniert die Sandbox in Claude Code? Und wie sch&#252;tzt mich Cowork davor, dass ungewollte &#196;nderungen auf meinem Rechner passieren?</p><p>Dabei wollte ich mich nicht nur auf die Dokumentation verlassen, sondern ich habe beide Systeme von innen untersucht. Hier ist, was ich gefunden habe.</p><h2>Zwei Produkte, zwei Zielgruppen, zwei Sicherheitsmodelle</h2><p>Bevor ich in die Technik gehe, ein wichtiger Unterschied:</p><p><strong>Claude Code</strong> ist ein Terminal-Tool f&#252;r Entwickler. Es f&#252;hrt Befehle auf deinem Rechner aus &#8212; im selben Kontext, in dem du arbeitest. Die Sandbox muss manuell aktiviert werden (<code>/sandbox</code>), ist opt-in. Das ergibt Sinn: Entwickler brauchen m&#246;glichst wenig Einschr&#228;nkungen, um produktiv zu sein. Sie wollen Befehle ausf&#252;hren k&#246;nnen, die eine restriktive Sandbox behindern w&#252;rde. Aber mit vielen Rechten kommt viel Verantwortung. Man muss verstehen, was man abnickt.</p><p><strong>Cowork</strong> ist Teil der Claude Desktop-App und richtet sich an Nutzer, die sich nicht mit der Kommandozeile auseinander setzen wollen. Wenn jemand Claude bittet, eine Excel-Tabelle aus f&#252;nf PDFs zu erstellen, erwartet er ein Ergebnis &#8212; nicht eine Diskussion &#252;ber Dateiberechtigungen. Cowork muss daher st&#228;rker absichern, und zwar ohne dass der Nutzer das konfigurieren muss.</p><p>Das Ergebnis: Zwei unterschiedliche Isolationsmodelle f&#252;r zwei unterschiedliche Risikoprofile.</p><p>Lass uns in die Details gehen.</p><div><hr></div><h2>Cowork: Ein Linux in deinem Mac</h2><p>Cowork startet eine leichtgewichtige Linux-VM &#252;ber Apples Virtualization.framework. Kein Container, sondern eine echte virtuelle Maschine mit eigenem Kernel.</p><p>Was sagt die VM &#252;ber sich?</p><pre><code><code>$ cat /etc/os-release
PRETTY_NAME="Ubuntu 22.04.5 LTS"

$ uname -r
6.8.0-94-generic

$ uname -m
aarch64

$ nproc
4

$ free -h
              total    used    free
Mem:          3.8Gi   564Mi   1.8Gi
Swap:            0B      0B      0B

$ df -h /
Filesystem      Size  Used Avail Use%
/dev/nvme0n1p1  9.6G  7.2G  2.4G  75%
</code></code></pre><p>Ubuntu 22.04 auf ARM64, 4 Kerne, 3,8 GB RAM, eine 10-GB-Disk. Kein Swap. Schlank genug f&#252;r Dokumentenverarbeitung und Skripte, aber nicht f&#252;r Machine-Learning-Training gedacht.</p><p>Auf dem macOS-Host finden sich die VM-Dateien unter <code>~/Library/Application Support/Claude/vm_bundles/claudevm.bundle/</code>. Das Root-Image (<code>rootfs.img</code>) ist 10 GB gro&#223; als Sparse-Datei, belegt aber nur etwa 7,5 GB on-disk.</p><p>Daneben liegt ein komprimiertes Backup (<code>rootfs.img.zst</code>, ~2 GB) und ein paar Konfigurationsdateien: <code>efivars.fd</code>, <code>macAddress</code>, <code>machineIdentifier</code>.</p><div><hr></div><h2>Wie drei Schichten zusammen die Isolation absichern</h2><p>Die VM allein w&#228;re schon eine solide Grenze. Aber Anthropic stapelt drei Schichten &#252;bereinander.</p><h3>Schicht 1: Die VM</h3><p>Apples Virtualization.framework stellt Hardware-Isolation bereit. Der Gast hat seinen eigenen Kernel. Selbst ein <code>rm -rf /</code> in der VM l&#228;sst den Host unber&#252;hrt.</p><h3>Schicht 2: bubblewrap + seccomp</h3><p>Innerhalb der VM l&#228;uft nicht direkt Claude, sondern erst <strong>bubblewrap</strong> (kurz: <code>bwrap</code>). Bubblewrap ist ein Sandboxing-Tool, das Linux-Namespaces nutzt, um Prozesse voneinander zu isolieren &#8212; &#228;hnlich wie Container es tun, aber leichtgewichtiger.</p><p>Es schr&#228;nkt ein, was ein Prozess sehen und tun darf: welche Dateien, welche Netzwerkschnittstellen, welche anderen Prozesse.</p><p>In der Cowork-VM ist bubblewrap PID 1, also der allererste Prozess:</p><pre><code><code>$ cat /proc/1/status | head -2
Name:   bwrap
State:  S (sleeping)
</code></code></pre><p>Die bwrap-Kommandozeile (&#252;ber <code>/proc/1/cmdline</code> auslesbar) zeigt die wichtigsten Einschr&#228;nkungen im &#220;berblick:</p><ul><li><p><code>--unshare-net</code> &#8212; eigener Netzwerk-Namespace, kein direkter Netzzugang</p></li><li><p><code>--unshare-pid</code> &#8212; eigener PID-Namespace, andere Prozesse unsichtbar</p></li><li><p><code>--ro-bind / /</code> &#8212; Root-Dateisystem read-only eingebunden</p></li><li><p><code>--die-with-parent</code> &#8212; stirbt der Elternprozess, stirbt die Sandbox mit</p></li><li><p><code>--tmpfs /etc/ssh/ssh_config.d</code> &#8212; SSH-Konfiguration wird mit einem leeren tmpfs &#252;berdeckt</p></li></ul><p>Zus&#228;tzlich wird ein <strong>seccomp-Filter</strong> geladen. Seccomp (Secure Computing Mode) ist ein Mechanismus im Linux-Kernel, der festlegt, welche Systemaufrufe ein Prozess machen darf. Systemaufrufe sind die Schnittstelle zwischen einem Programm und dem Betriebssystem &#8212; Dateien &#246;ffnen, Netzwerkverbindungen herstellen, Prozesse starten.</p><p>Ein seccomp-Filter kann gezielt einzelne Systemaufrufe blockieren und damit den Aktionsradius eines Prozesses stark einschr&#228;nken.</p><pre><code><code>$ grep Seccomp /proc/self/status
Seccomp:         2
Seccomp_filters: 2
</code></code></pre><p><code>Seccomp: 2</code> bedeutet Filter-Modus &#8212; es gibt eine aktive Allowlist f&#252;r erlaubte Syscalls. Die Filterdatei hei&#223;t <code>unix-block.bpf</code> und wird &#252;ber eine eigene Binary (<code>apply-seccomp</code>) geladen.</p><h3>Schicht 3: Netzwerk-Isolation</h3><p>Kein Prozess in der Sandbox hat direkten Internetzugang. Aller Traffic geht durch einen lokalen Proxy:</p><pre><code><code>$ env | grep HTTP_PROXY
HTTP_PROXY=http://localhost:3128

$ env | grep ALL_PROXY
ALL_PROXY=socks5h://localhost:1080
</code></code></pre><p>Der Proxy l&#228;uft &#252;ber <code>socat</code>, das TCP-Verbindungen in Unix-Sockets tunnelt, die aus der VM herausf&#252;hren. Auf der Host-Seite entscheidet eine <strong>Allowlist</strong>, welche Domains passieren d&#252;rfen.</p><p>Ich habe es getestet:</p><pre><code><code>$ curl -s -o /dev/null -w "%{http_code}" https://registry.npmjs.org
200

$ curl -s -o /dev/null -w "%{http_code}" https://pypi.org
200

$ curl -sv https://evil-exfiltration-test.example.org 2&gt;&amp;1 | grep "HTTP/1.1"
&lt; HTTP/1.1 403 Forbidden

$ curl -sv https://evil-exfiltration-test.example.org 2&gt;&amp;1 | grep "X-Proxy"
&lt; X-Proxy-Error: blocked-by-allowlist
</code></code></pre><p>npm und PyPI kommen durch. Alles andere bekommt ein <code>403 Forbidden</code> mit dem Header <code>X-Proxy-Error: blocked-by-allowlist</code>. Auch direkte DNS-Lookups scheitern:</p><pre><code><code>$ nslookup google.com
socket(): Operation not permitted
;; no servers could be reached
</code></code></pre><p>Das ist konsequent: Selbst wenn ein Prompt-Injection-Angriff Claude dazu bringen w&#252;rde, Daten an einen externen Server zu senden &#8212; der Proxy w&#252;rde es blockieren.</p><div><hr></div><h2>Welche Dateien sieht die VM?</h2><p>Dateien kommen &#252;ber <strong>VirtioFS</strong> in die VM &#8212; ein Dateisystem-Protokoll, das speziell f&#252;r die Kommunikation zwischen VM und Host entwickelt wurde. Statt echte Hardware zu simulieren, arbeiten Host und Guest bewusst zusammen (Paravirtualisierung). Das macht den Dateizugriff schnell und mit wenig Overhead m&#246;glich.</p><pre><code><code>$ mount | grep virtiofs
/mnt/.virtiofs-root/shared/Work/.../Marketing on
  /sessions/elegant-adoring-brown/mnt/Marketing type fuse (rw,...)
</code></code></pre><p>Nur der Ordner, den ich in der Desktop-App ausgew&#228;hlt habe, wird gemountet. Nicht mein Home-Verzeichnis, nicht mein Desktop, nicht meine Downloads &#8212; nur der eine Ordner, den ich explizit freigegeben habe.</p><p>Plugins und Skills werden &#252;ber <strong>bindfs</strong> zus&#228;tzlich eingebunden. Bindfs ist ein FUSE-Dateisystem, das einen vorhandenen Ordner an einer anderen Stelle nochmal einbindet &#8212; &#228;hnlich wie ein Symlink, aber mit der M&#246;glichkeit, die Berechtigungen zu &#228;ndern. So k&#246;nnen Skills zum Beispiel read-only eingebunden werden, obwohl sie auf dem Host beschreibbar sind. Uploads landen ebenfalls in einem separaten, schreibgesch&#252;tzten Mount.</p><p>Ein Detail verr&#228;t, dass die VM mehrere Conversations gleichzeitig bedient: Im <code>/sessions/</code>-Verzeichnis sitzen verschiedene Sessions nebeneinander:</p><pre><code><code>$ ls -la /sessions/
drwxr-x--- elegant-adoring-brown  elegant-adoring-brown  ...
drwxr-x--- nobody                 nogroup                awesome-epic-mccarthy
drwxr-x--- nobody                 nogroup                dazzling-vibrant-carson
</code></code></pre><p>Jede Session bekommt einen eigenen Linux-User mit eigener UID. Mein User hei&#223;t <code>elegant-adoring-brown</code> (uid 1005). Die anderen Sessions sind unter <code>nobody</code> gelistet &#8212; ich kann ihre Dateien nicht lesen.</p><div><hr></div><h2>Wie sch&#252;tzt Claude Code ohne VM?</h2><p>Claude Code im Terminal nutzt auf macOS einen anderen Ansatz: Apples <strong>Seatbelt</strong> (auch bekannt als <code>sandbox-exec</code>). Statt einer VM wird ein dynamisch generiertes Sandbox-Profil erstellt, das den Prozess auf OS-Ebene einschr&#228;nkt. Wichtig: Die Sandbox muss manuell mit <code>/sandbox</code> aktiviert werden &#8212; ohne diesen Schritt l&#228;uft Claude Code ohne OS-Level-Isolation.</p><p>Das Profil startet mit <code>(deny default)</code> &#8212; alles ist verboten, au&#223;er es wird explizit erlaubt. Die Sandbox-Runtime ist Open Source und auf GitHub einsehbar. Ich habe das npm-Paket <code>@anthropic-ai/sandbox-runtime</code> heruntergeladen und die <code>macos-sandbox-utils.js</code> analysiert:</p><ul><li><p><strong>59 sysctl-Eintr&#228;ge</strong> werden zum Lesen freigegeben (Hardware-Info wie CPU-Anzahl, Speichergr&#246;&#223;e)</p></li><li><p><strong>14 Mach-IPC-Services</strong> auf der Whitelist (Fonts, Logging, Security Server)</p></li><li><p><strong>Mandatory Denies</strong> f&#252;r <code>.env</code>, <code>.ssh</code>, <code>.aws</code>, <code>.git/hooks</code>, <code>.git/config</code> &#8212; auch wenn das Arbeitsverzeichnis Schreibzugriff hat</p></li><li><p><strong>Move-Blocking</strong>: <code>file-write-rename</code> und <code>file-write-unlink</code> werden f&#252;r gesch&#252;tzte Pfade blockiert, damit man die Denies nicht per <code>mv</code> umgehen kann</p></li></ul><p>Die Netzwerk-Isolation funktioniert genauso wie bei Cowork: Aller Traffic geht durch denselben Proxy mit Allowlist. Der Unterschied: Bei Seatbelt passiert das auf Prozess-Ebene (gleicher Kernel), bei Cowork auf VM-Ebene (eigener Kernel).</p><h3>Warum zwei Modelle?</h3><p>Claude Code richtet sich an Entwickler, die im Terminal schnelles Feedback brauchen. Der Seatbelt-Overhead liegt im niedrigen einstelligen Millisekundenbereich &#8212; ich habe es auf dem Host gemessen, kein sp&#252;rbarer Unterschied zu einem Befehl ohne Sandbox. Entwickler k&#246;nnen die Sandbox gezielt aktivieren, wenn sie einem Agenten mehr Autonomie geben wollen, ohne jeden Befehl freigeben zu m&#252;ssen.</p><p>Cowork gibt Claude deutlich mehr Autonomie: Es l&#228;uft l&#228;nger, erstellt eigenst&#228;ndig Dateien, installiert Pakete. Und es richtet sich an Nutzer, die nicht einsch&#228;tzen k&#246;nnen (und nicht einsch&#228;tzen m&#252;ssen), welche Befehle auf Betriebssystemebene ausgef&#252;hrt werden. Der m&#246;gliche Schaden eines Agenten mit lokalem Dateizugriff, Codegenerierung und Netzwerk-Egress ist gr&#246;&#223;er &#8212; und die Nutzer k&#246;nnen ihn schlechter einsch&#228;tzen. Die volle VM-Isolation ist hier angemessen.</p><div><hr></div><h2>Was ich daraus mitnehme</h2><p>Die Isolation ist real. Nicht nur auf dem Papier, sondern nachpr&#252;fbar.</p><p>Drei Dinge haben mich besonders &#252;berzeugt:</p><p>Erstens die <strong>Proxy-Allowlist mit dem expliziten </strong><code>X-Proxy-Error: blocked-by-allowlist</code><strong> Header</strong>. Das ist keine stille Fehlermeldung, sondern eine bewusste Architekturentscheidung. Man sieht sofort, warum eine Verbindung scheitert.</p><p>Zweitens die <strong>Schichtung</strong>. VM allein w&#228;re gut. Mit bubblewrap und seccomp wird&#8217;s besser. Alle drei zusammen machen es deutlich schwieriger, aus der Sandbox auszubrechen. Ein Exploit m&#252;sste gleichzeitig den seccomp-Filter umgehen, aus dem bwrap-Namespace ausbrechen und dann noch aus der VM raus &#8212; auf einem System, das keinen direkten Netzzugang hat.</p><p>Drittens die <strong>Transparenz</strong>. Die Sandbox-Runtime ist Open Source. Ich habe den Code der <code>macos-sandbox-utils.js</code> heruntergeladen &#8212; dort stehen die 59 sysctl-Eintr&#228;ge, die 14 Mach-Services und die Mandatory Denies f&#252;r <code>.env</code>, <code>.ssh</code> und <code>.aws</code> schwarz auf wei&#223;. Das Seatbelt-Profil wird dynamisch generiert, aber der generierende Code ist einsehbar. Die VM-Architektur l&#228;sst sich von innen inspizieren. Man muss niemandem glauben &#8212; man kann nachschauen.</p><p>Wer selbst nachschauen will: Die <a href="https://github.com/anthropic-experimental/sandbox-runtime">Sandbox-Runtime liegt auf GitHub</a>. Ein <code>npm pack</code> und ein Blick in <code>macos-sandbox-utils.js</code> reichen, um das Seatbelt-Profil zu verstehen.</p><div><hr></div><h2>Was du jetzt tun kannst</h2><p>Wenn du Claude Code nutzt und die Sandbox noch nicht ausprobiert hast: Starte eine Session und tippe <code>/sandbox</code>. Allein das reduziert den Aufwand, Befehle einzeln freizugeben, erheblich. F&#252;r den Alltag reicht das oft schon.</p><p>Wenn du tiefer einsteigen willst:</p><ul><li><p><strong>Sandbox-Runtime inspizieren</strong>: <code>npm pack @anthropic-ai/sandbox-runtime</code>, entpacken, <code>macos-sandbox-utils.js</code> lesen. Dort siehst du exakt, was erlaubt und was blockiert wird.</p></li><li><p><strong>Cowork von innen ansehen</strong>: Starte Cowork und bitte es <code>cat /proc/1/cmdline | tr '\0' '\n'</code> auszuf&#252;hren. Die bubblewrap-Flags verraten dir die Isolation im Detail.</p></li><li><p><strong>Netzwerk testen</strong>: Ein <code>curl https://evil-exfiltration-test.example.org</code> in der Sandbox zeigt dir sofort, ob die Allowlist greift.</p></li></ul><h2>Wie geht es weiter?</h2><p>Damit ist der Ist-Zustand klar. Aber eine Frage bleibt: Wird das so bleiben? Claude Code und Cowork teilen sich bereits die agentic Architektur &#8212; und es gibt konkrete Signale, dass auch die Sicherheitsmodelle zusammenwachsen:</p><ul><li><p><strong>Docker</strong> liefert mit <code>docker-model-runner</code> MicroVM-Sandboxes, die speziell f&#252;r KI-Agenten gedacht sind.</p></li><li><p><strong>Apple</strong> bringt mit macOS 26 ein eigenes Containerization-Framework &#8212; erstmals native Container-Unterst&#252;tzung auf dem Mac.</p></li><li><p><strong>Anthropic</strong> dokumentiert DevContainer als offiziellen Weg f&#252;r st&#228;rkere Isolation in Claude Code.</p></li></ul><p>Drei Player, drei Ans&#228;tze, ein Ziel: Agenten sollen mehr d&#252;rfen, ohne mehr Schaden anrichten zu k&#246;nnen. Im n&#228;chsten Artikel werde ich mir anschauen, was f&#252;r und gegen jeden dieser Pfade spricht &#8212; und warum ich einen davon f&#252;r den wahrscheinlichsten halte.</p><p>Wenn du benachrichtigt werden willst, wenn der n&#228;chste Artikel ver&#246;ffentlich ist:</p><p class="button-wrapper" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Jetzt abonnieren&quot;,&quot;action&quot;:null,&quot;class&quot;:null}" data-component-name="ButtonCreateButton"><a class="button primary" href="https://blog.fluxum.net/subscribe?"><span>Jetzt abonnieren</span></a></p><p></p><h2>Quellen</h2><ul><li><p><a href="https://code.claude.com/docs/en/sandboxing">Sandboxing &#8212; Claude Code Docs</a></p></li><li><p><a href="https://github.com/anthropic-experimental/sandbox-runtime">sandbox-runtime (GitHub)</a></p></li><li><p><a href="https://pvieito.com/2026/01/inside-claude-cowork">Inside Claude Cowork (Pedro Jos&#233; Pereira Vieito)</a> &#8212; Reverse-Engineering-Analyse der VM-Architektur</p></li><li><p><a href="https://developer.apple.com/documentation/virtualization">Apple Virtualization Framework</a></p></li></ul>]]></content:encoded></item><item><title><![CDATA[Der neue Engpass]]></title><description><![CDATA[Warum schnellerer Code eure Probleme nicht l&#246;st]]></description><link>https://blog.fluxum.net/p/der-neue-engpass</link><guid isPermaLink="false">https://blog.fluxum.net/p/der-neue-engpass</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Wed, 28 Jan 2026 13:57:54 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!0Y8G!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>Wir haben Code-Generierung so effizient gemacht, dass wir jetzt ein neues Problem haben: Menschen, die schneller Output abnehmen m&#252;ssen, als sie denken k&#246;nnen.</p><p>Die AI-Diskussion in der Softwareentwicklung dreht sich fast ausschlie&#223;lich um eine Frage: Wie generieren wir Code schneller? Das ist verst&#228;ndlich &#8211; aber es lenkt von dem ab, was gerade wirklich passiert.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!0Y8G!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!0Y8G!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png 424w, https://substackcdn.com/image/fetch/$s_!0Y8G!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png 848w, https://substackcdn.com/image/fetch/$s_!0Y8G!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png 1272w, https://substackcdn.com/image/fetch/$s_!0Y8G!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!0Y8G!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png" width="1456" height="971" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:971,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:2188226,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/186079359?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!0Y8G!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png 424w, https://substackcdn.com/image/fetch/$s_!0Y8G!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png 848w, https://substackcdn.com/image/fetch/$s_!0Y8G!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png 1272w, https://substackcdn.com/image/fetch/$s_!0Y8G!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F30082918-ff1f-485f-9ad0-74d2d98860b3_1536x1024.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p></p><h3>Das Bottleneck hat sich verschoben</h3><p>Vor einem Jahr war &#8220;Code schreiben&#8221; noch ein limitierender Faktor. Heute kann ein einzelner Entwickler mit den richtigen Agents an einem Tag produzieren, wof&#252;r fr&#252;her eine Woche n&#246;tig war.</p><p>Klingt nach Fortschritt. Ist es auch &#8211; bis man fragt: Wer reviewt das alles? Wer versteht es? Wer verantwortet es?</p><p>Die Velocity-Metriken sehen fantastisch aus. Aber die Engp&#228;sse sind nicht verschwunden. Sie haben sich verschoben &#8211; zum Menschen.</p><h3>F&#252;nf Fragen, auf die niemand gute Antworten hat</h3><p><strong>1. Wie bewertest du Arbeit, die du nicht mehr selbst machst?</strong></p><p>Engineering Leads haben jahrelang Code-Reviews gemacht. Sie wussten, worauf sie achten mussten, weil sie selbst im Code steckten. Wenn Agents den Gro&#223;teil des Codes produzieren und Engineers zu &#8220;Orchestratoren&#8221; werden &#8211; nach welchen Kriterien bewerten wir dann? Wie unterscheidest du guten von schlechtem Output, wenn du selbst nicht mehr Zeile f&#252;r Zeile durchgehst?</p><p><strong>2. Wer &#252;bernimmt die Verantwortung?</strong></p><p>Agent generiert Code. Engineer gibt ihn frei. QA testet. Alles gr&#252;n. Drei Monate sp&#228;ter: Security-Problem, das niemand gesehen hat.</p><p>Wer ist verantwortlich? Der Engineer, der den Code freigegeben hat, ohne ihn wirklich zu verstehen? Das Team, das die Guardrails definiert hat? Die Organisation, die keine besseren Review-Prozesse etabliert hat?</p><p>In klassischen Strukturen war Verantwortung an Wissen gekoppelt: Wer den Code geschrieben hat, verstand ihn und verantwortete ihn. Diese Kopplung l&#246;st sich gerade auf.</p><p><strong>3. Wie bef&#228;higst du Menschen, Verantwortung zu &#252;bernehmen, die sie nicht tragen k&#246;nnen?</strong></p><p>&#8220;Human in the Loop&#8221; klingt beruhigend. Aber was bedeutet das konkret?</p><p>Ein Mensch, der zehnmal so viel Output &#252;berpr&#252;fen muss wie vorher, pr&#252;ft nicht gr&#252;ndlicher &#8211; er pr&#252;ft oberfl&#228;chlicher. Oder er wird zum Bottleneck, der die gesamte AI-Velocity wieder zunichtemacht.</p><p>Wir verlangen von Menschen, dass sie Arbeit verantworten, f&#252;r die wir sie weder ausgebildet noch ausgestattet haben.</p><p><strong>4. Was genau wird verifiziert &#8211; und was nicht?</strong></p><p>Tests laufen durch. Linting ist sauber. Der Code funktioniert.</p><p>Aber: Ist die Architektur-Entscheidung richtig? Passt die L&#246;sung ins Gesamtsystem? Entsteht gerade technische Schuld, die erst in zwei Jahren sichtbar wird?</p><p>Agents optimieren lokal. Sie l&#246;sen die Aufgabe, die vor ihnen liegt. Die systemischen Auswirkungen sieht niemand &#8211; bis es zu sp&#228;t ist.</p><p><strong>5. Was passiert mit den Bereichen, die nicht Engineering hei&#223;en?</strong></p><p>Code-Generierung ist nur ein Teil des Delivery-Systems. Was ist mit Produktentscheidungen, die jetzt schneller technisch umsetzbar sind &#8211; aber nicht schneller durchdacht? Was ist mit Dokumentation, die niemand mehr schreibt, weil der Code sich zu schnell &#228;ndert? Mit Onboarding neuer Teammitglieder in eine Codebase, die niemand im Team mehr wirklich versteht?</p><p>Wenn Engineering pl&#246;tzlich zehnmal schneller liefern kann, verschiebt sich der Druck auf Product, Design, QA. Die Friction wandert &#8211; sie verschwindet nicht.</p><h3>Das eigentliche Problem</h3><p>Wir haben das Code-Schreiben beschleunigt. Aber die Arbeit, die sich nicht beschleunigen l&#228;sst &#8211; verstehen, bewerten, entscheiden, verantworten &#8211; ist immer noch da. Und unsere Organisationen sind nicht daf&#252;r gebaut.</p><p>Die meisten Unternehmen behandeln AI wie ein Upgrade ihrer Werkzeuge. Schnellere IDE, besserer Copilot, mehr Output pro Kopf.</p><p>Aber das Werkzeug hat sich fundamental ver&#228;ndert. Es trifft jetzt eigene Entscheidungen. Und wir haben keine Strukturen, Prozesse oder Rollenbilder, die damit umgehen k&#246;nnen.</p><p>Kleine AI-native Teams bauen gerade ihre Strukturen um diese Realit&#228;t herum. Gro&#223;e Organisationen diskutieren noch, welchen Copilot sie lizenzieren. Die Frage ist nicht, ob sich das r&#228;cht &#8211; sondern wann.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Wer kontrolliert die Agenten?]]></title><description><![CDATA[Kann man dem Output &#252;berhaupt vertrauen?]]></description><link>https://blog.fluxum.net/p/wer-kontrolliert-die-agenten</link><guid isPermaLink="false">https://blog.fluxum.net/p/wer-kontrolliert-die-agenten</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Fri, 16 Jan 2026 19:34:40 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!BM2t!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg" length="0" type="image/jpeg"/><content:encoded><![CDATA[<blockquote><p>&#8222;Ich schreibe kaum noch Code. Und trotzdem baue ich mehr Software als je zuvor.&#8220;</p></blockquote><p>Als ich das <a href="https://www.linkedin.com/posts/martingrossfluxum_ich-schreibe-kaum-noch-code-und-trotzdem-activity-7406338672528371712-JaYG/?rcm=ACoAAAQB_GMBre69owxxAqyVokpRE271ccFibqM">k&#252;rzlich auf LinkedIn</a> schrieb, kam:</p><blockquote><p>&#8222;Naja, und wer kontrolliert die Agenten? Wer r&#228;umt die technischen Schulden, die sie produzieren, wieder auf?&#8221;</p></blockquote><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!BM2t!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!BM2t!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg 424w, https://substackcdn.com/image/fetch/$s_!BM2t!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg 848w, https://substackcdn.com/image/fetch/$s_!BM2t!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg 1272w, https://substackcdn.com/image/fetch/$s_!BM2t!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!BM2t!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg" width="1024" height="1024" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:1024,&quot;width&quot;:1024,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:135690,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/jpeg&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/184803595?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!BM2t!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg 424w, https://substackcdn.com/image/fetch/$s_!BM2t!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg 848w, https://substackcdn.com/image/fetch/$s_!BM2t!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg 1272w, https://substackcdn.com/image/fetch/$s_!BM2t!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F907a5a4f-c6b1-4ebe-ba5c-607b12ae855c_1024x1024.jpeg 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p>Eine Frage, eine berechtigte Frage, mit der ich mich ebenfalls schon besch&#228;ftigt hatte.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><p>Eine Frage, die ich nicht mit einem Zweizeiler beantworten kann.</p><h2>Die Frage hinter der Frage</h2><p>Wer so fragt, will wissen: </p><p>Kannst du dem Output &#252;berhaupt vertrauen? </p><p>Oder baust du dir gerade ein Kartenhaus, das beim ersten echten Problem zusammenf&#228;llt?</p><p>Meine Antwort ist unbefriedigend f&#252;r alle, die ein klares Ja oder Nein wollen: Es kommt darauf an. Und genau dieses &#8222;es kommt darauf an&#8221; ist der eigentliche Skill, den ich in den letzten Monaten entwickelt habe.</p><h2>Nicht alles ist gleich kritisch</h2><p>Der erste Schritt war eine simple Erkenntnis: Nicht jeder Bereich meiner Software verdient dieselbe Aufmerksamkeit.</p><p>Ich unterscheide grob nach zwei Kriterien:</p><ol><li><p>Wie schnell sehe ich, wenn etwas nicht funktioniert?</p></li><li><p>Wie gro&#223; ist der potenzielle Schaden?</p></li></ol><p><strong>Kritische Bereiche</strong> sind f&#252;r mich zum Beispiel:</p><ul><li><p>Authentifizierung und Login-Flows</p></li><li><p>Autorisierungslogik &#8211; wer darf was sehen und tun</p></li><li><p>Datenbankdesign, insbesondere das Datenmodell</p></li><li><p>Row Level Security f&#252;r Datenbanken</p></li><li><p>Alles, was mit Zahlungen oder sensiblen Nutzerdaten zu tun hat</p></li><li><p>Alles, von dem viel abh&#228;ngt</p></li></ul><p>Diese Bereiche haben zwei Eigenschaften gemeinsam:</p><ul><li><p>Fehler sind nicht sofort sichtbar, und</p></li><li><p>wenn sie auftreten, ist der Schaden potenziell gro&#223;.</p></li></ul><p>Eine kaputte Authentifizierung merkst du nicht, wenn du die Anwendung durchklickst. Du merkst sie, wenn jemand anderes sie ausnutzt.</p><p><strong>Unkritische Bereiche</strong> sind f&#252;r mich:</p><ul><li><p>Frontend-Darstellung und UI-Komponenten</p></li><li><p>Styling und Layout</p></li><li><p>Nicht-sicherheitsrelevante Formularvalidierungen</p></li><li><p>Hilfsfunktionen und Utilities</p></li></ul><p>Das heisst nicht, dass sie unwichtig sind. Aber wenn hier etwas nicht funktioniert, sehe ich es schnell. Ein Button, der nicht reagiert, eine Liste, die nicht rendert &#8211; das f&#228;llt beim Testen auf. Und selbst wenn es durchrutscht: Der Schaden ist begrenzt. Kein Nutzer verliert Geld oder Daten, weil ein Schatten an der falschen Stelle sitzt.</p><h2>Wie ich Agenten einsetze</h2><p>F&#252;r meine Projekte habe ich spezialisierte Subagents aufgebaut, die auf definierte Aufgaben zugeschnitten sind. Manche habe ich selbst konfiguriert, bei anderen greife ich auf vorgefertigte L&#246;sungen zur&#252;ck. Entscheidend ist nicht das einzelne Tool, sondern wie sie zusammenarbeiten.</p><p>Mein Workflow folgt einem Muster, das menschliche Review-Prozesse nachbildet:</p><p><strong>Stufe 1: Entwurf.</strong> Ein Agent erstellt einen ersten Vorschlag &#8211; sei es Code, eine Architekturentscheidung oder ein Datenbankschema.</p><p><strong>Stufe 2: Ausarbeitung.</strong> Ein anderer Agent nimmt den Entwurf und arbeitet die Details aus. Er kennt den Kontext, aber er hat eine andere Perspektive.</p><p><strong>Stufe 3: Pr&#252;fung.</strong> Ein dritter Agent &#252;berpr&#252;ft das Ergebnis. Er fragt: Was k&#246;nnte man aus Sicherheitsperspektive verbessern? Wo sind potenzielle Schwachstellen?</p><p>Das klingt aufwendiger, als es ist. In der Praxis l&#228;uft vieles davon automatisiert. Ich sto&#223;e den Prozess an und bekomme am Ende einen Report, den ich durchgehe.</p><h2>Der entscheidende Unterschied: Wo ich selbst hinschaue</h2><p>Bei unkritischen Bereichen reicht mir, was die spezialisierten Agenten identifizieren.</p><p>Bei kritischen Bereichen ist das Agenten-Review nur die erste Runde. Die zweite Runde mache ich selbst.</p><p>Das bedeutet konkret: Ich lese den Code. Ich hinterfrage die Architekturentscheidungen. Ich &#252;berlege, welche Edge Cases nicht abgedeckt sind. Ich gleiche ab, ob das, was da steht, zu meinem mentalen Modell des Systems passt.</p><p>Das ist der Human-in-the-Loop, von dem alle reden. Nur dass er eben nicht bei jeder Zeile Code greift, sondern gezielt dort, wo es darauf ankommt.</p><h2>Vorgaben von Anfang an</h2><p>Ein Bereich, in dem sich der agentenbasierte Ansatz besonders bew&#228;hrt. Statt Anforderungen nachtr&#228;glich zu pr&#252;fen, bette ich sie von Anfang an in den Entwicklungsprozess ein.</p><p>Das funktioniert &#252;ber Guidelines &#8211; Markdown-Dateien, die beschreiben, welche Regeln gelten. Diese Guidelines flie&#223;en in die Spezifikations- und Planungsphase ein. Die Agenten kennen sie und ber&#252;cksichtigen sie.</p><p>Anschlie&#223;end lasse ich spezialisierte Agenten Reviews durchf&#252;hren und Reports erstellen. Diese Reports gehe ich durch, hinterfrage kritisch, f&#252;hre meine eigene Analyse durch und gleiche ab. Wenn Probleme auftauchen, lasse ich sie durch die Agenten beheben und sto&#223;e dann ein erneutes Review an.</p><p>Es ist ein iterativer Prozess. Aber einer, der Compliance by Design erm&#246;glicht, statt sie als nachtr&#228;glichen Kontrollschritt zu behandeln.</p><h2>Die Bilanz: &#196;hnliche Probleme, andere Dynamik</h2><p>Produzieren Agenten mehr technische Schulden als Menschen? Nach meiner Erfahrung: Nein. Es sind dieselben Probleme &#8211; nur schneller sichtbar.</p><p>Wenn eine Codebasis w&#228;chst, entsteht duplizierter Code. Nicht, weil die Agenten schlecht arbeiten, sondern weil ihnen der Gesamt&#252;berblick fehlt. Ein erfahrener Entwickler, der seit Monaten an einem Projekt arbeitet, wei&#223; implizit, dass es schon eine Utility-Funktion f&#252;r diesen Fall gibt. Ein Agent sieht nur den aktuellen Kontext.</p><p>Das ist kein Argument gegen Agenten. Es ist ein Argument f&#252;r iterative Zyklen.</p><p>Mein Vorgehen: Erst die Funktionalit&#228;t, dann das Aufr&#228;umen. Ich lasse entwickeln, schaue, dass es funktioniert, und starte dann eine neue Runde, in der ich gezielt auf Code-Qualit&#228;t achte. Daf&#252;r nutze ich einen Subagent, der sich auf Refactorings spezialisiert hat &#8211; er analysiert, identifiziert Duplikate, schl&#228;gt Zusammenf&#252;hrungen vor.</p><p>Dieses Vorgehen ist nicht neu. Es ist das, was erfahrene Entwickler schon immer gemacht haben: Erst zum Laufen bringen, dann aufr&#228;umen. Wer versucht, von Anfang an hundertprozentig sauberen Code zu schreiben, verzettelt sich und blockiert sich selbst.</p><p>Der Unterschied: Mit Agenten passiert beides schneller. Die technischen Schulden entstehen schneller &#8211; aber sie werden auch schneller sichtbar und schneller abgebaut.</p><h2>Was Agenten gut k&#246;nnen &#8211; und was nicht</h2><p>Nach Monaten intensiver Arbeit mit diesem Setup habe ich ein klareres Bild davon, wo die St&#228;rken und Grenzen liegen.</p><p><strong>Agenten schreiben exzellenten Code im Kleinen.</strong> Eine einzelne Funktion, ein Modul, eine Komponente &#8211; das bekommen sie auf dem Niveau eines erfahrenen Entwicklers hin. Saubere Struktur, gute Benennung, Best Practices.</p><p><strong>Was ihnen fehlt, ist der System&#252;berblick.</strong> Sie sehen nicht, wie die Teile zusammenh&#228;ngen. Sie wissen nicht, dass die Entscheidung in Modul A Auswirkungen auf Modul B hat, wenn das nicht explizit im Kontext steht.</p><p>Das liegt in der Natur der Sache: Eine KI kann nur aus dem verstehen, was ihr als Kontext gegeben wird. Ein erfahrener Entwickler hat das Gesamtsystem im Kopf &#8211; auch die Teile, die er nie explizit aufgeschrieben hat.</p><h2>Der Skill-Shift</h2><p>Diese Erkenntnis hat Konsequenzen f&#252;r die Art, wie ich arbeite.</p><p>Fr&#252;her konnte vieles implizit bleiben. Ich wusste, wie das System funktioniert, und musste es niemandem erkl&#228;ren. Jetzt muss ich es externalisieren &#8211; durch Spezifikationen, Guidelines, Architektur-Dokumentation. Was fr&#252;her im Kopf bleiben konnte, muss jetzt explizit werden.</p><p>Das ist mehr Arbeit. Aber es ist bessere Arbeit. Denn was ich f&#252;r die Agenten aufschreibe, hilft auch anderen Teammitgliedern. Also den Menschen<a class="footnote-anchor" data-component-name="FootnoteAnchorToDOM" id="footnote-anchor-1" href="#footnote-1" target="_self">1</a>. Es zwingt mich, meine Entscheidungen zu artikulieren, statt sie vorauszusetzen.</p><p>Der Shift, den ich beobachte, ist real:</p><p>Weniger &#8222;wie schreibe ich diesen Code&#8221;, mehr &#8222;wie lenke ich die Agenten&#8221;. Das bedeutet nicht, dass Programmierkenntnisse unwichtig werden. Es bedeutet, dass sie nicht mehr ausreichen.</p><p>Was jetzt z&#228;hlt:</p><ul><li><p><strong>Systemdesign auf h&#246;herer Ebene:</strong> Architektur, Schnittstellen, Datenmodelle</p></li><li><p><strong>Sicherheitsdenken:</strong> Wo sind die Angriffsfl&#228;chen, was muss besonders gesch&#252;tzt werden</p></li><li><p><strong>Agenten-Orchestrierung:</strong> Wie koordiniere ich verschiedene spezialisierte Agenten, wie definiere ich Richtlinien, wie behalte ich die Kontrolle</p></li><li><p><strong>Kritisches Pr&#252;fen:</strong> Wann vertraue ich dem Output, wann schaue ich selbst hin</p></li></ul><h2>Die Antwort auf die urspr&#252;ngliche Frage</h2><p>Wer kontrolliert die Agenten? Ich. Aber nicht bei jeder Zeile Code.</p><p>Ich kontrolliere durch Struktur: spezialisierte Agenten, die sich gegenseitig pr&#252;fen. Ich kontrolliere durch Fokus: menschliche Reviews dort, wo der Schaden am gr&#246;&#223;ten w&#228;re. Ich kontrolliere durch Iteration: Entwickeln, pr&#252;fen, aufr&#228;umen, wiederholen.</p><p>Und ich kontrolliere durch Akzeptanz: Die Einsicht, dass kein Prozess perfekt ist &#8211; weder mit Agenten noch ohne. Dass technische Schulden entstehen und abgebaut werden m&#252;ssen. Dass Fehler passieren und gefunden werden m&#252;ssen.</p><p>Der Unterschied ist nicht, dass Agenten fehlerfreien Code produzieren. Der Unterschied ist, dass ich mehr produziere und schneller iteriere. Und dass ich meine Zeit dort einsetze, wo sie den gr&#246;&#223;ten Unterschied macht: bei den Entscheidungen, die ein System sicher oder unsicher, wartbar oder unwartbar machen.</p><p>Das ist keine Zukunftsvision. Das ist mein Alltag seit Monaten. Und bisher funktioniert es.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><div class="footnote" data-component-name="FootnoteToDOM"><a id="footnote-1" href="#footnote-anchor-1" class="footnote-number" contenteditable="false" target="_self">1</a><div class="footnote-content"><p>Ich finde es schwierig, wenn manche Leute KI-Agenten als Teammitglieder bezeichnen, also vermenschlichen. Eine KI ist und bleibt eine intelligente Maschine und ist kein Menschenersatz. </p></div></div>]]></content:encoded></item><item><title><![CDATA[Warum in der agentenbasierten Softwareentwicklung Workflows für mich immer wichtiger werden]]></title><description><![CDATA[Als Softwareentwickler schreiben wir immer weniger Code selbst.]]></description><link>https://blog.fluxum.net/p/warum-in-der-agentenbasierten-softwareentwicklun</link><guid isPermaLink="false">https://blog.fluxum.net/p/warum-in-der-agentenbasierten-softwareentwicklun</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Fri, 09 Jan 2026 12:33:30 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>Als Softwareentwickler schreiben wir immer weniger Code selbst. Die Aufgabe verschiebt sich mehr in die Richtung, KI-Agenten in den jeweils passend gestalteten Workflows arbeiten zu lassen, damit sie so zuverl&#228;ssige Ergebnisse liefern. </p><p>Deshalb ist es so spannend sich gegenseitig auszutauschen und zu h&#246;ren, wie andere konzeptionell an die KI-gest&#252;tzte Softwareentwicklung herangehen. </p><p>Denn letztendlich war es schon immer der richtige L&#246;sungsansatz, der den eigentlichen Mehrwert liefert. Wenn man wei&#223;, wie man ein Problem l&#246;sen kann, ist die anschlie&#223;ende Umsetzung fast trivial.</p><p>Zudem wird immer deutlicher, dass testgetriebene Entwicklung wichtiger denn je ist:</p><p>1. Tests dienen als Leitplanken, die eine Beschreibung des Ziels liefern.</p><p>2. Tests dienen als Feedback-Schleife. Agenten k&#246;nnen sie eigenst&#228;ndig ausf&#252;hren und erhalten dadurch Feedback, wie gut sie ihre Aufgaben erf&#252;llt haben.</p><p>&#8594; Agenten k&#246;nnen autonom und iterativ weiterarbeiten, bis das Ergebnis die Erfolgskriterien erf&#252;llt.</p><p>3. Und wie sonst will man bei jeder Iteration die Korrektheit von so viel Code pr&#252;fen?</p>]]></content:encoded></item><item><title><![CDATA[Where humans matter: Agentic Coding in Practice]]></title><description><![CDATA[What I Learned from AI-Assisted Software Development and How I Approach It Today]]></description><link>https://blog.fluxum.net/p/where-humans-matter-agentic-coding</link><guid isPermaLink="false">https://blog.fluxum.net/p/where-humans-matter-agentic-coding</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Tue, 09 Dec 2025 18:06:15 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<h1>Agentic Coding: What I&#8217;ve learned and how I approach it today</h1><p>The discussion about agentic coding fluctuates between two extremes: &#8220;AI will solve everything&#8221; on the one hand, &#8220;It&#8217;s all just hype&#8221; on the other.</p><p>Both positions fall short. After months of intensive work with coding agents, I would like to share with you what I have learned in the process &#8211; and how my way of working has changed.</p><h2>The current state of affairs: 7 theses</h2><p>Before I get to my own specific experiences, here are 7 core theses written by Simon Wardley, which I have supplemented with my own perspective:</p><p><strong>Development is not yet engineering.</strong> While testing has become a systematic discipline through practices such as TDD, development remains largely intuition-driven. There are patterns, but no consistent system. Agentic coding could be a catalyst for this transformation, if we approach it correctly.</p><p><strong>Small, contextual tools beat monoliths with LLM on top.</strong> The prevailing approach of simply enriching existing systems with LLM capabilities does not exploit the potential. More effective are combinable tools with clear inputs, outputs, and specific application contexts.</p><p><strong>LLMs are coherence machines, not truth machines.</strong> They optimize for plausibility, not correctness. This makes them valuable for drafting and exploration, but unreliable for final decisions without human validation.</p><p><strong>Code is more than functionality &#8211; structure is the real decision.</strong> Architectural decisions manifest themselves in code. LLMs can generate functionality, but structural decisions require an understanding of the system.</p><p><strong>The key question: Where do humans stand in the decision-making process?</strong> It&#8217;s not about whether AI is used, but where human judgment remains indispensable. This boundary must be drawn consciously.</p><p><strong>Practices are still evolving.</strong> What is considered state of the art today may be obsolete tomorrow. Beware of hasty best practices.</p><p><strong>Experimentation is fine, but with an awareness of the terrain.</strong> Speed without direction is just getting lost quickly.</p><h2>My approach today</h2><p>These theories align well with my experiences. However, theory is one thing and daily practice is another. Here&#8217;s what works for me.</p><h3>A deliberately modular setup</h3><p>I don&#8217;t like working with fully integrated solutions. Not on principle, but because they don&#8217;t work optimally for my workflow.</p><p>My setup consists of three components:</p><ol><li><p>An IDE, such as IntelliJ IDEA, which allows me to keep track of the code. I can quickly check where everything is located. Git integration is extremely important here &#8212; it makes changes traceable and reversible. IntelliJ can do almost everything I need, including inspecting databases. Unfortunately, with power comes complexity. For smaller projects, I prefer the ZED editor because it&#8217;s more streamlined and intuitive.</p></li><li><p>I use the terminal (preferably Ghostty) with my coding agent, which is currently mainly Claude Code. There, I give instructions, observe, and control.</p></li><li><p>I use an LLM chat window for conceptual work. At the beginning of a project, I use it to work through ideas and organize them in a document before writing code.</p></li></ol><p>This three-way split is no coincidence. It corresponds to the principle of specialized tools: each component has its strengths, none tries to be everything.</p><p>I use other specialized tools here and there, such as the GitHub Desktop app. But at its core, these three tools are the ones I use.</p><h3>Sub-agents as the key</h3><p>Perhaps the most important lesson learned in recent months is that specialized sub-agents deliver significantly better results than general-purpose agents. The reason is simple&#8212;the tailored context makes all the difference.</p><p>Two examples from my experience:</p><p><strong>Quality assurance:</strong> A sub-agent exclusively responsible for quality assurance checks against specified guidelines and documentation. It does not advise; it validates. This is essentially TDD thinking at the agent level &#8212; explicit standards instead of intuition.</p><p><strong>UI design:</strong> I achieve significantly better results when designing user interfaces with a specialized design sub-agent. I specify the direction the design should take and which design principles apply. The agent generates designs within these guidelines instead of working in a vacuum.</p><p>In both cases, the lever is the specialized context and the focused system prompt of the sub-agent, not the general intelligence of the model.</p><h3>Validating coherence</h3><p>Yes, LLM output has misled me before. In fact, it was precisely because it sounded plausible. The coherence was there, but the truth was not.</p><p>My validation process is two-stage. First, I verify what I can myself. For everything else, I use specialized sub-agents with internet access that can verify facts. However, it&#8217;s crucial to note that ultimately, humans remain responsible. The sub-agents are tools, not decision-makers.</p><p>Hallucinations don&#8217;t like to stay alone. Where one thing is wrong, other things are often invalid.</p><h3>Keeping an eye on structure</h3><p>When does generated code become problematic? Most obviously, when source code files become too large. There are too many lines. Too much functionality in individual functions.</p><p>My approach: I let almost everything be generated. If I want to make changes, I let the agent adapt and then check it. Experience shows that this is faster than writing it myself, unless the changes are minor restructuring or corrections. In that case, I intervene directly.</p><p>However, I am responsible for the structure. I decide when a file becomes too large, when functionality needs to be split up, and what the architecture and refactorings should look like. I usually define the architecture before coding begins and document it in Markdown files.</p><h3>The real problem is communication</h3><p>Ultimately, humans must decide if what has been generated is good enough. Human judgment is indispensable because only humans can determine if they have received what they wanted.</p><p>Here lies an uncomfortable truth: Even with AI, the problem is often communication. The question is not &#8220;Can AI do that?&#8221; but &#8220;Can I articulate what I want?&#8221; This is not a new insight&#8212;anyone who has ever written requirements knows this. But with Agentic Coding, it becomes immediately apparent.</p><h3>Not balance, but a pendulum</h3><p>Is there a perfect balance between trying things out quickly and understanding what I&#8217;m doing? I don&#8217;t think so. It&#8217;s more like swinging back and forth.</p><p>I try out ideas to see if they lead to reasonable results. At the latest, I need to understand what I&#8217;m doing when I&#8217;m convinced of the direction and want to check its viability for the future.</p><p>That&#8217;s more honest than any best practice. Practices are still evolving. Anyone who claims to have found the optimal workflow today will be working differently in six months.</p><h2>The open question</h2><p>The core architectural question of our time remains: Where do we place people in the decision-making process?</p><p>This is not a technical question. It is a question of organization, responsibility, and design. Every organization must answer it for itself&#8212;consciously, rather than implicitly through tool adoption.</p><p>As of today, my answer is: People decide on the structure, validate the results, and take responsibility. Agents generate, specialize, and accelerate. The boundary is not fixed; it shifts with every learning experience.</p><p>That is precisely what makes this such an interesting time.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption"></p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Wo der Mensch bleibt: Agentic Coding in der Praxis]]></title><description><![CDATA[Was ich bei der KI-unterst&#252;tzten Softwareentwicklung gelernt habe und wie ich es heute angehe]]></description><link>https://blog.fluxum.net/p/wo-der-mensch-bleibt-agentic-coding</link><guid isPermaLink="false">https://blog.fluxum.net/p/wo-der-mensch-bleibt-agentic-coding</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Tue, 09 Dec 2025 16:54:44 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<h1>Agentic Coding: Was ich gelernt habe und wie ich es heute angehe</h1><p>Die Diskussion um Agentic Coding schwankt zwischen zwei Extremen: &#8220;AI wird alles l&#246;sen&#8221; auf der einen Seite, &#8220;Alles nur Hype&#8221; auf der anderen.</p><p>Beide Positionen greifen zu kurz. Nach Monaten intensiver Arbeit mit Coding-Agents m&#246;chte ich mit euch teilen, was ich dabei gelernt habe &#8211; und wie sich meine Arbeitsweise ver&#228;ndert hat.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><h2>Der aktuelle Stand: 7 Thesen</h2><p>Bevor ich zu meinen konkreten, eigenen Erfahrungen komme, hier 7 Kernthesen, zu denen Simon Wardley geschrieben hat und die ich durch meine Perspektive erg&#228;nzt habe:</p><p><strong>Entwicklung ist noch kein Engineering.</strong> W&#228;hrend Testing durch Praktiken wie TDD zu einer systematischen Disziplin geworden ist, bleibt die Entwicklung zum gr&#246;&#223;ten Teil intuitions-getrieben. Es gibt Patterns, aber keine durchg&#228;ngige Systematik. Agentic Coding k&#246;nnte ein Katalysator f&#252;r diese Transformation sein &#8211; wenn wir es richtig angehen.</p><p><strong>Kleine, kontextuelle Tools schlagen Monolithen mit aufgesetztem LLM.</strong> Der vorherrschende Ansatz, bestehende Systeme einfach mit LLM-F&#228;higkeiten anzureichern, nutzt das Potenzial nicht aus. Effektiver sind kombinierbare Tools mit klaren Inputs, Outputs und spezifischem Anwendungskontext.</p><p><strong>LLMs sind Koh&#228;renz-Maschinen, keine Wahrheits-Maschinen.</strong> Sie optimieren auf Plausibilit&#228;t, nicht auf Korrektheit. Das macht sie wertvoll f&#252;r Entw&#252;rfe und Exploration, aber unzuverl&#228;ssig f&#252;r finale Entscheidungen ohne menschliche Validierung.</p><p><strong>Code ist mehr als Funktionalit&#228;t &#8211; Struktur ist die eigentliche Entscheidung.</strong> Architektonische Entscheidungen manifestieren sich im Code. LLMs k&#246;nnen Funktionalit&#228;t generieren, aber strukturelle Entscheidungen erfordern Systemverst&#228;ndnis.</p><p><strong>Die Kernfrage: Wo stehen Menschen im Entscheidungsprozess?</strong> Es geht nicht darum, ob AI eingesetzt wird, sondern wo menschliches Urteil unverzichtbar bleibt. Diese Grenzziehung muss bewusst getroffen werden.</p><p><strong>Die Praktiken sind noch im Entstehen.</strong> Was heute als State of the Art gilt, kann morgen &#252;berholt sein. Vorsicht vor vorschnellen Best Practices.</p><p><strong>Experimentieren ja, aber mit Bewusstsein f&#252;r das Terrain.</strong> Geschwindigkeit ohne Richtung ist nur schnelles Verirren.</p><h2>Wie ich es heute angehe</h2><p>Diese Thesen decken sich gut mit meinen Erfahrungen. Aber Theorie ist das eine, die t&#228;gliche Praxis das andere. Hier ist, was bei mir funktioniert.</p><h3>Ein bewusst modulares Setup</h3><p>Ich arbeite ungern mit komplett integrierten L&#246;sungen. Nicht aus Prinzip, sondern weil sie nicht optimal f&#252;r meinen Workflow funktionieren.</p><p>Mein Setup besteht aus drei Komponenten:</p><ol><li><p>Eine IDE wie IntelliJ IDEA, weil ich hier den &#220;berblick &#252;ber den Code behalten kann. Schnell pr&#252;fen, wo was untergebracht ist. Die Git-Integration ist dabei eminent wichtig &#8211; sie macht &#196;nderungen nachvollziehbar und reversibel. IntelliJ kann nahezu alles (inkl. Datenbanken inspizieren), was ich brauche. Leider kommt mit M&#228;chtigkeit eine gewisse Un&#252;bersichtlichkeit. F&#252;r kleinere Projekte nutze ich gerne den ZED-Editor, der schlanker und &#252;bersichtlicher ist.</p></li><li><p>Das Terminal (am liebsten Ghostty) mit meinem Coding-Agent, aktuell haupts&#228;chlich Claude Code. Hier gebe ich Anweisungen, beobachte und steuere.</p></li><li><p>Ein LLM-Chat-Fenster f&#252;r die konzeptionelle Arbeit. Gerade am Anfang eines Projekts nutze ich es, um Ideen durchzuarbeiten und in ein Dokument zu bringen, bevor Code entsteht.</p></li></ol><p>Diese Dreiteilung ist kein Zufall. Sie entspricht dem Prinzip der spezialisierten Tools: Jede Komponente hat ihre St&#228;rke, keine versucht alles zu sein.</p><p>Hier und da nutze ich noch andere spezialisierte Tools, wie die GitHub Desktop App. Aber im Kern sind es diese drei, die ich benutze.</p><h3>Sub-Agents als Schl&#252;ssel</h3><p>Das vielleicht wichtigste Learning der letzten Monate: Spezialisierte Sub-Agents liefern deutlich bessere Ergebnisse als ein General-Purpose-Agent f&#252;r alle Aufgaben. Der Grund ist simpel &#8211; der zugeschnittene Kontext macht den Unterschied.</p><p>Zwei Beispiele aus meiner Praxis:</p><p><strong>Qualit&#228;tssicherung:</strong> Ein Sub-Agent, der ausschlie&#223;lich f&#252;r QA zust&#228;ndig ist, pr&#252;ft gegen vorgegebene Richtlinien und Dokumentationen. Er r&#228;t nicht, er validiert. Das ist im Grunde TDD-Denken auf Agent-Ebene &#8211; explizite Standards statt Intuition.</p><p><strong>UI-Design:</strong> Bei der Gestaltung von Benutzeroberfl&#228;chen erziele ich mit einem spezialisierten Design-Sub-Agent wesentlich bessere Ergebnisse. Ich kann Vorgaben machen, in welche Richtung das Design gehen soll, welche Designprinzipien gelten. Der Agent generiert innerhalb dieser Leitplanken, statt im luftleeren Raum zu arbeiten.</p><p>In beiden F&#228;llen ist der spezialisierte Kontext und der fokussierte Systemprompt des Sub-Agents der Hebel, nicht die allgemeine Intelligenz des Modells.</p><h3>Koh&#228;renz validieren</h3><p>Ja, LLM-Output hat mich schon in die Irre gef&#252;hrt. Tats&#228;chlich gerade weil er plausibel klang. Die Koh&#228;renz war da, die Wahrheit nicht.</p><p>Meine Validierung l&#228;uft zweistufig: Ich pr&#252;fe erst einmal selbst, was ich pr&#252;fen kann. F&#252;r alles andere nutze ich spezialisierte Sub-Agents mit Internetzugriff, die Fakten verifizieren k&#246;nnen. Aber &#8211; und das ist entscheidend &#8211; schlussendlich bleibt der Mensch verantwortlich. Die Sub-Agents sind Hilfsmittel, keine Entscheider.</p><p>Und Halluzinationen bleiben nicht gerne allein. Da, wo eine Sache nicht stimmt, sind oft andere Dinge nicht valide.</p><h3>Struktur im Blick behalten</h3><p>Wann wird generierter Code zum Problem? Am offensichtlichsten, wenn Source-Code-Files einfach zu gro&#223; werden. Zu viele Zeilen. Zu viel Funktionalit&#228;t in einzelnen Funktionen.</p><p>Mein Ansatz: Ich lasse fast alles generieren. Wenn ich &#196;nderungen will, lasse ich die Agent anpassen und &#252;berpr&#252;fe anschlie&#223;end. Die Erfahrung zeigt, dass das schneller geht als selbst zu schreiben &#8211; es sei denn, es sind kleinere Umstrukturierungen oder Korrekturen. Da greife ich direkt ein.</p><p>Die Struktur aber bleibt meine Verantwortung. Ich entscheide, wann ein File zu gro&#223; wird, wann Funktionalit&#228;t aufgeteilt werden muss, wie Refactorings aussehen sollen und die Architektur sein soll. Gerade die Architektur lege ich meist fest, bevor das Codieren beginnt, und dokumentiere sie in Markdown-Dateien.</p><h3>Das eigentliche Problem ist Kommunikation</h3><p>Schlussendlich muss der Mensch die Entscheidung treffen, ob das Generierte gut genug ist. Das menschliche Urteil bleibt unverzichtbar, weil nur der Mensch beurteilen kann, ob er bekommen hat, was er wollte.</p><p>Und hier liegt eine unbequeme Wahrheit: Auch mit KI ist das Problem h&#228;ufig die Kommunikation. Nicht &#8220;kann die KI das?&#8221;, sondern &#8220;kann ich artikulieren, was ich will?&#8221;. Das ist keine neue Erkenntnis &#8211; jeder, der je Requirements geschrieben hat, kennt das. Aber mit Agentic Coding wird es unmittelbar sp&#252;rbar.</p><h3>Keine Balance, sondern ein Pendel</h3><p>Gibt es eine perfekte Balance zwischen schnell ausprobieren und verstehen, was ich tue? Ich glaube nicht. Es ist eher ein Hin- und Herschwingen.</p><p>Manche Ideen probiere ich einfach aus, um zu sehen, ob sie zu einem vern&#252;nftigen Ergebnis f&#252;hren. Verstehen, was ich tue, muss ich sp&#228;testens dann, wenn ich von der Richtung &#252;berzeugt bin &#8211; und pr&#252;fen will, ob sie tragf&#228;hig f&#252;r die Zukunft ist.</p><p>Das ist ehrlicher als jede Best Practice. Die Praktiken entwickeln sich noch. Wer heute behauptet, den optimalen Workflow gefunden zu haben, wird in sechs Monaten anders arbeiten.</p><h2>Die offene Frage</h2><p>Die architektonische Kernfrage unserer Zeit bleibt: Wo platzieren wir Menschen im Entscheidungsprozess?</p><p>Das ist keine technische Frage. Es ist eine Frage der Organisation, der Verantwortung, des Designs. Jede Organisation muss sie f&#252;r sich beantworten &#8211; bewusst, nicht durch Tool-Adoption implizit.</p><p>Meine Antwort, Stand heute: Der Mensch entscheidet &#252;ber Struktur, validiert Ergebnisse, tr&#228;gt Verantwortung. Die Agents generieren, spezialisieren, beschleunigen. Die Grenze ist nicht fix, sie verschiebt sich mit jedem Learning.</p><p>Und genau das macht diese Zeit so interessant.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Figure 03: Faszinierend, beeindruckend – und irgendwie unheimlich]]></title><description><![CDATA[Der erste humanoide Roboter, der in unseren privatesten R&#228;umen operiert &#8211; und wir haben keine Instinkte daf&#252;r, wie wir damit umgehen sollen.]]></description><link>https://blog.fluxum.net/p/figure-03-faszinierend-beeindruckend</link><guid isPermaLink="false">https://blog.fluxum.net/p/figure-03-faszinierend-beeindruckend</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 09 Oct 2025 22:40:17 GMT</pubDate><enclosure url="https://api.substack.com/feed/podcast/175740098/14422acddcce2990db475f1f7050cb7d.mp3" length="0" type="audio/mpeg"/><content:encoded><![CDATA[<p>Figure 03 bewegt sich durch eine Wohnung. Langsam, bed&#228;chtig, mit einer Entschlossenheit, die keinen Raum f&#252;r Zweifel l&#228;sst. Kein Z&#246;gern, kein Stolpern &#8211; nur diese gleichm&#228;&#223;ige, unaufhaltsame Vorw&#228;rtsbewegung, als h&#228;tte der Roboter alle Zeit der Welt und w&#252;sste genau, wohin er will. </p><p>Dann dreht er sich zur Kamera. </p><p>Kein Augenkontakt &#8211; nur ein schwarzes Antlitz mit ein paar blinkenden Lichtern. Keine Mimik, kein L&#228;cheln, keine Unsicherheit. Nur Absicht.</p><p>Ich denke an C-3PO. An seine zappeligen, fast schusseligen Bewegungen, die ihn harmlos machten. An R2-D2, der piepste und gegen W&#228;nde fuhr. Figure 03 macht nichts davon. Er ist kompetent. Pr&#228;zise. Und genau das, gerade das, f&#252;hlt sich falsch an.</p><p>Faszinierend. Beeindruckend. Und trotzdem irgendwie ... unheimlich. Vielleicht habe ich zu viele dystopische Filme gesehen. Oder mein Instinkt sagt mir etwas, das ich ernst nehmen sollte.</p><p>Denn Figure 03 ist nicht der erste humanoide Roboter. Aber er ist der erste, der explizit daf&#252;r gebaut wurde, in meinem Zuhause herumzulaufen. Und das macht einen Unterschied.</p><h2>Der Unterschied: Verletzlichkeit</h2><p>Warum f&#252;hlt sich Figure 03 anders an als all die anderen smarten Ger&#228;te, mit denen wir l&#228;ngst leben?</p><p>Alexa und Siri h&#246;ren zu. Sie sammeln Daten, analysieren unsere Gewohnheiten, kennen unsere Stimmen. Aber sie stehen in einer Ecke. Wir wissen, wo sie sind. Wir haben gelernt, damit zu leben &#8212; oder es zu verdr&#228;ngen.</p><p>Staubsauger-Roboter bewegen sich durch unsere Wohnungen, tauchen unter Sofas, kartografieren unsere R&#228;ume. Aber sie sind offensichtlich dumm. Sie sind simpel und vorhersehbar. Wenn sie gegen die Wand fahren, lachen wir. Keine Bedrohung, weil sie so eindeutig Maschine sind.</p><p>Figure 03 ist anders. Er ist autonom und entscheidet selbst, wohin er geht. Er kann eigenst&#228;ndig handeln: T&#252;ren &#246;ffnen, Dinge greifen, die Umgebung aktiv ver&#228;ndern. Und er ist allgegenw&#228;rtig. Er ist nicht nur f&#252;r das Wohnzimmer gedacht, sondern f&#252;r alle R&#228;ume: K&#252;che, Schlafzimmer, Bad. Dort, wo wir am verletzlichsten sind.</p><p>Das Problem ist nicht die Technologie. Das Problem ist, dass Figure 03 in R&#228;umen agiert, in denen wir am verletzlichsten sind: w&#228;hrend wir schlafen, streiten, weinen, nackt durchs Bad laufen. </p><p>Wir haben keine evolution&#228;ren Instinkte daf&#252;r, wie man mit einem autonomen, beobachtenden, handlungsf&#228;higen Ding im eigenen Schlafzimmer umgeht.</p><p>Wir haben gelernt, damit zu leben, dass Google mehr &#252;ber uns wei&#223; als unsere Mutter. Dass Social-Media-Plattformen unsere Stimmungen erkennen, bevor wir sie selbst bemerken. Aber das passiert irgendwo da drau&#223;en, in der Cloud, abstrakt. </p><p>Figure 03 ist nicht abstrakt. Er steht neben deinem Bett. Mit seinem schwarzen Antlitz. Keine Seele dahinter. Und er geht langsam, sehr langsam, zur T&#252;r.</p><h2>Das eigentlich Beunruhigende</h2><p>Aber hier kommt das eigentlich Beunruhigende: In f&#252;nf, vielleicht zehn Jahren wird das alles normal sein. Figure 03, oder sein Nachfolger, wird so selbstverst&#228;ndlich sein wie heute ein Smartphone. Und genau das sollte uns mehr zu denken geben als die Technologie selbst.</p><p>Die Entwicklung beschleunigt sich rasant. Figure 01, 02, 03 &#8211; innerhalb k&#252;rzester Zeit. Parallel dazu die Spr&#252;nge bei Large Language Models: GPT-3, GPT-4 und -5, Claude, Gemini. </p><p>Wir haben uns so an exponentiellen Fortschritt gew&#246;hnt, dass wir bereits entt&#228;uscht sind, wenn die n&#228;chste Verbesserung ein paar Monate l&#228;nger braucht oder nicht sofort offensichtlich ist. Die Science Fiction von vor zehn Jahren ist heute Produktank&#252;ndigung. Und wir zucken kaum noch.</p><p>Vor 20 Jahren h&#228;tten wir es f&#252;r absurd gehalten, dass Konzerne unsere Bewegungsprofile haben. Dass sie vorhersagen k&#246;nnen, wann wir schwanger sind, depressiv werden oder den Job wechseln. </p><p>Heute? Achselzucken: &#8220;Was soll man machen?&#8221;</p><p>Gew&#246;hnung ist jedoch kein neutraler Prozess. Wenn wir uns an Technologie gew&#246;hnen, verlieren wir die F&#228;higkeit, die grundlegende Frage zu stellen: <br>&#8222;Will ich das wirklich?&#8221; </p><p>Stattdessen wird die Frage lauten: &#8222;Warum hast du noch keinen?&#8221; </p><p>In zehn Jahren wird jemand, der Figure 03 ablehnt, vielleicht klingen wie jemand, der heute &#8222;kein Internet&#8221; will &#8211; weltfremd, r&#252;ckst&#228;ndig, irrational.</p><p>Es geht nicht nur um Technologie. Es geht um die Frage: </p><ul><li><p>Wohin wollen wir als Menschen? </p></li><li><p>Welche Art von Zuhause wollen wir haben? </p></li><li><p>Welche Art von Beziehungen &#8211; zu uns selbst, zu anderen Menschen, zu den Dingen, die uns umgeben? </p></li></ul><p>Diese Fragen werden nicht durch Produktank&#252;ndigungen beantwortet, sondern durch unsere Entscheidungen. Aber nur, wenn wir sie noch stellen, bevor sie irrelevant werden.</p><p>Der Hersteller wei&#223; das. Figure 03 hat waschbare Kleidung, sanfte Materialien, wireless charging. Die Design-Entscheidungen sind nicht zuf&#228;llig. Sie wollen, dass wir ihn als Mitbewohner und nicht als Maschine sehen. Und die Chancen daf&#252;r stehen gut, denn der Nutzen ist gro&#223;.</p><h2>Die Frage bleibt</h2><p>W&#252;rde ich Figure 03 in mein Zuhause lassen? </p><p>Ehrlich gesagt, wei&#223; ich es nicht. </p><p>Die Technologie ist beeindruckend. Die M&#246;glichkeiten sind verlockend. Vielleicht ist mein Unbehagen aber auch nur eine irrationale Reaktion auf zu viele dystopische Filme.</p><p>Aber vielleicht ist es auch das Letzte, was uns noch sagt: <br>&#8222;Halt. Warte. Denk nochmal nach.&#8221; </p><p>Bevor wir es normalisieren. Bevor die Frage nicht mehr lautet, ob wir es wollen, sondern warum wir es nicht haben.</p><p>Frag mich in f&#252;nf Jahren nochmal &#8211; vielleicht finde ich die Frage dann absurd. Vielleicht habe ich mich dann daran gew&#246;hnt, in dieses schwarze Antlitz zu schauen. </p><p>Oder es ist l&#228;ngst ein Gesicht. Und das w&#228;re vielleicht noch unheimlicher.</p><p></p><div><hr></div><p>Quelle des Videos: Introducing Figure 03 <a href="https://www.figure.ai/news/introducing-figure-03">https://www.figure.ai/news/introducing-figure-03</a></p>]]></content:encoded></item><item><title><![CDATA[Wieviel Arbeitszeit verbringen Softwareentwickler mit dem eigentlichen Schreiben von Code?]]></title><description><![CDATA[Es ist ein &#252;berraschend geringer Anteil]]></description><link>https://blog.fluxum.net/p/wieviel-arbeitszeit-verbringen-softwareentwickle</link><guid isPermaLink="false">https://blog.fluxum.net/p/wieviel-arbeitszeit-verbringen-softwareentwickle</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Fri, 16 May 2025 12:57:58 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!nwu_!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>Softwareentwickler verbringen einen &#252;berraschend geringen Anteil ihrer Arbeitszeit mit dem eigentlichen Schreiben von Code. Aktuelle Studien und Analysen zeigen, dass dieser Anteil je nach Quelle und Definition zwischen 10&#8239;% und 30&#8239;% liegt.</p><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!nwu_!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!nwu_!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png 424w, https://substackcdn.com/image/fetch/$s_!nwu_!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png 848w, https://substackcdn.com/image/fetch/$s_!nwu_!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png 1272w, https://substackcdn.com/image/fetch/$s_!nwu_!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!nwu_!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png" width="1024" height="455" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:455,&quot;width&quot;:1024,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:523670,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/163705922?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!nwu_!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png 424w, https://substackcdn.com/image/fetch/$s_!nwu_!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png 848w, https://substackcdn.com/image/fetch/$s_!nwu_!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png 1272w, https://substackcdn.com/image/fetch/$s_!nwu_!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F98c042fe-0673-4b27-9936-b5faba097f3c_1024x455.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p></p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div><h3><strong>Verteilung der Arbeitszeit</strong></h3><ul><li><p><strong>Aktives Codieren:</strong> Laut einer Analyse von Software.com verbringen Entwickler im Durchschnitt nur etwa 52 Minuten pro Tag mit aktivem Codieren, was etwa 10&#8239;% ihrer Arbeitszeit entspricht .</p></li><li><p><strong>Anwendungsentwicklung:</strong> Eine IDC-Studie aus dem Jahr 2024 ergab, dass Entwickler etwa 16&#8239;% ihrer Zeit mit der Entwicklung von Anwendungen verbringen. Der Gro&#223;teil ihrer Zeit flie&#223;t in operative und unterst&#252;tzende Aufgaben wie CI/CD-Prozesse, Sicherheitsma&#223;nahmen und Performance-Monitoring .</p></li><li><p><strong>Meetings:</strong> Eine Studie von Clockwise zeigt, dass Entwickler durchschnittlich ein Drittel ihrer Arbeitszeit in Meetings verbringen. Zus&#228;tzlich fallen etwa 6,3 Stunden pro Woche auf fragmentierte Zeit, in der keine konzentrierte Arbeit m&#246;glich ist .</p></li><li><p><strong>Code-Wartung:</strong> Laut einer Umfrage von Tidelift verbringen Entwickler durchschnittlich 30&#8239;% ihrer Zeit mit der Wartung von Code, einschlie&#223;lich der Pflege von Open-Source-Komponenten .</p></li></ul><h3><strong>Weitere T&#228;tigkeiten</strong></h3><p>Neben dem Codieren sind Entwickler mit einer Vielzahl anderer Aufgaben besch&#228;ftigt, darunter:</p><ul><li><p><strong>Debugging:</strong> Embedded-Entwickler verbringen etwa 40&#8239;% ihrer Zeit mit dem Debuggen von Code .</p></li><li><p><strong>Kommunikation:</strong> Studien zeigen, dass Entwickler mehr als 50&#8239;% ihrer Zeit mit Kommunikation verbringen, w&#228;hrend das eigentliche Programmieren nur etwa 10&#8239;% bis 15&#8239;% ihrer Zeit ausmacht .</p></li><li><p><strong>Anwendungsprobleme:</strong> Eine Studie von Cisco ergab, dass Entwickler &#252;ber die H&#228;lfte ihrer Arbeitszeit (57&#8239;%) mit der Behebung von Performance-Problemen in bestehenden Anwendungen verbringen .</p></li></ul><h3><strong>Fazit</strong></h3><p>Die Vorstellung, dass Entwickler den Gro&#223;teil ihrer Zeit mit dem Schreiben von Code verbringen, entspricht nicht der Realit&#228;t. Vielmehr sind sie in zahlreiche andere Aufgaben eingebunden, die f&#252;r den Entwicklungsprozess ebenso entscheidend sind. Dies unterstreicht die Bedeutung eines ganzheitlichen Verst&#228;ndnisses von Entwicklerproduktivit&#228;t, das &#252;ber das reine Codieren hinausgeht.</p><p></p><div><hr></div><h4>Quellen:</h4><ul><li><p>https://www.software.com/reports/code-time-report</p></li><li><p>https://www.infoworld.com/article/3831759/developers-spend-most-of-their-time-not-coding-idc-report.html</p></li><li><p>https://www.heise.de/news/Softwareentwickler-verbringen-ein-Drittel-ihrer-Arbeitszeit-in-Meetings-7236712.html</p></li><li><p>https://www.sonarsource.com/blog/developers-spend-30-of-their-time-on-code-maintenance-our-latest-survey-results-part-3/</p></li><li><p>https://en.wikipedia.org/wiki/Software_Peter_principle</p></li><li><p>https://ap-verlag.de/entwickler-verbraten-ueber-die-haelfte-ihrer-arbeitszeit-fuer-das-beheben-von-anwendungsproblemen/88394/</p></li></ul><p></p><p></p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Bottlenecks erkennen statt "Retro-Müdigkeit"]]></title><description><![CDATA[&#8222;Unsere Retros bringen nichts mehr."]]></description><link>https://blog.fluxum.net/p/bottlenecks-erkennen-statt-retro</link><guid isPermaLink="false">https://blog.fluxum.net/p/bottlenecks-erkennen-statt-retro</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Wed, 14 May 2025 16:39:17 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!8Z0A!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>&#8222;Unsere Retros bringen nichts mehr."<br><br>Das h&#246;re ich immer wieder.<br><br>Das Problem? <br>&#8594; Zu viele Aktionspunkte, <br>&#8594; zu wenig Fokus <br>&#8594; und das Team verliert die Motivation, weil sich nichts &#228;ndert.<br><br>Ein klassisches Symptom einer "Retro-M&#252;digkeit".<br><br>Die L&#246;sung ist &#252;berraschend einfach:<br>Ein einst&#252;ndiger Value Stream Mapping Workshop.<br><br>&#8222;Ist das nicht eher etwas f&#252;r die produzierende Industrie?&#8220;<br>Nein. Es ist etwas f&#252;r Teams, die Ergebnisse liefern wollen &#8211; schneller, klarer, wirkungsvoller.<br><br>Im Workshop wird sichtbar:<br><br>&#9642;&#65039; Wie Entscheidungen blockiert werden, weil keiner das gro&#223;e Ganze sieht.<br>&#9642;&#65039; Wo Designs h&#228;ngen bleiben, weil Feedback-Schleifen zu sp&#228;t kommen.<br>&#9642;&#65039; Warum Features langsam geliefert werden, obwohl das Team eigentlich gut arbeitet.<br>&#9642;&#65039; Welche DevOps-Prinzipien gewollt &#8211; aber nicht gelebt werden.<br><br><br>Das Ergebnis?<br>&#8627; Statt 15 halbherzigen Aktionspunkten: 3 klare Engp&#228;sse identifizieren<br>&#8627; Die wahren Blockaden werden sichtbar - es liegt nicht an den Menschen, sondern dem Arbeitsfluss <br>&#8627; Das Team hat wieder ein gemeinsames Bild der Situation<br>&#8627; F&#252;hrungskr&#228;fte k&#246;nnen gezielt unterst&#252;tzen, statt sich zu verzetteln<br><br>Manchmal braucht es einen Perspektivwechsel, um aus einer festgefahrenen Situation herauszukommen.</p><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!8Z0A!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!8Z0A!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png 424w, https://substackcdn.com/image/fetch/$s_!8Z0A!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png 848w, https://substackcdn.com/image/fetch/$s_!8Z0A!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png 1272w, https://substackcdn.com/image/fetch/$s_!8Z0A!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!8Z0A!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png" width="1024" height="1536" data-attrs="{&quot;src&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:1536,&quot;width&quot;:1024,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:1672097,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/png&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:false,&quot;topImage&quot;:true,&quot;internalRedirect&quot;:&quot;https://blog.fluxum.net/i/163565820?img=https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png&quot;,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!8Z0A!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png 424w, https://substackcdn.com/image/fetch/$s_!8Z0A!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png 848w, https://substackcdn.com/image/fetch/$s_!8Z0A!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png 1272w, https://substackcdn.com/image/fetch/$s_!8Z0A!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F512f139f-ab16-44a3-9c27-eb12cb53634f_1024x1536.png 1456w" sizes="100vw" fetchpriority="high"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><p><br><br>Wenn du Verantwortung tr&#228;gst &#8211; als F&#252;hrungskraft, Designer:in, Produktmensch oder Engineer &#8211; und wissen willst, wo es bei euch wirklich klemmt, dann lade ich dich ein:<br><br>Mach statt Retro mal ein Value Stream Mapping.</p><p><strong>PS:</strong> Vielleicht fragt sich jetzt der eine oder andere: "Aber wie genau funktioniert dieses Value Stream Mapping bei Software-Teams?"<br><br>Im Kern geht es darum, den kompletten Weg einer Anforderung - vom ersten Gedanken bis zur Nutzung durch den Kunden - zu visualisieren.<br><br>Das Besondere: Wir messen nicht nur die aktive Arbeitszeit, sondern auch die Wartezeit zwischen den Schritten.<br><br>Bei einem Team zeigte sich: Von 21 Tagen Durchlaufzeit waren nur 3 Tage tats&#228;chliche Arbeitszeit. Der Rest? Warten und Blockaden.<br><br>Diese Transparenz ver&#228;ndert vieles.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke f&#252;rs Lesen von fluxum engineering! Abonnieren Sie kostenlos, um neue Posts zu erhalten und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item><item><title><![CDATA[Von Silos zu High-Performance Teams]]></title><description><![CDATA[Wie DevOps-Coaching Teams aus der Produktivit&#228;tsfalle f&#252;hrt]]></description><link>https://blog.fluxum.net/p/von-silos-zu-high-performance-teams</link><guid isPermaLink="false">https://blog.fluxum.net/p/von-silos-zu-high-performance-teams</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Fri, 01 Nov 2024 10:58:25 GMT</pubDate><enclosure url="https://api.substack.com/feed/podcast/150859679/e7afb6f5e515e71ea5a1602d32c00301.mp3" length="0" type="audio/mpeg"/><content:encoded><![CDATA[<p>Was passiert, wenn hochqualifizierte IT-Teams daran scheitern, ihr volles Potenzial zu entfalten? </p><p>In diesem 15-min&#252;tigen Deep Dive<a class="footnote-anchor" data-component-name="FootnoteAnchorToDOM" id="footnote-anchor-1" href="#footnote-1" target="_self">1</a> geht es darum, </p><ol><li><p>welche Probleme die Produktivit&#228;t in der Softwareentwicklung ausbremsen und </p></li><li><p>was Sie dagegen tun k&#246;nnen.</p></li></ol><p>Der Dialog zeigt auf, welche konkreten Schritte Sie unternehmen k&#246;nnen, um  Herausforderungen wie diesen zu begegnen:</p><ol><li><p><strong>Kommunikation &amp; Zusammenarbeit</strong>: warum selbst erfahrene Teams in Silos arbeiten</p></li></ol><ul><li><p>Silo-Denken zwischen Entwicklung und Operations</p></li><li><p>Teams arbeiten in "getrennten Welten"</p></li><li><p>Mangelnde Kommunikation f&#252;hrt zu Missverst&#228;ndnissen</p></li><li><p>Konflikte zwischen Teams</p><p></p></li></ul><ol start="2"><li><p><strong>Kultur &amp; Mindset</strong>: wie eine Kultur der Schuldzuweisung echtes Lernen und &#8216;Continuous Improvement&#8217; verhindert und </p></li></ol><ul><li><p>Angst vor Fehlern</p></li><li><p>Kultur der Schuldzuweisung statt Lernkultur</p></li><li><p>Widerst&#228;nde gegen Ver&#228;nderungen</p></li><li><p>Klammern an alten Gewohnheiten</p><p></p></li></ul><ol start="3"><li><p><strong>F&#252;hrung &amp; Kontrolle</strong>: warum zu viel Kontrolle die Leistung senkt</p></li></ol><ul><li><p>Angst der F&#252;hrungskr&#228;fte vor Kontrollverlust</p></li><li><p>Zu viele detaillierte Anweisungen von oben</p></li><li><p>Mangelnde Autonomie der Teams</p></li><li><p>Fehlendes Vertrauen in Team-F&#228;higkeiten</p><p></p></li></ul><ol start="4"><li><p><strong>Performance &amp; Effizienz</strong>:</p></li></ol><ul><li><p>Langsame Release-Zyklen</p></li><li><p>Verz&#246;gerungen in der Entwicklung</p></li><li><p>Qualit&#228;tsprobleme in der Software</p></li><li><p>Leistung bleibt hinter Erwartungen zur&#252;ck</p></li></ul><p>H&#246;ren Sie, wie DevOps Coaching diese Herausforderungen angeht - als nachhaltiger Weg zu besserer Zusammenarbeit und besseren Ergebnissen. </p><p>F&#252;r alle, die verstehen wollen, warum es nichts bringt, einfach nur neue Tools einzuf&#252;hren, um eine bessere Teamleistung zu erreichen.</p><p></p><div class="footnote" data-component-name="FootnoteToDOM"><a id="footnote-1" href="#footnote-anchor-1" class="footnote-number" contenteditable="false" target="_self">1</a><div class="footnote-content"><p>als virtueller Podcast</p></div></div>]]></content:encoded></item><item><title><![CDATA[Complex or complicated: What's the difference?]]></title><description><![CDATA[Without understanding this elementary difference, you will not reach your goal]]></description><link>https://blog.fluxum.net/p/complex-or-complicated-whats-the</link><guid isPermaLink="false">https://blog.fluxum.net/p/complex-or-complicated-whats-the</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Fri, 13 Sep 2024 12:26:22 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!YpZt!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>Recognizing whether a problem is of a complicated or complex nature is a necessary prerequisite for finding a solution.</p><p>A distinction is often not made in everyday language:</p><blockquote><p>This is a complex problem.</p><p>It's a complicated system.</p></blockquote><p>Some people use complex as the intensified form of complicated. A complex problem would then be a more complicated problem.</p><h3>A fundamental difference</h3><p>The difference between a complex system and a complicated system is of a fundamental nature.</p><p>It is not a quantitative difference, but a qualitative one. This is because they behave differently. The complicated system is predictable, the complex system is unpredictable and reacts unexpectedly to changes. </p><h3>What is complicated?</h3><p>Complicated is a system that is difficult to get an overview of. Nevertheless, the complicated system can be understood by analyzing the individual parts.</p><p>For example, a mixing console is not immediately obvious to the layman. But with the help of a specialist or an instruction manual, you can learn to understand the functions.</p><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!YpZt!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!YpZt!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg 424w, https://substackcdn.com/image/fetch/$s_!YpZt!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg 848w, https://substackcdn.com/image/fetch/$s_!YpZt!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg 1272w, https://substackcdn.com/image/fetch/$s_!YpZt!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!YpZt!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg" width="1456" height="972" data-attrs="{&quot;src&quot;:&quot;https://bucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com/public/images/c71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:972,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:265540,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/jpeg&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:true,&quot;topImage&quot;:false,&quot;internalRedirect&quot;:null,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!YpZt!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg 424w, https://substackcdn.com/image/fetch/$s_!YpZt!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg 848w, https://substackcdn.com/image/fetch/$s_!YpZt!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg 1272w, https://substackcdn.com/image/fetch/$s_!YpZt!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fc71f80ea-c1f1-43d7-9ab3-7a67a75b8878_1920x1282.jpeg 1456w" sizes="100vw" loading="lazy"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><h6>Photo by <a href="https://unsplash.com/@chuttersnap?utm_source=unsplash&amp;utm_medium=referral&amp;utm_content=creditCopyText">chuttersnap</a></h6><p></p><p>Complicated therefore has something to do with not knowing and a lack of comprehensibility. </p><blockquote><p>Complexity is the measure of our ignorance. A problem (or: "unignorable event") is complicated because we do not understand it. Because we lack knowledge. This can be remedied by cramming or acquiring knowledge.</p></blockquote><p>Roberto Poli <a href="https://www.cadmusjournal.org/files/pdfreprints/vol2issue1/reprint-cj-v2-i1-complex-vs-complicated-systems-rpoli.pdf">writes</a>:</p><blockquote><p>&#8222;Complicated problems originate from causes that can be individually distinguished; they can be addressed piece&#173;-by-&#173;piece; for each input to the system there is a proportionate output; the relevant systems can be controlled and the problems they present admit permanent solutions.&#8220;</p></blockquote><p>Solutions can be found for complicated systems that will work again and again and deliver the same effect. The solutions are reproducible.</p><p></p><p class="button-wrapper" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/p/complex-or-complicated-whats-the?utm_source=substack&utm_medium=email&utm_content=share&action=share&quot;,&quot;text&quot;:&quot;Teilen&quot;,&quot;action&quot;:null,&quot;class&quot;:null}" data-component-name="ButtonCreateButton"><a class="button primary" href="https://blog.fluxum.net/p/complex-or-complicated-whats-the?utm_source=substack&utm_medium=email&utm_content=share&action=share"><span>Teilen</span></a></p><h3>Complex</h3><p>Complexity means unpredictability. Complexity is the measure of the number of surprises you have to reckon with.</p><p>There is no simple cause-and-effect relationship. The influencing factors can influence or even reverse each other through interactions and feedback effects.</p><p>Complex means:</p><p>Outputs are not proportional or linear to inputs; small changes in one part of the system can cause unexpected outputs in other parts of the system or a system-wide reorganization.</p><div class="captioned-image-container"><figure><a class="image-link image2 is-viewable-img" target="_blank" href="https://substackcdn.com/image/fetch/$s_!Y4SP!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!Y4SP!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg 424w, https://substackcdn.com/image/fetch/$s_!Y4SP!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg 848w, https://substackcdn.com/image/fetch/$s_!Y4SP!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg 1272w, https://substackcdn.com/image/fetch/$s_!Y4SP!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!Y4SP!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg" width="1456" height="971" data-attrs="{&quot;src&quot;:&quot;https://bucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com/public/images/bb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg&quot;,&quot;srcNoWatermark&quot;:null,&quot;fullscreen&quot;:null,&quot;imageSize&quot;:null,&quot;height&quot;:971,&quot;width&quot;:1456,&quot;resizeWidth&quot;:null,&quot;bytes&quot;:383208,&quot;alt&quot;:null,&quot;title&quot;:null,&quot;type&quot;:&quot;image/jpeg&quot;,&quot;href&quot;:null,&quot;belowTheFold&quot;:true,&quot;topImage&quot;:false,&quot;internalRedirect&quot;:null,&quot;isProcessing&quot;:false,&quot;align&quot;:null,&quot;offset&quot;:false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!Y4SP!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg 424w, https://substackcdn.com/image/fetch/$s_!Y4SP!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg 848w, https://substackcdn.com/image/fetch/$s_!Y4SP!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg 1272w, https://substackcdn.com/image/fetch/$s_!Y4SP!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Fbb04f22f-8762-433b-9185-6455cea9ee05_1920x1280.jpeg 1456w" sizes="100vw" loading="lazy"></picture><div class="image-link-expand"><div class="pencraft pc-display-flex pc-gap-8 pc-reset"><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container restack-image"><svg role="img" width="20" height="20" viewBox="0 0 20 20" fill="none" stroke-width="1.5" stroke="var(--color-fg-primary)" stroke-linecap="round" stroke-linejoin="round" xmlns="http://www.w3.org/2000/svg"><g><title></title><path d="M2.53001 7.81595C3.49179 4.73911 6.43281 2.5 9.91173 2.5C13.1684 2.5 15.9537 4.46214 17.0852 7.23684L17.6179 8.67647M17.6179 8.67647L18.5002 4.26471M17.6179 8.67647L13.6473 6.91176M17.4995 12.1841C16.5378 15.2609 13.5967 17.5 10.1178 17.5C6.86118 17.5 4.07589 15.5379 2.94432 12.7632L2.41165 11.3235M2.41165 11.3235L1.5293 15.7353M2.41165 11.3235L6.38224 13.0882"></path></g></svg></button><button tabindex="0" type="button" class="pencraft pc-reset pencraft icon-container view-image"><svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" class="lucide lucide-maximize2 lucide-maximize-2"><polyline points="15 3 21 3 21 9"></polyline><polyline points="9 21 3 21 3 15"></polyline><line x1="21" x2="14" y1="3" y2="10"></line><line x1="3" x2="10" y1="21" y2="14"></line></svg></button></div></div></div></a></figure></div><h6>Photo by <a href="https://unsplash.com/@hikeshaw?utm_source=unsplash&amp;utm_medium=referral&amp;utm_content=creditCopyText">H Shaw</a></h6><p></p><p>Complex systems such as organizations can behave completely differently despite the same measures. The same solution that worked for one system may fail completely elsewhere. Solutions are not transferable.</p><p></p><blockquote><p>Complexity is like the weather. There is nothing wrong with it. It's just bad not to be prepared for it. &#8212;  &#187;<a href="https://www.m-vg.de/mediafiles/Leseprobe/9783868815863.pdf">Komplexithoden</a>&#171;</p></blockquote><p></p><p><a href="https://en.wikipedia.org/wiki/Complex_system">Examples</a> for complex systems:</p><ul><li><p>the earth's global climate</p></li><li><p>social and economic organizations (such as companies and cities)</p></li><li><p>Ecosystems</p></li></ul><p></p><p>Roberto Poli <a href="https://www.cadmusjournal.org/files/pdfreprints/vol2issue1/reprint-cj-v2-i1-complex-vs-complicated-systems-rpoli.pdf">adds</a>:</p><blockquote><p>&#8222;Complex problems and systems result from networks of multiple interacting causes that cannot be individually distinguished; must be addressed as entire systems, that is they cannot be addressed in a piecemeal way; they are such that small inputs may result in disproportionate effects; the problems they present cannot be solved once and for ever, but require to be systematically managed and typically any intervention merges into new problems as a result of the interventions dealing with them.&#8220;</p></blockquote><p></p><p>Surprisingly, most systems are complex in nature. Only complicated systems are the exception.</p><h3>Various solution approaches</h3><p>The solution to a complex problem cannot be approached in the same way as the solution to a complicated problem. They require different solution strategies.</p><p>Complicated systems can be analyzed and predictions can be made about the behavior of the system. Experts can help with this. Solutions can be reused.</p><p>Complex systems, on the other hand, defy an understanding of the overall relationships, as the factors influence each other. </p><blockquote><p>&#8222;The distinction between complicated and complex systems is of immense importance, yet it is often overlooked. Decision-makers commonly mistake complex systems for simply complicated ones and look for solutions without realizing that &#8216;learning to dance&#8217; with a complex system is definitely different from &#8216;solving&#8217; the problems arising from it.&#8220;</p></blockquote><p>If you handle complex things as if they were complicated, <a href="https://sloanreview.mit.edu/article/the-critical-difference-between-complex-and-complicated/">you are doomed to failure</a>.</p><p>Complexity means that there can be a certain degree of control; but it is not complete control, the situation is not fully controllable. By recognizing patterns, some relationships can be understood.</p><p>In a complex environment, you cannot expect a comprehensive plan or strategy to work as intended. An approach of trying, learning and adapting is more likely to get you further. Mistakes can be made and risks can be taken.</p><p>However, you shouldn't make big bets on large projects or invest too much in comprehensive plans, but instead constantly learn in small steps and make appropriate adjustments.</p><p></p><p class="button-wrapper" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Jetzt abonnieren&quot;,&quot;action&quot;:null,&quot;class&quot;:null}" data-component-name="ButtonCreateButton"><a class="button primary" href="https://blog.fluxum.net/subscribe?"><span>Jetzt abonnieren</span></a></p><div><hr></div><p>&#8212; <a href="https://twitter.com/MartinGross">Martin Gross</a></p>]]></content:encoded></item><item><title><![CDATA[3 Dinge, die ich vom Bohren dreieckiger Löcher gelernt habe]]></title><description><![CDATA[Ja, es geht wirklich]]></description><link>https://blog.fluxum.net/p/3-dinge-die-ich-vom-bohren-dreieckiger</link><guid isPermaLink="false">https://blog.fluxum.net/p/3-dinge-die-ich-vom-bohren-dreieckiger</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Sat, 06 Jul 2024 16:24:02 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!2eOE!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fec4b8ead-2f32-487b-a0bc-e134fab06b01_1024x1024.jpeg" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>Habt ihr jemals gedacht, dass es unm&#246;glich ist, ein dreieckiges Loch zu bohren?</p><p>Ich habe es definitiv. </p><p>Doch die Animation von <a href="https://beaujanzen.wixsite.com/reason-for-math">Beau Janzen</a> zeigt, dass es tats&#228;chlich geht und ist  beeindruckend. Ich konnte mir vorher nicht vorstellen, wie das gehen k&#246;nnte.</p><p>Aber schaut erst einmal selbst:</p><div id="tiktok-iframe?media=1&amp;app=1&amp;url=https%3A%2F%2Fwww.tiktok.com%2F%40reason4math%2Fvideo%2F7372387971884174638&amp;key=e27c740634285c9ddc20db64f73358dd" class="tiktok-wrap outer" data-attrs="{&quot;url&quot;:&quot;https://www.tiktok.com/@reason4math/video/7372387971884174638&quot;,&quot;title&quot;:&quot;Drilling a triangular hole. Yes, I know there logistical issues is making this work, but this is intended as a fun geometric breakdown. I&#8217;m creating all this work on my own, so if you like my content and would like to see more, I&#8217;d appreciate your support. In my bio, you can leave a tip in my Linktree. Thanks! #drill #triangle #hole #geometry #geometryart #math #maths #engineering #satisfying #satisfyingvideo #originalanimation #mathtok #stemtok&quot;,&quot;thumbnail_url&quot;:&quot;https://substack-post-media.s3.amazonaws.com/public/images/ec4b8ead-2f32-487b-a0bc-e134fab06b01_1024x1024.jpeg&quot;,&quot;author&quot;:&quot;Beau Janzen&quot;,&quot;embed_url&quot;:&quot;https://cdn.iframe.ly/api/iframe?media=1&amp;app=1&amp;url=https%3A%2F%2Fwww.tiktok.com%2F%40reason4math%2Fvideo%2F7372387971884174638&amp;key=e27c740634285c9ddc20db64f73358dd&quot;,&quot;author_url&quot;:&quot;https://www.tiktok.com/@reason4math&quot;,&quot;belowTheFold&quot;:false}" data-component-name="TikTokCreateTikTokEmbed"><iframe id="iframe-tiktok-iframe?media=1&amp;app=1&amp;url=https%3A%2F%2Fwww.tiktok.com%2F%40reason4math%2Fvideo%2F7372387971884174638&amp;key=e27c740634285c9ddc20db64f73358dd" class="tiktok-iframe" src="https://cdn.iframe.ly/api/iframe?media=1&amp;app=1&amp;url=https%3A%2F%2Fwww.tiktok.com%2F%40reason4math%2Fvideo%2F7372387971884174638&amp;key=e27c740634285c9ddc20db64f73358dd" frameborder="0" allow="autoplay; fullscreen; encrypted-media" allowfullscreen="" scrolling="no"></iframe><iframe src="https://team-hosted-public.s3.amazonaws.com/set-then-check-cookie.html" id="third-party-iframe-tiktok-iframe?media=1&amp;app=1&amp;url=https%3A%2F%2Fwww.tiktok.com%2F%40reason4math%2Fvideo%2F7372387971884174638&amp;key=e27c740634285c9ddc20db64f73358dd" class="third-party-cookie-check-iframe" style="display: none;"></iframe><div class="tiktok-wrap static" data-component-name="TikTokCreateStaticTikTokEmbed"><a href="https://www.tiktok.com/@reason4math/video/7372387971884174638" target="_blank"><img class="tiktok thumbnail" src="https://substackcdn.com/image/fetch/$s_!2eOE!,w_640,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fec4b8ead-2f32-487b-a0bc-e134fab06b01_1024x1024.jpeg" style="background-image: url(https://substackcdn.com/image/fetch/$s_!2eOE!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fec4b8ead-2f32-487b-a0bc-e134fab06b01_1024x1024.jpeg);"></a><div class="content"><a class="author" href="https://www.tiktok.com/@reason4math" target="_blank">@reason4math</a><a class="title" href="https://www.tiktok.com/@reason4math/video/7372387971884174638" target="_blank">Drilling a triangular hole. Yes, I know there logistical issues is making this work, but this is intended as a fun geometric breakdown. I&#8217;m creating all this work on my own, so if you like my content and would like to see more, I&#8217;d appreciate your support. In my bio, you can leave a tip in my Linktree. Thanks! #drill #triangle #hole #geometry #geometryart #math #maths #engineering #satisfying #satisfyingvideo #originalanimation #mathtok #stemtok</a></div></div><div class="fallback-failure" id="fallback-failure-tiktok-iframe?media=1&amp;app=1&amp;url=https%3A%2F%2Fwww.tiktok.com%2F%40reason4math%2Fvideo%2F7372387971884174638&amp;key=e27c740634285c9ddc20db64f73358dd"><div class="error-content"><img class="error-icon" src="https://substackcdn.com//img/alert-circle.svg">Tiktok failed to load.<br><br>Enable 3rd party cookies or use another browser</div></div></div><p>Um besser zu verstehen, warum diese Animation &#8212; neben der Tatsache, dass sie das Bohren eines dreieckigen Lochs zeigt &#8212; so faszinierend ist, habe ich sie mir mehrfach angeschaut. </p><p>3 Dinge wurden mir erneut bewusst. <br>3 Dinge, die ich in Zukunft mehr in meine T&#228;tigkeit integrieren m&#246;chte:</p><p>1. Wir beschr&#228;nken unser Denken auf das Vertraute, das wir kennen und t&#228;glich sehen. Bis uns jemand etwas unvorhergesehenes Neues zeigt. Und dass das, was wir f&#252;r unm&#246;glich hielten, doch m&#246;glich ist.</p><p>2. Gute Visualisierungen sind ein hervorragendes Mittel, um neue Probleml&#246;sungsans&#228;tze f&#252;r jedermann verst&#228;ndlich zu machen.</p><p>3. Anstatt nur die endg&#252;ltige L&#246;sung zu pr&#228;sentieren, ist es viel besser, die Menschen von der Machbarkeit einer L&#246;sung zu &#252;berzeugen, indem man ihnen den Denkprozess zeigt, der zu dieser L&#246;sung f&#252;hrt. </p><p>Lasst euch inspirieren:<br>Welche 'unm&#246;glichen' Probleme begegnen euch in eurem Alltag oder Beruf? <br><br>Wie w&#228;re es, wenn ihr euch heute die Zeit nehmt, eines davon aus einer v&#246;llig neuen Perspektive zu betrachten. Zeichnet es auf, diskutiert es mit anderen oder sucht nach unkonventionellen L&#246;sungsans&#228;tzen im Internet. </p><p>Vielleicht findet ihr euer eigenes 'dreieckiges Loch' und beweist, dass das, was unm&#246;glich erschien doch m&#246;glich ist. <br><br>Teilt gerne eure Erkenntnisse in den Kommentaren und inspiriert uns, &#252;ber den Tellerrand zu schauen. </p><p>Denn manchmal ist die kreativste L&#246;sung nur einen ungew&#246;hnlichen Ansatz entfernt.</p><p class="button-wrapper" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/p/3-dinge-die-ich-vom-bohren-dreieckiger/comments&quot;,&quot;text&quot;:&quot;Einen Kommentar hinterlassen&quot;,&quot;action&quot;:null,&quot;class&quot;:null}" data-component-name="ButtonCreateButton"><a class="button primary" href="https://blog.fluxum.net/p/3-dinge-die-ich-vom-bohren-dreieckiger/comments"><span>Einen Kommentar hinterlassen</span></a></p><p></p><p></p>]]></content:encoded></item><item><title><![CDATA[Warum technische Probleme oft organisatorische Ursachen haben]]></title><description><![CDATA[Die meisten Probleme, die als technische oder Produktprobleme erscheinen, sind in Wirklichkeit Management- oder Organisationsprobleme.]]></description><link>https://blog.fluxum.net/p/warum-technische-probleme-oft-organisatorische</link><guid isPermaLink="false">https://blog.fluxum.net/p/warum-technische-probleme-oft-organisatorische</guid><dc:creator><![CDATA[Martin Gross]]></dc:creator><pubDate>Thu, 06 Jun 2024 17:24:51 GMT</pubDate><enclosure url="https://substackcdn.com/image/fetch/$s_!y_oj!,w_256,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa142b85f-3d35-4a80-bdac-1835f765cd9e_512x512.png" length="0" type="image/jpeg"/><content:encoded><![CDATA[<p>Die meisten Probleme, die als technische oder Produktprobleme erscheinen, sind in Wirklichkeit Management- oder Organisationsprobleme.<br><br>Ein Beispiel:<br><br>Es gibt keine klare Vision und Strategie f&#252;r das Produkt.<br><br>Die Folge:<br><br>Die Abteilungen und Teams stimmen sich nicht ab, reden nicht wirklich miteinander und verstehen daher nicht, was die Kunden wirklich brauchen und wohin das Unternehmen will.<br><br>Die Konsequenz:<br><br>Die Teams werden in unterschiedliche Richtungen gezogen, weil verschiedene Stakeholder eine Vielzahl von Anforderungen an sie stellen, von denen viele im Widerspruch zu anderen Anforderungen stehen.<br><br>Die Auswirkungen:<br><br>&#8594; Stress und &#220;berforderung<br>Die Teams sind gestresst und &#252;berlastet. Es bleibt keine Zeit, die Arbeit zu unterbrechen, um Altlasten zu bereinigen und die Zusammenarbeit zu verbessern. Das System wird mit der Zeit immer instabiler.<br><br>&#8594; Die Probleme h&#228;ufen sich<br>Immer h&#228;ufiger tauchen Probleme auf, die das Team zus&#228;tzlich belasten. Die Arbeitsbelastung steigt und die Motivation des Teams sinkt.<br><br>&#8594; Schlechte Code-Qualit&#228;t<br>Der Code wird in aller Eile geschrieben und nicht ausreichend getestet, weil alle so besch&#228;ftigt sind und niemand Zeit zum Testen hat. Dies f&#252;hrt zu weiteren Problemen.<br><br><br>Deswegen: <br><br>Nehmen Sie sich die Zeit, Ihre Vision und Strategie zu entwickeln und stellen Sie sicher, dass alle an einem Strang ziehen. <br><br>Es ist wichtig, sich auf technische F&#228;higkeiten und Produktstrategien zu fokussieren. Aber echter Mehrwert entsteht nur, wenn die Qualit&#228;t stimmt, die Zusammenarbeit funktioniert und alles auf ein klares Ziel ausgerichtet ist.</p><div class="subscription-widget-wrap-editor" data-attrs="{&quot;url&quot;:&quot;https://blog.fluxum.net/subscribe?&quot;,&quot;text&quot;:&quot;Abonnieren&quot;,&quot;language&quot;:&quot;de&quot;}" data-component-name="SubscribeWidgetToDOM"><div class="subscription-widget show-subscribe"><div class="preamble"><p class="cta-caption">Danke, dass Sie fluxum engineering lesen! Schlie&#223;en Sie ein Free-Abonnement ab, um &#252;ber neue Posts benachrichtigt zu werden und meine Arbeit zu unterst&#252;tzen.</p></div><form class="subscription-widget-subscribe"><input type="email" class="email-input" name="email" placeholder="E-Mail-Adresse eingeben &#8230;" tabindex="-1"><input type="submit" class="button primary" value="Abonnieren"><div class="fake-input-wrapper"><div class="fake-input"></div><div class="fake-button"></div></div></form></div></div>]]></content:encoded></item></channel></rss>