Der Elektromotor
Als Fabriken Ende des 19. Jahrhunderts den Dampfmotor durch den Elektromotor ersetzten, passierte erst mal erstaunlich wenig.
Vorher stand am Rand der Halle ein großer Dampfmotor. Von dort liefen Wellen, Riemen und Gestänge durch das ganze Gebäude. Jede Maschine hing an derselben zentralen Kraftquelle. Danach stand dort ein großer Elektromotor. Dieselben Wellen. Dieselben Riemen. Derselbe Takt.
Die Fabrik sah moderner aus. Sie war nicht fundamental anders organisiert.
Der eigentliche Produktivitätssprung kam erst später. Nicht durch den besseren Motor an derselben Stelle, sondern durch eine andere Architektur. Kleine Motoren direkt an den einzelnen Maschinen. Plötzlich konnte jede Maschine unabhängig laufen. Anders platziert werden. Abgeschaltet werden, wenn sie nicht gebraucht wurde. Der Prozess wurde nicht optimiert. Er wurde um den neuen Antrieb herum neu gedacht.
Genau da stehen die meisten Unternehmen gerade mit AI.
Sie ersetzen den großen Dampfmotor durch einen großen Elektromotor und wundern sich, warum die Ergebnisse so klein ausfallen.
Die erste Verwechslung
Die meisten AI-Projekte scheitern nicht daran, dass das Modell zu schwach wäre. Sie scheitern an einer sehr alten Verwechslung.
Man hält den bestehenden Prozess für die Arbeit selbst.
Meetings, Reviews, Sprint Planning, Handoffs, Spezifikationen, Ticketketten, Freigabeschleifen, Decks, Übergaben zwischen Bereichen. All das fühlt sich in großen Organisationen so normal an, dass es wie Natur wirkt. Ist es nicht. Das meiste davon ist Koordinationsinfrastruktur. Gebaut, damit viele menschliche Gehirne mit begrenztem Kontext, begrenztem Arbeitsgedächtnis und begrenzter Verfügbarkeit gemeinsam etwas herstellen können.
Das ist nicht abwertend gemeint. Diese Infrastruktur hatte und hat einen Zweck.
Aber man muss sauber unterscheiden:
Was davon ist die eigentliche Wertschöpfung?
Und was davon ist nur das Getriebe, das man gebaut hat, um menschliche Limitierungen zu kompensieren?
Solange Menschen die Ausführung übernehmen, ist diese Frage unerquicklich, aber nicht existenziell. Mit Agentensystemen wird sie plötzlich zentral. Denn ein relevanter Teil dieser Infrastruktur existiert nur, weil Wissen zwischen Menschen transportiert werden muss.
Wenn der Antrieb sich ändert, wird genau diese Schicht fragwürdig.
Wofür die Transmissionsriemen heute stehen
Die Transmissionsriemen der Wissensarbeit heißen nicht mehr Leder und Stahl. Sie heißen Kalender, Ticketsystem, Review-Prozess und PowerPoint.
Meetings existieren oft deshalb, weil Menschen sich gegenseitig auf denselben Stand bringen müssen.
PRDs und Spezifikationen existieren, weil die Person, die etwas will, und die Person, die es baut, nicht dieselbe ist und nicht denselben Kontext hat.
Sprint Planning existiert, weil Aufgabenpakete so geschnitten werden müssen, dass sie in begrenzte menschliche Kapazität passen.
Code Reviews sind nicht nur Qualitätskontrolle. Sie sind auch Vertrauensmechanik zwischen Menschen.
Handoff-Dokumente existieren, weil Kontext von einem Kopf in den nächsten geschoben werden muss.
Decks existieren, weil komplexe Lagen in zwanzig Minuten Vorstandstermin passen müssen.
Wenn man das einmal nüchtern betrachtet, wird klar: Ein erheblicher Teil moderner Wissensarbeit ist nicht die Arbeit selbst. Es ist Koordination um die Arbeit herum.
Deshalb sind die Zahlen zum Koordinationsaufwand auch so unerquicklich. Microsofts Work Trend Index und ähnliche Erhebungen kommen seit Jahren in denselben Korridor: Ein großer Teil der Wissensarbeit besteht aus Kommunikation über Arbeit, nicht aus Arbeit am eigentlichen Gegenstand. Asana nennt das Work about Work. Nate B. Jones formuliert es zugespitzter: In vielen größeren Organisationen existiert ein relevanter Teil der Rollen nur, um Übergaben zwischen anderen Rollen zu managen.
Man muss die exakte Prozentzahl nicht zum Dogma machen, um den Punkt zu sehen.
Die Transmissionsanlage ist riesig geworden.
Drei Phasen, die gerade durcheinanderlaufen
Die Elektromotor-Analogie hilft genau deshalb, weil sie drei sehr unterschiedliche Zustände beschreibt, die in der AI-Debatte ständig vermischt werden.
Phase 1: Gleicher Prozess, anderes Werkzeug
Das ist der große Elektromotor.
Man nimmt den bestehenden Prozess und schraubt AI an einzelne Stellen. Zusammenfassungen werden automatisch geschrieben. Specs entstehen schneller. Code kommt mit Copilot oder Claude. Der Support hat einen Assistenten. Finance hat einen Prompt-Workflow.
Das bringt oft etwas. Geschwindigkeit. Kosten. manchmal auch einfach weniger nervige Fleißarbeit.
Aber strukturell bleibt alles gleich. Dieselben Meetings. Dieselben Freigaben. Dieselben Übergaben. Dieselben Teamgrenzen. Dieselbe Prozesslogik.
Deshalb ist Phase 1 so attraktiv. Sie ist leicht zu verkaufen. Leicht zu budgetieren. Leicht als Effizienzprogramm zu rahmen.
Und genau deshalb wird sie überschätzt.
Phase 2: Gleicher Grundriss, bessere Wege
Hier wird es schon interessanter.
Einzelne Schritte fallen weg. Rollen verschieben sich. Der Prozess wird neu geschnitten, aber seine Grundarchitektur bleibt erkennbar. Nicht bloß billiger, sondern besser. Weniger Handoffs. Weniger Wartezeit. Bessere Customer Experience. Kürzere Schleifen.
Viele gute Unternehmen werden hier landen, und das ist nichts Minderwertiges. Für gewachsene Systeme, regulierte Umfelder und komplexe Brownfield-Landschaften kann Phase 2 über Jahre der vernünftigste Zustand sein.
Phase 3: Kleiner Motor an jeder Maschine
Das ist die eigentliche Neuerfindung.
Nicht mehr die Frage: Wie machen wir den bestehenden Prozess effizienter?
Sondern: Welche Teile dieses Prozesses existierten nur, weil Menschen sich wechselseitig Kontext übergeben mussten?
Wenn Agents Kontext halten, Arbeit ausführen und Ergebnisse gegen klar definierte Kriterien prüfen können, braucht man manche dieser Schichten nicht digitalisiert, sondern gar nicht mehr.
Nicht alle. Aber viel mehr, als den meisten lieb ist.
Was Phase 3 konkret anders macht
Die stärksten Beispiele aus den letzten Monaten sind nicht deshalb interessant, weil sie zeigen, dass AI Code schreiben kann. Das ist inzwischen fast banal. Interessant ist, was sie mit dem Prozess machen.
StrongDM hat mit seiner sogenannten Dark Factory ein Modell öffentlich beschrieben, in dem ein kleines Team Software über Spezifikationen und Evaluationslogik steuert, statt über klassische Sprint- und Review-Infrastruktur. Das eigentlich Neue daran ist nicht die Zahl der erzeugten Zeilen Code. Das Neue ist, dass die Koordinationsschicht massiv dünner wird. Menschen formulieren, begrenzen und prüfen. Die Maschine setzt um.
Karpathys Autoresearch-Primitive zeigt dieselbe Logik in kleiner und roher Form. Ein klar abgegrenzter Suchraum. Eine maschinenlesbare Aufgabenbeschreibung. Eine verifizierbare Metrik. Eine Schleife aus Versuch, Auswertung, Anpassung. Kein Meeting-Orchester dazwischen.
Beide Beispiele machen denselben Punkt:
Wenn Ausführung billig und schnell wird, verschiebt sich die knappe Ressource.
Nicht mehr: Wer kann es bauen?
Sondern: Wer kann präzise genug sagen, was gebaut werden soll, und wer kann zuverlässig beurteilen, ob das Ergebnis gut ist?
Das heißt auf Deutsch: Spec und Evaluation rücken ins Zentrum. Koordination verliert ihren Monopolstatus.
Warum das für viele Unternehmen so unbequem ist
Weil ein erheblicher Teil ihrer gewachsenen Struktur genau um diese Koordinationsfunktion herum gebaut wurde.
Projektmanager koordinieren.
Produktmanager übersetzen.
Engineering Manager synchronisieren.
PMO-Strukturen halten Übergabeketten stabil.
Decks existieren, um zwischen Entscheidungsebenen zu vermitteln.
Steering Committees existieren, weil Informationen an jeder Hierarchiestufe anders verpackt werden müssen.
All das verschwindet nicht automatisch. Und schon gar nicht über Nacht. Aber es verliert seinen selbstverständlichen Status.
Wenn die Maschine große Teile der Ausführung übernimmt, wird plötzlich sichtbar, wie viel Organisation nur eine Antwort auf langsame, kontextarme, koordinationsbedürftige menschliche Ausführung war.
Das ist der Moment, in dem Menschen nervös werden.
Nicht nur, weil Jobs unter Druck geraten. Sondern weil Rollen ihren stillen Rechtfertigungsgrund verlieren können. Ein Prozess, der gestern als professionell galt, wirkt morgen wie eine teure Umleitung.
Deshalb werden viele Unternehmen zunächst genau das Falsche tun. Sie digitalisieren die Umleitung. Sie bauen mehr Workflow um einen Prozess, der als Ganzes bereits fragwürdig geworden ist.
Das ist Phase 1 in Reinform.
Warum Spec plötzlich das Zentrum wird
In der alten Welt konnte man schlechte Spezifikationen lange kaschieren.
Ein Entwickler stellte Rückfragen. Eine Projektleiterin merkte, dass etwas fehlt. Im Review fiel auf, dass der eigentliche Bedarf anders lag. Eine erfahrene Person schloss die Lücke mit Kontext, Geschmack und Gespräch.
Die Maschine tut das nur begrenzt. Sie füllt Lücken nicht verlässlich mit gesundem Urteil, sondern mit Musterfortsetzung.
Deshalb kippt der Engpass.
Sobald Ausführung schneller und billiger wird, wird schlechte Spezifikation brutal sichtbar. Nicht theoretisch. Operativ. Plötzlich sieht man, wie viel Ambiguität die menschliche Organisation bisher still aufgefangen hat.
Das ist auch der Grund, warum der Schritt von Phase 1 zu Phase 3 nicht zuerst ein Tool-Thema ist. Es ist ein Artikulationsthema.
Wer Phase 3 will, muss lernen, Anforderungen, Randbedingungen, Qualitätskriterien und Abbruchkriterien sauberer zu formulieren als die meisten Organisationen es heute gewohnt sind.
Und direkt dahinter kommt Evaluation.
Denn eine gute Spec ohne gute Prüfung produziert nur schnellere Enttäuschung.
Warum Evaluation kein Nachbau der alten Kontrolle ist
Hier passieren gerade zwei Denkfehler gleichzeitig.
Der erste lautet: Wenn Agents bauen, brauchen wir einfach mehr Reviews.
Der zweite lautet: Wenn Agents bauen, können wir auf Reviews verzichten, weil die Maschine ja getestet hat.
Beides greift zu kurz.
Phase 3 bedeutet nicht, dass menschliches Urteil verschwindet. Es bedeutet, dass menschliches Urteil anders eingesetzt wird. Weniger als dauernde Begleitung jedes einzelnen Schritts, mehr als gezielte Definition von Erfolg und Prüfung gegen diesen Erfolg.
StrongDMs Behavioral Scenarios sind deshalb so interessant. Nicht weil Scenarios magisch wären, sondern weil sie zeigen, dass Verifikation eigenständig gestaltet werden muss. Nicht als Nebensatz im alten Prozess, sondern als eigenes System. Wer Agents an ihren selbstgeschriebenen Prüfsteinen misst, baut sich nur eine schönere Form von Selbsttäuschung.
Evaluation wird dadurch zur Infrastruktur. Nicht zum QA-Nachklapp.
Und genau da schließt sich der Kreis zu deinem Modell: Terrain, Intent, Taste, Spec, Evaluation. Wenn Execution billig wird, steigen nicht alle Schichten gleich stark an Bedeutung. Die mittleren und oberen Schichten werden härter, nicht weicher.
Die härteste Grenze heißt nicht Technologie, sondern Kontextreife
An dieser Stelle kommt der unangenehme Teil.
Viele Unternehmen kommen nicht einmal in die Nähe von Phase 3, weil ihnen die Vorstufe fehlt.
Maschinenlesbarer Kontext.
Im Text zum falschen Black-Box-Problem ging es darum, dass Organisationen ihr eigenes Terrain und ihren eigenen Intent nicht sauber lesen können. Genau deshalb ist der Elektromotor-Text kein isolierter Ausflug in Prozessdesign. Er hängt an der Frage, ob das relevante Wissen überhaupt in einer Form vorliegt, mit der eine Maschine arbeiten kann.
StrongDM funktioniert nicht, weil dort einfach mutigere Leute sitzen. Es funktioniert auch, weil Spezifikation und Prüfstruktur ernst genommen werden. Karpathys Primitive funktioniert nur dort, wo Erfolg hinreichend klar messbar ist.
Wer sein kritisches Wissen in Köpfen, PDFs und impliziten Abkürzungen hält, kann Phase 3 bewundern. Er kann sie aber nicht betreiben.
Deshalb ist der häufigste Irrtum in der AI-Transformation gerade dieser:
Man hält Phase 1 für einen Vorgeschmack auf Phase 3.
In Wahrheit sind das oft zwei sehr verschiedene Welten.
Phase 1 kann mit unklarem Kontext leben, weil Menschen die Lücken schließen.
Phase 3 kann das nicht.
Der DACH-Faktor
Im DACH-Raum wird dieser Umbau langsamer verlaufen als in manchen US-Kontexten. Betriebsräte, Mitbestimmung, stärkere Prozessbindung, gewachsene Qualitätskulturen, Brownfield-Landschaften. All das bremst.
Ich würde das nicht vorschnell als Nachteil lesen.
Denn dieselben Kräfte, die verlangsamen, erzwingen an manchen Stellen genau die Fragen, die anderswo zu lange übersprungen werden.
Was ist der menschliche Beitrag in diesem Prozess wirklich?
Welche Qualität darf nicht implizit bleiben?
Wo wäre Automatisierung nur eine billigere Fassung falscher Entscheidungen?
Das Problem ist nicht, dass DACH-Unternehmen vorsichtiger sind. Das Problem ist eher, dass viele ihre Vorsicht auf die Technologie richten, nicht auf den Prozess. Sie prüfen das Modell. Sie prüfen die Datenschutzlage. Sie prüfen den Betriebsratskonflikt. Alles legitim. Aber sie prüfen zu selten, ob der zugrunde liegende Prozess überhaupt noch die richtige Form hat.
Dann wird AI zum Werkzeug in einem Betriebssystem, das längst einen Architekturfehler hat.
Drei Fragen, bevor ihr den großen Motor austauscht
Keine Roadmap. Ein Diagnoseversuch.
Erstens: Welche Teile eures Prozesses existieren nur, um Kontext zwischen Menschen zu übertragen?
Nicht welche Teile nerven. Welche Teile genau deshalb da sind, weil Wissen sonst nicht von A nach B käme.
Dort liegt das größte Phase-3-Potenzial.
Zweitens: Wo wäre die Organisation ohne diese Transmissionsriemen heute blind?
Wenn ihr ein Meeting, einen Handoff oder einen Review-Zyklus streicht, was geht dann verloren? Reine Synchronisation? Oder Urteil, Vertrauen, Geschmack, Machtbalance?
Diese Unterscheidung entscheidet, was eliminiert, was umgebaut und was bewusst erhalten werden sollte.
Drittens: Könnt ihr einen relevanten Workflow auf Spec plus Evaluation reduzieren?
Nicht das ganze Unternehmen. Einen Workflow.
Wenn diese Reduktion sofort absurd wirkt, liegt das meist an einem von drei Dingen: fehlendem Kontext, unklarer Spec oder nicht operationalisierter Evaluation. Genau dort liegt dann die eigentliche Arbeit.
Wo ich falsch liegen könnte
Drei Punkte gegen mein eigenes Argument. Sie sind nicht kosmetisch.
Erstens: Nicht jeder Prozess ist nur Koordinationsabfall. Retrospektiven können psychologische Sicherheit erzeugen. Pairing kann Ausbildung sein. Reviews können Geschmack kalibrieren. Manche Reibung ist kein Fehler, sondern Qualitätssicherung. Wenn man zu aggressiv zwischen Wertschöpfung und Overhead trennt, streicht man am Ende nicht Bürokratie, sondern Lern- und Urteilssysteme.
Zweitens: Phase 3 ist für viele Unternehmen auf absehbare Zeit kein realistisches Zielbild. Brownfield-Realitäten, Regulatorik, Sicherheitsanforderungen und institutionelles Gedächtnis sind keine Fußnoten. In solchen Kontexten kann der Versuch, den kleinen Motor an jede Maschine zu schrauben, mehr zerstören als verbessern. Dann ist Phase 2 nicht Feigheit, sondern Professionalität.
Drittens: Ich könnte den Zeithorizont unterschätzen. Es ist gut möglich, dass viele Unternehmen viel länger mit hybriden Prozessformen leben, als die Analogie suggeriert. Der große Motor verschwindet vielleicht nicht schnell, sondern bleibt noch Jahre parallel stehen. Wenn das so ist, dann ist der eigentliche Engpass nicht die radikale Neuerfindung, sondern die Fähigkeit, alte und neue Koordinationsformen über längere Zeit nebeneinander zu betreiben.
Trotzdem ändert das den Kernpunkt nicht.
Viele Unternehmen halten heute Prozesse für unverzichtbar, die in Wahrheit Workarounds für einen alten Antrieb sind.
Sie werden diese Prozesse nicht los, indem sie sie effizienter machen.
Sie werden sie erst los, wenn sie erkennen, wofür sie gebaut wurden.
Der Produktivitätssprung des Elektromotors kam nicht aus der Steckdose.
Er kam in dem Moment, in dem jemand begriff, dass die Wellen und Riemen nicht zur Natur der Fabrik gehörten. Sie gehörten zur Natur des alten Antriebs.
Genau dort stehen Unternehmen jetzt mit AI.
Meetings, Handoffs, Review-Schleifen, Abstimmungsrituale, Übergabedokumente, halbe Managementschichten aus Synchronisation. Vieles davon fühlt sich an wie die Arbeit. Ist es aber oft nicht. Es ist die Infrastruktur, die wir gebaut haben, damit menschliche Gehirne gemeinsam ausführen können.
Wenn der Antrieb sich ändert, wird diese Infrastruktur nicht automatisch besser.
Ein Teil von ihr wird schlicht überflüssig.
Die meisten Unternehmen tauschen gerade den großen Motor aus.
Die interessantere Frage ist, wer den Mut hat, die Transmissionsriemen zu demontieren.
Direkt anwenden
Dieses Prompt Kit übersetzt die Konzepte des Essays in konkrete Prompts, die du sofort nutzen kannst.
Zum Prompt Kit