Der Elektromotor
Als Fabriken Ende des 19. Jahrhunderts den Dampfmotor durch den Elektromotor ersetzten, passierte erst einmal erstaunlich wenig.
Vorher stand am Rand der Halle ein großer Dampfmotor. Von dort liefen Wellen, Riemen und Gestänge durch das ganze Gebäude. Danach stand dort ein großer Elektromotor. Dieselben Wellen. Dieselben Riemen. Derselbe Takt.
Die Fabrik sah moderner aus. Sie war nicht anders organisiert.
Der eigentliche Produktivitätssprung kam erst später. Nicht durch den besseren Motor an derselben Stelle, sondern durch eine andere Architektur. Kleine Motoren direkt an den einzelnen Maschinen. Plötzlich konnte jede Maschine unabhängig laufen, anders platziert werden, abgeschaltet werden, wenn sie nicht gebraucht wurde. Der Prozess wurde nicht optimiert. Er wurde um den neuen Antrieb herum neu gedacht.
Genau da stehen viele Unternehmen gerade mit AI.
Sie ersetzen den großen Dampfmotor durch einen großen Elektromotor und wundern sich, warum die Ergebnisse so klein ausfallen.
Das ist keine hübsche historische Analogie für eine Keynote. Es ist ein Diagnosewerkzeug. Der Text soll helfen, zwischen eigentlicher Wertschöpfung und Koordinationsinfrastruktur zu unterscheiden, bevor Unternehmen anfangen, nur den alten Prozess mit neuer Technik zu beschleunigen.
Die erste Verwechslung
Viele AI-Projekte scheitern nicht daran, dass das Modell zu schwach wäre. Sie scheitern an einer alten Verwechslung:
Man hält den bestehenden Prozess für die Arbeit selbst.
Meetings, Reviews, Sprint Planning, Handoffs, Spezifikationen, Ticketketten, Freigabeschleifen, Decks, Übergaben zwischen Bereichen. In großen Organisationen wirkt das schnell wie Natur. Ist es nicht. Ein großer Teil davon ist Koordinationsinfrastruktur. Gebaut, damit viele Menschen mit begrenztem Kontext, begrenztem Arbeitsgedächtnis und begrenzter Verfügbarkeit gemeinsam etwas herstellen können.
Diese Infrastruktur hatte einen Zweck. Aber sie ist nicht automatisch die Arbeit.
Die entscheidende Frage lautet deshalb:
Was davon ist eigentliche Wertschöpfung?
Und was davon ist nur das Getriebe, das man gebaut hat, um menschliche Limitierungen zu kompensieren?
Solange Menschen die Ausführung tragen, ist diese Unterscheidung unerquicklich, aber nicht existenziell. Mit Agentensystemen wird sie zentral. Denn ein relevanter Teil dieser Infrastruktur existiert nur, weil Wissen zwischen Menschen transportiert werden muss.
Wenn der Antrieb sich ändert, wird genau diese Schicht fragwürdig.
Wofür die Transmissionsriemen heute stehen
Die Transmissionsriemen der Wissensarbeit heißen nicht mehr Leder und Stahl. Sie heißen Kalender, Ticketsystem, Review-Prozess und PowerPoint.
Meetings existieren oft deshalb, weil Menschen sich gegenseitig auf denselben Stand bringen müssen.
Spezifikationen und PRDs existieren, weil die Person, die etwas will, und die Person, die es baut, nicht denselben Kontext haben.
Code Reviews sind nicht nur Qualitätskontrolle. Sie sind auch Vertrauensmechanik zwischen Menschen.
Handoff-Dokumente existieren, weil Kontext von einem Kopf in den nächsten geschoben werden muss.
Decks existieren, weil komplexe Lagen in zwanzig Minuten Vorstandstermin passen müssen.
Wenn man das einmal nüchtern anschaut, wird schnell klar: Ein erheblicher Teil moderner Wissensarbeit ist nicht die Arbeit selbst. Es ist Koordination um die Arbeit herum.
Deshalb kreisen die Zahlen zum Koordinationsaufwand seit Jahren um denselben unangenehmen Befund. Microsoft spricht von Kommunikationslast. Asana von Work about Work. Nate B. Jones formuliert es härter: In vielen größeren Organisationen existiert ein relevanter Teil der Rollen vor allem deshalb, weil Übergaben zwischen anderen Rollen gemanagt werden müssen.
Man muss keine exakte Prozentzahl vergöttern, um den Punkt zu sehen.
Die Transmissionsanlage ist riesig geworden.
Drei Phasen, die gerade durcheinanderlaufen
Die Elektromotor-Analogie ist deshalb nützlich, weil sie drei Zustände trennt, die in der AI-Debatte ständig vermischt werden.
Phase 1: Gleicher Prozess, anderes Werkzeug
Das ist der große Elektromotor.
Man nimmt den bestehenden Prozess und schraubt AI an einzelne Stellen. Zusammenfassungen werden automatisch geschrieben. Specs entstehen schneller. Code kommt mit Copilot oder Claude. Support bekommt einen Assistenten. Finance einen Prompt-Workflow.
Das bringt oft etwas: Tempo, Kosten, weniger Fleißarbeit.
Strukturell bleibt aber fast alles gleich. Dieselben Meetings. Dieselben Freigaben. Dieselben Übergaben. Dieselbe Prozesslogik.
Genau deshalb ist Phase 1 so attraktiv. Sie ist leicht zu verkaufen, leicht zu budgetieren und leicht als Effizienzprogramm zu rahmen.
Und genau deshalb wird sie überschätzt.
Phase 2: Gleicher Grundriss, bessere Wege
Hier wird es interessanter.
Einzelne Schritte fallen weg. Rollen verschieben sich. Der Prozess wird neu geschnitten, aber seine Grundarchitektur bleibt erkennbar. Weniger Handoffs. Weniger Wartezeit. Kürzere Schleifen.
Viele gute Unternehmen werden hier landen. Gerade in regulierten Umfeldern, gewachsenen Brownfield-Landschaften und Organisationen mit hoher Prozessbindung ist das kein Mangel, sondern oft der vernünftigste Zustand.
Phase 3: Kleiner Motor an jeder Maschine
Das ist die eigentliche Neuerfindung.
Nicht mehr die Frage: Wie machen wir den bestehenden Prozess effizienter?
Sondern: Welche Teile dieses Prozesses existierten nur, weil Menschen sich wechselseitig Kontext übergeben mussten?
Wenn Agents Kontext halten, Arbeit ausführen und Ergebnisse gegen klar definierte Kriterien prüfen können, braucht man manche dieser Schichten nicht digitalisiert, sondern gar nicht mehr.
Nicht alle. Aber mehr, als den meisten lieb ist.
Was Phase 3 konkret anders macht
Die interessantesten Beispiele der letzten Monate sind nicht deshalb interessant, weil AI Code schreiben kann. Das ist inzwischen fast banal. Interessant ist, was sie mit dem Prozess machen.
StrongDM hat mit seiner sogenannten Dark Factory ein Modell öffentlich beschrieben, in dem ein kleines Team Software über Spezifikationen und Evaluationslogik steuert statt über klassische Sprint- und Review-Infrastruktur. Das eigentlich Neue daran ist nicht die Zahl der erzeugten Zeilen Code. Das Neue ist, dass die Koordinationsschicht massiv dünner wird. Menschen formulieren, begrenzen und prüfen. Die Maschine setzt um.
Karpathys Autoresearch-Primitive zeigt dieselbe Logik in kleiner und roher Form: ein klar abgegrenzter Suchraum, eine maschinenlesbare Aufgabenbeschreibung, eine verifizierbare Metrik, eine Schleife aus Versuch, Auswertung und Anpassung. Kein Meeting-Orchester dazwischen.
Beide Beispiele machen denselben Punkt:
Nicht mehr: Wer kann es bauen?
Sondern: Wer kann präzise genug sagen, was gebaut werden soll, und wer kann zuverlässig beurteilen, ob das Ergebnis gut ist?
Auf Deutsch heißt das: Spec und Evaluation rücken ins Zentrum. Koordination verliert ihren Monopolstatus.
Warum das für viele Unternehmen so unbequem ist
Weil ein erheblicher Teil ihrer gewachsenen Struktur genau um diese Koordinationsfunktion herum gebaut wurde.
Projektmanager koordinieren.
Produktmanager übersetzen.
Engineering Manager synchronisieren.
PMO-Strukturen halten Übergabeketten stabil.
Steering Committees existieren, weil Informationen an jeder Hierarchiestufe anders verpackt werden müssen.
All das verschwindet nicht automatisch. Und schon gar nicht über Nacht. Aber es verliert seinen selbstverständlichen Status.
Wenn die Maschine große Teile der Ausführung übernimmt, wird plötzlich sichtbar, wie viel Organisation nur eine Antwort auf langsame, kontextarme und koordinationsbedürftige menschliche Ausführung war.
Das ist der Moment, in dem Menschen nervös werden.
Nicht nur, weil Jobs unter Druck geraten. Sondern weil Rollen ihren stillen Rechtfertigungsgrund verlieren können. Ein Prozess, der gestern als professionell galt, wirkt morgen wie eine teure Umleitung.
Deshalb werden viele Unternehmen zuerst genau das Falsche tun. Sie digitalisieren die Umleitung. Sie bauen mehr Workflow um einen Prozess, der als Ganzes schon fragwürdig geworden ist.
Das ist Phase 1 in Reinform.
Warum Spec plötzlich das Zentrum wird
In der alten Welt konnte man schlechte Spezifikationen lange kaschieren.
Ein Entwickler stellte Rückfragen. Eine Projektleiterin merkte, dass etwas fehlt. Im Review fiel auf, dass der eigentliche Bedarf anders lag. Eine erfahrene Person schloss die Lücke mit Kontext, Geschmack und Gespräch.
Die Maschine tut das nur begrenzt. Sie füllt Lücken nicht verlässlich mit gesundem Urteil, sondern mit Musterfortsetzung.
Deshalb kippt der Engpass.
Sobald Ausführung schneller und billiger wird, wird schlechte Spezifikation brutal sichtbar. Nicht theoretisch. Operativ. Plötzlich sieht man, wie viel Ambiguität die menschliche Organisation bisher still aufgefangen hat.
Darum ist der Schritt von Phase 1 zu Phase 3 nicht zuerst ein Tool-Thema. Es ist ein Artikulationsthema.
Wer Phase 3 will, muss Anforderungen, Randbedingungen, Qualitätskriterien und Abbruchkriterien sauberer formulieren, als die meisten Organisationen es heute gewohnt sind.
Und direkt dahinter kommt Evaluation.
Denn eine gute Spec ohne gute Prüfung produziert nur schnellere Enttäuschung.
Warum Evaluation kein Nachbau der alten Kontrolle ist
Hier laufen gerade zwei Denkfehler parallel.
Der erste lautet: Wenn Agents bauen, brauchen wir einfach mehr Reviews.
Der zweite lautet: Wenn Agents bauen, können wir auf Reviews verzichten, weil die Maschine ja getestet hat.
Beides greift zu kurz.
Phase 3 bedeutet nicht, dass menschliches Urteil verschwindet. Es bedeutet, dass menschliches Urteil anders eingesetzt wird. Weniger als dauernde Begleitung jedes einzelnen Schritts, mehr als gezielte Definition von Erfolg und Prüfung gegen diesen Erfolg.
StrongDMs Behavioral Scenarios sind deshalb interessant. Nicht weil Scenarios magisch wären, sondern weil sie zeigen, dass Verifikation als eigenes System gestaltet werden muss. Nicht als Nebensatz im alten Prozess. Wer Agents an ihren selbstgeschriebenen Prüfsteinen misst, baut sich nur eine hübschere Form von Selbsttäuschung.
Evaluation wird dadurch zur Infrastruktur. Nicht zum QA-Nachklapp.
Und genau da schließt sich der Kreis zu deinem Modell: Terrain, Intent, Taste, Spec, Evaluation. Wenn Execution billig wird, steigen nicht alle Schichten gleich stark an Bedeutung. Die mittleren und oberen Schichten werden härter, nicht weicher.
Die härteste Grenze heißt nicht Technologie, sondern Kontextreife
An dieser Stelle wird es unerquicklich.
Viele Unternehmen kommen nicht einmal in die Nähe von Phase 3, weil ihnen die Vorstufe fehlt:
maschinenlesbarer Kontext.
Im Text zum falschen Black-Box-Problem ging es darum, dass Organisationen ihr eigenes Terrain und ihren eigenen Intent nicht sauber lesen können. Genau deshalb ist der Elektromotor-Text kein isolierter Ausflug in Prozessdesign. Er hängt an der Frage, ob das relevante Wissen überhaupt in einer Form vorliegt, mit der eine Maschine arbeiten kann.
StrongDM funktioniert nicht, weil dort einfach mutigere Leute sitzen. Es funktioniert, weil Spezifikation und Prüfstruktur ernst genommen werden. Karpathys Primitive funktioniert nur dort, wo Erfolg hinreichend klar messbar ist.
Wer sein kritisches Wissen in Köpfen, PDFs und impliziten Abkürzungen hält, kann Phase 3 bewundern. Er kann sie aber nicht betreiben.
Deshalb ist einer der häufigsten Irrtümer in der AI-Transformation gerade dieser:
Man hält Phase 1 für einen Vorgeschmack auf Phase 3.
In Wahrheit sind das oft zwei verschiedene Welten.
Phase 1 kann mit unklarem Kontext leben, weil Menschen die Lücken schließen.
Phase 3 kann das nicht.
Der DACH-Faktor
Im DACH-Raum wird dieser Umbau langsamer verlaufen als in manchen US-Kontexten. Betriebsräte, Mitbestimmung, stärkere Prozessbindung, gewachsene Qualitätskulturen, Brownfield-Landschaften. All das bremst.
Das ist nicht automatisch ein Nachteil.
Denn dieselben Kräfte, die verlangsamen, erzwingen an manchen Stellen genau die Fragen, die anderswo zu lange übersprungen werden.
Was ist der menschliche Beitrag in diesem Prozess wirklich?
Welche Qualität darf nicht implizit bleiben?
Wo wäre Automatisierung nur eine billigere Fassung falscher Entscheidungen?
Das Problem ist nicht, dass DACH-Unternehmen vorsichtiger sind. Das Problem ist, dass viele ihre Vorsicht auf die Technologie richten, nicht auf den Prozess. Sie prüfen das Modell. Sie prüfen die Datenschutzlage. Sie prüfen den Betriebsratskonflikt. Alles legitim. Aber sie prüfen zu selten, ob der zugrunde liegende Prozess überhaupt noch die richtige Form hat.
Dann wird AI zum Werkzeug in einem Betriebssystem, das längst einen Architekturfehler hat.
Drei Fragen, bevor ihr den großen Motor austauscht
Keine Roadmap. Eher ein Diagnoseversuch.
Erstens: Welche Teile eures Prozesses existieren nur, um Kontext zwischen Menschen zu übertragen?
Nicht welche Teile nerven. Welche Teile genau deshalb da sind, weil Wissen sonst nicht von A nach B käme.
Dort liegt das größte Phase-3-Potenzial.
Zweitens: Wo wäre die Organisation ohne diese Transmissionsriemen heute blind?
Wenn ihr ein Meeting, einen Handoff oder einen Review-Zyklus streicht, was geht dann verloren? Reine Synchronisation? Oder Urteil, Vertrauen, Geschmack, Machtbalance?
Diese Unterscheidung entscheidet, was eliminiert, was umgebaut und was bewusst erhalten werden sollte.
Drittens: Könnt ihr einen relevanten Workflow auf Spec plus Evaluation reduzieren?
Nicht das ganze Unternehmen. Einen Workflow.
Wenn diese Reduktion sofort absurd wirkt, liegt das meist an einem von drei Dingen: fehlendem Kontext, unklarer Spec oder nicht operationalisierter Evaluation. Genau dort liegt dann die eigentliche Arbeit.
Wo ich falsch liegen könnte
Drei Einwände gegen mein eigenes Argument. Sie sind nicht kosmetisch.
Erstens: Nicht jeder Prozess ist nur Koordinationsabfall. Retrospektiven können psychologische Sicherheit erzeugen. Pairing kann Ausbildung sein. Reviews können Geschmack kalibrieren. Manche Reibung ist kein Fehler, sondern Qualitätssicherung. Wenn man zu aggressiv zwischen Wertschöpfung und Overhead trennt, streicht man am Ende nicht Bürokratie, sondern Lern- und Urteilssysteme.
Zweitens: Phase 3 ist für viele Unternehmen auf absehbare Zeit kein realistisches Zielbild. Brownfield-Realitäten, Regulatorik, Sicherheitsanforderungen und institutionelles Gedächtnis sind keine Fußnoten. In solchen Kontexten kann der Versuch, den kleinen Motor an jede Maschine zu schrauben, mehr zerstören als verbessern. Dann ist Phase 2 nicht Feigheit, sondern Professionalität.
Drittens: Ich könnte den Zeithorizont unterschätzen. Es ist gut möglich, dass viele Unternehmen viel länger mit hybriden Prozessformen leben, als die Analogie suggeriert. Der große Motor verschwindet vielleicht nicht schnell, sondern bleibt noch Jahre parallel stehen. Wenn das so ist, ist der eigentliche Engpass nicht die radikale Neuerfindung, sondern die Fähigkeit, alte und neue Koordinationsformen über längere Zeit nebeneinander zu betreiben.
Trotzdem ändert das den Kernpunkt nicht.
Viele Unternehmen halten heute Prozesse für unverzichtbar, die in Wahrheit Workarounds für einen alten Antrieb sind.
Sie werden diese Prozesse nicht los, indem sie sie effizienter machen.
Sie werden sie erst los, wenn sie erkennen, wofür sie gebaut wurden.
Der Produktivitätssprung des Elektromotors kam nicht aus der Steckdose.
Er kam in dem Moment, in dem jemand begriff, dass Wellen und Riemen nicht zur Natur der Fabrik gehörten. Sie gehörten zum alten Antrieb.
Genau dort stehen Unternehmen jetzt mit AI.
Die meisten tauschen gerade den Motor aus und lassen das Getriebe stehen.
Die interessantere Frage ist nicht, wer mehr Automation einkauft.
Die interessantere Frage ist, wer den Mut hat, die Transmissionsriemen zu demontieren.
Direkt anwenden
Dieses Prompt Kit übersetzt die Konzepte des Essays in konkrete Prompts, die du sofort nutzen kannst.
Zum Prompt Kit