KI-Agenten9 Min. Lesezeit

5 Stufen der KI-gestützten Softwareentwicklung: Wo stehst du?

Andrej Karpathy hat vor Kurzem 342 Jobs bewertet und danach einsortiert, wie stark KI sie verändern oder verdrängen wird. Das Ergebnis: Softwareentwickler landen bei 8 bis 9 von 10 (Quelle: Deeper Insights / Karpathy, 2026). Wenig überraschend und gleichzeitig erschreckend.
Das klingt bedrohlich, heißt aber vor allem, dass sich die Jobs transformieren, nicht dass sie verschwinden. Anders wird es auf jeden Fall.

Ich persönlich glaube auch, dass der Job „Programmierer“ Geschichte ist. Beim „Softwareentwickler“ wird sich das klassische Berufsbild zu großen Teilen auflösen, weil der reine Code-Output zunehmend von AI übernommen wird. Was bleibt und sogar wichtiger wird: menschliches Urteilsvermögen bei Architekturen und komplexen Zusammenhängen, Kommunikation mit Stakeholdern, das Übersetzen zwischen Business und Technik. Der Job verschwindet nicht, er verwandelt sich in eine Rolle, die deutlich mehr Abstimmung, mehr Menschliches zu Menschlichem erfordert als heute. Nebenbei bemerkt: Karpathy hat im gleichen Artikel einen Dachdecker bei weniger als 2 einsortiert. Das zeigt die Schere zwischen den Jobs und wie unterschiedlich exponiert wir da sind.

Ich beschäftige mich seit Jahren mit dem Thema und habe im letzten Jahr meine gesamte Arbeitsweise auf agentische Arbeit umgestellt. Es gibt inzwischen zahlreiche Artikel, die Hierarchien und Lernkurven für den KI-Einsatz beschreiben.
Aber die meisten davon gehen aus meiner Sicht am Ziel vorbei. Sie beschreiben nicht, was ich in meinem Alltag tatsächlich sehe. Deswegen habe ich eine eigene Fünf-Stufen-Hierarchie entwickelt. Das Spannende: Viele hängen bei Stufe 1 oder 2 fest, vielleicht bei 2,5 dank Copilot. Aber Stufe 4 und 5 sind es, wo es wirklich interessant wird.

Die meisten sind hierDer echte Hebel

Copy-Paste-Prompts

Generischer Output, kein Kontext

Strukturierte Templates

Gute Artefakte, manueller Aufwand

Templates + Projekt-DNA

Konsistent, klingt nach dir

KI-Agenten mit Werkzeugen

Autonome Workflows, selbstkorrigierend

Autonome Agenten-Teams

Geteilter Kontext, wachsendes Wissen

Der "Schutzgraben" ist dein Urteilsvermögen, nicht Geschwindigkeit

Stufe 1: Der Einzeiler

Stufe 1 ist simpel: Du öffnest ChatGPT, stellst eine Frage, bekommst ein Ergebnis. Im schlechtesten Fall ist die KI hier eine bessere Suchmaschine. Klar, du kannst sagen „schreib mir eine Zusammenfassung“ oder „schreib mir einen Instagram Post“. Das Problem: Die KI kennt dein Projekt nicht, es gibt keinen Kontext. Das Ergebnis bleibt weit hinter dem zurück, was du eigentlich brauchst.

Aufschlussreich dazu die METR-Studien: In der ersten Runde (Anfang 2025) waren erfahrene Entwickler mit KI 19% langsamer, glaubten aber, sie seien 20% schneller (Quelle: METR, 2025). Im Follow-up von Februar 2026 zeigte sich: Ein Teil der ursprünglichen Entwickler war plötzlich 18% schneller. Erst langsamer, dann schneller. Was sich verändert hat? Die Menschen haben gelernt, wann KI hilft und wann sie im Weg steht. Der Zeitverlust auf Stufe 1 entsteht durch ständiges Nachkorrigieren. Man übernimmt KI-generierte Ergebnisse, denkt, man macht das Richtige, und steht am Ende schlechter da als vorher. Genau das gilt es zu vermeiden.

Stufe 2: Strukturierte Templates

In Stufe 2 wird es deutlich strukturierter. Du nutzt konkrete Template-Prompts: länger, komplexer, mit echtem Kontext. Und häufig noch wichtiger: Sie definieren auch, was du nicht willst. Das hat einen massiven Einfluss auf die Qualität.

Das Problem: Du bist immer noch der Engpass. Du musst die Idee haben, den richtigen Prompt raussuchen, alles in den Chatbot kopieren, absenden, Ergebnis prüfen. Das ist eine Beschleunigung, weil du Aufgaben direkt umsetzt, für die du vorher vielleicht zwei Stunden gebraucht hättest. Hilfreich, aber keine Revolution. Vielleicht eine Evolution.
Und an der Stelle fragt man sich: Wo ist der versprochene Hebel? Es ist nett, es hilft, es spart Zeit. Aber wo ist die eigentliche Veränderung?

Stufe 3: Projekt-DNA

Ab Stufe 3 wird es interessant. Hier stellst du der KI konkreten Kontext bereit: Dateien und Ordner mit Projektwissen, Branding-Kits, Presse-Kits, vergangene Konversationen, dokumentierte Entscheidungen. Die KI antwortet nicht mehr nur auf eine isolierte Frage, sondern auf deine Frage unter Berücksichtigung des Gesamtprojektes. Das verändert die Situation grundlegend, weil du jetzt tatsächlich komplette Aufgaben delegieren und anschließend prüfen kannst.

Das Produktivitäts-Paradox

Hier zeigt sich ein aufschlussreiches Paradox. Der DORA Report belegt: 95% der Befragten nutzen KI, mehr als 80% berichten von Produktivitätsgewinn. Eine weitere Studie bestätigt: 21% mehr Tasks, 98% mehr PRs. Aber die tatsächliche Geschwindigkeit auf Organisationsebene, auf Team-Ebene, auf Projektebene? Der Output blieb nahezu konstant (Quelle: Faros AI / DORA Report, 2025).

Entwickler produzieren doppelt so viel, aber die Gesamtleistung kommt nicht mit. Warum? Meine Vermutung: Es beginnt an den Rändern zu knirschen. Stell dir einen Motor vor, der plötzlich höher dreht, während Getriebe und Antriebsstrang nicht mithalten. Die Geschwindigkeit kommt nicht auf die Straße.

Das KI-Produktivitätsparadox: Mehr Tasks, mehr Pull Requests, aber die Delivery-Geschwindigkeit auf Teamebene bleibt unverändert.

Und genau das ist der entscheidende Punkt: „KI-gestützte Entwicklung“ ist eigentlich ein Missnomer. Es geht nicht nur um KI-getriebene Entwicklung, sondern um eine KI-getriebene Organisation. Das klingt nach einem feinen Unterschied, ist aber fundamental. Denn KI-getriebene Entwicklung ohne eine KI-getriebene Organisation funktioniert nicht: Die Leistung kommt nicht auf die Straße. Du glaubst, du machst das Richtige, versuchst dich zu beschleunigen, aber die Zusatzleistung verliert sich auf dem Weg.

Stufe 4 und 5: Agenten und orchestrierte Teams

Hier entstehen die Agenten, die Möglichkeit, komplette Aufgaben zu delegieren. Und hier entsteht der eigentliche Hebel.

Was heißt KI-getriebene Organisation konkret? Es bedeutet, nicht nur einzelne Agenten zu haben, die isolierte Aufgaben übernehmen, sondern komplette Teams und Abteilungen agentisch aufzubauen. Oder zumindest das Agentische so tief zu integrieren, dass KI fast wie Strom wird: Sie ist einfach da, alles fließt hindurch. An genau dieser Stelle fangen die Bottlenecks an, sich aufzulösen.

Wie sieht das in der Praxis aus? Es gibt Planer-Agenten, Architekten, Implementierungsagenten, Tester, Reviewer. Aber eben nicht nur in der Entwicklung: Auch Design- und Marketingagenten lassen sich in die Organisation einbetten, die wirklich miteinander zusammenarbeiten. Anthropics „Agentic Coding Trends Report 2026“ beschreibt genau diese Entwicklung: Agenten arbeiten nicht mehr minutenlang an isolierten Aufgaben, sondern stundenlang an ganzen Systemen (Quelle: Anthropic, 2026).

Konkretes Beispiel: Ein Feature-Request „Kundenverwaltung mit Rollenkonzept“. Der Research-Agent analysiert die aktuelle Codebase: Wo docken wir an, welche Elemente existieren bereits? Dann übernimmt der Architekt, erstellt einen Entwicklungsplan, prüft welche Module betroffen sind und verwebt die Erweiterung mit der „Projekt-DNA“: dokumentierte Entscheidungen, Projekthistorie, Architektur-Prinzipien. Danach wird umgesetzt, getestet, reviewed und automatisch durch eine QA-Vorababnahme geschleust. Die finale Abnahme sollte menschlich sein, aber wo genau man diesen Schnitt macht, ist eine eigene Diskussion.

Feature-Request

“Kundenverwaltung mit Rollenkonzept”

Research-Agent

Analysiert Codebase + externe Quellen

Architektur-Agent

Entwirft Plan aus der Projekt-DNA

parallel

Implementierungs-Agent

Schreibt Code nach Konventionen

Test-Agent

Generiert Tests parallel

parallel

Review-Agent

Prüft Qualität + Konsistenz

QA-Agent

Validiert Anforderungsabdeckung

Mensch entscheidet

Strategischer Checkpoint: freigeben, anpassen oder umlenken

Projekt-DNA

Architekturprinzipien, Coding-Konventionen, Domänenwissen

Architektur

Implementierungs

Review

Projekt-DNA: Architekturprinzipien, Coding-Konventionen, Domänenwissen

Menschen steuern das Ergebnis, nicht die Schritte

Keiner dieser Agenten ist allwissend. Jeder macht genau das, wofür er spezialisiert ist und wofür er das nötige Wissen kapselt. Das System kann über die Zeit lernen: Skills verfeinern, Metriken abzweigen, Feedback-Schleifen einbauen. Der Gestaltungsspielraum ist enorm.

Was die Stufen voneinander trennt

Unter Stufe 3 ist der Vorteil reine Geschwindigkeit: Du erledigst Aufgaben schneller, aber immer noch selbst. Ab Stufe 3 ändert sich das fundamental. Es geht nicht mehr darum, schneller zu arbeiten. Es geht darum, Aufgaben an das KI-System zu delegieren.

Und hier liegt die entscheidende Unterscheidung: Es ist das menschliche Urteilsvermögen, das den Ausschlag gibt. Das Urteilsvermögen, das sagt: „Der Plan gefällt mir“ oder „Die Lösung nehme ich ab.“ Als Mensch musst du natürlich auch noch wissen, was du tust, gelinde gesagt.

Du kannst versuchen, dein Wissen zu abstrahieren, dein Urteilsvermögen in Pipelines zu packen und daraus fast fabrikartig Ergebnisse produzieren zu lassen. Aber es bleibt das menschliche Urteil, der menschliche Geschmack, der das Quality Gate bildet, das die Maschine zu erfüllen hat.

Vergleichbar mit Rick Rubin, dem Musikproduzenten: Er spielt keine Instrumente, aber weiß genau, was er will. Jedes Album klingt nach seiner Vision. Das ist der Kern ab Stufe 3: Du machst es nicht mehr selbst, du delegierst. Aber es ist deine Vision, dein Warum, das die Entscheidungen trifft und das Quality Gate setzen sollte.

Ohne diese menschliche Steuerung landet man im berüchtigten AI-Slop: Masse ohne Substanz, weil die Maschine produzieren kann, aber nicht beurteilen. Natürlich kann eine KI große Mengen Source Code schreiben. Das heißt nicht, dass er gut ist. Es ist das Zusammenspiel zwischen Mensch und Maschine, das zählt. Wie Rick Rubin, der weiß, welche Emotion die Musik auslösen soll. Genau das Gleiche gilt in der Softwareentwicklung.

Laut World Economic Forum sagen 37 Prozent der Entwickler, KI habe ihre Karrieremöglichkeiten bereits erweitert (Quelle: World Economic Forum, 2026). Die Bereitschaft ist da. Was fehlt, ist der Sprung vom Werkzeug zum System.

Konkrete nächste Schritte

Wie kommt man da hin? Der einfachste erste Schritt: Setz dich einen Nachmittag hin und schreib Templates. Weg von „Erzeuge mir einen Text für...“, hin zu konkreten Vorgaben: Was soll das Ergebnis enthalten, was explizit nicht?

Der nächste Schritt: Was fehlt in diesen Templates? Wo steckt gemeinsames Wissen über dein Unternehmen, dein Projekt, deine Brand? Was sind deine stilistischen Mittel? Dieses Wissen zu abstrahieren ist der eigentlich anspruchsvolle Teil. Aber wenn du es geschafft hast, ergibt die Kombination aus abstrahiertem Wissen und Template-Prompts deutlich spezifischere Ergebnisse.

Danach wird es technischer: Welche einzelnen Aufgaben habe ich? Was müsste konkret passieren? Welche Module sind betroffen, welche Funktionen werden aufgerufen? Für Stufe 4 und 5 muss das systematisch aufgearbeitet und zu Pipelines orchestriert werden. In Stufe 5 kommt hinzu, dass das System ein Gedächtnis bekommt: selbst lernende Systeme, automatisches Feedback, kontinuierliche Selbstoptimierung.

Das Zeitfenster

Wer jetzt bei Stufe 3 oder darüber steht, gehört zur Minderheit. Genau darin liegt die Chance: Der Vorsprung wächst jeden Monat. Sehr viele bleiben bei Stufe 1 und 2 hängen, bei 2,5. Da scheint so etwas wie eine Schallmauer zu sein.

Umso wichtiger ist es, diesen Wandel jetzt anzugehen. Den Wandel von „ich arbeite selbst, nur schneller“ zu „ich delegiere, prüfe und bin das Herz und die Seele meiner Arbeit.“ Das ist eine grundlegend andere Arbeitsweise mit zwei Komponenten: das Handwerk zu lernen und diese neue Denkweise zu verinnerlichen. Das passiert nicht über Nacht. Genau deshalb lohnt es sich, jetzt anzufangen, damit die eigene Lernkurve in Gang kommt.

Passend zum Thema

Hol dir den kostenlosen KI-Starter-Guide: 10 konkrete Wege, wie du KI ab morgen produktiv einsetzt.

Hat dich dieser Artikel auf eine Idee gebracht? Beschreib mir, was du vorhast.

Projekt beschreibenFolge mir auf Instagram