Wie lange darf Ihre KI allein arbeiten?

Warum die Frage nach der „Leinenlänge“ zur wichtigsten Führungsfrage im KI-Zeitalter wird — und wie Sie sie für Ihr Unternehmen beantworten.


Stellen Sie sich vor, Sie stellen einen neuen Mitarbeitenden ein. Am ersten Tag lassen Sie ihn kaum etwas allein entscheiden. Nach drei Monaten prüfen Sie nur noch die Ergebnisse. Nach drei Jahren führt er/sie ein eigenes Team, und Sie sehen sich im Quartalsgespräch. Was da wächst, ist Autonomie — und mit ihr die Frage, wie viel Vertrauen und wie viel Kontrolle angemessen sind.

Genau diese Frage stellt sich gerade neu. Nicht für Menschen, sondern für KI-Agenten und Roboter. Und sie stellt sich schneller, als vielen Unternehmen lieb ist: Die Zeitspanne, die KI-Systeme am Stück fehlerarm arbeiten können, verdoppelt sich derzeit etwa alle vier bis sieben Monate — das zeigt die Messreihe des Forschungsinstituts METR. Konnte ein KI-Agent 2024 Aufgaben von wenigen Minuten Länge zuverlässig erledigen, sind es heute Aufgaben, für die ein Mensch einen ganzen Arbeitstag oder länger bräuchte. Die Technik gibt der KI eine immer längere Leine. Die Frage ist, ob Ihre Führung mithält.

Drei Grössen entscheiden, wie eng Sie führen müssen

Aus der Forschung zu autonomen Systemen — vom NIST-Framework für unbemannte Systeme bis zu den Betriebsgrenzen selbstfahrender Autos — lässt sich der Kontrollbedarf eines KI-Einsatzes auf drei Grössen verdichten.

Die erste ist die Autonomiezeit: Wie lange arbeitet das System, bevor ein Mensch das Ergebnis prüft? Eine Stunde ist etwas anderes als eine Woche. Die zweite ist die Berechenbarkeit des Umfelds: Eine fest eingerichtete Fertigungszelle ist berechenbar, ein Bahnhofplatz oder ein Social-Media-Kanal nicht. Je häufiger die KI auf Situationen trifft, die sie nie gesehen hat, desto eher irrt sie — und merkt es selbst nicht. Die dritte ist die Konsequenz: Lässt sich ein Fehler per Klick rückgängig machen, oder steht am Ende ein Sach- oder Personenschaden?

Der entscheidende Punkt: Diese drei Grössen verstärken sich gegenseitig. Ein Agent, der acht Stunden unbeaufsichtigt in einem unberechenbaren Umfeld mit physischen Konsequenzen arbeitet, braucht nicht „etwas mehr“ Kontrolle als derselbe Agent in der Testumgebung — er braucht eine kategorisch andere: laufende technische Überwachung, Not-Stopp, fälschungssicheres Protokoll, definierte Einsatzgrenzen.

Die vierte Grösse: Regulierung

Dazu kommt, was der Gesetzgeber oder die Unternehmensleitung verlangt. Die EU-KI-Verordnung schreibt für Hochrisiko-Anwendungen wirksame menschliche Aufsicht vor – das betrifft Schweizer KMU, sobald sie Kunden in der EU haben. Wer kritische Infrastrukturen betreibt oder beliefert, unterliegt zusätzlichen Sicherheitsanforderungen. Und je sensibler die Daten, von öffentlich über vertraulich bis geheim, desto strenger die Datenschutz-Pflichten. Die Faustregel ist einfach: Je höher die regulatorischen Anforderungen, desto höher die Governance-Anforderung, unabhängig davon, was die Technik könnte. Regulierung setzt Mindeststandards, die kein noch so guter Benchmark-Wert aushebelt.

Menschen führt man anders als Maschinen

Nun könnte man einwenden: Delegierte Autonomie kennen wir doch. Jede Prokura, jede Budgetkompetenz, jede Zielvereinbarung ist genau das. Stimmt, und der Vergleich ist aufschlussreich, weil er den Unterschied sichtbar macht.

Beim Menschen gilt: je mehr Autonomie, desto mehr Rechenschaft und Verantwortung. Wer mehr entscheiden darf, berichtet mehr, verantwortet mehr, haftet stärker persönlich. Vertrauen entsteht aus Erfahrung und Track Record, es wächst über Jahre und ersetzt schrittweise die Kontrolle. Und es gibt harte Grenzen: Gewisse Führungsaufgaben sind unübertragbar — in der Schweiz etwa die Oberleitung und Finanzverantwortung des Verwaltungsrats nach OR Art. 716a.

Bei der Maschine gilt: je mehr Autonomie, desto mehr Kontrolle und Nachweis. Denn eine Maschine kann keine Verantwortung übernehmen — die bleibt vollständig bei der Geschäftsleitung, egal wie autonom das System agiert. Vertrauen ist hier eine Zahl: Benchmarks, Fehlerstatistik, Testabdeckung. Und es muss laufend neu belegt werden, weil sich Systeme und Umgebungen ändern.

Die Formel „je mehr Autonomie, desto mehr Governance“ gilt für beide. Nur die Währung unterscheidet sich: sozial beim Menschen, technisch bei der Maschine. Leider verwechseln das heute viele Führungskräfte.

Das Dosierungs-Risiko

Beide Register kippen, wenn man sie vertauscht. Zu viel Kontrolle beim Menschen ist genauso ein Risiko wie zu viel Vertrauen bei der KI. Wer Mitarbeitende wie Maschinen überwacht, erstickt Motivation und Eigenverantwortung – die besten Leute gehen, Entscheidungen stauen sich oben. Wer umgekehrt der KI wie einem bewährten Mitarbeiter vertraut, übersieht Fehler, die das System selbst nicht bemerkt. Die Forschung nennt das Automation Bias: Je zuverlässiger ein System meistens ist, desto blinder verlassen wir uns darauf – bis zum Schaden, für den am Ende die Geschäftsleitung geradesteht.

Gute Governance heisst deshalb nicht maximale Kontrolle. Sie heisst: das richtige Mass am richtigen Ort.

Darum verändert sich Führung

Das ist der eigentliche Grund, warum sich Führung im Zeitalter von Digitalisierung und KI verändert. Führungskräfte müssen künftig beide Register beherrschen (mehr über Ambidextrie): Menschen Freiraum geben und ihnen Verantwortung zutrauen – Maschinen dagegen Grenzen setzen, ihre Leistung laufend messen und die Verantwortung behalten, die sich nicht delegieren lässt. Wer nur eines der beiden Register kennt, führt entweder seine Leute wie Roboter oder seine Roboter wie Leute. Beides wird teuer.

Und weil die Leine der KI sich alle paar Monate verdoppelt, ist das keine Frage für „irgendwann“. Der Einsatz, der heute mit einem wöchentlichen Kontrollblick gut geführt ist, arbeitet in zwei Jahren tagelang allein. Die Spielregeln dafür legt man besser heute fest.

Probieren Sie es aus

Wie viel Governance braucht Ihr konkreter KI-Einsatz — der Marketing-Agent, der Kundenservice-Bot, der Transportroboter in der Halle? Unser Autonomy Governance Navigator übersetzt die vier Grössen in eine von vier Governance-Stufen und in eine konkrete Empfehlung: die „Leinenlänge“, also die Zeit, die Ihre KI guten Gewissens allein arbeiten darf, samt Massnahmenpaket. In fünf Minuten, ohne Vorwissen.

Zum Autonomy Governance Navigator

Und wenn Sie die Spielregeln für Ihr Unternehmen festlegen wollen – von der Datenklassifikation bis zur KI-Kompetenzordnung, begleiten wir Sie gern auf dieser Reise. So, wie wir es als Reisebegleiter der digitalen Transformation immer tun: mit Herz und Verstand.



Quellen und Vertiefung: METR, Task-Completion Time Horizons of Frontier AI Models (metr.org) · NIST, Autonomy Levels for Unmanned Systems (ALFUS) · EU AI Act, Art. 14 Menschliche Aufsicht · FH Graubünden, „Minimal Data – Maximum Utility: Ermittlung der optimalen Datengranularität für generativen KI-Einsatz in Schweizer Unternehmen“ (Mathis/Klinkhammer) · World Economic Forum, Why governance is the new infrastructure for physical AI (2026). Dieser Beitrag ist keine Rechtsberatung.


Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert