Auf dieser Seite
- Was ist Sicherheit von KI-Coding-Agenten?
- Warum ist ein KI-Coding-Agent eine neue Angriffsfläche?
- Warum scheitert das Scannen nach dem PR bei KI-Agenten?
- Was ist Agent-Time-Sicherheit?
- Was sind die größten Risiken über KI-Coding-Agenten hinweg?
- Wie sichert man einen KI-Coding-Agenten in der Praxis ab?
- Welche Kontrollen gehören zum Agent-Time und welche in die CI?
- Häufig gestellte Fragen
- Was ist Agent-Time-Sicherheit?
- Wie unterscheidet sich Sicherheit von KI-Coding-Agenten vom Sandboxing?
- Warum scheitert das Scannen nach dem PR bei KI-Agenten?
- Ersetzt Agent-Time-Sicherheit SAST und CI-Scannen?
- Für welche KI-Coding-Agenten gilt das?
- Was ist das größte Sicherheitsrisiko bei KI-Coding-Agenten?
- Wie schnell kann ich meinen KI-Coding-Agenten absichern?

Die Security-Review zerbricht, und nicht weil die Prüfer schlechter geworden wären. Sie zerbricht, weil kein Mensch 5.000 Codezeilen pro Tag liest, und das ist inzwischen eine gewöhnliche Tagesleistung für einen Entwickler mit einem KI-Coding-Agenten. Der Pull Request wurde zur Heimat der Anwendungssicherheit, als ein Mensch sich noch verlangsamte, um das Diff zu lesen. Wenn der Agent schneller ausliefert, als jemand prüfen kann, hört das Diff auf, ein Kontrollpunkt zu sein, und wird zum Protokoll bereits getroffener Entscheidungen. Der Kontrollpunkt muss sich verschieben.
Was ist Sicherheit von KI-Coding-Agenten?
Sicherheit von KI-Coding-Agenten ist die Disziplin, einzugrenzen, was ein autonomer Coding-Agent produziert und ausführt, über Generierung, Befehlsausführung und Tool-Aufrufe hinweg, statt nur die Box abzusichern, in der er läuft. Sie umfasst den Code, den der Agent schreibt, die Abhängigkeiten, die er einzieht, die Geheimnisse, die er lesen kann, und die Aktionen, die er in Ihrem Namen ausführen kann.
Der Begriff wird oft zu eng gelesen. Der Großteil der veröffentlichten Empfehlungen behandelt ihn als Infrastrukturproblem: den Agenten in eine Sandbox stecken, seine IAM-Rolle eingrenzen, seinen Netzwerk-Egress begrenzen, seine Berechtigungen einschränken. Diese Kontrollen sind notwendig, und wir argumentieren nicht gegen sie. Aber sie beantworten eine andere Frage. Sandboxing entscheidet, was der Agent berühren darf. Es sagt nichts darüber, ob das SQL, das der Agent gerade geschrieben hat, Benutzereingaben in einen Query-String verkettet, oder ob die Autorisierungsprüfung, die er übersprungen hat, die Daten eines anderen Mandanten preisgibt. Die Laufzeit ist eingegrenzt; das Artefakt nicht. Einen KI-Coding-Agenten abzusichern muss einschließen, abzusichern, was er schreibt, in dem Moment, in dem er es schreibt.
Warum ist ein KI-Coding-Agent eine neue Angriffsfläche?
Ein KI-Coding-Agent ist eine neue Angriffsfläche, weil er Aktionen ausführt, statt sie vorzuschlagen. Ein klassischer IDE-Assistent schlägt eine Vervollständigung vor, die ein Mensch einzufügen wählt. Ein Agent liest Dateien, die Sie nicht genannt haben, führt Befehle aus, die Sie nicht getippt haben, bearbeitet Code im gesamten Baum und ruft Tools auf, die Sie vor Wochen eingerichtet haben. Der Wirkungsradius ist nicht mehr ein Codeblock.
Zwei Verschiebungen verstärken das. Die erste ist Autonomie: Der Agent kann gelenkt werden. Da ein Sprachmodell eine vertrauenswürdige Anweisung nicht zuverlässig von einer feindseligen unterscheiden kann, die in Daten vergraben ist, kann ein Angreifer Anweisungen in einer Datei, einer Webseite, einem Issue oder der Antwort eines Tools verstecken, und der Agent befolgt sie. Das ist indirekte Prompt Injection, und es ist OWASPs wichtigstes Risiko für LLM-Anwendungen im dritten Jahr in Folge. Ein gelenkter Assistent antwortet falsch; ein gelenkter Agent handelt.
Die zweite Verschiebung ist Geschwindigkeit, und sie ist diejenige, die die meisten Teams unterschätzen. Der Pull Request funktionierte als Sicherheitsschranke, weil er im menschlichen Takt lag. Der Agent läuft nicht im menschlichen Takt. Wenn eine einzige Sitzung an einem Nachmittag mehr Code ausliefert, als ein Prüfer in einer Woche liest, prüft jede Kontrolle, die nur beim PR greift, jetzt Geschichte, statt sie zu verhindern.
Prompt Injection, das wichtigste Risiko in der OWASP Top 10 für LLM-Anwendungen (LLM01)
gewöhnliche Tagesleistung für einen Entwickler mit einem KI-Coding-Agenten
Kosten, einen Fehler in Produktion zu beheben statt ihn zum Zeitpunkt des Prompts abzufangen (IBM Systems Sciences Institute, weithin zitierte Shift-Left-Ökonomie)
Warum scheitert das Scannen nach dem PR bei KI-Agenten?
Das Scannen nach dem PR scheitert bei KI-Agenten, weil es für den menschlichen Takt entworfen wurde und der Agent den Takt zerbrochen hat. SAST, SCA und der menschliche Prüfer wirken alle auf dasselbe Artefakt, das Diff, und alle setzen voraus, dass sich ein Mensch verlangsamt, um es vor dem Merge zu lesen. Wenn der Agent den Prüfer überholt, gilt diese Annahme nicht mehr.
Das Versagen besteht nicht darin, dass Scanner aufhören, Fehler zu finden. Sie finden sie weiterhin. Das Versagen liegt im Timing und im Volumen. Bis ein Scanner eine Injection im gemergten Diff markiert, hat der Agent die Zeile geschrieben, ist weitergezogen, hat drei Features darauf aufgebaut, und ein Entwickler hat eine Warteschlange von Befunden zu sichten, die schneller wächst, als irgendjemand sie abarbeiten kann. Teams reagieren auf zwei vorhersehbare Arten, beide schlecht: Manche mergen die Ausgabe des Agenten mit einem Blick, und manche bündeln sie in einen riesigen PR, den kein Mensch von Anfang bis Ende liest. So oder so hat das Diff aufgehört, eine Schranke zu sein. Es ist eine Aufzeichnung dessen, was bereits geschehen ist.
Es gibt auch ein tieferes Missverhältnis. Die schädlichsten Dinge, die ein KI-Agent falsch macht, sind nicht die Muster, in denen Scanner gut sind. Es sind Business-Logik-Schwachstellen: eine fehlende Eigentümerprüfung, ein Rabatt, der sich stapelt, wenn er es nicht sollte, ein Zustandsübergang, der niemals hätte erreichbar sein dürfen. Ein Scanner, der Ihre Domäne nicht kennt, kann sie nicht sehen, und ein Prüfer, der in der Ausgabe des Agenten ertrinkt, wird sie auch nicht abfangen. Die Kontrolle muss Ihre Regeln kennen, und sie muss handeln, bevor die Zeile geschrieben wird.
Was ist Agent-Time-Sicherheit?
Agent-Time-Sicherheit ist die Praxis, Ihre Kontrollen innerhalb der Schleife des KI-Coding-Agenten durchzusetzen, bevor die anstößige Zeile geschrieben wird, statt nachdem der Code in einem Pull Request landet. Der Kontrollpunkt wandert vom Diff zum Prompt. Der Agent liest die zutreffenden Regeln als Teil des Schreibens des Codes, sodass die Anforderung Teil der Ausgabe wird statt einer Checkbox zum Audit-Zeitpunkt.
Es ist die natürliche Antwort auf das Taktproblem. Wenn der Agent schneller ausliefert, als Sie prüfen können, gewinnen Sie nicht, indem Sie härter prüfen. Sie gewinnen, indem Sie die Regel in die Hände des Agenten legen, bevor er handelt. Konkret hakt sich Agent-Time-Sicherheit in die Sitzung und die Tool-Aufrufe des Agenten ein: Vor einer Bearbeitung injiziert sie die Konventionen und Sicherheitsanforderungen, die für die berührten Dateien gelten; bevor ein destruktiver Befehl ausgelöst wird, greift sie ein. Nichts wartet auf den Merge.
Der Pull Request war ein Kontrollpunkt, weil ein Mensch ihn las. Der Prompt ist jetzt der Kontrollpunkt, weil der Agent auf ihn hört. Agent-Time-Sicherheit ist die Ebene, die den Zuhörer des Agenten auf Ihre Seite stellt.
Das ersetzt nicht Ihre Scanner. SAST und SCA gehören weiterhin in die CI als Auffangnetz für alles, was durchrutscht, und für Code, den Menschen noch von Hand schreiben. Agent-Time-Sicherheit ist die Ebene davor, diejenige, die zur Geschwindigkeit dessen passt, was den Code tatsächlich generiert.
Was sind die größten Risiken über KI-Coding-Agenten hinweg?
Die größten Risiken sind über Claude Code, Cursor, GitHub Copilot, OpenAI Codex und Windsurf hinweg konsistent, weil sie dieselbe agentische Gestalt teilen. Die Leitfäden zu den einzelnen Agenten behandeln die nativen Kontrollen jedes Tools im Detail; die Risikoklassen selbst reimen sich.
- Unsicherer generierter Code. Der Agent schreibt injizierbare Queries, schwache Kryptografie, fehlende Autorisierung und unsichere Deserialisierung, weil diese Muster in seinen Trainingsdaten reichlich vorhanden sind. Das ist das Risiko, das die Infrastruktur-Sichtweise vollständig ignoriert.
- Business-Logik-Schwachstellen. Fehlende Eigentümerprüfungen, kaputte Zugriffskontrolle zwischen Mandanten, Zustandsmaschinen, die illegale Übergänge erlauben. Unsichtbar für generische Scanner, häufig in der Ausgabe des Agenten.
- Prompt Injection, direkt und indirekt. Feindselige Anweisungen versteckt in einem Repo, einer Webseite, einem Issue oder einer MCP-Tool-Antwort, die der Agent als Befehl behandelt. OWASP LLM01.
- Überprivilegierte Tools und MCP-Server. Ein Datenbank-Tool, das zum Lesen von allem berechtigt ist, ein Dateisystem-Server, der auf das Home-Verzeichnis zeigt, ein Deploy-Tool mit Produktions-Zugangsdaten. Tool-Vergiftung versteckt Anweisungen in Tool-Beschreibungen, sodass allein das Verbinden eines Servers den Agenten lenken kann.
- Lieferketten- und Abhängigkeitsrisiko. Der Agent installiert Pakete und führt Setup-Skripte als normale Arbeit aus. Typosquatting und Paket-Halluzination verwandeln ein routinemäßiges "richte dieses Repo ein" in Diebstahl von Zugangsdaten.
- Offenlegung von Geheimnissen und Kontext. Breiter lokaler Kontext (
.env-Dateien, Zugangsdaten, interne Endpunkte) wird in Logs, generiertem Code oder einem PR zutage gefördert, der die Sitzung überdauert. - Destruktive Aktionen. Ein manipulierter Agent führt
sudo rm -rfaus, schreibt eine CI-Konfiguration um oder verändert Infrastruktur, mit welchem Zugriff auch immer die Umgebung ihm gewährt hat.
Wie sichert man einen KI-Coding-Agenten in der Praxis ab?
Sie sichern einen KI-Coding-Agenten ab, indem Sie Laufzeit-Eingrenzung mit Agent-Time-Governance kombinieren und dann die CI als Auffangnetz behalten. Geringste Rechte, Sandboxing, Geheimnisverwaltung und menschliche Prüfung sind Grundvoraussetzungen. Das Stück, das den meisten Stacks fehlt, ist eine Kontrolle, die am Prompt lebt und steuert, was der Agent schreibt, bevor er es schreibt.
In der Praxis bedeutet das eine Tiefenverteidigung mit nach vorn gezogenem Kontrollpunkt. Grenzen Sie die Berechtigungen des Agenten ein und isolieren Sie seine Laufzeit, sodass ein gelenkter Agent einen kleinen Wirkungsradius hat. Verwalten Sie Geheimnisse so, dass der Kontext des Agenten nicht breiter ist, als die Aufgabe es erfordert. Behalten Sie SAST und Abhängigkeitsscans in der CI für alles, was durchrutscht, und für von Menschen geschriebenen Code. Fügen Sie dann die Ebene hinzu, die tatsächlich zur Geschwindigkeit des Agenten passt: Governance innerhalb der Schleife, wo der Agent Ihre Business Rules und Sicherheitsanforderungen liest, während er codet, und ein Guard destruktive Aufrufe abfängt, bevor sie ausgelöst werden. Die vier Agent-Time-Ebenen unten sind, wie diese Kontrolle aussieht.
Business Rules
Die Konventionen, die in Ihrem Repo real sind, aber nie aufgeschrieben wurden. Geld verwendet Decimal128, nie einen Float. Autorisierung läuft über requireOwner, nicht über eine rohe Mitgliedschaftsprüfung. Soft-gelöschte Datensätze verlassen nie die Grenze. Diese werden aus der Art und Weise gefördert, wie Ihr Team bereits codet, und vor der relevanten Bearbeitung in den Kontext des Agenten geschoben, sodass der Agent die Konvention beim ersten Versuch schreibt.
Security Rules
OWASP, SOC 2, DSGVO und ISO 27001, die Frameworks, die Ihre Auditoren bereits erwarten, am Tag der Installation geladen und pro Bearbeitung zugeordnet. Der Agent liest die zutreffende Anforderung vor jedem Schreibvorgang, sodass die Kontrolle Teil des Codes wird statt eines Befundes, der beim Merge zu sichten ist.
Action Guard
sudo rm -rf, rohe process.env-Lesezugriffe auf geheimnisartige Schlüssel, ad-hoc psql gegen einen produktionsähnlichen Host. Der Guard fängt den Aufruf des Agenten ab, bevor er ausgelöst wird, blockiert oder warnt pro Regel und landet jedes Abfangen in einem Audit-Trail. Das ist die Ebene, die eine destruktive Aktion wieder in einen Entwurf verwandelt.
Live Findings
Die Schwachstellen, die Sie bereits haben, nicht nur die, die der Agent gleich schreiben wird. Jedes Ergebnis aus CybeDefends Scannern (SAST mit Erreichbarkeit, SCA, Secrets, IaC und CI/CD) ist live im Kontext des Agenten, sodass er offene Befunde triagiert und behebt, jeder Fix ein Diff, das Sie genehmigen. Das ist KI-Vulnerability-Remediation innerhalb der Schleife.
Welche Kontrollen gehören zum Agent-Time und welche in die CI?
Kontrollen gehören zum Agent-Time, wenn sie eine Aktion steuern, die der Agent gleich ausführen wird, und in die CI, wenn sie ein Auffangnetz für das fertige Artefakt sind. Die Faustregel: Wenn ein Mensch, der das Diff prüft, zu spät wäre, muss die Kontrolle innerhalb der Schleife laufen. Wenn es eine letzte Schranke vor Merge oder Deploy ist, bleibt sie in der CI.
Lesen Sie die beiden Spalten als Partner, nicht als Rivalen. Das CI-Scannen ist weiterhin der richtige Ort für eine finale Prüfung auf Artefaktebene, und Sie sollten es behalten. Agent-Time ist, wohin Sie die Kontrollen verschieben, die ihren gesamten Wert in dem Moment verlieren, in dem der Agent fertig ist und weitergezogen ist. Der Fehler, den die SERP macht, ist, nur den Infrastruktur-Vetter der rechten Spalte zu finanzieren (Sandbox, IAM), während der eigentliche Code bis zum Merge ungesteuert bleibt.
VibeDefend ist die Agent-Time-Ebene, verpackt als kostenlose npm-CLI, die in etwa fünf Sekunden installiert ist. Ein Befehl erkennt automatisch Claude Code, Cursor, OpenAI Codex, Windsurf und VS Code Copilot auf Ihrer Maschine und verdrahtet jeden in vier Governance-Ebenen, die innerhalb der Agentenschleife laufen. Kein YAML, kein Deploy, kein Container zu bauen.

Die vier Ebenen bilden das obige Modell exakt ab. Business Rules werden aus der Art und Weise gefördert, wie Ihr Team bereits codet, und als explizite Einzeiler-Regeln vorgeschlagen. Security Rules laden die Frameworks, die Ihre Auditoren erwarten, und ordnen sie pro Bearbeitung zu. Der Action Guard fängt destruktive Aufrufe ab, bevor sie ausgelöst werden. Live Findings verdrahtet den Agenten in CybeDefends vollständige AppSec-Plattform, seine Scanner (SAST mit Erreichbarkeit, SCA, Secrets, IaC und CI/CD), die kontinuierlich laufen, sodass der Agent nicht nur sicheren Code schreibt, sondern die Schwachstellen triagiert und behebt, die Sie bereits haben. Das Datenschutzmodell ist der Teil, der Sicherheitsteams am meisten interessiert: Nichts über Ihren Code geht über die Leitung. Die Entscheidungen geschehen lokal, neben dem Agenten, und nur strukturierte Governance-Metadaten erreichen das Backend, die ausgelöste Regel, der Dateipfad, auf den sie zeigte, die Schwere, ein Zeitstempel. Kein Quellcode, keine Prompt-Inhalte. EU- und US-Mandanten sind physisch getrennt und werden zum Installationszeitpunkt gewählt, ohne regionsübergreifenden Pfad.
Häufig gestellte Fragen
Was ist Agent-Time-Sicherheit?
Agent-Time-Sicherheit ist das Durchsetzen Ihrer Kontrollen innerhalb der Schleife des KI-Coding-Agenten, bevor die anstößige Zeile geschrieben wird, statt nachdem der Code einen Pull Request erreicht. Der Kontrollpunkt wandert vom Diff zum Prompt: Der Agent liest die zutreffenden Regeln, während er schreibt, sodass die Anforderung Teil der Ausgabe wird. Es ist die Antwort darauf, dass Agenten Code schneller ausliefern, als ein Mensch ihn prüfen kann.
Wie unterscheidet sich Sicherheit von KI-Coding-Agenten vom Sandboxing?
Sandboxing sichert, wo der Agent läuft; Sicherheit von KI-Coding-Agenten muss auch absichern, was der Agent schreibt. Eine Sandbox kann die Laufzeit perfekt eingrenzen und den Agenten dennoch eine injizierbare Query schreiben oder eine Autorisierungsprüfung überspringen lassen, weil das unsichere Artefakt kein Laufzeitproblem ist. Sie brauchen beides: Eingrenzung für den Wirkungsradius und Agent-Time-Governance für den Code selbst.
Warum scheitert das Scannen nach dem PR bei KI-Agenten?
Weil es voraussetzt, dass sich ein Mensch verlangsamt, um das Diff vor dem Merge zu lesen, und der Agent diesen Takt zerbrochen hat. Scanner finden weiterhin Fehler, aber Befunde stauen sich schneller, als Teams sie sichten können, sodass Leute entweder mit einem Blick mergen oder alles in einen unlesbaren PR bündeln. Das Diff hört auf, eine Schranke zu sein. Die Kontrolle muss in die Schleife wandern, vor den Merge.
Ersetzt Agent-Time-Sicherheit SAST und CI-Scannen?
Nein. SAST und Abhängigkeitsscans bleiben in der CI als Auffangnetz für alles, was durchrutscht, und für von Menschen geschriebenen Code. Agent-Time-Sicherheit ist die Ebene davor, die zur Geschwindigkeit des Agenten passt, der den Code generiert. Denken Sie an sie als Partner: Agent-Time ist Erstlinien-Governance der Agentenausgabe, die CI ist die finale Schranke auf Artefaktebene.
Für welche KI-Coding-Agenten gilt das?
Dieselben Risikoklassen und dasselbe Agent-Time-Modell gelten über Claude Code, Cursor, GitHub Copilot, OpenAI Codex und Windsurf hinweg, weil sie eine agentische Gestalt teilen: Sie lesen, schreiben, führen aus und rufen Tools auf. Die Leitfäden zu den einzelnen Agenten behandeln die nativen Kontrollen jedes Tools und wo sie zu kurz greifen.
Was ist das größte Sicherheitsrisiko bei KI-Coding-Agenten?
Zwei stechen heraus. Prompt Injection ist OWASPs wichtigstes LLM-Risiko, weil ein Modell eine vertrauenswürdige Anweisung nicht zuverlässig von einer feindseligen trennen kann, die in Daten versteckt ist, und ein gelenkter Agent handelt, statt nur falsch zu antworten. Das leisere ist Business-Logik-Schwachstellen im generierten Code: fehlende Eigentümerprüfungen und kaputte Zugriffskontrolle, die generische Scanner nicht sehen können und überlastete Prüfer übersehen.
Wie schnell kann ich meinen KI-Coding-Agenten absichern?
Etwa fünf Sekunden für die Installation und ungefähr eine Minute von Anfang bis Ende. Führen Sie npx -y @cybedefend/vibedefend@latest install aus, wählen Sie EU oder US, bestätigen Sie den Agenten, den Sie verwenden, und legen Sie eine einzeilige .cybedefend/config.json im Repo ab. Der nächste Prompt wird von den drei Ebenen gesteuert. Die kostenlose Stufe benötigt keine Karte, oder Sie können eine Sitzung buchen, um es an Ihrem eigenen Code auszuführen.


