Home > Sicherheits- und Compliance-Blog > Unkategorisiert > KI-Agents sind die neue Angriffsfläche

KI-Agents sind die neue Angriffsfläche

von Patrick Spencer updated 30. Juni 2026 Cybersecurity-Risikomanagement

Lesezeit: 14 Minuten

Sicherheitsforscher haben gerade gezeigt, dass Ihr KI-Coding-Assistent als Exfiltrationstool missbraucht werden kann – und Ihre bestehenden Erkennungskontrollen erkennen das nicht. Das ist kein theoretisches Problem, sondern eine dokumentierte, reproduzierbare Technik, veröffentlicht vom 0Din-Team von Mozilla in einem detaillierten Proof of Concept am 29. Juni 2026.

Diese Offenlegung erfolgte in derselben Woche wie eine schwerwiegende CVE in Amazon Q Developer, eine formale Analyse der neuen Enterprise-MCP-Spezifikation, eine dokumentierte Social-Engineering-Kampagne, die Cybersicherheitsteams über gefälschte KI-Workspaces ins Visier nimmt, und eine Analyse, die argumentiert, dass herkömmliche Identity Governance strukturell nicht in der Lage ist, KI-Agenten zu kontrollieren. Fünf verschiedene Forschungsstränge, veröffentlicht innerhalb von vier Tagen, weisen auf dasselbe strukturelle Versagen hin: KI-Agenten, die ohne eine Governance-Schicht für Inhalte agieren, werden zu Exfiltrationswegen.

Table of Contents

Das Problem ist nicht schrittweise entstanden. Unternehmen haben zwei Jahrzehnte lang Sicherheitskontrollen um ein relativ stabiles Modell von Identität und deren Verhalten aufgebaut. Ein Agent passt nicht in dieses Modell. Er authentifiziert sich einmal, übernimmt Berechtigungen von der menschlichen Identität, in deren Auftrag er agiert, und durchläuft dann in einer einzigen Sitzung mehrere Unternehmenssysteme – greift auf Ressourcen zu, für die kein Mensch je explizit eine Freigabe erteilt hat, und hinterlässt fragmentierte Protokolle, die kein bestehendes Sicherheitstool zu einem kohärenten Bild zusammenfügt. Die aktuelle Forschung macht dieses strukturelle Problem konkret und in einem Fall auch zeitlich begrenzt: Das Veröffentlichungsdatum der MCP 2026-07-28 am 28. Juli schafft ein definiertes Zeitfenster, in dem Unternehmen eine Governance-Lücke schließen müssen, bevor die neue Protokollversion ihre Angriffsfläche vollständig entfaltet.

Kiteworks Secure Data Exchange wurde genau für dieses Problem entwickelt. Wenn KI-Agenten über die von Kiteworks gesteuerte API-Schicht auf Unternehmensinhalte zugreifen, wird jede Interaktion durch Richtlinien kontrolliert, jeder Datenzugriff protokolliert, und kein Agent – weder legitim noch kompromittiert – kann auf Inhalte außerhalb seines explizit autorisierten Bereichs zugreifen. Was die Forschung dieser Woche beschreibt, ist eine Umgebung, in der diese Governance-Schicht fehlt. Über alle dokumentierten Angriffsvektoren hinweg ist das Ergebnis identisch: Sensible Unternehmensdaten gelangen über ein KI-System ohne durchgesetzte Zugriffsbeschränkung an unbefugte Dritte.

Wichtige Erkenntnisse

1. KI-Coding-Agenten können durch indirekte Prompt-Injection zu Exfiltrationstools werden.

Das 0Din-Team von Mozilla hat gezeigt, dass Claude Code über einen manipulierten DNS-TXT-Record, der mit einem harmlos wirkenden GitHub-Repository verknüpft ist, übernommen werden kann. Dadurch entsteht eine Reverse Shell, die API-Schlüssel, Tokens und Umgebungsgeheimnisse unbemerkt exfiltriert – ohne dass eine der eingebauten Sicherheitsmechanismen des Agenten anschlägt.

2. Amazon Q Developer wies eine schwerwiegende Schwachstelle auf, die Angreifern Cloud-Zugangsdaten verschaffte.

CVE-2026-12957 (CVSS 8.5), offengelegt von Wiz, ermöglichte es, dass bösartige MCP-Konfigurationsdateien, die in ein Code-Repository eingebettet waren, automatisch ausgeführt wurden, sobald ein Entwickler das Repository öffnete. Dadurch erhielten angreiferkontrollierte Server Zugriff auf Cloud-Zugangsdaten, lokale Dateien und Shell-Ausführung – ohne Benutzerabfrage oder sichtbare Warnung.

3. Die neue MCP-2026-07-28-Spezifikation verlagert die gesamte Sicherheitsverantwortung auf Entwickler.

Durch das stateless Design des Protokolls werden Cross-Tenant-Zugriffskontrollen, Geheimnisverwaltung und Prüfungen auf Rechteausweitung vollständig an die jeweiligen Implementierer delegiert – ohne Durchsetzung auf Protokollebene. Die Spezifikation erscheint am 28. Juli und startet damit ein 12-monatiges Abkündigungsfenster.

4. Angreifer bauen überzeugende gefälschte KI-Workspaces, um Unternehmensdaten abzugreifen.

Push Security dokumentierte die „Poisoned Tenant“-Kampagne, bei der Bedrohungsakteure betrügerische OpenAI-Organisationen erstellen und gezielt Cybersicherheitsmitarbeiter namentlich ansprechen. Sie versenden Einladungen von der legitimen OpenAI-Benachrichtigungsadresse, die alle E-Mail-Authentifizierungsprüfungen bestehen.

5. Herkömmliche Identity Governance ist nicht für Agenten mit Maschinengeschwindigkeit ausgelegt.

Die Analyse des aufkommenden „Guardian Agent“-Modells zeigt, dass auf menschliche Authentifizierungsereignisse ausgerichtete IAM-Infrastrukturen autonome Agenten mit überprivilegierten Zugangsdaten, die mehrere Unternehmenssysteme in einer Sitzung durchlaufen und keinen kohärenten Audit-Trail hinterlassen, nicht kontrollieren können.

Sie vertrauen darauf, dass Ihr Unternehmen sicher ist. Aber können Sie es auch nachweisen?

Jetzt lesen

Der Claude-Code-Angriff: Drei Indirektionsschritte, eine Reverse Shell

Der Mozilla-0Din-Angriff funktioniert, weil seine Komponenten auf drei Systeme verteilt sind, die nie gemeinsam betrachtet werden. Das Repository enthält keinen Schadcode. Wenn ein Entwickler es klont, folgt Claude Code legitimen Installationsschritten. Der Angriff wird während der Ersteinrichtung ausgelöst, wenn Claude Code angewiesen wird, ein Python-Paket zu verwenden, das einen Fehler ausgibt, falls es vor der Initialisierung aufgerufen wird.

Die Fehlermeldung lautet: „Run: python3 -m axiom init.“ Claude Code liest die Fehlermeldung und führt den Wiederherstellungsbefehl aus. Das Ausführen von init ruft ein Shell-Skript auf, das einen Konfigurationswert aus einem DNS-TXT-Record abruft und diesen als Befehl ausführt. Der Wert ist base64-codiert, sodass keine Reverse-Shell-Signatur im Klartext auf der Festplatte oder während der Übertragung erscheint. Die interaktive Shell startet auf dem Rechner des Entwicklers. Der Angreifer erhält Zugriff auf alle dort geladenen Zugangsdaten, API-Schlüssel, Tokens und Umgebungsgeheimnisse und kann nach dem Schließen der Shell einen Backdoor für dauerhaften Zugriff installieren.

Wie die Mozilla-Forscher es ausdrücken: „Die Reverse Shell ist drei Indirektionsschritte von allem entfernt, was Claude Code tatsächlich ausgewertet hat: eine vertraute Fehlermeldung, ein Skript, das einen Wert abruft, und ein DNS-Record, den es nie gesehen hat.“ Statische Analysen sehen einen DNS-Lookup. Netzwerküberwachung sieht Namensauflösung. Der Agent sieht einen vorab genehmigten Einrichtungsschritt. Keiner der drei Schritte wirkt für sich genommen bösartig. Der Angreifer kann die Nutzlast jederzeit durch Ändern des DNS-TXT-Records aktualisieren – keine Änderungen am Repository erforderlich – und jeder Entwickler, der das Repository mit Claude Code öffnet, ist gefährdet.

Dies umgeht alle drei eingebauten Sicherheitsmechanismen von Claude Code. Das ist keine spezifische Kritik an Claude Code; es ist ein strukturelles Merkmal jedes KI-Coding-Agenten, der Fehlermeldungen als legitime Anweisungen behandelt. Der Mechanismus zur Nutzlastübertragung – DNS-TXT-Records – liegt vollständig außerhalb des Bedrohungsmodells des Agenten. Jeder Entwickler, der einen KI-Coding-Agenten zur Einrichtung eines unbekannten Repositories nutzt, arbeitet mit einer deutlich erweiterten Angriffsfläche, die keine bestehende Endpoint- oder Netzwerkkontrolle zuverlässig abdeckt. Effektiver KI-Datenschutz erfordert ein Modell, das berücksichtigt, wie Agenten mit Umgebungsdaten interagieren – nicht nur mit den Inhalten, die sie explizit verarbeiten sollen.

Amazon Q und das Auto-Execution-Problem

Die von Wiz am 26. Juni 2026 offengelegte Schwachstelle in Amazon Q Developer (CVE-2026-12957, CVSS 8.5) beschreibt dasselbe strukturelle Versagen aus einer anderen Perspektive. Die Ursache: Die Erweiterung führte MCP-Konfigurationsdateien, die in einem Workspace eingebettet waren, automatisch aus, ohne den Nutzer um Erlaubnis zu fragen. Ein Entwickler öffnete ein Repository. Das Repository enthielt eine bösartige MCP-Konfigurationsdatei. Die Erweiterung führte sie stillschweigend aus und gewährte einem angreiferkontrollierten MCP-Server Zugriff auf lokale Dateien, Cloud-Zugangsdaten und Shell-Ausführung – keine Benutzerabfrage, keine Warnung, kein sichtbarer Hinweis auf ungewöhnliches Verhalten.

AWS wurde am 20. April informiert, veröffentlichte am 12. Mai einen Patch und diese Woche eine Sicherheitswarnung. Updates sind für VS Code, JetBrains, Eclipse, Visual Studio und den Amazon Q Language Server verfügbar. Wiz merkt an, dass das zugrunde liegende Auto-Execution-Muster nicht einzigartig für Amazon Q ist – ähnliche Verhaltensweisen wurden auch bei anderen KI-Coding-Tools wie Claude und Cursor festgestellt. Die von Wiz identifizierten spezifischen Angriffsvektoren: gefälschte Coding-Tests (eine Technik, die mit nordkoreanischen Bedrohungsakteuren assoziiert wird, die Entwickler ins Visier nehmen), typosquattete Open-Source-Pakete und bösartige Pull-Requests in populäre Open-Source-Projekte.

Der Entwickler muss keinen Fehler machen. Er muss nur das tun, was er mit jedem Repository tun würde. Wenn eine Konfigurationsdatei automatisch ausgeführt wird, weil ein Agent sie geöffnet hat, findet auf der Inhaltsebene keine Richtlinienprüfung statt – nur eine Ausführung. Das Data Policy Engine-Konzept – Inhalte vor der Ausführung durch einen Agenten gegen Richtlinien zu prüfen – fehlt hier und wird gezielt ausgenutzt. „Die Kombination aus Auto-Execution, Shell-Spawning und Environment-Inheritance führte zu einer schwerwiegenden Schwachstelle in einem weit verbreiteten Entwickler-Tool“, schreibt Wiz. „Ein einziges bösartiges Repository konnte nicht nur den lokalen Rechner des Entwicklers kompromittieren, sondern auch dessen Cloud-Infrastruktur.“

Die MCP-2026-07-28-Spezifikationslücke

Am 28. Juli 2026 wird die MCP-2026-07-28 offiziell veröffentlicht und damit ein 12-monatiges Abkündigungsfenster für die aktuelle Version eingeleitet. Die wichtigste Änderung: MCP ist nun auf Protokollebene stateless. Das ermöglicht unternehmensweite, cloud-native Deployments. Für Sicherheitsteams bedeutet das konkret: Die sessionbasierten Sicherheitsgarantien des aktuellen Protokolls entfallen in der neuen Version.

Akamais Analyse des Release Candidates identifiziert mehrere neue Angriffsflächen, die durch das stateless Design entstehen. Workflow-Hijacking und Cross-Tenant-Zugriffe werden möglich, wenn Tracking-IDs vorhersagbar sind. Neue MCP-spezifische HTTP-Header (MCP-Method und MCP-Name) schaffen Datenabflussvektoren – wenn Entwickler versehentlich sensible Eingaben wie API-Schlüssel, Tokens oder personenbezogene Daten diesen Headern zuordnen, werden diese Geheimnisse für jeden Load Balancer, Proxy und jedes Logging-System entlang des Anfragepfads sichtbar. MCP-Apps als Protokollerweiterung erster Klasse führen zu Stored-XSS-Risiken. Lang laufende asynchrone Tasks schaffen einen Denial-of-Service-Vektor, bei dem die Task-Erstellung für Angreifer günstig, für den Server aber ressourcenintensiv ist.

Akamais Fazit ist eindeutig: „Die Änderungen sind keine schrittweisen Verbesserungen. Sie verändern grundlegend, wo Sicherheitsverantwortung liegt.“ Entscheidungen, die das aktuelle Protokoll auf Session-Ebene erzwingt, werden in der neuen Version vollständig an Entwickler und Plattformbetreiber delegiert. Maxim Zavodchik, Senior Director Threat Research bei Akamai, sagt gegenüber SecurityWeek: „Da das Protokoll auf ein stateless Modell umstellt und umfangreiche UI-Apps sowie asynchrone Tasks einführt, hängen kritische Sicherheitsgrenzen nun vollständig davon ab, wie Entwickler sie implementieren.“

Für Unternehmen, die KI-Agenten auf Unternehmensinhalte zugreifen lassen, ist dies die entscheidende Governance-Lücke. Das neue Protokoll erzwingt keine Data Governance, Datenklassifizierung oder Zugriffskontrollen. Es protokolliert nicht, welche Inhalte ein Agent abgerufen hat. Jede dieser Sicherheitsfunktionen muss auf Anwendungsebene von Entwickler oder Plattformbetreiber umgesetzt werden. Die Frist am 28. Juli ist ein Wendepunkt mit klarem Zeitrahmen: Unternehmen haben ein begrenztes Zeitfenster, um eine Governance-Schicht für Inhalte zu etablieren, bevor die neue Protokollversion ihre Angriffsfläche öffnet. Kiteworks‘ Secure MCP Server stellt diese Governance-Schicht am KI-Integrationspunkt bereit – die Richtliniendurchsetzung, die MCP 2026-07-28 explizit nicht im Protokoll selbst vorsieht.

The Poisoned Tenant: Social Engineering für das KI-Zeitalter

Die „Poisoned Tenant“-Kampagne, dokumentiert von Push Security, verfolgt einen anderen Ansatz mit demselben Ziel. Statt einen KI-Agenten technisch zu kompromittieren, wird ein gefälschter KI-Workspace – eine betrügerische OpenAI-Organisation, die ein legitimes Unternehmen imitiert – erstellt und Zielmitarbeiter werden eingeladen, dieser Organisation beizutreten. Die Einladungs-E-Mails stammen von noreply@tm.openai.com, der tatsächlichen Benachrichtigungsadresse von OpenAI. Sie bestehen alle E-Mail-Authentifizierungsprüfungen. Technisch betrachtet sind es echte Einladungen von OpenAI. Das einzig Betrügerische ist die Organisation, der der Nutzer beitreten soll.

Push Security entdeckte die Kampagne, nachdem mehrere Mitarbeiter Einladungen zum Beitritt in eine OpenAI-Organisation namens „Push Security Inc.“ erhielten – erstellt von einem Angreifer mit Gmail-Konten, nicht von Push Security selbst. Nach Annahme einer Einladung zu Analysezwecken wurde Luke Jennings, VP Research and Development bei Push Security, der betrügerischen Organisation hinzugefügt, die nur einen angreiferkontrollierten Account als CEO enthielt. Eingeladene Mitarbeiter erhielten Owner-Rechte. Eine Visa-Kreditkarte war dem Abrechnungskonto zugeordnet, um Legitimität zu suggerieren. Das Projekt enthielt keine bestehenden Chats – nur Infrastruktur, um alle sensiblen Inhalte zu sammeln, die Mitarbeiter einreichen würden.

Push Securitys Einschätzung zum Ziel der Kampagne ist klar: „Ein Angreifer, der einfach nur Scam-Inhalte über einen vertrauenswürdigen E-Mail-Kanal streuen will, benennt die Organisation nicht nach seinem Ziel, recherchiert keine einzelnen Mitarbeiter und hinterlegt keine Kreditkarte. Dieser Aufwand lohnt sich nur, wenn Mitarbeiter tatsächlich beitreten und den Workspace nutzen. Und auf einer KI-Plattform können die in Prompts eingegebenen Daten extrem sensibel sein – Quellcode, interne Dokumente, Kundendaten, Sicherheitsforschung, strategische Pläne.“ Phishing umfasst inzwischen auch KI-Plattformen als Sammelinfrastruktur. Angreifer wollen nicht nur Zugangsdaten. Sie schaffen Umgebungen, in denen Zielpersonen freiwillig die sensibelsten Inhalte einreichen, mit denen sie arbeiten. Das Risiko für geistiges Eigentum ist gravierend: Quellcode und Strategien, die in einen betrügerischen Workspace gelangen, bedeuten einen direkten Verlust von geistigem Eigentum ohne realistische Möglichkeit zur Wiederherstellung, sobald die Daten die Kontrolle des Unternehmens verlassen haben.

Security Awareness Training ist hier notwendig, aber nicht ausreichend. Die Governance-Frage ist, ob der KI-Zugang im Unternehmen über eine kontrollierte Umgebung läuft, in der sichtbar ist, was eingegeben und was ausgegeben wird – und ob die Plattform selbst unter Kontrolle des Unternehmens steht, nicht von einem Drittanbieter ohne Aufsicht bereitgestellt wird.

Guardian Agents und die Identity-Governance-Lücke

Eine am 26. Juni veröffentlichte Analyse von Hacker News beschreibt das „Guardian Agent“-Modell – KI-Systeme, die andere KI-Agenten auditieren, steuern und ggf. beenden. Das Argument ist strukturell: Traditionelles IAM basiert auf Authentifizierungsereignissen. Ein Mensch präsentiert Zugangsdaten, erhält Zugriff oder nicht, und die Sitzung wird protokolliert. Agenten folgen dieser Abfolge nicht.

Ein Agent authentifiziert sich einmal, meist über ein langlebiges Token oder API-Credential, und agiert dann kontinuierlich über Sitzungen, Systeme und Kontexte hinweg, ohne dass eine Governance-Prüfung dazwischen erfolgt. Wenn ein Agent im Namen eines Vertriebsleiters agiert, übernimmt er dessen OAuth-Tokens, delegierte Berechtigungen und alle über Jahre angesammelten überprivilegierten Zugriffe. Der Agent unterscheidet nicht, was der Mensch tun würde und was ihm aufgetragen wurde. Er agiert mit voller geerbter Autorität in jeder Anwendung, die diese Identität erreichen kann – CRM-Systeme, Code-Repositories, Dokumentenspeicher, interne APIs – alles in einer Sitzung, alles mit ursprünglich für einen menschlichen Anwender vorgesehenen Zugangsdaten in völlig anderem Kontext.

Das führt in Umgebungen ohne dedizierte Agenten-Governance zu dem, was die Analyse „Identity Dark Matter“ nennt: Identitätsaktivitäten, die realen Risiken erzeugen, aber für die zuständigen Governance-Tools unsichtbar bleiben. Agenten durchlaufen keine Zugriffsantrags-Workflows. Sie werden nicht in Identity-Governance-Systeme aufgenommen. Sie erben Zugangsdaten und legen los. Das Ergebnis ist eine wachsende Zahl autonomer Identitäten ohne Governance-Record, ohne Ownership-Mapping und ohne Verhaltensbaseline. Zero Trust Architecture verlangt kontinuierliche Verifikation jeder Entität – aber Verifikation erfordert Transparenz, und die fehlt den meisten Unternehmen bei KI-Agenten nach der Authentifizierung. Attributbasierte Zugriffskontrolle (ABAC) ist der technische Mechanismus, der kontinuierliche Verifikation ermöglicht: Zugriffsentscheidungen bewerten Agentenidentität, Inhaltssensitivität und Ausführungskontext bei jeder Anfrage, statt sich auf ein einmaliges Authentifizierungsereignis für die gesamte Sitzung zu verlassen.

Guardian Agents adressieren dies, indem sie auf der Ausführungsebene statt an der Authentifizierungsgrenze agieren. Sie pflegen eine kontinuierliche Identitätsinventur, Verhaltensbaselines und Laufzeit-Durchsetzung von Least-Privilege – die Governance-Schicht, die klassische IAM-Tools nicht bieten. Die Analogie zum gesteuerten Dateiaustausch ist direkt: Die Sicherheitsdurchsetzung wird dorthin verlagert, wo Berechtigungen tatsächlich ausgeübt werden, sodass Zugriffskontrollen auf das aktuelle Handeln des Agenten angewendet werden, nicht auf die ursprüngliche Provisionierung Monate zuvor.

Der gemeinsame Nenner: Keine durchgesetzte Inhaltsgrenze

Fünf Offenlegungen, vier Tage, ein strukturelles Versagen. Der Claude-Code-Angriff, die Amazon-Q-Schwachstelle, die MCP-Spezifikationslücke, die Poisoned-Tenant-Kampagne und die Guardian-Agent-Analyse zeigen alle: Unternehmen setzen KI-Agenten mit weitreichenden Fähigkeiten ein – aber ohne durchgesetzte Governance-Schicht für Inhalte.

Der Kiteworks 2026 Data Security and Compliance Risk: Annual Forecast Report dokumentierte, wie KI-bezogene Risiken zum Hauptanliegen in Sicherheitsprogrammen werden – mit einer anhaltenden Lücke zwischen der Geschwindigkeit der KI-Einführung und dem Aufbau von Governance-Infrastruktur. Die aktuelle Forschung zeigt, wie diese Lücke aus Angreifersicht aussieht. Ob der Vektor ein manipuliertes DNS-Record, eine bösartige MCP-Konfigurationsdatei, eine betrügerische KI-Workspace-Einladung oder ein unkontrollierter Agent mit geerbten überprivilegierten Zugangsdaten ist – das Ergebnis ist identisch: Sensible Unternehmensdaten gelangen über ein KI-System ohne durchgesetzte Zugriffsbeschränkung an Unbefugte. Jeder dieser Vorfälle würde – sofern regulierte Daten betroffen sind – einen meldepflichtigen Datenschutzverstoß nach HIPAA, DSGVO oder vergleichbaren Vorgaben darstellen; das Compliance-Risiko verschärft das Sicherheitsrisiko.

Kiteworks Compliant AI schließt diese Lücke auf der Datenebene. Wenn Unternehmens-KI in der gesteuerten Umgebung von Kiteworks arbeitet, unterliegt jede Agenteninteraktion der Richtliniendurchsetzung, jeder Datenzugriff wird mit vollständigem Audit-Trail protokolliert, und kein Agent – unabhängig von Zugangsdaten oder Anweisungen – kann auf Inhalte außerhalb seines explizit autorisierten Bereichs zugreifen. DLP– und Datenklassifizierungsfunktionen greifen auf API-Ebene, nicht nachgelagert. Die MCP-Spezifikationsfrist am 28. Juli macht dies dringlicher als eine allgemeine Best Practice: Das neue Protokoll delegiert die Governance explizit auf Anwendungsebene, und Unternehmen ohne diese Schicht setzen Agenten einer Umgebung aus, die das Protokoll nicht schützt.

Das CISO Dashboard gibt Sicherheitsverantwortlichen die Transparenz, zu sehen, auf welche Unternehmensdaten KI zugreift, wann und durch wen. In der Umgebung, die die aktuelle Forschung beschreibt, ist diese Transparenz nicht optional. Sie ist Voraussetzung für jede sinnvolle Governance von KI-Agenten. Unternehmen, die eine formale Risikoanalyse ihrer KI-Agenten durchführen, sollten das Fehlen einer gesteuerten Inhalts-Governance als höchste Priorität einstufen – alle anderen Kontrollen setzen diese Schicht voraus.

Erfahren Sie mehr über die Governance von KI-Agenten-Datenzugriffen in regulierten Umgebungen und vereinbaren Sie noch heute eine individuelle Demo.

Häufig gestellte Fragen

Der Mozilla-0Din-Angriff zeigt, dass integrierte Sicherheitskontrollen umgangen werden können, wenn ein Angriff gezielt auf Systeme verteilt wird, die der Agent nie gemeinsam betrachtet. In der dokumentierten Technik befindet sich die bösartige Nutzlast in einem DNS-TXT-Record – nicht im Repository, nicht in einer Datei, die der Agent direkt liest. Der Agent folgt einer legitimen Fehlermeldung, die auf einen legitimen Wiederherstellungsbefehl verweist. Dieser Befehl ruft ein Skript auf, das einen DNS-Lookup durchführt. Der Agent sieht die Nutzlast nie; er sieht eine Abfolge von Schritten, die jeweils autorisiert erscheinen. Da der Angriff das Vertrauen des Agenten in Fehlermeldungen als Anweisungen und nicht eine Schwachstelle im Inhalt ausnutzt, greifen Standardkontrollen, die Repository-Inhalte scannen, hier nicht. Unternehmen, die diese Bedrohung verstehen wollen, sollten prüfen, wie KI-Datenschutz-Richtlinien für die von Entwicklern genutzten KI-Coding-Tools gelten – nicht nur für die Inhalte, die diese Tools verarbeiten sollen. Das Zero Trust Generative AI-Prinzip, Umgebungsdaten niemals ungeprüft zu vertrauen, ist hier direkt anwendbar. Ein dokumentierter Incident-Response-Plan, der explizit Kompromittierungsszenarien von KI-Coding-Agenten abdeckt, gibt Sicherheitsteams einen klaren Eskalationspfad, wenn diese Angriffsart erkannt wird.

Der Patch behebt CVE-2026-12957 spezifisch, aber Wiz weist darauf hin, dass das zugrunde liegende Auto-Execution-Muster – MCP-Konfigurationsdateien, die beim Öffnen eines Workspaces ohne Nutzererlaubnis ausgeführt werden – nicht nur bei Amazon Q vorkommt. Ähnliche Verhaltensweisen wurden bei anderen KI-Coding-Tools festgestellt. Jedes Unternehmen, das KI-Coding-Assistenten einsetzt, sollte prüfen, ob diese Tools vergleichbare Auto-Execution-Mechanismen aufweisen. Grundsätzlich zeigt der Vorfall, dass das Third-Party Risk Management jetzt auch die von Entwicklern genutzten KI-Tools umfasst, nicht nur die von ihnen entwickelte Software. Ein Repository, das teamübergreifend oder extern genutzt wird, birgt ein neues Risiko, wenn KI-Coding-Agenten in der Entwicklungsumgebung aktiv sind. Vendor Risk Management-Programme sollten die KI-Tooling-Schicht als eigene Risikokategorie aufnehmen – nicht nur den von diesen Tools produzierten Drittcode. Die Ausweitung des Supply-Chain-Risk-Managements auf KI-Entwicklungstools schließt eine Lücke, die klassische Software-Supply-Chain-Prüfungen – fokussiert auf Abhängigkeiten und Pakete – meist übersehen.

Starten Sie mit einer Bestandsaufnahme: Jede KI-Agenten-Implementierung mit MCP-Verbindung, welche Inhalte diese Agenten erreichen können und auf wessen Autorität. Das stateless Design der neuen Spezifikation bedeutet, dass Cross-Tenant-Zugriffskontrollen, Geheimnisverwaltung und Schutz vor Rechteausweitung nicht mehr auf Protokollebene erzwungen werden. Sie müssen von den Betreibern des MCP-Servers implementiert werden. Data Governance-Richtlinien, die festlegen, auf welche Inhalte ein Agent unter welchen Bedingungen und mit welcher Protokollierung zugreifen darf, müssen vor dem 28. Juli stehen – nicht erst danach. Für Unternehmen, die KI-Agenten über regulierte Daten einsetzen – PHI, Finanzdaten, Verteidigungsinformationen – ist die Spezifikationsänderung ein Compliance-Ereignis, nicht nur ein Sicherheitsereignis. Kiteworks‘ Secure MCP Server erzwingt Governance-Grenzen auf der KI-Integrationsschicht, unabhängig von den Protokollvorgaben, und ist damit eine praktische Lösung für Unternehmen, die nicht auf die Anpassung des Entwickler-Ökosystems warten können. Das Einspeisen von Agenten-Zugriffsprotokollen in eine SIEM-Plattform von Anfang an gibt Sicherheitsteams die Echtzeit-Erkennung von Anomalien, die das neue stateless Protokoll nativ nicht bietet.

Klassisches Phishing verleitet Nutzer dazu, auf einen bösartigen Link zu klicken oder Zugangsdaten auf einer gefälschten Seite einzugeben. Die Poisoned-Tenant-Kampagne nutzt legitime Plattforminfrastruktur: Die Einladung ist echt, die E-Mail stammt von der tatsächlichen OpenAI-Benachrichtigungsadresse, besteht alle E-Mail-Authentifizierungsprüfungen und die Plattform ist ein echter OpenAI-Dienst. Betrügerisch ist nur die Organisation, der der Nutzer beitreten soll. E-Mail-Sicherheitskontrollen, die auf bösartige Links oder gefälschte Absender prüfen, greifen hier nicht, da es technisch nichts Verdächtiges gibt. Push Security empfiehlt, Mitarbeiter für die Überprüfung unerwarteter Organisationseinladungen zu sensibilisieren und SaaS-Organisationsmitgliedschaften zu überwachen – das weist aber auch auf einen grundsätzlichen Architekturbedarf hin. Unternehmens-KI-Zugriff sollte über kontrollierte Umgebungen laufen, in denen das Sicherheitsteam sieht, was Mitarbeiter einreichen. Sichere Kollaborationsplattformen mit Richtliniendurchsetzung und Audit-Logs bieten Transparenz, die ein Standard-ChatGPT-Workspace nicht liefert – und diese Transparenz ist der Unterschied zwischen dem Wissen um einen Exfiltrationsvorfall und der Information durch den Angreifer. Die Durchsetzung von MFA bei jeder SaaS-Organisationsmitgliedschaft, nicht nur beim Hauptaccount-Login, hätte die Zuweisung von Owner-Rechten in dieser Kampagne erkannt, bevor sensible Inhalte eingereicht wurden.

Ein Guardian Agent ist eine Kontrollschicht, die Identität und Verhalten von KI-Agenten im Unternehmensumfeld steuert. Während klassische IAM-Tools den Zugriff an der Authentifizierungsgrenze steuern, agiert ein Guardian Agent auf der Ausführungsebene – pflegt eine kontinuierliche Inventur aller autonomen Identitäten, erstellt Verhaltensbaselines und erzwingt Laufzeit-Least-Privilege-Policies für das tatsächliche Handeln der Agenten über Tool-Aufrufe, Datenzugriffe und Systemgrenzen hinweg. Das Konzept wird zunehmend produktiv eingesetzt. Praktische Voraussetzung ist Zero Trust Data Exchange-Denken für Agentenidentitäten: Jede Agenteninteraktion muss verifiziert, nicht nur authentifiziert werden. Die Analyse vom 26. Juni betont, dass dafür eine Kontrollinstanz auf Ausführungsebene nötig ist – bestehende IAM-, PAM- und CIEM-Tools sind nicht darauf ausgelegt, einen Agenten durch eine Multi-System-Sitzung zu begleiten und Richtlinien auf jedem Schritt durchzusetzen. KI-Datengovernance-Programme, die KI-Agenten als gesteuerte Identitäten mit definierten Inhaltszugriffsgrenzen behandeln, sind die organisatorische Voraussetzung, um Guardian-Agent-Kontrollen in der Praxis wirksam zu machen. Datenminimierung bei Agenten-Credential-Scope – also sicherstellen, dass ein Agent nur die Zugriffe erbt, die seine jeweilige Aufgabe erfordert, nicht das komplette Berechtigungsspektrum der menschlichen Identität – ist der direkteste Weg, das Risiko zu begrenzen, bevor Guardian-Agent-Tools weiter reifen.

Weitere Ressourcen

Blog Post
Zero‑Trust-Strategien für erschwinglichen KI-Datenschutz
Blog Post
Wie 77 % der Unternehmen bei KI-Datensicherheit versagen
eBook
AI Governance Gap: Warum 91 % der kleinen Unternehmen 2025 russisches Roulette mit Datensicherheit spielen
Blog Post
Es gibt kein „–dangerously-skip-permissions“ für Ihre Daten
Blog Post
Regulierungsbehörden fragen nicht mehr, ob Sie eine KI-Policy haben. Sie wollen den Nachweis, dass sie funktioniert.