DSGVO & KI-Chatbots: Was tun mit aufgedrängten personenbezogenen Daten?
Der Einsatz generativer KI-Systeme, wie Chatbots im Kundenservice, bringt nicht nur Effizienzgewinne, sondern auch neue datenschutzrechtliche Herausforderungen mit sich. Besonders kritisch sind sogenannte „aufgedrängte Daten“ – personenbezogene Informationen, die Nutzer ungefragt eingeben und die der KI-Betreiber eigentlich nicht erfassen will. Da es technisch kaum möglich ist, solche Eingaben vollständig zu verhindern, stellt sich die Frage: Welche DSGVO-Pflichten treffen Unternehmen in diesem Fall? Dieser Beitrag beleuchtet, wann eine Verarbeitung vorliegt, und welche Maßnahmen helfen, um datenschutzkonform mit aufgedrängten Daten umzugehen.
Was sind „aufgedrängte Daten“?
Aufgedrängte Daten entstehen, wenn eine Person einem Unternehmen oder einer anderen Stelle ungefragt personenbezogene Daten zukommen lässt. Im Zeitalter generativer KI-Systeme, wie beispielsweise Chatbots im Kundenservice, kann dies auf vielfältige Weise geschehen. Nutzer können in das Eingabefeld (Prompt) jegliche Art von Informationen tippen, einschließlich sensibler Daten wie Gesundheitsinformationen oder politische Meinungen, auch wenn der Betreiber des KI-Systems diese Daten für die beabsichtigte Nutzung (z.B. Beantwortung von Fragen zu Produkten) nicht benötigt. Da es derzeit kaum technische Möglichkeiten gibt, die Eingabe bestimmter personenbezogener Daten zu verhindern, stellt sich die Frage, wie Unternehmen datenschutzkonform mit solchen ungewollten Informationen umgehen müssen.
Erhebung und Verarbeitung nach der DSGVO
Damit sich Pflichten aus der DSGVO für KI-Betreiber ergeben, muss der Anwendungsbereich des Regelwerks gegeben sein. Die DSGVO gilt gemäß Art. 2 I DSGVO, wenn personenbezogene Daten ganz, teilweise oder nicht automatisiert verarbeitet werden. Der Begriff der Verarbeitung umfasst dabei jeden Umgang mit personenbezogenen Daten, einschließlich des Erhebens, Erfassens, der Speicherung, Verwendung und Löschung (Art. 4 Nr. 2 DSGVO). Grundsätzlich gilt, dass in Prompts enthaltene personenbezogene Daten verarbeitet werden. Die Daten müssen zumindest kurzzeitig gespeichert werden, damit das KI-System den Input verarbeiten und eine Antwort generieren kann.
Erhebung und Verarbeitung „aufgedrängter Daten“
Die Frage, ob in Bezug auf aufgedrängte Daten auch eine Erhebung stattfindet, wird unterschiedlich beurteilt. Die sächsische und saarländische Landesbeauftragte für Datenschutz und Informationsfreiheit gingen (zumindest in der Vergangenheit) davon aus, dass aufgedrängte Daten z.B. per Post nicht erhoben werden. Auch bei Initiativbewerbungen handelt es sich grundsätzlich um aufgedrängte Daten, die erst mit einer Speicherung der Personalabteilung als erhoben gelten. Dabei wird davon ausgegangen, dass die Erhebung ein zielgerichtetes Handeln des Verantwortlichen erfordert, um Kenntnis von den personenbezogenen Daten zu erlangen. Fehlt es an dieser Verarbeitungsabsicht hinsichtlich der aufgedrängten Daten, soll keine Erhebung vorliegen.
Allerdings äußerten sich die Landesdatenschutzbeauftragten nur allgemein zu aufgedrängten Daten und noch vor den aktuellen Entwicklungen der KI-Chatbots. Lennart Meyer, Doktorand an der Universität Osnabrück (RDi 2025, 125), argumentiert, dass es im Kontext von KI-Chatbots einer anderen Auslegung bedürfe. Nach Meyer, könne in der Bereitstellung eines KI-Systems durch den Betreiber, zumindest wenn dieser auch (bestimmte) Kategorien personenbezogener Daten verarbeiten möchte, in der Regel ein immanenter Erhebungswille für den gesamten Datensatz (also auch die aufgedrängten Daten) gesehen werden. Dieser Wille zur Erhebung der erwünschten Daten “strahlt” auf die ungewollt eingegebenen Daten aus.
„Bitte keine personenbezogenen Daten eingeben“
Um eine Erhebung auszuschließen ist es empfehlenswert als KI-Betreiber objektiv deutlich zu machen, dass dieser keinerlei personenbezogene Daten erhalten möchte. Dies kann durch einen klaren Hinweis unter dem Eingabefeld geschehen. Die ARD.ZDF medienakademie schreibt hierzu zwar in ihren Chatbot-Nutzungsbedingungen: „Die Eingabe von personenbezogenen Daten ist für die Nutzung des Chatbots und für die Bearbeitung der Anfragen durch den Chatbot grundsätzlich nicht erforderlich und sollte unterlassen werden.“ Ein Hinweis direkt im Chat-Fenster erfolgt dagegen nicht. Ob dies im Zweifelsfall, für die Ablehnung der Erhebung ausreicht, ist fraglich.
Verantwortlichkeit des KI-Betreibers
Grundsätzlich ist der KI-Betreiber für die Verarbeitung der personenbezogenen Daten durch das KI-System verantwortlich (Art. 4 Nr. 7 DSGVO), da er die Zwecke und Mittel der Verarbeitung festlegt. Dies gilt insbesondere, wenn ein immanenter Erhebungswille vorliegt oder die aufgedrängten Daten nach der Chat-Session nicht gelöscht werden.
Rechtsgrundlage der Verarbeitung
Sofern eine Verarbeitung personenbezogener Daten stattfindet, benötigt der Verantwortliche eine Rechtsgrundlage gemäß Art. 6 DSGVO. Für die technisch bedingte Erhebung und kurzfristige Speicherung aufgedrängter Daten zur Ermöglichung der Chatfunktion kann Art. 6 Abs. 1 lit. f DSGVO (berechtigte Interessen) in Betracht gezogen werden, beispielsweise das Interesse des Unternehmens an einem effizienten Kundenservice.
Verarbeitung besonderer Kategorien personenbezogener Daten
Besonders problematisch wird es, wenn besondere Kategorien personenbezogener Daten (Art. 9 DSGVO) aufgedrängt werden (z.B. Gesundheitsdaten). Für deren Verarbeitung ist grundsätzlich eine ausdrückliche Einwilligung der betroffenen Person erforderlich. Die bloße Eingabe solcher Daten durch den Nutzer kann in der Regel nicht als Einwilligung gewertet werden.
Die französische Datenschutzbehörde (CNIL) sieht jedoch in Fällen, in denen das Aufdrängen sensibler Daten nicht vorhersehbar ist, Unternehmen nicht in der Pflicht zwingend eine vorherige Einwilligung einzuholen. Allerdings seien Maßnahmen zur Risikominimierung erforderlich, um die Rechte und Freiheiten der betroffenen Personen zu schützen. Die CNIL nennt hier zum einen Warnhinweise vor der Nutzung des Chatbots, der Nutzer auffordert, keine sensiblen Daten einzugeben. Zum anderen müsse ein System zur sofortigen oder zumindest regelmäßigen Löschung sensibler Daten implementiert werden, da deren Speicherung nicht erforderlich ist. Die Firma Bosch ergänzt diesbezüglich zu ihrem KI-Chatbot Frizz: „Sollten darunter Eingaben mit aufgedrängten personenbezogenen Daten sein, werden sie spätestens bei der Sichtung von einem Bosch-Mitarbeiter gelöscht.“ In welcher Regelmäßigkeit eine Löschung stattfindet geht daraus nicht hervor.
Informationspflichten
Wird eine Erhebung und Verantwortlichkeit des KI-Betreibers bejaht, stellt sich die Frage nach den Informationspflichten nach Art. 13 und 14 DSGVO. Bei der Direkterhebung der Daten durch die Eingabe des Nutzers als Prompt, ist der Betroffene in der Regel bereits über die von ihm eingegebenen Daten informiert. Eine umfassende Information über alle potenziell möglichen Kategorien aufgedrängter Daten ist nicht erforderlich.
Wenn die Daten nicht direkt bei der betroffenen Person erhoben wurden, sondern von Dritten, ist die Informationspflicht bei KI-Chatbots jedoch oft schwer umsetzbar. Der Betreiber kann nicht vorhersehen, welche Daten eingegeben werden und von wem. Daher wäre die Informationserteilung mit unverhältnismäßigem Aufwand verbunden.
Technische und organisatorische Maßnahmen
Um den datenschutzrechtlichen Anforderungen im Umgang mit aufgedrängten Daten gerecht zu werden und Risiken zu minimieren, sind folgende technische und organisatorische Maßnahmen ratsam:
- Klare Hinweise für Nutzer: Vor der Nutzung des Chatbots sollten Nutzer deutlich darauf hingewiesen werden, keine sensiblen oder unnötigen personenbezogenen Daten einzugeben.
- Privacy by Design: Eingabemasken sollten nur die für den jeweiligen Zweck erforderlichen Daten abfragen. Freitextfelder sollten mit dem Hinweis versehen sein, keine personenbezogenen Daten preiszugeben.
- Automatisierte Löschkonzepte: Es sollten Systeme implementiert werden, die aufgedrängte Daten unmittelbar nach der Chat-Session oder in regelmäßigen Abständen automatisch löschen. Eine Speicherung über die Sitzung hinaus sollte ohne Rechtsgrundlage vermieden werden.
- Erkennung und Behandlung sensibler Daten: Unternehmen sollten prüfen, ob technische Mechanismen eingesetzt werden können, um potenziell sensible Daten in Prompts zu erkennen und gegebenenfalls zu anonymisieren.
- Schulung der Mitarbeitenden: Mitarbeiter, die mit den Ergebnissen von KI-Systemen in Kontakt kommen, sollten im Rahmen ihrer KI-Kompetenz mit aufgedrängten Daten geschult werden. Insbesondere hinsichtlich der Löschpflichten und der Sensibilisierung für den Schutz personenbezogener Daten.
- Datenschutzerklärung: Die Datenschutzerklärung sollte klar und verständlich über die Verarbeitung von Daten im Zusammenhang mit dem KI-System informieren, einschließlich des Umgangs mit unbeabsichtigt eingegebenen Daten.
- Datenschutz-Folgeabschätzung (DPIA): Im Rahmen der Einführung und des Betriebs von KI-Systemen ist die Durchführung einer Datenschutz-Folgenabschätzung empfehlenswert.
Fazit
Der Umgang mit aufgedrängten Daten bei KI-Chatbots stellt Unternehmen vor komplexe datenschutzrechtliche Herausforderungen. Es ist entscheidend, sich der Risiken bewusst zu sein und proaktive Maßnahmen zu ergreifen. Durch eine Kombination aus klaren Richtlinien, technischen Vorkehrungen und Sensibilisierung der Nutzenden können Unternehmen den datenschutzkonformen Einsatz von KI-Systemen im Kundensupport sicherstellen. Die unverzügliche Löschung ungewollter personenbezogener Daten und die Vermeidung ihrer Weiterverarbeitung ohne Rechtsgrundlage sind dabei zentrale Aspekte.