LfDI BW: Datenschutz bei Large Language Models

23. Januar 2025

Wann und wie dürfen personenbezogene Daten für das Training und die Anwendung von KI verarbeitet werden? Mit dieser Frage hat sich der Landesbeauftragte für Datenschutz und Informationsfreiheit Baden-Württemberg (LfDI BW) im Diskussionspapier „Rechtsgrundlagen im Datenschutz beim Einsatz von Künstlicher Intelligenz“, Version 2.0, ausführlich beschäftigt. Das Papier bietet Orientierung für öffentliche und private Akteure und adressiert insbesondere Herausforderungen beim Einsatz von Large Language Models (LLM).

Diskussionspapier Version 2.0

Das am 17.10.2024 veröffentlichte Diskussionspapier des LfDI BW ersetzt die Version von 2023. Ziel ist es, Organisationen einen Überblick über die rechtlichen Anforderungen im Datenschutz zu bieten und praxisnahe Leitfragen bereitzustellen. Besonders berücksichtigt werden dabei die Datenschutz-Grundverordnung (DSGVO), das Bundesdatenschutzgesetz (BDSG) und das Landesdatenschutzgesetz Baden-Württemberg (LDSG BW).

Im Zuge der Überarbeitung wurde zum einen beleuchtet, wann personenbezogene Daten mittels LLM verarbeitet werden. Zum anderen wurde ein besonderer Fokus auf die Auslegung des berechtigten Interesses der Datenverarbeitung nach Art. 6 Abs. 1 Buchst. f DS-GVO gelegt. Wenngleich die europäischen KI-Verordnung (KI-VO) selbst nur am Rande behandelt wird, liefert der LfDI BW mit ONKIDA (Orientierungshilfen-Navigator KI & Datenschutz) ein wertvolles Werkzeug, das zentrale Aspekte der datenschutzrechtlichen Anforderungen übersichtlich darstellt.

Personenbezug bei Large Language Models (LLM)

Bei der Nutzung von Large Language Models (LLM) stellt sich die Frage, ob und inwieweit personenbezogene Daten im Sinne der DSGVO, also Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen, verarbeitet werden. Liegt ein Personenbezug beim Einsatz von LLM vor, sind die datenschutzrechtlichen Vorgaben zu beachten.

Der Hamburgische Beauftragte für Datenschutz und Informationsfreiheit (HmbBfDI) meinte in seinem Diskussionspapier, dass die bloße Speicherung eines LLMs  keine Verarbeitung im Sinne der DSGVO darstellt, da es selbst keine personenbezogenen Daten enthalten würde. Der LfDI BW stimmt dieser Einschätzung grundsätzlich zu, ergänzt jedoch, dass es durch Nutzerinteraktionen dennoch zu einem Personenbezug kommen kann. Insbesondere dann, wenn schlecht anonymisierte Daten ins Training eingeflossen sind oder Dritte durch gezielte Eingabeprompts personenbezogene Daten generieren.

Sollten solche sogenannten „Model Attacks“ möglich sein, so könnte dadurch das Modell selbst wiederum als personenbezogenes Datum anzusehen sein. Aus diesem Grund betont der LfDI BW, dass bei der Bewertung von LLMs nicht nur das Modell selbst, sondern das gesamte KI-System bzw. KI-Anwendung betrachtet werden müsse, einschließlich der spezifischen Anwendung, in der das Modell eingesetzt wird.

Berechtigtes Interesse an der Verarbeitung in LLMs

Der LfDI BW hebt die besondere Bedeutung von Art. 6 Abs. 1 Buchst. f DSGVO für die Datenverarbeitung durch KI-Systeme hervor. Die flexible, innovationsfreundliche Formulierung der Rechtsgrundlage ermöglicht die Verarbeitung personenbezogener Daten, führt jedoch auch zu Rechtsunsicherheiten in der Praxis. Die dreigliedrige Prüfung aus berechtigtem Interesse, Erforderlichkeit und Interessenabwägung muss dabei kumulativ erfüllt sein.

Bei LLMs sei aufgrund ihrer individuellen Unterschiede keine pauschale Interessenabwägung möglich. Faktoren wie die Zugänglichkeit des Modells (frei oder intern genutzt) und die Möglichkeit, risikoreiche Nutzungsweisen zu verhindern, spielen eine Rolle. Gleichzeitig stellen fehlende Transparenz und Erklärbarkeit der Modelle Herausforderungen dar. Unternehmen müssen daher im Einzelfall sorgfältig abwägen, ob die berechtigten Interessen die Risiken für die Rechte und Freiheiten der Betroffenen überwiegen.

ONKIDA der Orientierungshilfen-Navigator für KI & Datenschutz

Um Organisationen die Navigation durch komplexe datenschutzrechtliche Anforderungen zu erleichtern, hat der LfDI BW den Orientierungshilfen-Navigator KI & Datenschutz (ONKIDA) entwickelt. Dieses Werkzeug ermöglicht einen ersten Überblick der existierenden Handreichungen anderer Aufsichtsbehörden und Gremien und einen schnelleren Zugang zu Einzelaspekten zentraler datenschutzrechtlicher Vorgaben. Aktuell können dort zu den 10 zentralen datenschutzrechtlichen Vorgaben die Fundstellenübersicht.

Fazit 

Das Diskussionspapier des LfDI BW ist eine wertvolle Ergänzung der bereits bestehenden Handreichungen anderer Datenschutzbeauftragten. Das Tool ONKIDA ermöglicht Unternehmen und Behörden schnell Erklärungshilfen zu den komplexen rechtlichen Anforderungen zu finden und schafft Transparenz. Als verantwortliche Stelle sollten Sie die bestehenden Orientierungshilfen aktiv nutzen  und eine regelmäßige Überprüfung ihrer KI-Anwendungen vornehmen, um den dynamischen rechtlichen Anforderungen gerecht zu werden.