Berlin Group: Arbeitspapiere zu LLMs und Data Sharing

8. Januar 2025

Die Internationale Arbeitsgruppe für Datenschutz in der Technologie (IWGDPT), besser bekannt als Berlin Group, hat unter der Leitung der Bundesbeauftragten für den Datenschutz und die Informationsfreiheit (BfDI) am 06.12.2024 zwei Arbeitspapiere veröffentlicht. Diese widmen sich laut einer Pressemitteilung vom 27.12.2024 den Herausforderungen und Möglichkeiten im Umgang mit “Large Language Models” (LLMs) und dem Datenaustausch zwischen Organisationen (Data Sharing). Ziel der Papiere ist es, praktikable Ansätze zu entwickeln, um Innovation und Datenschutz in Einklang zu bringen.

Large Language Models

LLMs sind hochkomplexe KI-Modelle, die in der Lage sind, menschenähnlich Texte zu erstellen. Das Training dieser Modelle findet mit einer riesigen Anzahl an Daten statt, was ihre Leistungsfähigkeit stetig verbessert. Gleichzeitig birgt die Verarbeitung personenbezogener Daten zu solchen Zwecken erhebliche Datenschutzrisiken, die das Papier (abrufbar hier) herausarbeitet und entsprechende Lösungsansätze aufzeigt.

In ihrer Pressemitteilung weist die BfDI, Louisa Specht-Riemenschneider, darauf hin, dass eine Verarbeitung von personenbezogenen Daten zu Trainingszwecken „transparent und rechtmäßig geschehen“ muss. Risiken bestehen laut des Papiers in einer vermehrten Datenverarbeitung, dem Verlust von Datenrechten, etwa durch Belästigung oder Scams, Cybersicherheitsrisiken, Ungleichbehandlung oder der Manipulierung von Informationen.

Empfehlungen der Berlin Group

Die Arbeitsgruppe betont die Bedeutung hochwertiger und datenschutzkonformer Trainingsdaten. Vorrangig müssten zunächst die allgemeinen Datenschutzgrundsätze, wie etwa Transparenz, Zweckbegrenzung und das Erfordernis einer Rechtsgrundlage für die Datenverarbeitung beachtet werden. Daneben würde aber vermehrt auch an Lösungen gearbeitet, die ohne die komplexe Verarbeitung personenbezogener Daten funktionieren. Ein Vorschlag sei, das LLM lokal zu betreiben und nicht in einer Cloudversion. Exemplarisch hierfür steht der aktuelle Trend von KI-Laptops.

Data Sharing

Daneben hat die Berlin Group auch ein Arbeitspapier (abrufbar hier) zu Data Sharing veröffentlicht. Damit ist „das Teilen von Daten zwischen Organisationen“ gemeint. Insbesondere im internationalen Kontext könne dies in schweren Datenschutzverletzungen und Datenmissbrauch resultieren.

Empfehlungen der Berlin Group

Das Papier empfiehlt die Schaffung einer vertrauenswürdigen Umgebung für den Datenaustausch. Dabei sei vor allem auf datenschutzfördernde Technologien (Privacy-enhancing technologies) zu bauen. Insofern solle zunächst eine exakte Analyse darüber stattfinden, warum und an wen Daten geschickt werden und ob die Betroffenen ausreichend hierüber informiert wurden. Betroffene müssen die Möglichkeit haben einer solchen Datenübermittlung widersprechen zu können.

Fazit

Die von der Berlin Group verabschiedeten Arbeitspapiere setzen wichtige Impulse für den Umgang mit modernen Technologien und Datenschutz. Sie zeigen insbesondere, dass Datenschutz im Einklang mit wirtschaftlichen Bestrebungen und technologischem Fortschritt stehen kann. Während LLMs innovative Chancen bieten, erfordert ihr Einsatz eine sensible Abwägung zwischen Nutzen und Datenschutz. Der Datenaustausch hingegen muss durch vertrauenswürdige Rahmenbedingungen gestärkt werden.