Firmeninterna werden KI-Trainingsdaten

Die Abwicklung gescheiterter Unternehmen hat sich in den USA zu einem neuen Markt entwickelt wie das US-Magazin Forbes berichtet: Interne Kommunikationsdaten insolventer Firmen werden zunehmend als Trainingsmaterial für Künstliche Intelligenz (KI) gehandelt. E-Mails, Chatverläufe oder Projektunterlagen, ursprünglich für den internen Gebrauch bestimmt, erhalten damit einen ökonomischen Wert, der weit über das Ende der jeweiligen Firma hinausreicht. Die Problematik liegt weniger in der technischen Machbarkeit als in den datenschutzrechtlichen und urheberrechtlichen Fragen, die diese Praxis aufwirft.

Was steckt hinter dem neuen Geschäftsmodell?

Hinter dem Ankauf interner Firmendaten steht der wachsende Bedarf von KI-Unternehmen an qualitativ hochwertigem, menschlich verfasstem Material. Öffentlich zugängliche Inhalte aus dem Internet sind für das Training großer Sprachmodelle weitgehend ausgeschöpft. Interne Kommunikation aus realen Arbeitsumgebungen gilt daher als besonders wertvoll, weil sie konkrete Arbeitsprozesse, Entscheidungsfindung und fachliche Sprache abbildet. Abwicklungsdienstleister wie SimpleClosure fungieren dabei als Vermittler: Sie unterstützen Firmen bei der Schließung und verkaufen anschließend Datenbestände wie Slack-Archive, interne E-Mails oder Quellcode an KI-Anbieter, nachdem nach eigenen Angaben personenbezogene Informationen entfernt wurden. Diese Praxis hat sich innerhalb kurzer Zeit zu einem festen Geschäftsmodell entwickelt.

Ist der Verkauf rechtlich zulässig?

Die rechtliche Einordnung ist hiergegen noch uneindeutig. Zwar argumentieren die beteiligten Dienstleister, dass die Daten im Rahmen der Unternehmensabwicklung veräußert werden dürfen und zuvor anonymisiert werden. Kritiker verweisen jedoch darauf, dass nicht abschließend geklärt ist, ob Arbeitgeber berechtigt sind, interne Kommunikation ihrer Beschäftigten weiterzuverkaufen. Neben Urheberrechtlichen Fragestellungen wirf der Verkauf auch datenschutzrechtliche Probleme auf. Laut Berichten von Forbes sehen Datenschutzexperten erhebliche Risiken, da es sich um Inhalte handelt, die zumindest ursprünglich konkreten Personen zuzuordnen und nicht für eine externe Nutzung bestimmt waren. Hinzu kommt die Sorge, dass KI-Modelle Inhalte aus ihren Trainingsdaten reproduzieren könnten, was ebenfalls mögliche Rechtsverletzungen nach sich ziehen würde.

Urheberrechte bei KI-Training

Die Praxis reiht sich in eine breitere Debatte um Urheberrechte beim KI-Training ein. Parallel zu den Verkäufen interner Firmendaten häufen sich rechtliche Auseinandersetzungen mit Aanbietern. So hat die Encyclopaedia Britannica den Konzern OpenAI wegen der angeblich unzulässigen Nutzung urheberrechtlich geschützter Inhalte verklagt. Der Vorwurf lautet, dass KI-Modelle Inhalte nahezu wortgleich wiedergeben und damit Angebote etablierter Wissensanbieter substituieren. Diese Verfahren zeigen, dass sowohl die Nutzung öffentlicher als auch nicht-öffentlicher Inhalte für das KI-Training juristisch umstritten ist und konkrete Lizenzfragen bislang nicht eindeutig geklärt sind.

Hiergegen setzten Plattformen wie Wikipedia bereits auf vertraglich geregelte Zugriffe durch entsprechende Lizenzierungsvereinbarungen mit großen KI-Anbietern. So teilte das Online-Lexikon in einer Pressemitteilung zu seinem Geburtstag am 15. Januar 2026 mit, zukünftig neben Meta, Google und Amazon auch mit Ecosia, Microsoft, Mistral AI, Perplexity, Pleias und ProRata zusammenzuarbeiten.

Wozu werden die gekauften Daten genutzt?

Der Einsatz der aufgekauften Daten erfolgt primär im Training fortgeschrittener KI-Modelle. Nach Angaben aus den zitierten Berichten dienen interne Kommunikationsdaten dazu, Modelle zu entwickeln, die Arbeitsabläufe und betriebliche Kontexte besser verstehen und abbilden können. Damit unterscheiden sich diese Datensätze von klassischen, frei zugänglichen Textsammlungen. Der Nutzen für KI-Unternehmen liegt in der realitätsnäheren Simulation beruflicher Tätigkeiten, was insbesondere für den Einsatz von KI in Unternehmen als relevant gilt.

Fazit

Der Handel mit internen Firmendaten gescheiterter Unternehmen verdeutlicht, wie knapp hochwertige Trainingsdaten für KI geworden sind. Gleichzeitig macht er deutlich, dass die rechtlichen und urheberrechtlichen Rahmenbedingungen mit dieser Entwicklung bislang nicht Schritt halten. Die laufenden gerichtlichen Auseinandersetzungen und Lizenzmodelle zeigen, dass die Nutzung von Daten für KI-Training zunehmend zum Gegenstand formalisierter Regelungen wird. Ob der Verkauf interner Kommunikation dauerhaft Bestand haben kann, bleibt vor diesem Hintergrund offen.

Der „KI-Beauftragte“ -

Ihre Lösung für rechtssichere KI-Compliance

Wir bieten Unternehmen eine umfassende Lösung für die rechtlichen und regulatorischen Herausforderungen, die der Einsatz von KI mit sich bringt. 

Jetzt unverbindliches Angebot anfordern