DeepSeek: Welche Datenschutzrisiken birgt die KI aus China?

17. Februar 2025

DeepSeek: Welche Datenschutzrisiken birgt die KI aus China?DeepSeek, ein chinesischer KI-Anbieter, beeindruckt mit seinem leistungsstarken Modell R1, birgt aber erhebliche Datenschutzrisiken. Daten werden auf Servern in China gespeichert, ohne Opt-out-Option, was Behördenzugriffe ermöglichen könnte. Experten warnen vor Sicherheitslücken, Jailbreaks und potenzieller Malware. Zudem steht die KI wegen Zensurvorwürfen in der Kritik. Die italienische Datenschutzbehörde ermittelt. Unternehmen und Verbraucher sollten den Einsatz sorgfältig prüfen.

Was steckt hinter DeepSeek?

DeepSeek ist ein chinesisches KI-Unternehmen, das mit seinem KI-Modell R1 in der Technologiebranche für Aufsehen gesorgt hat. Es wird als Konkurrent zu etablierten Modellen wie OpenAI’s ChatGPT gesehen, da es ähnliche Leistungen erbringen soll, aber gleichzeitig effizienter und kostengünstiger sein soll.

Nach eigenen Angaben soll DeepSeek R1 in bestimmten Bereichen wie mathematischen Aufgaben und logischem Schlussfolgern eine beeindruckende Leistung zeigen. Es soll mit deutlich weniger Ressourcen und Kosten trainiert worden sein als vergleichbare Modelle wie GPT-4o. Die Trainingskosten sollen sich auf etwa 5,6 Millionen Dollar und 2,9 Millionen GPU-Stunden belaufen. DeepSeek-R1 ist ca. 30 Mal günstiger in der Nutzung als OpenAI o1 und ca. 5 Mal schneller. Es gibt kleinere Varianten von R1, die sogar auf Laptops betrieben werden können. DeepSeek R1 ist ein Reasoning-Modell, das Aufgaben in kleinere Teilaufgaben zerlegt und sie nacheinander abarbeitet. DeepSeek R1 soll damit führende Open-Source-Modelle wie Meta’s Llama 3.1-405B und proprietäre Modelle wie OpenAI’s o1 und Anthropic’s Claude 3.5 Sonnet übertreffen.

Transparenz durch Open Source?

DeepSeek stellt seine Sprachmodelle als Open Source unter MIT-Lizenz zur Verfügung. Die Quelltexte sind öffentlich und die Modelle können heruntergeladen werden. Zudem zeigt es seine Denkschritte offen (z.B. mit der Funktion #DeepThink), was es anfälliger für Angriffe macht. Ende Januar meldete DeepSeek einige bösartige Cyberangriffe auf seine Dienste. Dies führte zwischenzeitlich dazu, dass Registrierung und Anmeldung deaktiviert waren.

Daneben gibt es weitere kritische Stimmen und Bedenken:

Sicherheitsbedenken

Wie KELA in seinem Blogbeitrag unter Beweis stellt, ist das Modell anfällig für Jailbreaks und kann dazu gebracht werden, schädliche Inhalte wie zu beispielsweise Anleitungen zu Geldwäsche oder Sprengstoff Herstellung zu generieren. KELA brachte DeepSeek auch dazu falsche Informationen über Mitarbeiter von OpenAI zu generieren und sensible, aber unwahre Details aufzulisten. Des Weiteren kann DeepSeek Infostealer Malware generieren, die Daten von kompromittierten Geräten stehlen kann, einschließlich Kreditkartennummern.

Datenschutzbedenken

Datenschutzbedenken ergeben bei einem Blick in die Privacy Policy:

Datenserver in China

Zum einen die Datenspeicherung in China. Nutzerdaten werden auf Servern in China gespeichert. Dies ist besonders problematisch für Organisationen, die den EU-Datenschutzrichtlinien unterliegen, da die Daten somit dem Zugriff chinesischer Behörden unterliegen könnten. Dazu kommt mangelnde Transparenz bei den Datenübertragungen. Die Datenschutzrichtlinien von DeepSeek geben keine detaillierten Informationen darüber, wie Daten während der Übertragung geschützt werden.

Speicherung Personenbezogener Daten ohne Opt-Out

Zudem sammelt DeepSeek eine Vielzahl persönlicher Daten. Von den E-Mail-Adressen, Telefonnummern und Geburtsdaten, die bei der Kontoerstellung angegeben werden begonnen. Des Weiteren werden jegliche Benutzereingaben, einschließlich Text- und Audiodaten sowie Chatverläufe gespeichert. Auch technische Informationen wie Telefonmodell, Betriebssystem, IP-Adresse und Tastatureingabemuster sollen gespeichert werden. Diese Nutzerdaten können für Werbe- und Analysezwecke verwendet werden, ohne dass eine klare Opt-out-Option besteht. Es gibt Bedenken, dass DeepSeek Daten verwendet, um Nutzer und ihre Aktivitäten außerhalb des Dienstes abzugleichen. Auch hier fehlt ausreichende Transparenz.

Zensur durch chinesische Regierung

Zudem bestehen Bedenken zu Voreingenommenheit und Zensur: DeepSeek unterschlägt Informationen zu Themen, die der chinesischen Regierung nicht genehm sind, wie z.B. die Unterdrückung der Uiguren oder das Massaker am Tiananmen-Platz. Dies deutet auf eine voreingenommene KI hin. Da DeepSeek ein chinesisches Unternehmen ist, agiert es in einem regulatorischen Umfeld, in dem die staatliche Aufsicht über Daten streng ist. Dies birgt zudem das Risiko, dass auch die Regierung auf die gespeicherten Daten zugreifen kann.

Experten warnen vor DeepSeek

Diese Datenschutzbedenken werden von Experten aus verschiedenen Bereichen geteilt. “Open-Source-KI-Modelle wie DeepSeek bieten zwar Zugänglichkeit und Innovation, sind aber zunehmend anfällig für Angriffe auf die Lieferkette, die bei groß angelegten Cyberangriffen ausgelöst werden,“ so Aditya Sood, von Aryaka gegenüber techradar. Auch Renuka Nadkarni, ebenfalls von Aryaka sorgt sich um die Sicherheit der Nutzer. “Während die Nichtverfügbarkeit des Dienstes ein einfacher und sichtbarer Angriff auf seine Infrastruktur ist, liegt die größere Sorge in den unentdeckten Angriffen auf sein Modell und seine Daten. Diese versteckten Bedrohungen könnten gutartige Benutzer kompromittieren und andere bösartige Aktivitäten ermöglichen.”

Italienische Datenschutzbehörde ermittelt

Auch die italienische Datenschutzbehörde sieht ein “mögliches Risiko für die Daten von Millionen von Menschen in Italien”, weshalb sie wie sie am 28. Januar 2025 in einer Pressemitteilung bekannt gab, eine Anfrage an DeepSeek gestellt hat. Die Behörde will Auskunft darüber, welche personenbezogenen Daten aus welchen Quellen und zu welchen Zwecken erhoben werden, was die Rechtsgrundlage für die Verarbeitung ist und ob sie auf Servern in China gespeichert werden.

Fazit

DeepSeek beeindruckt zwar durch seine Leistung und Effizienz, sorgt aber auch für erhebliche Sicherheits- und Datenschutzbedenken. Mit DeepSeek einhergehende Risiken sollten sorgfältig abgewogen werden. Verbraucher und Unternehmen sollten die Sicherheit und Zuverlässigkeit von GenAI-Anwendungen bewerten, bevor sie diese intern oder extern verwenden. Dies gilt für alle öffentlich zugänglichen KI-Modelle.