Cracked Labs: Studie zur Erfassung, Verknüpfung und Verwertung von Daten im Zeitalter von Big Data
Eine jüngst veröffentlichte Studie des Wiener Instituts für kritische digitale Kultur Cracked Labs im Auftrag der österreichischen Bundesarbeitskammer gibt anhand von ausgewählten Problemfeldern und Beispielen einen Überblick über internationale Trends in der zunehmenden Erfassung, Verknüpfung und Verwertung von personenbezogenen Daten durch Unternehmen und umschreibt zugleich mögliche Auswirkungen auf die Nutzer. Im Zeitalter von Big Data würden immer häufiger statistische Methoden und andere Technologien des Data Mining eingesetzt, um große Mengen persönlicher Daten zu analysieren und darin Muster und Zusammenhänge zu finden. Damit ließen sich Erkenntnisse über Einzelne gewinnen, die weit über die in den gesammelten Rohdaten enthaltenen Informationen hinausgehen – oder sogar Prognosen über zukünftiges Verhalten treffen.
Um dies zu belegen, wird u.a. auf eine vor zwei Jahren durchgeführte Analyse der US-Supermarktkette Target verwiesen, die zum Ziel hatte, schwangere Kundinnen durch ihr Einkaufsverhalten zu identifizieren. Dafür wurde allen Kunden von Target intern eine Identifikationsnummer zugewiesen, unabhängig davon, ob sie mit Kreditkarte bezahlen, einen Gutschein verwenden, eine Umfrage ausfüllen, die Telefon-Hotline anrufen, eine E-Mail von Target öffnen oder deren Website besuchen. Danach wurden alle Einkäufe und Interaktionen dieser Kunden protokolliert sowie bei Bedarf auch mit zugekauften Informationen angereichert. Eine eigene Abteilung wurde damit betraut, das Verhalten der Kunden zu analysieren und daraus Handlungsempfehlungen für die Steigerung der Umsätze abzuleiten.
Die Analyseergebnisse zeigten, dass es recht einfach war, Eltern mit Kindern zu identifizieren, denen man vor Weihnachten Kataloge mit Spielzeug zusenden kann. Auch konnten so Kundinnen, die im April Badeanzüge gekauft haben, identifiziert werden, denen dann im Sommer Gutscheine für Sonnencreme und im Dezember Werbung für Diät-Ratgeber geschickt werden kann.
Zusätzlich konnte man außerdem wichtige Momente im Leben der Kunden – z.B. Schulabschluss, Heirat, Umzug oder Scheidung – ausfindig machen, die deswegen für Unternehmen interessant sind, weil in diesen das Einkaufsverhalten flexibel wird und damit Werbung oder Gutscheine sehr effektiv sein können. Die Analyseergebnisse zeigten, dass der lukrativste Moment die Geburt eines Kindes ist. In Folge wurden aufwändigere Analysen durchgeführt, die zur Identifikation von 25 Produkten geführt haben sollen, deren Kauf die Erstellung einer Art von „Schwangerschafts-Prognose-Score“ ermöglichen und es sogar erlauben sollen, mit einer bestimmten Wahrscheinlichkeit den Geburtstermin zu prognostizieren. Zu diesen Produkten zählten nicht etwa Babykleidung oder Kinderwägen, die ganz offensichtlich auf eine nahe Geburt schließen lassen, sondern es handelte sich um bestimmte Mengen von bestimmten Hautlotionen, Seife, Watte, Waschlappen oder Nahrungsergänzungsmittel, die in bestimmten Frequenzen und Zeitabständen gekauft werden. Waren die schwangeren Kunden erst einmal identifiziert, erhielten sie verschiedene Arten von individueller Werbung, Gutscheine oder andere Kaufanreize – und zwar nicht nur für Babybedarf, sondern auch für ganz andere Produkte, bei denen man herausgefunden hätte, dass sie von frischgebackenen Müttern gerne gleich mitgekauft werden.
Um die möglichen negativen Auswirkungen zu minimieren, wird durch Crackes Labs empfohlen,
- durch Forschung, Öffentlichkeit und Regulierung Transparenz über die Praktiken von Unternehmen zu schaffen,
- dezentrale Technologien, die mehr Kontrolle über persönliche Daten einräumen, zu unterstützen,
- die digitale Zivilgesellschaft und den kritischen Diskurs über Chancen, Risiken, Machtungleichgewichte und Lösungsmöglichkeiten zu stärken,
- digitale Kompetenz und Wissen über den Umgang mit den eigenen persönlichen Daten zu stärken,
- maximale Aufmerksamkeit auf eine gute und trotzdem zügige Ausgestaltung der europäischen Datenschutzverordnung zu verwenden und
- darüber nachzudenken, Transparenz rechtlich nicht nur in Bezug auf die gesammelten Daten einfordern, sondern auch bezüglich der eingesetzten statistischen Verarbeitungsalgorithmen.