Alumni-Programm

Hinter den Kulissen der KI

TU-Alumna Dr. Milagros Miceli beschäftigt sich am Weizenbaum-Institut mit den prekären Arbeitsbedingungen der sogenannten Clickworker, die die KI trainieren.

Es ist nicht alles künstlich, was künstlich erscheint. Da ist beispielsweise die „Künstliche Intelligenz“ (KI) oder das „Maschinelle Lernen“. Beide Begrifflichkeiten vermitteln uns, dass etwas künstlich, durch Maschinen, in diesem Fall durch „Software“, geschaffen ist. Fragen wir uns nach dem „Nicht- Künstlichen“ in der KI, dann fallen uns zumeist die Erfinder*innen, die Softwareentwickler*innen ein, die die Anwendungen auf den Weg bringen. Tiefer hinter die Kulissen der KI schauen wir meist nicht. Dann würden wir nämlich sehen, dass hinter vielen Anwendungen Menschen stecken, die die Software mit Daten bestücken, sie trainieren. Nur mit dieser grundlegenden Unterstützung durch Menschenhand, kann die KI beispielsweise ein Auto erkennen oder auf Satellitenbildern Häuser von Bäumen unterscheiden. Die Arbeitsbedingungen dieser Menschen, die in der Branche als „Clickworker“ bezeichnet werden, sind oftmals prekär, denn auch im Geschäftsbereich der KI lagern die reichen Ländern die Arbeit gern in arme Länder aus.

Dr. Milagros Miceli begibt sich mit ihrer Forschung quasi ins Getriebewerk des maschinellen Lernens und beschäftigt sich mit den Arbeitsbedingungen der Clickworker, die in den Ländern des globalen Südens dafür sorgen, dass unsere KI so maschinell und künstlich wirkt obwohl sie es an vielen Stellen gar nicht ist. Die Soziologin und Informatikerin leitet die Forschungsgruppe Daten, Algorithmische Systeme und Ethik am Weizenbaum-Institut. Die TU-Alumna hat 2022 ihre Promotion an der TU Berlin abschlossen. Auch in ihrer Dissertation am TU-Fachgebiet Internet und Gesellschaft hat sie sich mit dem ungerechten Umgang mit den Datenarbeiter*innen beschäftigt.

Im Rahmen des Symposiums „Critical Stances towards AI: For a Critical and Self-Determined Approach to Digital Technology“, das Ende September 2023 in New York stattfand, hat sie Einblick in ihre Forschungsarbeit gegeben.

In diesem Interview spricht Milagros Miceli über die Rolle menschlicher Arbeitskräfte in der KI-Branche und über die Forschung in diesem Bereich

Worin besteht die Arbeit der Datenarbeiter*innen?

Wir haben den Begriff „Datenarbeit“ geprägt, um das zu benennen, was andere als Mikroarbeit, Klickarbeit oder Ghost Work bezeichnet haben. Ich finde, diese Bezeichnungen vermitteln die Idee, dass diese Arbeit klein sei. Datenarbeit bezieht sich auf die Arbeit, die mit der Produktion und Pflege von Trainingsdaten für maschinelles Lernen verbunden ist. Dazu gehören Aufgaben wie Datengenerierung. Diese reicht von der Erhebung öffentlich verfügbarer Daten aus dem Internet bis hin zu Arbeiter*innen, die kurze Texte schreiben, ihre eigenen Stimmen aufzeichnen oder sogar Videos und Bilder ihrer Häuser, Familien, Städte, Freunde oder ihrer eigenen Gesichter hochladen. Eine weitere Aufgabe besteht in der sogenannten Datenannotation. Hierbei geht es darum, Daten zu interpretieren und sie gemäß vordefinierten Kategorien zu etikettieren. Datenarbeiter*innen verifizieren auch den algorithmischen Output. Dies umfasst zum Beispiel die Überprüfung der Ergebnisse von Suchmaschinen oder die Klassifizierung maschinengenerierter Empfehlungen in Bezug auf deren Nützlichkeit oder Angemessenheit. Und nicht zuletzt geben sich mitunter die Arbeiter*innen gegenüber Nutzern*innen als KI aus. Dies bezeichnen wir als „AI Impersonation“: Dies passiert oft bei Chatbots oder sogenannten „Smart Cameras“.

Lässt sich sagen wieviele Menschen weltweit als Clickworker arbeiten, in welchen Ländern diese Arbeit zumeist durchgeführt wird und wie das System aufgebaut ist? Was ist das Ungerechte daran?

Es ist schwierig, genaue Zahlen darüber zu finden, wie viele Menschen weltweit als Datenarbeiter*innen arbeiten, da dies eine Art von Arbeit ist, die oft online und in verschiedenen Formen und Plattformen ausgeführt wird. Die Nutzer*innenzahlen der Plattformen können uns nur wenig über die genaue Zahl der Arbeiter*innen sagen, da sich zwar viele Menschen bei der Plattform anmelden, aber nur wenige bekommen regelmäßig Aufgaben. Unter Berücksichtigung von Forschungsarbeiten zur Anzahl der Menschen, die online arbeiten, und der Nutzer*innenbasis der Plattformen schätze ich, dass es sich um etwa zehn Millionen Menschen handeln könnte, die Datenarbeit ausführen.

Die Verbreitung von Datenarbeiter*innen findet weltweit statt, da diese Art von Arbeit in vielen Ländern möglich ist, solange eine Internetverbindung verfügbar ist. Länder mit einer gut entwickelten Online-Infrastruktur und einem größeren Pool an Internetnutzer*innen neigen jedoch dazu, mehr Clickworker zu haben. Zu den Ländern, in denen Clickworking besonders verbreitet ist, gehören die USA, Venezuela, Indien, Philippinen, Bangladesch und Kenia. Auftraggeber*innen suchen nach kostengünstigen Arbeitskräften. Plattformen wie Amazon Mechanical Turk und Datenunternehmen wie etwa Sama zielen auf Länder ab, die hohe Arbeitslosenquoten aufweisen. Orte, an denen wirtschaftliche, Umwelt- und politische Krisen Arbeiter*innen abhängig machen. Plattformen, Datenunternehmen und v.a. Auftraggeber*innen profitieren oft von der preiswerten Arbeit der Data Worker und erzielen hohe Gewinne, während die Datenarbeiter*innen unter schlechten Bedingungen tätig sind.

Sie werden oft nach dem Prinzip „Pay per Task“ bezahlt, wobei die Entlohnung je nach Art der Aufgabe und ihrer Komplexität variiert. Aber, vor allem, variiert die Bezahlung je nach dem Ort, in dem sich die Arbeitenden befinden. OpenAI beispielsweise lagerte die Datenarbeit für ChatGPT über die Firma Sama an kenianische Arbeiter*innen aus. Es handelte sich um eine Klassifizierungs- bzw. Annotationsaufgabe: Sie müssten Texfragmente lesen, interpretieren und trennen. Viele dieser Textfragmente beinhalteten graphische Beschreibungen von Gewalt, Missbrauch, Folter und Mord. Natürlich ist dies keine angenehme Aufgabe. OpenAI bzw. Sama bezahlten den kenianischen Datenarbeiter*innen weniger als zwei Dollar pro Stunde und nachdem die Arbeiter*innen mit diesem sehr verstörendem Material arbeiten mussten, haben die unternehmen ihnen keine psychologische Unterstützung angeboten.

Wie muss man sich konkret Ihre Forschung vorstellen?

Meine Forschung ist tiefgreifend und intensiv, was bestimmt mit meiner Ausbildung als Soziologin begründet ist. Ich halte es für inakzeptabel, über prekarisierte Arbeiter*innen aus dem Komfort meines Arbeitszimmers zu schreiben. Deshalb bestand ein Großteil meiner Forschung aus Feldarbeit, das heißt, ich habe die Orte aufgesucht, an denen Datenarbeit stattfindet und Zeit mit den Arbeiter*innen verbracht. Seit einigen Jahren, und nachdem ich Fördermittel sichern konnte, wurden all meine Studien in enger Zusammenarbeit mit den Datenarbeiter*innen durchgeführt: Sie beteiligen sich als Mitforscher*innen und wir entwickeln gemeinsam die Forschungsfragen, führen die Studie durch und arbeiten gemeinsam an den Ergebnissen. Aktuell forschen wir mit Datenarbeiter*innen in Syrien, Argentinien, Brasilien, Kenia und Deutschland.

Wie ist der Stand der Forschung auf dem Gebiet? Und wie sieht speziell der Austausch mit US-Forscher*innen aus?

Ich habe vor sechs Jahren mit dieser Forschung begonnen als fast niemand über die menschliche Arbeit hinter KI-Systemen sprach, vor allem nicht aus computerwissenschaftlicher Sicht. Mittlerweile gilt unsere Forschung als wegweisend in diesem Bereich und zahlreiche Presseartikeln haben über unsere Ergebnisse berichtet. Ich habe über die Jahre mit vielen Forscher*innen aus den USA und anderen Ländern gearbeitet. Etwas intensiver waren und sind die Kooperationen mit Julian Posada von dr University of Yale und Adriana Alvarado von IBM Research, die ebenfalls am Symposium in New York teilgenommen haben. Außer meiner Tätigkeit als Forschungsgruppenleiterin am Weizenbaum-Institut arbeite ich auch am vom ehemaligen Google Ethical AI-Chefin Timnit Gebru gegründeten DAIR Institute. Das ist ein Non-profit-Institut mit dem Ziel, proaktiv mit KI umzugehen und Wege zu finden, sie zum Nutzen der Menschen einzusetzen, wo dies möglich ist, vor möglichen Schäden zu warnen und sie zu blockieren, wenn sie mehr Schaden als Nutzen anrichtet.

Was muss getan werden, um die Bedingungen für die Menschen zu verbessern? Was kann eventuell jede und jeder Einzelne von uns tun?

Das Grundlegende ist das Verständnis, dass Datenarbeit keine gering qualifizierte Arbeit ist. Datenarbeiter*innen verfügen in den meisten Fällen über spezifisches Fachwissen, das von der Beherrschung mehrerer Sprachen bis hin zu geografischem Fachwissen reicht. Viele von ihnen haben Hochschulabschlüsse. Alle sind Expert*innen der Daten, mit denen sie arbeiten. Auftraggeber*innen profitieren von dieser spezifischen Expertise. Die Betrachtung von den Datenarbeiter*innen als Expert*innen und nicht als low-skill Arbeitskräfte kann dazu beitragen, das Narrativ zu ändern. Dies kann die Politikgestaltung, Lohnverhandlungen und sogar die Qualität von Datensätzen und KI-Systemen beeinflussen.

Bildungs- und Forschungseinrichtungen sind in vielen Fällen Datenarbeit-Auftraggeber. Das heißt wir alle können etwas tun, um prekäre Arbeitsbedingungen zu bekämpfen. Zum Beispiel sicherstellen, dass unsere Forschungsbudgets faire Bezahlung ermöglichen und den Datenarbeiter*innen genügend Zeit geben, um ihre Aufgaben abzuschließen. Es ist auch wichtig zu bedenken, dass eine schlechte Bewertung ihnen den Job kosten kann. Datenarbeiter*innen sind oft ein wesentlicher Teil der KI-Forschung. Die Art und Weise, wie wir sie behandeln, sollte als Frage der Forschungsethik betrachtet werden. Auf die gleiche Weise, wie institutionelle Ethikkommissionen darüber wachen, wie Forscher*innen mit Forschungsteilnehmer*innen umgehen, sollten sie auch kontrollieren, wie Datenarbeiter*innen in akademischen Forschungsprojekten behandelt werden. Wir alle können uns in unseren jeweiligen Institutionen hierfür einsetzen.

 

Autorin: Bettina Klotz

Über das Weizenbaum-Institut

Das Weizenbaum-Institut erforscht die ethischen, rechtlichen, wirtschaftlichen und gesellschaftlichen Aspekte von Internet und Digitalisierung. Das Verbundprojekt wird seit September 2017 von einem Forschungskonsortium aus Berlin und Brandenburg getragen, dem die Freie Universität Berlin, die Humboldt-Universität zu Berlin, die Universität der Künste Berlin, die Technische Universität Berlin, die Universität Potsdam, das Fraunhofer-Institut für Offene Kommunikationssysteme (FOKUS) und das Wissenschaftszentrum Berlin für Sozialforschung angehören. Gefördert wird das Weizenbaum-Institut vom Bundesministerium für Bildung und Forschung und dem Land Berlin.