None

Wie menschliche Trainer KI schlauer machen

ChatGPT & Co. verdanken ihre Expertise in zahlreichen Fachgebieten menschlichen Trainern. sutadimages – Shutterstock



Brachten in der Anfangszeit noch riesige Teams von billigen Arbeitskräften den Large Language Models (LLMs) wie GPT die Grundlagen bei, ist nun mehr und mehr Expertenwissen gefragt. „Vor einem Jahr konnten wir noch Studenten einstellen, um der KI beizubringen, wie sie sich verbessern kann“, erklärte Ivan Zhang, Mitbegründer des kanadischen KI-Spezialisten Cohere, gegenüber Reuters. „Jetzt haben wir zugelassene Ärzte, die den Modellen beibringen, wie man sich im medizinischen Umfeld verhält, oder Finanzanalysten oder Buchhalter.“



Der mit 5,5 Milliarden Dollar bewertete Anbieter von Business-KI-Lösungen arbeitet zu diesem Zweck mit Invisible Technologies zusammen. 2015 gegründet, war Invisible zunächst auf Workflow Automation spezialisiert – bis sich im Frühjahr 2022 das damals noch relativ unbekannte Research-Unternehmen OpenAI bei ihnen meldete, wie Invisible-Mitbegründer Francis Pedraza im Gespräch mit Reuters berichtete.



Reinforcement Learning mit menschlichem Feedback



Ihr Problem: Wenn man einer frühen Version von ChatGPT eine Frage stellte, halluzinierte sie. Man konnte sich nicht auf die Antwort verlassen. „Sie brauchten einen fortschrittlichen KI-Trainingspartner, der Reinforcement Learning mit menschlichem Feedback anbietet“, so der Invisible-Mann.



Mittlerweile hat das kalifornische Startup weltweit Tausende von Experten unter Vertrag, die Unternehmen wie Microsoft oder OpenAI dabei helfen, ihre KI-Modelle zu trainieren und Halluzinationen zu reduzieren.



Je nachdem, was die KI-Firmen wollen, stellt Invisible Mitarbeiter mit entsprechenden Abschlüssen für diese Projekte ein und entlastet damit die KI-Firmen, wie Pedraza erklärt: „OpenAI hat einige der unglaublichsten Informatiker der Welt, aber sie sind nicht unbedingt Experten für schwedische Geschichte, Chemie oder Biologie oder andere Themen, die gefragt werden“, meinte der KI-Experte und fügte hinzu, dass allein bei OpenAI über 1.000 Auftragsarbeiter beschäftigt seien. Der Wettbewerber Cohere wiederum nutze die Trainer von Invisible, um seinem GenAI-Modell beizubringen, relevante Informationen in einem großen Datensatz zu finden.



Von billigen Klick-Arbeitern zu Fachexperten



Der Einsatz von menschlichen Trainern für generative KI ist nicht unüblich. Schon früh wurden meist weniger qualifizierte Menschen, die vorwiegend aus Schwellenländern stammen, hinzugezogen, um gegen möglichst geringen Lohn Daten zu kennzeichnen. 2023 Jahr sorgte ein Bericht des Time Magazine für Aufsehen, wonach OpenAI Klickarbeiter in Kenia weniger als zwei Dollar pro Stunde dafür zahlte, anstößige Inhalte zu kennzeichnen – und so die Trainingsdaten von GPT zu säubern.



Um diese Kennzeichnungen für ein Lernmodell zu erhalten, schickte OpenAI dem Bericht zufolge ab November 2021 Zehntausende von Textfragmenten an ein Outsourcing-Unternehmen in Kenia, in denen sexueller Kindesmissbrauch, Grausamkeit, Mord, Selbstmord, Folter, Selbstverletzung und Inzest detailliert beschrieben wurden, .



Die Aufgabenstellung bei Invisible und Co. ist etwas komplexer und wird auch vergleichsweise besser bezahlt. Dem Reuters-Bericht zufolge zahlt Invisible bis zu 40 Dollar pro Stunde, je nach Standort des Arbeitnehmers und der Komplexität der Arbeit. Bei Outlier, einer Plattform, die Fachexperten für die Weiterentwicklung und Bewertung von großen Sprachmodellen vermittelt, werden bis zu 50 Dollar pro Stunde gezahlt, während Labelbox hochqualifizierten KI-Trainern nach eigenen Angaben über seine Tochter Alignerr bis zu 60 Dollar pro Stunde zahlt.



Auch wenn – wie bei den Beträgen unschwer erkennbar – der Fokus auf Schwellenländern liegt: Durch die Nachfrage nach spezialisierten KI-Trainern in Dutzenden von Sprachen entsteht eine gut bezahlte Nische für Experten aus einer Vielzahl von Fachrichtungen, ohne dass diese über Programmierkenntnisse verfügen müssen.