Mark Zuckerberg habe Metas Verwendung von „Raubkopien“ von urheberrechtlich geschützten Büchern zum Trainieren der künstlichen Intelligenzmodelle des Unternehmens genehmigt, behauptete eine Gruppe von Autoren in einem US-Klage.
Intern zitieren Meta In der Mitteilung heißt es, der CEO des Social-Networking-Unternehmens habe die Verwendung des LibGen-Datensatzes, eines großen Online-Archivs von Büchern, unterstützt, obwohl das KI-Führungsteam des Unternehmens gewarnt hatte, dass es sich um einen Datensatz handele, „von dem wir wissen, dass er raubkopiert ist“.
In der internen Mitteilung heißt es, dass die Verwendung einer Datenbank mit Raubkopien die Verhandlungen des Facebook- und Instagram-Eigentümers mit den Aufsichtsbehörden schwächen könnte, heißt es in der Akte. „Die Berichterstattung in den Medien, die darauf hindeutet, dass wir einen Datensatz verwendet haben, von dem wir wissen, dass es sich um Raubkopien handelt, wie etwa LibGen, könnte unsere Verhandlungsposition gegenüber den Regulierungsbehörden untergraben.“
Der amerikanische Autor Ta-Nehisi Coates, die Komikerin Sarah Silverman und die anderen Autoren, die Meta wegen Urheberrechtsverletzung verklagten, erhoben die Vorwürfe in einer am Mittwoch vor einem Bundesgericht in Kalifornien angekündigten Klage.
Die Autoren verklagte Meta im Jahr 2023und argumentierte, dass das Social-Media-Unternehmen seine Bücher missbraucht habe, um Llama zu trainieren, das große Sprachmodell, das seine Chatbots antreibt.
Der Library Genesis- oder LibGen-Datensatz ist eine „Schattenbibliothek“, die ihren Ursprung in Russland hat und angeblich Millionen von Romanen, Sachbüchern und wissenschaftlichen Zeitschriften enthält. Letztes Jahr ordnete ein Bundesgericht in New York den anonymen Betreibern von LibGen an, dies zu tun Zahlen Sie einer Gruppe von Verlegern 30 Millionen US-Dollar (24 Millionen Pfund) Schadensersatz wegen Urheberrechtsverletzung.
Die Verwendung urheberrechtlich geschützter Inhalte zum Trainieren von KI-Modellen ist zu einem geworden juristisches Schlachtfeld bei der Entwicklung generativer KI-Tools wie dem ChatGPT-Chatbot, wobei Kreativprofis und Verlage davor warnen, dass ihre Arbeit ohne Erlaubnis verwendet werden darf ihre Lebensgrundlage gefährden und Geschäftsmodelle.
In der Akte wird ein Memo zitiert, das sich auf Mark Zuckerbergs Initialen bezieht und feststellt, dass „nach der Eskalation an MZ“ Metas KI-Team „die Genehmigung für die Verwendung von LibGen erhalten hat“.
Unter Berufung auf interne Mitteilungen heißt es in der Akte auch, dass Meta-Ingenieure den Zugriff auf und die Überprüfung von LibGen-Daten diskutierten, aber zögerten, diesen Prozess zu starten, weil „Torrenting“, ein Begriff für Peer-to-Peer-Dateifreigabe, von „einem (Meta-eigenen) Unternehmens-Laptop aus“ nicht möglich sei fühlt sich nicht richtig an“.
Ein US-Bezirksrichter, Vince Chhabria, wies letztes Jahr Behauptungen zurück, dass von den KI-Modellen von Meta generierte Texte die Urheberrechte der Autoren verletzten und dass Meta ihren Büchern illegal Urheberrechtsverwaltungsinformationen (CMI) entzogen habe, die sich auf Informationen über das Werk, einschließlich des Titels, beziehen. Name des Autors und Urheberrechtsinhabers. Den Klägern wurde jedoch gestattet, ihre Schriftsätze zu ändern.
Die Autoren argumentierten diese Woche, dass die Beweise ihre Verletzungsansprüche untermauerten und es rechtfertigten, ihre CMI-Klage wieder aufzunehmen und einen neuen Vorwurf des Computerbetrugs hinzuzufügen.
Chhabria sagte bei einer Anhörung am Donnerstag, dass er den Autoren erlauben würde, eine geänderte Beschwerde einzureichen, äußerte jedoch Skepsis hinsichtlich der Begründetheit des Betrugs und der CMI-Ansprüche.
Meta wurde für einen Kommentar kontaktiert.
Reuters hat zu diesem Artikel beigetragen