Start IT/Tech Mark Zuckerberg gab dem Llama-Team von Meta die Erlaubnis, an urheberrechtlich geschützten...

Mark Zuckerberg gab dem Llama-Team von Meta die Erlaubnis, an urheberrechtlich geschützten Werken zu trainieren und Ansprüche einzureichen

8
0
Google-Suchanfragen zum Löschen von Facebook und Instagram explodieren, nachdem Meta die Faktenprüfung beendet hat

Anwälte der Kläger in einer gegen Meta eingereichten Urheberrechtsklage behaupten, Meta-CEO Mark Zuckerberg habe dem Team hinter dem Projekt des Unternehmens grünes Licht gegeben Lama-KI-Modelle Verwenden Sie einen Datensatz mit raubkopierten E-Books und Artikeln für Schulungen.

Der Fall Kadrey v. Meta ist einer von vielen, die gegen Technologiegiganten vorgehen, die KI entwickeln, und Unternehmen beschuldigen, ohne Erlaubnis Modelle an urheberrechtlich geschützten Werken zu trainieren. In den meisten Fällen haben Beklagte wie Meta behauptet, dass sie durch „Fair Use“ geschützt sind, die US-amerikanische Rechtsdoktrin, die es erlaubt, urheberrechtlich geschützte Werke zur Schaffung von etwas Neuem zu verwenden, solange es ausreichend transformativ ist. Viele Züchter weisen dieses Argument zurück.

In kürzlich unbearbeitete Dokumente Am Mittwochabend beim US-Bezirksgericht für den nördlichen Bezirk von Kalifornien eingereicht, haben die Kläger im Fall Kadrey v. Meta, zu dem auch die Bestsellerautoren Sarah Silverman und Ta-Nehisi Coates gehören, erzählt von Metas Aussage von Ende letzten Jahres, in der bekannt wurde, dass Zuckerberg Metas Verwendung eines Datensatzes namens LibGen für Schulungen im Zusammenhang mit Lama genehmigte.

LibGen, das sich selbst als „Link-Aggregator“ bezeichnet, bietet Zugriff auf urheberrechtlich geschützte Werke von Verlagen wie Cengage Learning, Macmillan Learning, McGraw Hill und Pearson Education. LibGen wurde mehrfach verklagt, zur Schließung verurteilt und wegen Urheberrechtsverletzung mit einer Geldstrafe in zweistelliger Millionenhöhe belegt.

Laut der Aussage von Meta, die vom Anwalt der Kläger übermittelt wurde, genehmigte Zuckerberg die Verwendung von LibGen zum Trainieren von mindestens einem von Metas Lama-Modellen, trotz der Bedenken des KI-Führungsteams von Meta und anderer im Unternehmen. In der Klage werden Vertreter von Meta zitiert, die LibGen als einen „Datensatz, von dem wir wissen, dass er raubkopiert ist“ bezeichnen und darauf hinweisen, dass seine Verwendung „der Verhandlungsposition von (Meta) gegenüber den Regulierungsbehörden schaden könnte.“

Das Dokument zitiert auch ein Memo an die Entscheidungsträger von Meta AI, in dem es heißt, dass das Meta AI-Team nach der „Eskalation an MZ“ „die Genehmigung für die Verwendung von LibGen erhalten“ habe. (MZ ist hier eine ziemlich offensichtliche Abkürzung für „Mark Zuckerberg“.)

Die Details stimmen offenbar mit der Berichterstattung der New York Times vom vergangenen April überein. der Meta vorschlug, Geld zu sparen, um Daten für seine KI zu sammeln.. Zu einem Zeitpunkt beauftragte Meta Auftragnehmer in Afrika mit der Zusammenstellung von Buchzusammenfassungen und erwog der Times zufolge, den Verlag Simon & Schuster zu kaufen. Die Führungskräfte des Unternehmens kamen jedoch zu dem Schluss, dass die Aushandlung von Lizenzen zu lange dauern würde, und argumentierten, dass eine faire Nutzung eine solide Verteidigung sei.

Die Klage vom Mittwoch enthält neue Vorwürfe, etwa dass Meta möglicherweise versucht hat, seinen angeblichen Verstoß zu verbergen, indem es die Daten von LibGen gelöscht hat.

Nach Angaben des Anwalts der Kläger hat der Meta-Ingenieur Nikolay Bashlykov, der im Llama-Forschungsteam arbeitet, ein Skript geschrieben, um Urheberrechtsinformationen, einschließlich der Wörter „Copyright“ und „Acknowledgements“, aus E-Books bei LibGen zu entfernen. Unabhängig davon hat Meta angeblich Urheberrechtsmarkierungen aus wissenschaftlichen Zeitschriftenartikeln und „Quellenmetadaten“ in den Trainingsdaten entfernt, die es für Llama verwendet hat.

„Dieser Befund legt nahe, dass Meta (Urheberrechtsinformationen) nicht nur zu Schulungszwecken entfernt“, heißt es in der Klage, „sondern auch, um seine Urheberrechtsverletzung zu verbergen, weil das Entfernen urheberrechtlich geschützter Werke … verhindert, dass Llama Urheberrechtsinformationen bereitstellt, die Llama-Benutzer und die Öffentlichkeit alarmieren könnten.“ zur Verletzung der Meta.“

Laut dem neuesten Dokument gab Meta bei Aussagen auch bekannt, dass es LibGen per Torrent heruntergeladen hat, ein Schritt, der einige Meta-Forschungsingenieure zum Nachdenken brachte. Torrenting, eine Form der Dateiverteilung über das Internet, erfordert, dass Torrenter die Dateien, die sie erhalten möchten, „säen“ oder gleichzeitig hochladen.

Der Anwalt der Kläger behauptet, Meta habe tatsächlich eine andere Form der Urheberrechtsverletzung begangen, indem es Torrents von LibGen heruntergeladen und so zur Verbreitung seiner Inhalte beigetragen habe. Meta habe auch versucht, seine Aktivitäten zu verbergen, behauptet der Anwalt, indem es die Anzahl der hochgeladenen Dateien minimiert habe.

Der Klageschrift zufolge hat Metas Leiter für generative KI, Ahmad Ah-Dahle, „den Weg geebnet“, Torrents von LibGen herunterzuladen – und damit Bashlykovs Vorbehalte beiseite geschoben, dass dies „juristisch illegal sein könnte“.

„Hätte Meta die Werke der Kläger in einer Buchhandlung gekauft oder sie in einer Bibliothek ausgeliehen und ohne Lizenz ihre Lama-Modelle darauf trainiert, hätte es eine Urheberrechtsverletzung begangen“, schrieb der Anwalt der Kläger in der Klage. „Metas Entscheidung, legale Bucherwerbsmethoden zu umgehen und ein wissender Teilnehmer eines illegalen Torrent-Netzwerks zu werden … dient als Beweis für eine Urheberrechtsverletzung.“

Der Fall gegen Meta ist noch lange nicht entschieden. Im Moment bezieht es sich nur auf die frühen Llama-Modelle von Meta – nicht auf die jüngsten Veröffentlichungen. Und das Gericht könnte durchaus zugunsten von Meta entscheiden, wenn es vom Fair-Use-Argument des Unternehmens überzeugt wird.

Aber die Anschuldigungen werfen kein gutes Licht auf Meta, wie der Richter, der den Fall leitet, Richter Thomas Hixson, am Mittwoch in einem Beschluss feststellte, mit dem er Metas Antrag auf Schwärzung großer Teile der Klage ablehnte.

„Es ist klar, dass die Versiegelungsanordnung von Meta nicht dazu gedacht war, vor der Offenlegung vertraulicher Geschäftsinformationen zu schützen, die Wettbewerber zu ihrem Vorteil nutzen könnten“, schrieb Hixson. „Es war vielmehr darauf ausgelegt, negative Publicity zu vermeiden.“

Wir haben Meta um einen Kommentar gebeten und werden diesen Artikel aktualisieren, wenn wir etwas hören.

Quelle link

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein