Start IT/Tech OpenAI hat versehentlich mögliche Beweise in der Urheberrechtsklage der NY Times gelöscht...

OpenAI hat versehentlich mögliche Beweise in der Urheberrechtsklage der NY Times gelöscht (aktualisiert)

15
0
OpenAI logo with spiraling pastel colors (Image Credits: Bryce Durbin / TechCrunch)

Anwälte der New York Times und der Daily News Verarbeitung OpenAI soll ihre Arbeit zum Trainieren seiner KI-Modelle ohne Erlaubnis kopiert haben. OpenAI-Ingenieure sollen versehentlich möglicherweise für den Fall relevante Daten gelöscht haben.

Anfang Herbst erklärte sich OpenAI bereit, zwei virtuelle Maschinen bereitzustellen, damit Anwälte von The Times und Daily News in ihren KI-Trainingssuiten nach ihren urheberrechtlich geschützten Inhalten suchen konnten. (Virtuelle Maschinen sind softwarebasierte Computer, die im Betriebssystem eines anderen Computers vorhanden sind und normalerweise zu Testzwecken, zum Sichern von Daten und zum Ausführen von Anwendungen verwendet werden.) In a BriefAnwälte der Herausgeber sagen, dass sie und beauftragte Experten seit dem 1. November mehr als 150 Stunden damit verbracht haben, OpenAI-Trainingsdaten zu recherchieren.

Doch am 14. November löschten OpenAI-Ingenieure alle auf einer der virtuellen Maschinen gespeicherten Suchdaten der Herausgeber, wie aus dem oben genannten Schreiben hervorgeht, das in der Nacht zum Mittwoch beim US-Bezirksgericht für den südlichen Bezirk von New York eingereicht wurde .

OpenAI versuchte, die Daten wiederherzustellen – und hatte Erfolg. Da die Ordnerstruktur und die Dateinamen jedoch „unwiederbringlich“ verloren gingen, können die wiederhergestellten Daten „nicht dazu verwendet werden, festzustellen, wo die kopierten Artikel der Kläger zum Erstellen von Modellen (von OpenAI) verwendet wurden“, heißt es in dem Schreiben.

„Die Nachrichtenkläger waren gezwungen, ihre Arbeit von Grund auf neu zu erstellen, was erhebliche Arbeitsstunden und Computerverarbeitungszeit erforderte“, schrieben Anwälte von The Times und Daily News. „Die Kläger in den Nachrichten haben gestern erfahren, dass die wiederhergestellten Daten unbrauchbar sind und dass die Arbeit ihrer Experten und Anwälte einer ganzen Woche wiederholt werden muss, weshalb dieses ergänzende Schreiben heute eingereicht wird.“

Der Anwalt der Kläger stellt klar, dass sie keinen Grund zu der Annahme haben, dass der Ausschluss beabsichtigt war. Sie sagen jedoch, dass der Vorfall deutlich macht, dass OpenAI „am besten in der Lage ist, seine eigenen Datensätze“ mithilfe seiner eigenen Tools nach potenziell rechtsverletzenden Inhalten zu durchsuchen.

Ein OpenAI-Sprecher lehnte eine Stellungnahme ab.

Doch am Freitagabend, dem 22. November, reichte der Anwalt von OpenAI Klage ein Antwort zu dem Brief, den Anwälte am Mittwoch für The Times und Daily News verschickten. In ihrer Antwort bestritten die Anwälte von OpenAI unmissverständlich, dass OpenAI jegliche Beweise ausgeschlossen habe, und behaupteten stattdessen, dass die Kläger für eine Fehlkonfiguration des Systems verantwortlich seien, die zu einem technischen Problem geführt habe.

„Die Kläger beantragten eine Konfigurationsänderung auf einem von mehreren Computern, die OpenAI zur Suche nach Trainingsdatensätzen zur Verfügung stellte“, schrieb der Anwalt von OpenAI. „Die Umsetzung der von den Klägern geforderten Änderung führte jedoch dazu, dass die Ordnerstruktur und einige Dateinamen auf einer Festplatte entfernt wurden – einem Laufwerk, das als temporärer Cache verwendet werden sollte … Es gibt jedenfalls keinen Grund dafür.“ Ich denke, dass wirklich alle Dateien verloren gegangen sind.“

In diesem und anderen Fällen hat OpenAI behauptet, dass Trainingsmodelle, die öffentlich verfügbare Daten nutzen – einschließlich Artikeln aus The Times und Daily News – eine faire Verwendung darstellen. Mit anderen Worten, beim Erstellen von Modellen wie GPT-4oDas Unternehmen „lernt“ aus Milliarden von Beispielen aus E-Books, Essays und mehr, um menschlich klingende Texte zu generieren. OpenAI ist davon überzeugt, dass es nicht verpflichtet ist, die Beispiele zu lizenzieren oder zu bezahlen – selbst wenn es mit diesen Modellen Geld verdient.

Allerdings hat OpenAI Lizenzverträge mit einer wachsenden Zahl neuer Verlage unterzeichnet, darunter Associated Press, Business Insider-Eigentümer Axel Springer, die Financial Times, die People-Muttergesellschaft Dotdash Meredith und News Corp. öffentliche Angebote, aber ein Content-Partner, Dotdash, ist es angeblich Sie erhalten mindestens 16 Millionen US-Dollar pro Jahr.

OpenAI hat weder bestätigt noch dementiert, dass es seine KI-Systeme ohne Erlaubnis auf bestimmte urheberrechtlich geschützte Werke trainiert hat.

Update: Antwort von OpenAI auf die Vorwürfe hinzugefügt.

Quelle link