Start IT/Tech OpenAI hat versehentlich mögliche Beweise in der Urheberrechtsklage der NY Times gelöscht

OpenAI hat versehentlich mögliche Beweise in der Urheberrechtsklage der NY Times gelöscht

15
0
OpenAI logo with spiraling pastel colors (Image Credits: Bryce Durbin / TechCrunch)

Anwälte der New York Times und der Daily News Verarbeitung OpenAI soll ihre Arbeit zum Trainieren seiner KI-Modelle ohne Erlaubnis kopiert haben. OpenAI-Ingenieure sollen versehentlich möglicherweise für den Fall relevante Daten gelöscht haben.

Anfang Herbst erklärte sich OpenAI bereit, zwei virtuelle Maschinen bereitzustellen, damit Anwälte von The Times und Daily News in ihren KI-Trainingssuiten nach ihren urheberrechtlich geschützten Inhalten suchen konnten. (Virtuelle Maschinen sind softwarebasierte Computer, die im Betriebssystem eines anderen Computers vorhanden sind und häufig zu Testzwecken, zum Sichern von Daten und zum Ausführen von Anwendungen verwendet werden.) In einem Brief sagen die Anwälte der Verlage, dass sie und die von ihnen beauftragten Experten mehr als ausgegeben haben 150 Stunden seit dem 1. November für die Recherche von OpenAI-Trainingsdaten.

Doch am 14. November löschten OpenAI-Ingenieure alle auf einer der virtuellen Maschinen gespeicherten Suchdaten der Herausgeber, wie aus dem oben genannten Schreiben hervorgeht, das in der Nacht zum Mittwoch beim US-Bezirksgericht für den südlichen Bezirk von New York eingereicht wurde .

OpenAI versuchte, die Daten wiederherzustellen – und hatte Erfolg. Da die Ordnerstruktur und die Dateinamen jedoch „unwiederbringlich“ verloren gingen, können die wiederhergestellten Daten „nicht dazu verwendet werden, festzustellen, wo die kopierten Artikel der Kläger zum Erstellen von Modellen (von OpenAI) verwendet wurden“, heißt es in dem Schreiben.

„Die Nachrichtenkläger waren gezwungen, ihre Arbeit von Grund auf neu zu erstellen, was erhebliche Arbeitsstunden und Computerverarbeitungszeit erforderte“, schrieben Anwälte von The Times und Daily News. „Die Kläger in den Nachrichten haben gestern erfahren, dass die wiederhergestellten Daten unbrauchbar sind und dass die Arbeit ihrer Experten und Anwälte einer ganzen Woche wiederholt werden muss, weshalb dieses ergänzende Schreiben heute eingereicht wird.“

Der Anwalt der Kläger stellt klar, dass sie keinen Grund zu der Annahme haben, dass der Ausschluss beabsichtigt war. Sie sagen jedoch, dass der Vorfall deutlich macht, dass OpenAI „am besten in der Lage ist, seine eigenen Datensätze“ mithilfe seiner eigenen Tools nach potenziell rechtsverletzenden Inhalten zu durchsuchen.

Wir haben OpenAI um einen Kommentar gebeten und werden diesen Artikel aktualisieren, wenn wir etwas hören.

In diesem und anderen Fällen hat OpenAI behauptet, dass Trainingsmodelle, die öffentlich verfügbare Daten nutzen – einschließlich Artikeln aus The Times und Daily News – eine faire Verwendung darstellen. Mit anderen Worten, beim Erstellen von Modellen wie GPT-4oOpenAI ist der Ansicht, dass OpenAI, das aus Milliarden von Beispielen aus E-Books, Essays und mehr „lernt“, um menschlich klingende Texte zu generieren, nicht verpflichtet ist, die Beispiele zu lizenzieren oder zu bezahlen – selbst wenn es mit diesen Modellen Geld verdient.

Allerdings hat OpenAI Lizenzverträge mit einer wachsenden Zahl neuer Verlage unterzeichnet, darunter The Associated Press, Business Insider-Inhaber Axel Springer, Financial Times, die People-Muttergesellschaft Dotdash Meredith und News Corp. öffentliche Angebote, aber ein Content-Partner, Dotdash, schon angeblich Sie erhalten mindestens 16 Millionen US-Dollar pro Jahr.

OpenAI hat weder bestätigt noch dementiert, dass es seine KI-Systeme ohne Erlaubnis auf bestimmte urheberrechtlich geschützte Werke trainiert hat.

Quelle link

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein