Start IT/Tech Es sieht so aus, als ob OpenAI Sora in Bezug auf den...

IT/Tech

Es sieht so aus, als ob OpenAI Sora in Bezug auf den Inhalt des Spiels geschult hat – und Rechtsexperten sagen, dass dies ein Problem sein könnte

Von

11 Dezember 2024

OpenAI hat nie genau bekannt gegeben, welche Daten es zum Trainieren seiner videoerzeugenden KI Sora verwendet hat. Aber so wie es aussieht, könnten zumindest einige der Daten aus Twitch-Streams und Komplettlösungen für Spiele stammen.

Sora wurde am Montag veröffentlicht und ich spiele schon eine Weile damit (soweit es die Kapazitätsprobleme zulassen). Aus einer Text- oder Bildaufforderung kann Sora Videos von bis zu 20 Sekunden in verschiedenen Seitenverhältnissen und Auflösungen generieren.

Als OpenAI zuerst enthüllt Sora spielte im Februar in Minecraft-Videos darauf an, dass er das Modell trainiert habe. Also habe ich mich gefragt, welche anderen Videospielbewegungen möglicherweise im Trainingsset verborgen sind?

Viele, so scheint es.

Sora kann ein Video von einem Klon von Super Mario Bros. erstellen. (wenn es sich um einen fehlgeschlagenen Klon handelt):

Bildnachweis:OpenAI

Es kann Gameplay-Szenen aus einem von Call of Duty und Counter-Strike inspirierten Ego-Shooter erstellen:

OpenAI Sora-Videospiel — **Bildnachweis:**OpenAI

Und es kann einen Clip anzeigen, der einen Arcade-Kämpfer im Stil eines Teenage Mutant Ninja Turtle-Spiels aus den 90er Jahren zeigt:

Sora scheint auch zu verstehen, wie ein Twitch-Stream aussehen sollte – was bedeutet, dass sie bereits einige Male angeschaut wurde. Schauen Sie sich den Screenshot unten an, der die richtigen breiten Striche zeigt:

Noch etwas Erwähnenswertes an dem Screenshot: Er zeigt das Konterfei des beliebten Twitch-Streamers Raúl Álvarez Genes, der sich Auronplay nennt – bis hin zum Tattoo auf Genes‘ linkem Unterarm.

Auronplay ist nicht der einzige Twitch-Streamer, den Sora zu „wissen“ scheint. Es entstand ein Video einer Figur, die im Aussehen (mit einigen künstlerischen Freiheiten) Imane Anys, besser bekannt als Pokimane, ähnelt.

Zugegeben, ich musste bei manchen Anleitungen etwas kreativ werden (z. B. „Italienisches Klempnerspiel“). OpenAI hat eine Filterung implementiert, um zu verhindern, dass Sora Clips generiert, die markenrechtlich geschützte Charaktere darstellen. Wenn Sie beispielsweise etwas wie „Mortal Kombat 1 Gameplay“ eingeben, wird nichts wie der Titel angezeigt.

Meine Tests deuten jedoch darauf hin, dass Spielinhalte möglicherweise in die Trainingsdaten von Sora gelangt sind.

OpenAI war vorsichtig, woher es seine Trainingsdaten bezieht. In einem Interview Mit dem Wall Street Journal im März wollte die damalige CTO von OpenAI, Mira Murati, nicht direkt leugnen, dass Sora auf Inhalten von YouTube, Instagram und Facebook geschult wurde. Und rein technische Spezifikationen Für Sora gab OpenAI zu, dass es für die Entwicklung von Sora „öffentlich verfügbare“ Daten sowie von Medienbibliotheken wie Shutterstock lizenzierte Daten verwendet habe.

OpenAI reagierte auch nicht auf eine Bitte um Stellungnahme.

Sollten Spielinhalte tatsächlich im Sora-Trainingsset enthalten sein, könnte dies rechtliche Auswirkungen haben – insbesondere wenn OpenAI mehr interaktive Erlebnisse auf Sora aufbaut.

„Unternehmen, die mit nicht lizenziertem Videospielmaterial trainieren, gehen ein großes Risiko ein“, sagte Joshua Weigensberg, Anwalt für geistiges Eigentum bei Pryor Cashman, gegenüber TechCrunch. „Das Training eines generativen KI-Modells erfordert normalerweise das Kopieren der Trainingsdaten. Wenn es sich bei diesen Daten um Spielevideos handelt, ist es äußerst wahrscheinlich, dass urheberrechtlich geschütztes Material in den Trainingssatz aufgenommen wird.“

Wahrscheinlichkeitsmodelle

Generative KI-Modelle wie Sora sind probabilistisch. Anhand zahlreicher Daten lernen sie Muster in diesen Daten, um Vorhersagen zu treffen – zum Beispiel, dass eine Person, die in einen Hamburger beißt, eine Bissspur hinterlassen wird.

Dies ist eine nützliche Eigenschaft. Dadurch können Modelle bis zu einem gewissen Grad durch Beobachtung „lernen“, wie die Welt funktioniert. Es kann aber auch eine Achillesferse sein. Auf eine bestimmte Art und Weise gefragt, erstellen Modelle – von denen viele anhand öffentlicher Webdaten trainiert werden – nahezu Kopien ihrer Trainingsbeispiele.

Dies verärgerte verständlicherweise die Urheber, deren Werke ohne ihre Erlaubnis für Schulungen genutzt wurden. Immer mehr Menschen suchen nach Lösungen durch das Justizsystem.

Microsoft und OpenAI sind derzeit dabei verarbeitet weil es angeblich zugelassen hat, dass seine KI-Tools lizenzierten Code wiedergeben. Drei Unternehmen hinter den beliebten KI-Kunst-Apps Midjourney, Runway und Stability AI sind auf dem Vormarsch Ziel eines Falles, in dem ihnen die Verletzung von Künstlerrechten vorgeworfen wird. Und die wichtigsten Musikplattenfirmen haben eine Klage eingereicht gegen zwei Startups, die KI-gestützte Musikgeneratoren entwickeln, Udio und Suno, von Breach.

Viele KI-Unternehmen fordern seit langem Fair-Use-Schutz und behaupten, dass ihre Modelle transformative Arbeit schaffen und kein Plagiat. Suno argumentiert beispielsweise, dass sich wahlloses Training nicht von „einem Kind unterscheidet, das seine eigenen Rocksongs schreibt, nachdem es sich das Genre angehört hat“.

Aber es gibt bestimmte einzigartige Überlegungen zu Spielinhalten, sagt Evan Everist, ein auf Urheberrecht spezialisierter Anwalt bei Dorsey & Whitney.

„Gameplay-Videos beinhalten mindestens zwei Ebenen des Urheberrechtsschutzes: den Spielinhalt, der dem Spieleentwickler gehört, und das exklusive Video, das vom Spieler oder Videofilmer erstellt wurde und das Spielerlebnis festhält“, sagte Everist in einer E-Mail an TechCrunch. „Und für einige Spiele gibt es eine potenzielle dritte Rechteebene in Form von benutzergenerierten Inhalten, die in der Software erscheinen.“

Everist gab Epic ein Beispiel FortniteDadurch können Spieler ihre eigenen Spielkarten erstellen und diese für andere zur Nutzung freigeben. An einem Video einer dieser Karten wären nicht weniger als drei Urheberrechtsinhaber beteiligt, sagte er: (1) Epic, (2) die Person, die die Karte nutzt, und (3) der Ersteller der Karte.

„Wenn Gerichte eine Urheberrechtshaftung für das Training von KI-Modellen in Betracht ziehen, wäre jeder dieser Urheberrechtsinhaber potenzieller Kläger oder Lizenzgeber“, sagte Everist. „Für jeden Entwickler, der KI anhand dieser Videos trainiert, ist das Risiko exponentiell.“

Weigensberg stellte fest, dass Spiele selbst viele „schützbare“ Elemente haben, wie etwa proprietäre Texturen, die ein Richter in einem Fall des geistigen Eigentums berücksichtigen könnte. „Solange diese Werke nicht ordnungsgemäß lizenziert wurden“, sagte er, „könnte eine Schulung dazu einen Verstoß darstellen.“

TechCrunch hat mehrere Spielestudios und Herausgeber um einen Kommentar gebeten, darunter Epic, Microsoft (Inhaber von Minecraft), Ubisoft, Nintendo, Roblox und den Cyberpunk-Entwickler CD Projekt Red. Nur wenige antworteten – und keiner gab eine offizielle Stellungnahme ab.

„Zu diesem Zeitpunkt können wir kein Interview führen“, sagte ein Sprecher von CD Projekt Red gegenüber TechCrunch, dass es „derzeit keinen Kommentar“ gebe.

Riskante Ergebnisse

Es ist möglich, dass KI-Unternehmen diese Rechtsstreitigkeiten gewinnen. Gerichte können entscheiden, dass generative KI einen „höchst überzeugenden transformativen Zweck“ hat Präzedenzfall Dies geschah vor etwa einem Jahrzehnt im Rahmen der Klage der Verlagsbranche gegen Google.

In diesem Fall entschied ein Gericht, dass Googles Kopieren von Millionen Büchern in Google Books, eine Art digitales Archiv, erlaubt sei. Autoren und Verleger versuchten zu argumentieren, dass die Wiedergabe ihres geistigen Eigentums im Internet eine Verletzung darstelle.

Doch ein Urteil zugunsten von KI-Unternehmen würde Nutzer nicht unbedingt vor Vorwürfen eines Fehlverhaltens schützen. Wenn ein generatives Modell ein urheberrechtlich geschütztes Werk wieder hervorbringt, könnte eine Person, die dieses Werk dann veröffentlicht – oder es in ein anderes Projekt einbaut – immer noch für die Verletzung von geistigem Eigentum haftbar gemacht werden.

„Generative KI-Systeme erzeugen dadurch häufig erkennbare und schützbare geistige Eigentumswerte“, sagte Weigensberg. „Einfachere Systeme, die Text oder Standbilder generieren, haben oft Schwierigkeiten, die Generierung von urheberrechtlich geschütztem Material in ihrer Ausgabe zu verhindern, und daher können komplexere Systeme das gleiche Problem haben, unabhängig von den Absichten des Programmierers.“

Einige KI-Unternehmen haben dies getan Schadensersatzklauseln um diese Situationen abzudecken, falls sie auftreten sollten. Aber Klauseln enthalten oft Ausschlüsse. Zum Beispiel OpenAI Gilt nur für Firmenkunden – nicht einzelne Benutzer.

Auch über das Urheberrecht hinausgehende Risiken seien zu bedenken, sagt Weigensberg, etwa die Verletzung von Markenrechten.

„Das Ergebnis kann auch Vermögenswerte umfassen, die im Zusammenhang mit Marketing und Branding verwendet werden – einschließlich erkennbarer Gaming-Charaktere – was ein Markenrisiko darstellt“, sagte er. „Oder das Ergebnis könnte Risiken für Namens-, Bild- und Bildrechte mit sich bringen.“

Das wachsende Interesse an Weltmodelle könnte das alles noch komplizierter machen. Eine Anwendung von Weltmodellen – die OpenAI als Sora betrachtet – ist im Wesentlichen die Generierung von Videospielen in Echtzeit. Wenn diese „synthetischen“ Spiele den Inhalten ähneln, auf denen das Modell trainiert wurde, könnte dies rechtlich problematisch sein.

„Das Trainieren einer KI-Plattform auf Stimmen, Bewegungen, Charaktere, Musik, Dialoge und Kunst in einem Videospiel stellt eine Urheberrechtsverletzung dar, genau wie es auch der Fall wäre, wenn diese Elemente in anderen Kontexten verwendet würden“, sagt Avery Williams, Anwalt für Eigentumsprozesse bei McKool Smith , sagte. „Die Fragen zur fairen Nutzung, die in so vielen Klagen gegen generative KI-Unternehmen aufgekommen sind, werden die Videospielbranche genauso betreffen wie jeden anderen kreativen Markt.“

Quelle link

Wahrscheinlichkeitsmodelle

Riskante Ergebnisse

Verwandte ArtikelMehr vom Autor

Jedes Smartphone in Los Angeles erhielt versehentlich eine Evakuierungswarnung für Waldbrände

Mercedes-Benz-Elektrofahrzeuge werden nächsten Monat Zugang zum Supercharger-Netzwerk von Tesla erhalten

Tesla bringt neues Model Y in China auf den Markt

Kategorie

Verwandte Artikel Mehr vom Autor