Sora, der Videogenerator von OpenAI, startet heute – zumindest für einige Benutzer.
YouTuber Marques Brownlee enthüllte die Neuigkeiten in einem Video, das am Montagmorgen auf seinem Kanal veröffentlicht wurde. Brownlee erhielt frühzeitig Zugang zu Sora und gab in einem 15-minütigen Rückblick seine ersten Eindrücke preis.
Sora lebt Sora.comsagte Brownlee, dessen Homepage eine Liste kürzlich erstellter Sora-Videos zeigt, die von OpenAI kuratiert wurden. (Zum Zeitpunkt der Veröffentlichung stand es uns hier bei TechCrunch nicht zur Verfügung.) Bemerkenswert ist, dass das Tool nicht integriert ist GPT-Chatdie KI-basierte Chatbot-Plattform von OpenAI. Sora scheint vorerst ein separates Produkt zu sein.
Videos auf der Sora-Homepage können zur späteren Ansicht auf der Registerkarte „Gespeichert“ mit Lesezeichen versehen, in Ordnern organisiert und angeklickt werden, um zu sehen, welche Textaufforderungen zur Erstellung verwendet wurden. Laut Brownlee kann Sora Videos aus hochgeladenen Bildern sowie Eingabeaufforderungen generieren und vorhandene, von Sora erstellte Videos bearbeiten.
Mithilfe der „Remix“-Funktion können Benutzer die Änderungen beschreiben, die sie in einem Video sehen möchten, und Sora wird versuchen, diese in einen neu generierten Clip zu integrieren. Re-Mix verfügt über eine „Stärke“-Einstellung, mit der Benutzer festlegen können, wie stark Sora das Zielvideo verändern soll. Höhere Werte ergeben Videos, die mehr künstlerische Freiheiten erfordern.
Sora kann Bilder mit bis zu 1080p erzeugen, sagte Brownlee – aber je höher die Auflösung, desto länger dauert die Erstellung der Videos. Das Aufnehmen mit 1080p dauert 8x länger als mit 480p, der schnellsten Option, während 720p viermal länger dauert.
Brownlee sagte, dass die Erstellung eines 1080p-Videos in seinen Tests durchschnittlich „einige Minuten“ gedauert habe. „Das passiert auch jetzt, wo es fast niemand mehr nutzt“, sagte er. „Ich frage mich, wie lange es dauern wird, bis es für jedermann zugänglich ist.“
Neben der Generierung einzelner Clips verfügt Sora über eine „Storyboard“-Funktion, mit der Benutzer Anweisungen aneinanderreihen können, um Szenen oder Videosequenzen zu erstellen, sagte Brownlee. Dabei geht es vermutlich darum, die Konsistenz zu verbessern – eine berüchtigte Schwäche von KI-Videogeneratoren.
Aber wie ist Soras Leistung? Nun, sagte Brownlee, weist es die gleichen Mängel auf wie andere generative Tools auf dem Markt, nämlich Probleme im Zusammenhang mit der Objektpermanenz. In Soras Videos laufen Objekte auf sinnlose Weise vor- oder hintereinander vorbei und verschwinden und tauchen ohne Grund wieder auf.
Beine seien eine weitere große Quelle von Problemen für Sora, sagte Brownlee. Immer wenn eine Person oder ein Tier mit Beinen in einem Clip längere Zeit laufen muss, verwechselt Sora die Vorder- und Hinterbeine. Die Beine würden auf anatomisch unmögliche Weise hin und her „wechseln“, sagte Brownlee.
Sora verfügt laut Brownlee über eine Reihe eingebauter Sicherheitsvorkehrungen und verbietet Urhebern die Erstellung von Bildern, die Personen unter 18 Jahren zeigen, Gewalt oder „explizite Themen“ enthalten und das Urheberrecht anderer verletzen könnten. Laut Brownlee generiert Sora auch keine Videos aus Bildern mit Persönlichkeiten des öffentlichen Lebens, erkennbaren Charakteren oder Logos und versieht jedes Video mit einem Wasserzeichen – allerdings mit einem visuellen Wasserzeichen, das leicht zugeschnitten werden kann.
Wofür ist Sora also da? Brownlee fand es nützlich für Dinge wie Titelfolien in einem bestimmten Stil, Animationen, Zusammenfassungen und Stop-Motion-Filmmaterial. Aber er schreckte davor zurück, ihn für irgendetwas Fotorealistisches zu unterstützen.
„Es ist beeindruckend, dass es sich um ein KI-generiertes Video handelt, aber man erkennt schnell, dass es sich um ein KI-generiertes Video handelt“, sagte er über die meisten Clips von Sora. „Die Dinge werden wirklich kompliziert.“