Start News Was ist Sora Turbo und ist es ein Game-Changer für künstliche Intelligenz?

Was ist Sora Turbo und ist es ein Game-Changer für künstliche Intelligenz?

45
0
Was ist Sora Turbo und ist es ein Game-Changer für künstliche Intelligenz?

Sora, ein Videogeneratorprogramm mit künstlicher Intelligenz (KI), das 2021 vom Startup OpenAI entwickelt wurde, schlägt Wellen, da es nun die Forschungsphase verlassen hat und unter dem neuen Namen Sora Turbo offiziell der Öffentlichkeit zugänglich gemacht wurde.

Der Start löste bei den Nutzern einen Online-Rausch aus und veranlasste das Unternehmen, die Erstellung neuer Konten vorübergehend einzustellen, nachdem es von einer Lawine an Datenverkehr überschwemmt wurde.

Sora verwendet Textaufforderungen zum Erstellen von Inhalten, ähnlich wie andere Programme zur Inhaltserstellung wie ChatGPT. Im Gegensatz zu herkömmlichen KI-Programmen, die schriftliche Antworten produzieren, erstellt Sora hochwertige Videos basierend auf der Texteingabe eines Benutzers.

Laut einer Erklärung von OpenAI, die der Veröffentlichung vom 9. Dezember beilag, ist Sora Turbo eine Verbesserung gegenüber dem ursprünglichen Sora-Programm und ermöglicht eine schnellere Videoerstellung, qualitativ hochwertigere Videos und eine Vielzahl von Videobearbeitungsfunktionen, mit denen Benutzer Videosequenzen schneiden und erstellen können und um Elemente eines Videos zu ändern, während andere Teile des Videos erhalten bleiben.

Was genau ist Sora Turbo und wie verändert es die Videoproduktionsbranche?

Wie funktioniert Sora Turbo?

Die Stärke von Sora und vielen anderen KI-Videogeneratoren liegt in ihrer Fähigkeit, das zu reproduzieren, was Menschen mit hochwertiger Filmausrüstung tun können, und das in extrem kurzer Zeit.

Benutzer können dem Programm nicht nur Eingabeaufforderungen dazu geben, was in das Video aufgenommen werden soll, sondern auch zum Typ der Kamera, die sie verwenden möchten, zur Objektivauswahl, zur Beleuchtungseinrichtung, zur visuellen Ästhetik, zur Komposition und zum Storyboarding.

Eine Beispielaufforderung, die einige dieser Details verwendet, könnte wie folgt aussehen:

„Verwenden Sie ein mittleres Teleobjektiv (85 mm), um ein intimes Porträt eines Straßenverkäufers aufzunehmen, der nachts arbeitet. Beleuchten Sie die Szene mit einer Mischung aus den warmen, leuchtenden Standlichtern des Verkäufers und den kühleren Umgebungslichtern der Stadt im Hintergrund. Konzentrieren Sie sich auf das Details der Hände des Verkäufers beim Zubereiten von Speisen oder Waren, die den Rahmen mit ihrem ausdrucksstarken Gesicht in Einklang bringen. Das Bild sollte die harte Arbeit und den Stolz auf sein Handwerk hervorrufen.

Wie gut ist Sora Turbo?

Es ist nicht perfekt.

Benutzer geben eine Textaufforderung über die Art des Videos ein, das sie generieren möchten, und Sora erstellt das Video. In der aktuellen Version gibt es Einschränkungen. Die Videoqualität beträgt bis zu 1080p bei 30 Bildern pro Sekunde und kann nur 20 Sekunden lang sein.

Dies ist ein Beispiel für ein Sora Turbo-Video von Emi Kusana, einer Multimedia-Künstlerin und Leadsängerin von Satellite Young, einer Musikgruppe, die von J-Pop- und Science-Fiction-Themen der 1980er Jahre inspiriert ist und Themen von Takenoko-zoku, einer Modegruppe der 1980er Jahre, verwendet. ers. Obwohl es eine Beschränkung auf 20 Sekunden gibt, können Benutzer mit der Sora-Storyboard-Funktion mehrere KI-generierte Videos aneinanderreihen und nacheinander anordnen, wie im Video unten gezeigt.

Es gibt auch offensichtliche Fehler in einigen Videos. Im obigen Video beispielsweise macht einer der Tänzer bei der 36-Sekunden-Marke eine 180-Grad-Halsdrehung, was natürlich menschlich nicht möglich ist, und setzt die Tanzroutine fort. Das Unternehmen müsse weiter daran arbeiten, solche Fehler zu beheben, hieß es.

In einem Beispielvideo einer kochenden Frau, das im Februar von Sam Altman, dem Gründer von OpenAI, gepostet wurde, werden die Zuschauer bemerken, dass der Löffel in der rechten Hand der Frau verschwindet, nachdem sie mit dem Mischen aufhört.

Wie wurde Sora Turbo in der Branche aufgenommen?

Einige Branchenexperten und Kreativdirektoren sind besorgt darüber, wie Sora die Filmindustrie, insbesondere Hollywood, revolutionieren könnte.

Im März sagte ein Hollywood-Manager unter der Bedingung, dass er anonym bleiben möchte: „Ich sehe darin keine Bedrohung für die Produktion, sondern eher eine Bedrohung für die Art und Weise, wie wir derzeit produzieren.“

Er bezog sich auf Veränderungen in der Art und Weise, wie die Postproduktion in der Vergangenheit durchgeführt wurde – etwa als die Leute begannen, Videos auf privaten Laptops zu bearbeiten, anstatt Postproduktionsfirmen für die Arbeit zu bezahlen.

„Viele Leute wurden bei diesem Übergang ausgelöscht, während andere sich plötzlich einen richtigen Redakteur leisten konnten, ohne den Aufwand, den ein Postamt erfordert“, sagte er.

Ist Sora der einzige KI-Videogenerator?

Nein, das ist es nicht. Der Markt für KI-Videogeneratoren wächst täglich. Ein klarer Unterschied zwischen Sora und anderen Mitbewerbern ist jedoch die unübertroffene Videoqualität und der Realismus, die Sora erzeugen kann.

Darüber hinaus verfügt die neue Version, Sora Turbo, über eine Vielzahl erweiterter Videobearbeitungsfunktionen, die Benutzer in Adobe Premiere Pro oder Final Cut Pro finden, zwei sehr beliebten Videobearbeitungssoftwareprogrammen, die zum Erstellen von Filmen, TV- und Online-Inhalten verwendet werden.

Darüber hinaus wird Sora vom Mega-Softwareunternehmen Microsoft finanziell unterstützt. Bis heute hat Microsoft fast 14 Milliarden US-Dollar investiert. mit der jüngsten Finanzspritze von 10 Milliarden US-Dollar. am 23. Januar. Laut CNBC im Oktober hat OpenAI jetzt einen Wert von 4 Milliarden US-Dollar revolvierende Kreditlinie, wodurch sich die Gesamtliquidität auf über 10 Milliarden US-Dollar erhöht. Dieser Investitionsbetrag verschafft Sora eine Hebelwirkung, die viele andere Wettbewerber nicht haben.

Welche anderen Videogeneratoren gibt es?

Es gibt mehrere andere erstklassige KI-Videogeneratoren, darunter:

Runway Gen 3

Das 2018 gegründete Unternehmen Runway hat insgesamt 237 Millionen US-Dollar an Finanzmitteln eingesammelt und befindet sich Berichten zufolge in Gesprächen mit der Risikokapitalgesellschaft General Atlantic, um 450 Millionen US-Dollar an neuen Mitteln aufzubringen, so The Information, eine Veröffentlichung, die sich mit der Technologie- und Risikokapitalbranche befasst. Die kostenlose Version von Runway Gen 3 kann 10-sekündige Videoclips mit einer Auflösung von 720p und 30 Bildern pro Sekunde generieren. Für zahlende Abonnenten können Videoclips auf 1440p oder 2160p eingestellt werden.

Ähnlich wie Sora kann es ein Video auf der Grundlage einer Textaufforderung erstellen, ist jedoch aufgrund seiner hohen Geschwindigkeit und Effizienz bei Kurzvideoprojekten stark auf Social-Media-Ersteller und Vermarkter angewiesen, die es zum Erstellen von Werbung verwenden.

Eine der Herausforderungen bei KI-generierten Langvideos ist die Konsistenz über mehrere generierte Videos hinweg. Längere Videos erfordern eine interaktive, sofortige Verfeinerung, damit alle Videos gleich aussehen und sich gleich anfühlen.

Verlässt die KI

Kling, unterstützt von Kuaishou, international auch als Kwai bekannt, ist ein großes chinesisches Technologieunternehmen mit Sitz in Peking, China. Kling wurde im Juni 2024 vorgestellt und positioniert sich als Konkurrent von Plattformen wie Sora von OpenAI. Kling kann bis zu zweiminütige Videos mit einer Auflösung von 1080p und 30 Bildern pro Sekunde erstellen.

MiniMax

MiniMax, ein chinesisches KI-Startup, wird von Alibaba Group Holding unterstützt, einem multinationalen Unternehmen mit Sitz in China, das auf E-Commerce, Internetdienste und Technologiedienstleistungen spezialisiert ist und dessen letzte Finanzierungsrunde 600 Millionen US-Dollar betrug. im März. MiniMax wurde 2021 von ehemaligen Mitarbeitern von SenseTime, einem führenden KI-Unternehmen mit Sitz in Shatin, Hongkong, gegründet.

Minimax kann sechs Sekunden lange Videoclips mit einer Auflösung von 720p und 25 Bildern pro Sekunde erstellen.



Quelle link