Der Videogenerator von Google kommt zu einigen weiteren Kunden – genauer gesagt zu Google Cloud-Kunden.
Am Dienstag gab Google bekannt, dass Veo, sein KI-Modell, das aus Bildern und Eingabeaufforderungen kurze Videoclips generieren kann, in der privaten Vorschau für Kunden verfügbar sein wird, die Vertex AI, die KI-Entwicklungsplattform von Google Cloud, nutzen.
Google sagt, dass der Start es einem Kunden, Quora, ermöglichen wird, Veo zu seinem Markt zu bringen Poe Chatbot-Plattform und eine andere, Mondelez International, Eigentümer von Oreo, um mit seinen Partneragenturen Marketinginhalte zu erstellen.
„Wir haben Poe geschaffen, um den Zugang zu den weltweit besten generativen KI-Modellen zu demokratisieren“, sagte Poe-Produktleiter Spencer Chan in einer Erklärung. „Durch Partnerschaften mit führenden Unternehmen wie Google erweitern wir die kreativen Möglichkeiten in allen Formen der KI.“
Flaggschiff-Generator
Veo wurde im April eingeführt und kann 1080p-Clips von Tieren, Objekten und Menschen mit einer Länge von bis zu sechs Sekunden und 24 oder 30 Bildern pro Sekunde erstellen. Google behauptet, dass Veo in der Lage ist, verschiedene visuelle und filmische Stile, einschließlich Landschaftsfotos und Zeitrafferaufnahmen, aufzunehmen und bereits generierte Bilder zu bearbeiten.
Warum so lange auf die API warten? „Enterprise Readiness“, sagt Warren Barkley, Senior Director für Produktmanagement bei Google Cloud.
„Seit der Ankündigung von Veo sind unsere Teams gewachsen, haben das Modell für Unternehmenskunden bei Vertex AI gestärkt und verbessert“, sagte er. „Ab heute können Sie hochauflösende Videos in 720p, im Seitenverhältnis 16:9 Querformat oder 9:16 Hochformat erstellen. Ähnlich wie wir die Funktionen anderer Modelle wie Gemini auf Vertex AI verbessert haben, werden wir dies auch weiterhin für Veo tun.“
Laut Google versteht Veo die visuellen Effekte anhand von Eingabeaufforderungen einigermaßen gut (denken Sie an Bildunterschriften wie „große Explosion“) und verfügt über einige Kenntnisse der Physik, einschließlich der Strömungsdynamik. Das Modell unterstützt auch die maskierte Bearbeitung für Änderungen an bestimmten Bereichen eines Videos und ist technisch in der Lage, Filmmaterial in längere Projekte zu gruppieren.
Auf diese Weise ist Veo mit den heute führenden Videogenerierungsmodellen konkurrenzfähig – nicht nur mit denen von OpenAI Soraaber Modelle von Adobe, Schiene, Luma, Zielund andere.
Das heißt nicht, dass Veo perfekt ist. Aufgrund der Einschränkungen der aktuellen KI verschwinden Objekte in Veo-Videos und tauchen ohne große Erklärung oder Konsistenz wieder auf. Und Veo versteht die Physik oft falsch. Beispielsweise können Autos auf unerklärliche Weise und unmöglich im Handumdrehen rückwärts fahren.
Ausbildung und Risiken
Veo wurde auf vielen Shootings trainiert. Im Allgemeinen funktioniert es mit generativen KI-Modellen so: Wenn man ihnen ein Beispiel nach dem anderen einer Datenform gibt, erkennen die Modelle Muster in den Daten, die es ihnen ermöglichen, neue Daten zu generieren – im Fall von Veo Videos.
Wie viele seiner KI-Konkurrenten sagt Google nicht genau, woher es die Daten zum Trainieren seiner generativen Modelle bezieht. Speziell nach Veo gefragt, sagte Barkley nur, dass das Modell „gemäß (Googles) Vereinbarung mit YouTube-Erstellern“ auf „einige“ YouTube-Inhalte trainiert werden könne. (Googles Muttergesellschaft Alphabet besitzt YouTube.)
„Veo wurde an einer Vielzahl hochwertiger Videobeschreibungsdatensätze geschult, die stark aus Sicherheitsgründen kuratiert sind“, fügte er hinzu. „Die Kernmodelle von Google werden hauptsächlich auf öffentlich zugänglichen Quellen trainiert.“
Ein Bericht der New York Times im April enthüllte, dass Google erweiterte seine Nutzungsbedingungen letztes Jahr, teilweise um es dem Unternehmen zu ermöglichen, mehr Daten zum Trainieren seiner KI-Modelle zu verwenden. Im Rahmen der alten Nutzungsbedingungen war unklar, ob Google YouTube-Daten für die Entwicklung von Produkten außerhalb der Videoplattform nutzen darf. Das Gleiche gilt nicht für die neuen Bedingungen, die die Zügel erheblich lockern.
Während Google Tools hostet, die es Webmastern ermöglichen, die Bots des Unternehmens daran zu hindern, Trainingsdaten von ihren Websites zu entfernen, bietet es keinen Mechanismus, der es Erstellern ermöglicht, ihre Arbeit aus vorhandenen Trainingssätzen zu entfernen. Google gibt an, dass es Trainingsmodelle gibt, die öffentlich verfügbare Daten verwenden faire NutzungDas bedeutet, dass das Unternehmen der Ansicht ist, dass es nicht verpflichtet ist, die Dateneigentümer um Erlaubnis zu bitten oder sie zu entschädigen. (Google gibt jedoch an, dass es keine Kundendaten zum Trainieren seiner Modelle verwendet.)
Aufgrund der Art und Weise, wie sich aktuelle generative Modelle beim Training verhalten, sind sie mit bestimmten Risiken verbunden, wie z. B. dem Aufstoßen, wenn ein Modell eine Spiegelkopie der Trainingsdaten generiert. Es wurde festgestellt, dass Werkzeuge wie das von Runway spucken Fotos ähneln im Wesentlichen urheberrechtlich geschützten Videos und schaffen ein potenzielles rechtliches Minenfeld für Benutzer der Tools.
Die Lösung von Google sind Filter auf unmittelbarer Ebene für Veo, auch für gewalttätige und explizite Inhalte. Sollte dies fehlschlagen, gibt das Unternehmen an, dass dies der Fall sei Vergütungspolitik Bietet berechtigten Veo-Benutzern eine Verteidigung gegen Ansprüche wegen Urheberrechtsverletzung.
„Wir planen, Veo-Ergebnisse in Vertex AI zu veröffentlichen, sobald es allgemein verfügbar ist“, sagte Barkley.
Ich sehe es überall
In den letzten Monaten hat Google Veo langsam in weitere seiner Apps und Dienste integriert, um das Modell zu verbessern.
Im Mai brachte Google Veo für ausgewählte Tester in sein Early-Access-Programm Google Labs. Und im September Google angekündigt eine Veo-Integration für YouTube Shorts, das kurze Videoformat von YouTube, um YouTubern dies zu ermöglichen zu generieren Hintergründe und sechs Sekunden lange Videoclips.
Und was ist mit dem Deepfake Welche Risiken birgt das alles, fragen Sie sich vielleicht? Google gibt an, seine proprietäre Wasserzeichentechnologie SynthID zu verwenden, um unsichtbare Markierungen in von Veo generierte Frames einzubetten. Es stimmt, dass SynthID nicht gegen Änderungen unfehlbar ist und Google den Inhalt der ID nicht an Dritte weitergegeben hat.
Dies könnten strittige Punkte sein, wenn Veo nicht deutlich an Zugkraft gewinnt. Wenn es um Partnerschaften geht, hat Google den Konkurrenten im Bereich der generativen KI den Garaus gemacht, die schnell versucht haben, Produzenten, Studios und Kreativagenturen mit ihren Tools zu locken. Runway unterzeichnete kürzlich einen Geschäft mit Lionsgate, um ein benutzerdefiniertes Modell für den Filmkatalog des Studios zu trainieren, und OpenAI arbeitete mit zusammen Marken Und unabhängige Direktoren um Soras Potenzial zu zeigen.
Einmal sagte Google, dass man Veo-Apps in Zusammenarbeit mit Künstlern wie Donald Glover (auch bekannt als Childish Gambino) erkundet. Das Unternehmen hat heute keine Updates zu diesen Outreach-Bemühungen bereitgestellt.
Googles Pitch für Veo – eine Möglichkeit, Kosten zu senken und Videoinhalte schnell zu iterieren – birgt die Gefahr, Kreative zu entfremden. Ein 2024 zu studieren Die von der Animation Guild, einer Gewerkschaft, die Hollywood-Animatoren und Cartoonisten vertritt, in Auftrag gegebene Studie schätzt, dass bis 2026 mehr als 100.000 Film-, Fernseh- und Animationsjobs in den USA durch KI zerstört werden.
Dies könnte den vorsichtigen und „langsamen und stetigen“ Ansatz von Google erklären. Auf Nachfrage gab Barkley weder eine voraussichtliche voraussichtliche Ankunftszeit für Veo auf Vertex bekannt, noch sagte er, wann Veo auf weiteren Google-Plattformen und -Diensten verfügbar sein könnte.
„Normalerweise veröffentlichen wir Produkte zuerst in der Vorschau, da wir so von einer ausgewählten Gruppe unserer Unternehmenskunden reales Feedback erhalten können, bevor sie für eine breitere Nutzung verfügbar werden“, sagte er. „Dies trägt dazu bei, die Funktionalität zu verbessern und sicherzustellen, dass das Produkt den Bedürfnissen unserer Kunden entspricht.“
In einer entsprechenden Ankündigung gab Google heute bekannt, dass sein Flaggschiff-Bildgenerator Bild 3ist jetzt für alle Vertex AI-Kunden ohne Warteliste verfügbar. Es verfügt über neue Anpassungs- und Bildbearbeitungsfunktionen – diese sind jedoch vorerst auf eine separate Warteliste beschränkt.