Google Deepmind hat seine KI-Tools der nächsten Generation, Veo 2 und Imagen 3, sowie ein spielerisches neues Experiment, Whisk, vorgestellt, das darauf abzielt, Bilder auf kreative Weise neu zu mischen.
Veo 2 ist die neueste Version des Flaggschiff-Tools zur Videogenerierung des Unternehmens Googeln wird zu höherem Realismus und einem besseren Verständnis von Bewegung, Physik und Filmtechniken fähig sein. In seiner Pressemitteilung gibt Google Deepmind an, dass Veo 2 4K-Videos erzeugen und komplexe Signale wie bestimmte Kameraobjektive oder Filmmaterial verarbeiten kann.
„Veo 2 versteht die einzigartige Sprache der Kinematographie“, heißt es in der Pressemitteilung und hebt die Fähigkeit hervor, stilistische Entscheidungen wie „Kamerafahrten aus geringem Winkel“ oder „geringe Schärfentiefe“ zu treffen. Darüber hinaus gibt das Unternehmen an, dass Veo 2 im Gegensatz zu früheren Modellen, die häufig seltsame Bilder (z. B. zusätzliche Gliedmaßen) „halluzinieren“, diese Kuriositäten reduziert und die Ergebnisse natürlicher macht.
Zerstörbare Lichtgeschwindigkeit
Bild 3, im August veröffentlichthat einige Verbesserungen mit reichhaltigeren Texturen, leuchtenderen Farben und vielfältigen Kunststilen erhalten – von fotorealistischen Landschaften bis hin zu Anime. Das Upgrade wird auch den Benutzeranweisungen treuer bleiben.
Die vielleicht faszinierendste Ergänzung ist Whisk, ein Tool, mit dem Benutzer Bilder mit kreativem Flair neu mischen können. Durch die Kombination der Imagen 3- und Gemini-Modelle von Google kann Whisk rohe Bildideen in digitale Kunstwerke wie „Umarmungen oder Emaille-Pins“ umwandeln und gleichzeitig automatisch beschreibende Bildunterschriften generieren.
Veo 2 wird in Googles VideoFX eingeführt, Imagen 3 ist in ImageFX in über 100 Ländern verfügbar und Whisk ist für US-Benutzer live. Sie können sich dafür anmelden Google Labs-Warteliste Jetzt.
Themen
Künstliche Intelligenz
Googeln