Das Googeln hat begonnen Einführung eines privaten Zugangs zu seinen generativen KI-Modellen Veo und Imagen 3. Ab heute können Kunden des Vertex AI Google Cloud-Pakets des Unternehmens loslegen Ich verstehe um Videos aus Textaufforderungen und Bildern zu generieren. Dann wird Google ab nächster Woche Imagen 3, sein neuestes Text-zu-Bild-Framework, denselben Nutzern zur Verfügung stellen.
Mit der Einführung von Veo ist Google nach eigenen Angaben der erste große Cloud-Anbieter, der ein Bild-zu-Video-Modell anbietet. So viel zu OpenAIs Sora Das Modell steht weiterhin nur ausgewählten Künstlern, Akademikern und Forschern zur Verfügung – obwohl sich das bei dem Unternehmen bald ändern könnte 12 Tage spannende Produktvorführungen ab 5. Dezember.
Über Veo sagt Google, dass das Modell 1080p-Bilder erstellt, „die konsistent und kohärent sind“ und „länger als eine Minute“ dauern können. Das Tool kann auch sowohl mit Textaufforderungen als auch mit Bildern arbeiten. Im letzteren Fall ist es möglich, KI-generierte oder von Menschen erstellte Bilder als Ausgangspunkt für ein Video zu verwenden.
Wenn man sich die von Google geteilten Beispielbilder ansieht, wird deutlich, dass Veo, wie alle KI-Modelle, mit Ursache und Wirkung zu kämpfen haben kann. Im gerösteten Marshmallow-Clip zum Beispiel werden die Leckereien nicht gelb oder verkohlen, wenn sie der Hitze einer Lagerfeuerflamme ausgesetzt werden. Auch Artefakte sind ein Problem, wie man sieht, wenn man sich die Hände in den Konzertaufnahmen genau ansieht.
Zu Imagen 3 sagt Google, dass das Modell „aus einfachen Textaufforderungen die realistischsten Bilder mit höchster Qualität generiert und frühere Versionen von Imagen in Bezug auf Details, Beleuchtung und Artefaktreduzierung übertrifft.“ Aber auch hier muss man nicht genau hinsehen, um zu erkennen, dass Google noch viel Arbeit vor sich hat.
Im ersten Beispiel einer Gruppe von Freunden, die auf dem Kofferraum eines Autos sitzen, ist in der ursprünglichen Aufforderung von „Blitzfotografie“ die Rede, aber die Motive sind deutlich von hinten beleuchtet. Man könnte argumentieren, dass ein Blitz verwendet wurde, um eine intensive Hintergrundbeleuchtung zu erzeugen, aber wenn die Idee hinter der Aufgabe darin bestand, etwas zu schaffen, das für die Blitzfotografie der 1960er Jahre repräsentativ ist, dann ist dies nicht der Fall.
Dennoch ist Google daran interessiert, mehr seiner Geschäftskunden für den Einsatz generativer KI zu gewinnen. Unter Bezugnahme auf eigene RecherchenNach Angaben des Technologieriesen vermelden 86 Prozent der Unternehmen, die generative KI in der Fertigung einsetzen, einen Umsatzanstieg. Allerdings a aktuelle Appen-Forschung Die festgestellte Kapitalrendite von KI-Projekten ist zwischen 2023 und 2024 um 4,6 Prozentpunkte gesunken.
Wenn Sie über einen Link in diesem Artikel etwas kaufen, erhalten wir möglicherweise eine Provision.