Start IT/Tech Das neue KI-Videomodell von Google greift weniger in die Physik ein

IT/Tech

Das neue KI-Videomodell von Google greift weniger in die Physik ein

Von

16 Dezember 2024

Möglicherweise hat Google erst vor kurzem mit der Einführung begonnen Ich verstehe generative KI GeschäftskundenDoch das Unternehmen verschwendet keine Zeit und stellt den ersten Testern eine neue Version des Videotools zur Verfügung. Am Montag hat Google eines erstellt Vorschau auf Veo 2. Nach Angaben des Unternehmens versteht Veo 2 „die Sprache der Kinematographie“. In der Praxis bedeutet dies, dass Sie sich bei der Nachfrage nach dem Modell auf ein bestimmtes Filmgenre, einen bestimmten Filmeffekt oder ein bestimmtes Objektiv beziehen können.

Darüber hinaus sagt Google, dass das neue Modell ein besseres Verständnis der Physik und menschlichen Bewegungen in der realen Welt hat. Sich bewegende Menschen richtig zu modellieren, ist etwas, mit dem alle generativen Modelle Schwierigkeiten haben. Bemerkenswert ist daher die Behauptung des Unternehmens, dass Veo 2 in Bezug auf diese beiden Probleme besser sei. Natürlich reichen die vom Unternehmen bereitgestellten Proben nicht aus, um sicher zu sein; Der eigentliche Test der Fähigkeiten von Veo 2 wird kommen, wenn jemand danach fragt Erstellen Sie ein Video der Routine einer Turnerin. Oh, und wo wir gerade von den Dingen sprechen, mit denen Videomodelle zu kämpfen haben: Google sagt, dass Veo „seltener“ Artefakte wie zusätzliche Finger produzieren wird.

Ein Beispielbild eines Eichhörnchens, das von Google Imagen 3 erstellt wurde. — Googeln

Unabhängig davon implementiert Google Verbesserungen an Bild 3. Das Unternehmen gibt an, dass die neueste Version seines Text-zu-Bild-Modells klarere und besser komponierte Bilder generiert. Darüber hinaus können vielfältigere Kunststile mit größerer Genauigkeit dargestellt werden. Gleichzeitig ist es auch besser, den Anweisungen genauer zu folgen. Schnelle Compliance war ein Problem, das ich hervorgehoben habe, als das Unternehmen Anfang dieses Monats Imagen 3 für Google Cloud-Kunden verfügbar machte. Daher ist sich Google der Bereiche bewusst, in denen seine KI-Modelle verbessert werden müssen.

Veo 2 wird schrittweise eingeführt Google Labs Benutzer in den USA. Derzeit beschränkt Google die Tester darauf, maximal acht Sekunden Filmmaterial mit 720p zu erstellen. Für den Kontext: Sora kann bis zu 20 Sekunden 1080p-Filmmaterial erzeugen, obwohl dafür 200 US-Dollar pro Monat erforderlich sind ChatGPT Pro-Abonnement. Die neuesten Verbesserungen von Imagen 3 stehen Google Labs-Nutzern in mehr als 100 Ländern unter zur Verfügung ImageFX.

Quelle link

Das neue KI-Videomodell von Google greift weniger in die Physik ein

Kommentieren Sie den Artikel Antwort abbrechen

Kategorie

Verwandte ArtikelMehr vom Autor

Amazon veranstaltet einen riesigen Ausverkauf von Echo-Geräten und sie werden sogar noch vor Weihnachten eintreffen.

Cohere arbeitet im Stillen mit Palantir zusammen, um seine KI-Modelle bereitzustellen

Instagram fügt eine DM-Planungsfunktion hinzu, bevor jemand Beiträge planen kann

Kommentieren Sie den Artikel Antwort abbrechen

Kategorie

Verwandte Artikel Mehr vom Autor