Google Labs, Googles experimenteller Zweig, ist es Testen eines neuen Bildgenerators namens Whisk. Mit diesem Tool können Benutzer Bilder anstelle von Text anzeigen und so ein Foto neu mischen, indem sie das Motiv, die Szene und den Stil ändern.
Whisk verwendet Googles Bildgenerierungsmodell Imagen 3, um drei Bilder zu kombinieren: eines für das Motiv, eines für die Szene und eines für den Stil. Sie können beispielsweise ein Foto von sich selbst als Motiv, eine futuristische Landschaft als Szene und einen Anime-Stil für den endgültigen Look auswählen.
Die Vorlage generiert automatisch eine detaillierte Bildunterschrift aus Ihren Bildern, die Imagen 3 dann bei der Erstellung eines Remixes des Fotos unterstützt. Sie können auch Textaufforderungen eingeben, um Ihr gewünschtes Ergebnis weiter zu definieren, einschließlich detaillierter Beschreibungen wie „Betreff fährt ein fliegendes Fahrrad“.
Da sich Whisk nur auf einige Schlüsselmerkmale jedes Bildes konzentriert, erklärt das Unternehmen, dass die Ergebnisse möglicherweise nicht immer Ihren Erwartungen entsprechen. Beispielsweise kann sich das generierte Motiv in Größe, Gewicht, Frisur oder Hautton unterscheiden. Laut Google können Sie die zugrunde liegenden Anfragen jederzeit einsehen und bearbeiten.
Das Experiment ist derzeit nur für Benutzer mit Wohnsitz in den USA unter verfügbar labs.google/whisk.