Die weitverbreitete Verfügbarkeit von Werkzeugen für den Aufbau generativer KI hat zu einer kambrischen Explosion von Start-ups in diesem Bereich geführt. Reichlich Kapital Es hat auch nicht geschadet – ebenso wenig wie die sinkenden Kosten für die notwendige technische Infrastruktur.
Tatsächlich besteht bei einer der auffälligsten Anwendungen der generativen KI, dem generativen Video, die Gefahr einer Übersättigung. Labore mögen Genmo, Haiper Und IA Reime Sie bringen Modelle schnell auf den Markt und unterscheiden sich zum Teil kaum vom bisherigen Stand der Technik.
Naeem Talukdar glaubt, dass Vertrauen – und nicht unbedingt die Fähigkeiten eines Models – einige generative Videoprojekte von den anderen unterscheiden wird. Deshalb gründet er Tal des Mondesein in Los Angeles ansässiges Startup, das scheinbar „transparentere“ generative Videotools entwickelt.
Talukdar leitete das Produktwachstum bei Zapier, bevor er das von Y Combinator unterstützte Unternehmen Draft gründete, das einen Marktplatz für Unternehmens-KI-Inhalte betrieb. Er rekrutierte Mateusz Malinowski und Mik Binkowski, um Moonvalley zu gründen – beide ehemalige Wissenschaftler bei DeepMind, wo sie Techniken zur Videoerzeugung studierten.
„Wir waren davon überzeugt, dass die Videoerzeugung Medien und Unterhaltung verändern würde, aber die Start-ups, die wir in diesem Sektor gesehen haben, verfügten nicht über die notwendigen Eigenschaften, um erfolgreich zu sein“, sagte Talukdar gegenüber TechCrunch. „Bestehende Unternehmen standen Künstlern, Kreativen und der Branche im Allgemeinen zutiefst feindlich gegenüber.“
Laut Talukdar trainieren die meisten generativen KI-Unternehmen Modelle anhand öffentlicher Daten, von denen einige ausnahmslos urheberrechtlich geschützt sind. Das argumentieren diese Unternehmen faire Nutzung Die Lehre schützt die Praxis. Zum Beispiel hat OpenAI bestand darauf das Modelle ohne urheberrechtlich geschütztes Material nicht richtig trainieren kann, und Suno hat es getan argumentierte dass wahlloses Training nichts anderes ist als „ein Kind, das seine eigenen Rocksongs schreibt, nachdem es das Genre gehört hat“.
Aber das hat die Rechteinhaber nicht aufgehalten Beschwerden einreichen oder die Einreichung einer Unterlassungserklärung.
Die Lieferanten sind ziemlich dreist geworden, auch wenn Klagen gegen sie häufen sich. Anfang dieses Jahres bestritt die ehemalige OpenAI-CTO Mira Murati nicht direkt, dass das Videomodell von OpenAI Sorawurde auf YouTube-Clips trainiert – so wie es aussah Verstoß YouTube-Nutzungsrichtlinie. An anderer Stelle a 404 Medienbericht schlägt vor, dass Runway, ein generatives Video-Startup, ohne Erlaubnis YouTube-Filmmaterial von Disney-eigenen Kanälen und YouTubern wie MKBHD kopiert hat.
Das kanadische KI-Startup Viggle auf jeden Fall zugeben das YouTube-Videos nutzt, um seine Videomodelle anzutreiben. Und wie die meisten seiner Konkurrenten bietet es keinen Rückgriff auf Urheber, deren Werke möglicherweise in seine Schulung einbezogen wurden.
„Generative Modelle müssen Urheberrechte, Marken und Bildrechte respektieren“, sagte Talukdar. „Deshalb arbeiten wir eng mit den Machern unserer Modelle zusammen.“
Moonvalley, das noch nicht über ein vollständig ausgebildetes Videomodell verfügt, behauptet, eines der wenigen Unternehmen zu sein, das ausschließlich Daten von Inhaltseigentümern verwendet, die sich dafür entschieden haben. Um seine Grundlagen abzudecken, beabsichtigt Moonvalley, Erstellern die Möglichkeit zu geben, die Entfernung ihrer Inhalte aus ihren Vorlagen zu beantragen, Kunden die Möglichkeit zu geben, ihre Daten jederzeit zu löschen, und eine anzubieten Vergütungspolitik um Benutzer vor urheberrechtlichen Herausforderungen zu schützen.
Der Ansatz ähnelt dem von Adobe, das seine Schulungen durchführt Firefly-Videovorlagen auf lizenzierte Inhalte von Ihrer Adobe Stock-Plattform. Talukdar hat nicht gesagt, wie viel Moonvalley seinen Mitarbeitern für die Clips bezahlt, aber es könnte eine Menge sein. Bloomberg gemeldet dass Adobe etwa 120 US-Dollar pro 40–45 Minuten Video anbot.
Um es klarzustellen: Moonvalley erwirbt selbst keine Inhalte. Es arbeitet mit namentlich nicht genannten Partnern zusammen, die Lizenzverträge abwickeln und Videos in Datensätze packen, die Moonvalley kauft.
Diese Partner – sogenannte „Datenbroker“ – sind dank des Booms der generativen KI heutzutage sehr gefragt. Der Markt für KI-Trainingsdaten ist erwartet innerhalb eines Jahrzehnts von derzeit rund 2,5 Milliarden US-Dollar auf fast 30 Milliarden US-Dollar wachsen.
„Wir lizenzieren hochwertige Daten aus mehreren Quellen, die direkt mit den Urhebern zusammenarbeiten und sie für die Nutzung ihrer Inhalte gut entlohnen“, fügte Talukdar hinzu. „Wir stellen sicher, dass wir einen vielfältigen, qualitativ hochwertigen Datensatz verwenden.“
Im Gegensatz zu einigen „ungefilterten“ Videomodellen, die das Bild einer Person problemlos in Clips einfügen, ist Moonvalley auch bestrebt, schützende Mauern um seine kreativen Werkzeuge zu errichten. Wie Sora von OpenAI blockieren die Modelle von Moonvalley bestimmte Inhalte, wie z. B. NSFW-Phrasen, und lassen es nicht zu, dass Personen sie auffordern, Videos von bestimmten Personen oder Prominenten zu erstellen.
Natürlich ist kein Filter perfekt, aber Talukdar sagt, dass dieses „rote Team“ ein zentraler Bestandteil der Veröffentlichungsstrategie von Moonvalley sein wird.
„Da sich die Beziehung zwischen Medien und KI weiterhin rasant und nicht ohne Skepsis weiterentwickelt, möchte sich Moonvalley als vertrauenswürdigster Partner für Medienorganisationen etablieren“, sagte er.
Aber kann Moonvalley wirklich mithalten?
Wie bereits erwähnt, Google, Zielund unzählige andere verfolgen generative Videos – mit unterschiedlichem Grad an ethischer Überlegung. Tech-Giganten ändern ihre Nutzungsbedingungen, um sich einen Datenvorteil zu verschaffen: Google trainiert sein Veo-Videomodell auf YouTube-Videos, während Meta seine Modelle auf Inhalten von Instagram und Facebook trainiert.
Moonvalley hofft, Marken und Kreativhäuser anzuziehen, doch einige Anbieter haben in dieser Hinsicht bereits erhebliche Fortschritte gemacht. Runway unterzeichnete kürzlich einen Geschäft mit Lionsgate, um ein benutzerdefiniertes Modell anhand des Filmkatalogs des Studios zu trainieren; Stabilitäts-KI rekrutiert „Avatar“-Regisseur James Cameron in seinen Vorstand; und OpenAI haben sich mit zusammengetan Marken Und unabhängige Direktoren um Soras Potenzial zu zeigen.
Dann ist da noch Adobe, das es auf die Zielgruppe von Moonvalley abgesehen hat: Künstler und Content-Ersteller, die „sicherere“ (zumindest aus rechtlicher Sicht) generative Videotools wollen.
Die Herausforderung von Moonvalley ist dreifach. Sie müssen Ihre Kunden davon überzeugen, dass Ihre Werkzeuge mit dem bereits Vorhandenen konkurrenzfähig sind. Es wird notwendig sein, genügend Start- und Landebahnen zu bauen, um Nachfolgemodelle trainieren und betreuen zu können. Und Sie müssen einen treuen Kundenstamm garantieren, der zu keinem Zeitpunkt zu einem anderen Anbieter wechseln wird.
Viele Künstler und Kreative sind verständlicherweise misstrauisch gegenüber generativer KI, da sie die Film- und Fernsehbranche auf den Kopf zu stellen droht. Ein 2024 zu studieren Die von der Animation Guild, einer Gewerkschaft, die Hollywood-Animatoren und Cartoonisten vertritt, in Auftrag gegebene Studie schätzt, dass bis 2026 mehr als 100.000 Film-, Fernseh- und Animationsjobs in den USA durch KI zerstört werden.
„Unser Fokus liegt auf der Entwicklung von Tools, die Kreativen dabei helfen, immer tollere und ansprechendere Inhalte zu erstellen“, sagte Talukdar, als ich ihn nach dem Risiko fragte, dass Kreative aufgrund generativer KI ihren Job verlieren.
An der Start- und Landebahnfront hat Moonvalley einige Fortschritte gemacht: Das Unternehmen hat kürzlich 70 Millionen US-Dollar in einer von General Catalyst und Khosla Ventures gemeinsam geleiteten Startkapitalfinanzierungsrunde unter Beteiligung von Bessemer Ventures eingesammelt. Damit werden die Forschung und Entwicklung sowie die Einstellung von Mitarbeitern von Moonvalley finanziert.
Das Unternehmen beschäftigt derzeit etwa 30 Mitarbeiter, die zuvor bei DeepMind, Meta, Microsoft und TikTok gearbeitet haben, sagt Talukdar.
„Was uns von anderen Unternehmen unterscheidet, ist unser Fokus auf das Produkt“, fügte er hinzu. „Während der Kern unseres Unternehmens darin besteht, generative Modelle der nächsten Generation zu trainieren, liegt unser Fokus auf der Entwicklung äußerst leistungsfähiger kreativer Werkzeuge, um diese Modelle in leistungsstarke Geräte für professionelle Entwickler, Studios und Marken umzuwandeln.“
Talukdar sagt, es sei geplant, das erste Moonvalley-Modell noch in diesem Jahr auf den Markt zu bringen. Das Unternehmen muss sich beeilen, wenn es die nächsten Veröffentlichungen übertreffen will Schwarzwaldlabore, Luma-Labor, Mitten auf der Reiseund die Elefant im Raum.