Da der weltweite Konsum von Inhalten zunimmt und die Nachfrage nach nicht-englischsprachigen Inhalten die nach englischsprachigen Filmen und Shows übersteigt, nutzt IMAX KI, um die Lokalisierung seiner Originalinhalte zu skalieren.
Die Unterhaltungs- und Medienbranche wuchs um 5 % auf 2,8 Billionen US-Dollar im Jahr 2023, laut einem PwC-Bericht. Es wird erwartet, dass die Branche ihre Expansion in den nächsten fünf Jahren fortsetzen wird, wenn auch mit einer bescheidenen durchschnittlichen jährlichen Wachstumsrate von fast 4 % auf 3,4 Billionen US-Dollar. Inhalte in einer anderen Sprache als Englisch sind wächst schnell, auch auf den englischen Märkteneinschließlich der USA, Großbritannien, Australien und Kanada. Letztes Jahr berichtete Netflix a 90 % Wachstum bei der Anzeige von Inhalten in anderen Sprachen in Großbritannien in den letzten drei Jahren.
IMAX hat all dies berücksichtigt und erforscht nun die Lokalisierung mithilfe von KI, um mehr Aufmerksamkeit zu erregen.
Am Montag gab die kanadische Theaterproduktionsfirma, die für ihre großartigen Theater und immersiven Kinoerlebnisse bekannt ist, ihre Partnerschaft mit einem in Dubai ansässigen Startup bekannt. Camb.ai Nutzen Sie Ihre KI-Sprachmodelle, um Originalinhalte, einschließlich Dokumentationen, zu übersetzen.
Camb.ai, das seine KI-Synchronisation und Sprachübersetzung bereits bei Live-Sportveranstaltungen und -Ligen eingesetzt hat, darunter Australian Open, Eurovision SportUnd Major League Soccerbietet sein Boli-Modell für die Sprach-zu-Text-Übersetzung und Mars für die Sprachemulation an. Die Modelle sind über die DubStudio-Plattform des Startups verfügbar, die 140 Sprachen unterstützt, darunter mehrere Sprachen mit geringen Ressourcen, für die es keine nennenswerten Daten im Internet gibt.
„Unternehmen wie OpenAI und Anthropic haben eine andere Sicht auf die Gesellschaft“, sagte Akshat Prakash, Mitbegründer und CTO von Camb.ai, in einem exklusiven Interview. „Sie versuchen, Modelle zu bauen, die sehr horizontal sind und ein breites Spektrum an Aufgaben abdecken können… Das brauchen wir überhaupt nicht. Einige unserer Modelle haben weniger als 100 Millionen Parameter und sind hochspezialisiert.“
Prakash, ein ehemaliger Apple-Ingenieur, der mit dem Team zusammenarbeitete, das KI- und ML-Modelle für Siri entwickelte, gründete letztes Jahr zusammen mit seinem Vater Avneesh Prakash Camb.ai.
„Wir sind eine Generation entfernt und wachsen in Indien. Im Abstand von 30 Jahren standen wir vor denselben sprachlichen Herausforderungen“, sagte der CTO gegenüber TechCrunch.
Er sagte, Camb.ai habe 70 % seiner Modelle mit akademisch lizenzierten Datensätzen vorab trainiert, die kommerziell nutzbar seien. Die restlichen 30 % betreffen die Feinabstimmung von Daten, die von frühen Partnern gewonnen wurden, die ihre Modelle für KI-basierte Synchronisierung und Übersetzung einsetzen.
„Was wir nicht tun, und wir sind sehr vorsichtig gewesen und haben dies komplett vermieden, ist die potenzielle Zerstörung des Internets“, sagte Prakash. „Einige Unternehmen denken, dass sie damit durchkommen, weil sie eine verbraucherorientierte App oder ein Tool entwickeln und glauben, es sei in Ordnung, etwa 10 Petabyte des Internets abzukratzen.“
Camb.ai verwendet einen „dreistufigen“ Ansatz zur Bereitstellung der KI-basierten Übersetzung, der die Basisschicht seiner Boli- und Mars-Modelle, die Infrastrukturschicht, die diese KI-Modelle hostet, und dann die DubStudio-Plattform für das Frontend umfasst .
Im Gegensatz zu anderen KI-basierten Modellen nimmt Boli von Camb.ai eingegebene Sprachtokens entgegen, erzeugt Ausgabetexttokens in der übersetzten Sprache und behält Nuancen bei, sagt Prakash. Nachdem Boli den Text generiert hat, übersetzt Mars den Text mithilfe desselben Audioeingangssignals in Sprache, um die tatsächliche Audioleistung zu erfassen, einschließlich Umgebungsgeräuschen, beispielsweise der Hintergrundmusik des jubelnden Publikums bei Sportveranstaltungen, sagte er.
Prakash sagte gegenüber TechCrunch, dass die Camb.ai-Technologie Sprachübersetzungen in bis zu 10 Sprachen gleichzeitig mit einer Latenz von 20 bis 30 Sekunden bietet, die durch die Streaming- und Übertragungsverzögerung von 30 bis 40 Sekunden abgedeckt werden kann.
IMAX wird KI-Übersetzungen schrittweise implementieren, beginnend mit ressourcenintensiven Sprachen. Die Implementierung erfolgt nach internen Tests der Camb.ai-Technologie anhand ihres ursprünglichen Inhalts.
„Obwohl wir uns erst in der Anfangsphase der Partnerschaft befinden, werden wir weiterhin zusammenarbeiten, um ihr Potenzial besser auszuloten und herauszufinden, wie sie uns voranbringen kann“, sagte Mark Welton, Präsident von IMAX Global Theatres.
Welton gab an, dass der Einsatz von KI dazu beitragen würde, Übersetzungskosten zu sparen, ohne Details preiszugeben.
Camb.ai hat derzeit ein Team von 50 Mitarbeitern. Im Februar sammelte das Unternehmen in einer von Courtside Ventures angeführten Seed-Runde 4 Millionen US-Dollar. Prakash sagte gegenüber TechCrunch, dass das Startup eine größere Pre-Series-A-Runde abschließt, um seine Reichweite und die Anzahl der Mitarbeiter zu vergrößern.