Sprach-KI-Startup ElfLabs hat am Mittwoch eine Funktion eingeführt, mit der Sie verschiedene Arten von Inhalten hochladen können, um einen Podcast mit mehreren Sprechern für Sie zu erstellen, ähnlich wie Google NotebookLM.
Die Funktion namens GenFM ist in der iOS-App ElevenLabs Reader des Unternehmens zu finden. GenFM unterstützt derzeit 32 Sprachen, darunter Englisch, Hindi, Portugiesisch, Chinesisch, Spanisch, Französisch, Deutsch, Japanisch und andere.
Um GenFM zu nutzen, laden Sie zunächst ein YouTube-Video, einen Text oder ein Dokument hoch. Die App wählt dann automatisch zwei Stimmen aus, um einen Podcast zu erstellen. Das Unternehmen stellt fest, dass mehr als ein Dutzend Stimmen verfügbar sind.
Einer der interessanten Bildschirme, die Sie möglicherweise sehen, wenn die App einen KI-generierten Podcast vorbereitet, lautet „Spreizen Sie ein paar Ähm“ und „Fügen Sie ein paar nachdenkliche Pausen hinzu“. Zu einer Zeit, als Tools helfen Menschen dabei, „Ähm“ und „Ah“ zu entfernen. ElevenLabs fügt seinem KI-generierten Podcast menschliche Elemente hinzu.
„Wir diskutieren darüber, wie viel ‚Ähm‘, ‚Ah‘, ‚Mhmm‘/Kichern/Atemfüller oder ähnliche Überlagerungen menschlicher Dialoge eingefügt werden sollen – unser Ziel ist es, die richtige Balance zwischen natürlichen menschlichen Gesprächen und der Bereitstellung von Nutzen aus den Inhalten zu finden.“ Er sagte, dass Jack McDermott, der bei ElevenLabs für das mobile Wachstum verantwortlich ist, TechCrunch in einer E-Mail erzählt habe.
„Wenn wir uns außergewöhnliche Podcasts in Langform ansehen, stellen wir fest, dass sie (weniger) unterbrochen werden und der Gesprächsfluss natürlicher und aufschlussreicher ist“, sagte er. „Diese Art von Erfahrung ist letztendlich das, was wir anstreben, indem wir Audio-Storytelling über Stimmen und Sprachen hinweg zugänglicher machen.“
In Zukunft plant ElevenLabs, mehr Anpassungsmöglichkeiten zu unterstützen und die Möglichkeit zu bieten, mehrere Quellen hinzuzufügen, um einen generativen KI-Podcast zu erstellen.
Im September startete Google die Möglichkeit, KI-generierte Gespräche zu erstellen mit NotebookLM aus den von Ihnen bereitgestellten Quellen. Einen Monat später fügte das Unternehmen die Möglichkeit hinzu Benutzer können diese KI-generierten Podcast-Ausgaben anpassen.
Anfang dieses Monats gab ElevenLabs bekannt, dass es investiert 11 Millionen US-Dollar für das polnische Startup-Ökosystem und die Eröffnung eines Büros in Warschau, das als Forschungs- und Entwicklungszentrum des Unternehmens dienen wird, um lokale KI-Talente anzuziehen. Das sagte auch das Startup Expansion nach IndienDort stellte er einen Geschäftsleiter ein und baut nun ein Team auf. Das Unternehmen wurde ebenfalls gegründet Konversations-KI-Agenten für Ihre Kunden.