Start IT/Tech Cartesia behauptet, seine KI sei effizient genug, um fast überall zu arbeiten

IT/Tech

Cartesia behauptet, seine KI sei effizient genug, um fast überall zu arbeiten

Von

12 Dezember 2024

Die Entwicklung und der Betrieb von KI wird immer teurer. Die KI-Betriebskosten von OpenAI könnten zu erreichen 7 Milliarden US-Dollar in diesem Jahr, während der CEO von Anthropic dies kürzlich vorgeschlagen hat kosten Bald könnten mehr als 10 Milliarden US-Dollar eintreffen.

Daher begann die Suche nach Möglichkeiten, KI billiger zu machen.

Einige Forscher konzentrieren sich auf Techniken zur Optimierung bestehender Modellarchitekturen – also der Struktur und Komponenten, die Modelle zum Funktionieren bringen. Andere entwickeln neue Architekturen, von denen sie glauben, dass sie bessere Skalierungschancen zu erschwinglichen Preisen haben.

Karan Goel gehört zum letzteren Lager. Beim Startup war er Mitbegründer von KartesischGoel arbeitet an sogenannten State Space Models (SSMs), einer neueren, hocheffizienten Modellarchitektur, die große Datenmengen – Texte, Bilder usw. – gleichzeitig verarbeiten kann.

„Wir glauben, dass neue Modellarchitekturen notwendig sind, um wirklich nützliche KI-Modelle zu erstellen“, sagte Goel gegenüber TechCrunch. „Die KI-Branche ist ein wettbewerbsintensiver Bereich, sowohl kommerziell als auch Open Source, und die Entwicklung des besten Modells ist entscheidend für den Erfolg.“

Akademische Wurzeln

Bevor er zu Cartesia kam, war Goel Doktorand im KI-Labor von Stanford, wo er unter anderem unter der Leitung des Informatikers Christopher Ré arbeitete. Während seiner Zeit in Stanford traf Goel Albert Gu, einen anderen Doktoranden im Labor, und die beiden entwarfen, was SSM werden sollte.

Goel bekam schließlich einen Job bei Schnorchel-KIdann Salesforce, während Gu Assistenzprofessor an der Carnegie Mellon wurde. Aber Gu und Goel untersuchten weiterhin SSMs und veröffentlichten mehrere grundlegend Forschungsartikel über Architektur.

Im Jahr 2023 beschlossen Gu und Goel – zusammen mit zwei ihrer ehemaligen Stanford-Kollegen, Arjun Desai und Brandon Yang – ihre Kräfte zu bündeln, um Cartesia zu gründen, um ihre Forschung zu kommerzialisieren.

Cartesia-Gründerteam. Von links nach rechts: Brandon Yang, Karan Goel, Albert Gu und Arjun Desai. Bildnachweis:Kartesisch

Cartesia, zu dessen Gründungsteam auch Ré gehört, steht hinter vielen Derivaten von Mamba, dem heute vielleicht beliebtesten SSM. Gu und Princeton-Professor Tri Dao haben Mamba im vergangenen Dezember als offenes Forschungsprojekt gestartet und verbessern es durch nachfolgende Veröffentlichungen weiter.

Cartesia baut auf Mamba auf und trainiert eigene SSMs. Wie alle SSMs gibt Cartesia der KI so etwas wie ein Arbeitsgedächtnis und macht Modelle dadurch schneller – und möglicherweise effizienter – in der Art und Weise, wie sie Rechenleistung nutzen.

SSMs vs. Transformatoren

Die meisten KI-Anwendungen heute von GPT-Chat Zu Sorawerden von Modellen mit Transformatorarchitektur angetrieben. Als Transformator verarbeitet Daten und fügt Einträge zu einem sogenannten „verborgenen Zustand“ hinzu, um sich zu „merken“, was verarbeitet wurde. Wenn das Modell beispielsweise durch ein Buch geht, könnten die verborgenen Zustandswerte Darstellungen von Wörtern im Buch sein.

Der verborgene Zustand ist einer der Gründe, warum Transformatoren so leistungsstark sind. Aber es ist auch die Ursache seiner Ineffizienz. Um auch nur ein einziges Wort über ein Buch zu „sagen“, das ein Transformator gerade aufgenommen hat, müsste das Modell seinen gesamten verborgenen Zustand untersuchen – eine Aufgabe, die so rechenintensiv ist wie das erneute Lesen des gesamten Buchs.

Im Gegensatz dazu komprimieren SSMs alle vorherigen Datenpunkte zu einer Art Zusammenfassung von allem, was sie zuvor gesehen haben. Wenn neue Daten eintreffen, wird der „Status“ des Modells aktualisiert und SSM verwirft die meisten der vorherigen Daten.

Das Ergebnis? SSMs können große Datenmengen verarbeiten und sind bei bestimmten Datengenerierungsaufgaben besser als Transformatoren. Mit Inferenzkosten So wie sie sind, ist das wirklich ein attraktives Angebot.

Ethische Bedenken

Cartesia fungiert als gemeinschaftliches Forschungslabor und entwickelt SSMs in Partnerschaft mit externen und internen Organisationen. Sonic, das jüngste Projekt des Unternehmens, ist ein SSM, der die Stimme einer Person klonen oder eine neue Stimme erzeugen und den Ton und die Kadenz der Aufnahme anpassen kann.

Goel behauptet, dass Sonic, das über API und Web-Dashboard verfügbar ist, das schnellste Modell seiner Klasse ist. „Sonic ist ein Beweis dafür, wie sich SSMs bei Langkontextdaten wie Audio auszeichnen und gleichzeitig den höchsten Leistungsstandard in Bezug auf Stabilität und Genauigkeit beibehalten“, sagte er.

Obwohl Cartesia in der Lage war, Produkte schnell auszuliefern, stieß das Unternehmen auf viele der gleichen ethischen Fallstricke, mit denen auch andere Hersteller von KI-Modellen zu kämpfen hatten.

Kartesisch ausgebildet zumindest einige seiner SSMs in The Pile, einem offenen Datensatz, der bekanntermaßen nicht lizenzierte urheberrechtlich geschützte Bücher enthält. Das argumentieren viele KI-Unternehmen faire Nutzung Die Doktrin schützt sie vor Vorwürfen der Verletzung. Doch das hinderte die Täter nicht daran, zu klagen Meta und Microsoftsowie andere wegen angeblicher Ausbildung von Models bei The Pile.

Und Cartesia verfügt über kaum sichtbare Sicherheitsvorkehrungen für seinen Sonic-basierten Sprachkloner. Vor ein paar Wochen ist es mir gelungen, eine zu erstellen Klon die Stimme der ehemaligen Vizepräsidentin Kamala Harris in Wahlkampfreden (siehe unten). Für das Tool von Cartesia müssen Sie lediglich ein Kästchen ankreuzen, das angibt, dass Sie die Nutzungsbedingungen des Startups einhalten.

Der KI-Agentendienst von Goodcall basiert auf der Sonic API von Cartesia. **Bildnachweis:**Guter Anruf

Quelle link

Cartesia behauptet, seine KI sei effizient genug, um fast überall zu arbeiten

Akademische Wurzeln

SSMs vs. Transformatoren

Ethische Bedenken

Aufstrebendes Geschäft

Kommentieren Sie den Artikel Antwort abbrechen

Kategorie

Akademische Wurzeln

SSMs vs. Transformatoren

Ethische Bedenken

Aufstrebendes Geschäft

Verwandte ArtikelMehr vom Autor

Die Gründer von SlideShare machen das Teilen von Dokumenten mit ihrer neuen Plattform Jaunt sozialer

BeReal wirft vor, Benutzer dazu zu verleiten, ihre Daten weiterzugeben

„Sing“ von Realise Music möchte, dass Sie allein in VR laut singen, weil es sich gut anfühlt

Kommentieren Sie den Artikel Antwort abbrechen

Kategorie

Verwandte Artikel Mehr vom Autor