Jahrelang rief Vyas Sekar Muckai Girish, einen alten Studienfreund, an, um über mögliche Startup-Ideen zu sprechen und Girishs Meinung einzuholen. Normalerweise redeten die beiden über eine Idee und beendeten das Gespräch so. Als Sekar Girish Anfang 2022 mit einer Idee zu synthetischen Daten anrief, endete das Gespräch nicht erst, als sie auflegten.
Sekar und seine Kollegin an der Carnegie Mellon University, Giulia Fanti, hatten an der Erstellung synthetischer Daten gearbeitet, um die Reproduzierbarkeitskrise oder die Unfähigkeit, Daten in der Wissenschaft zu reproduzieren, zu lösen. Während Sekar die Notwendigkeit einer Lösung im akademischen Bereich sah, wusste Girish, dass seine damaligen Kunden vor dem gleichen Problem standen. Nach Gesprächen mit einigen Unternehmen wurde die These weiter validiert.
„Damals hatte ich das Gefühl, dass dies sehr real war und eine Chance bestand“, sagte CEO Girish gegenüber TechCrunch. „Das war der Ausgangspunkt für uns, und in den nächsten Monaten sprachen wir mit einigen Investoren, Leuten, die wir kannten, und vor allem mit Unternehmen und erkannten, dass es sich um ein erhebliches Problem handelte, das es wert war, ein Leben lang hinter uns zu lassen . ”
Das Ergebnis war Rockfish, ein Startup, das generative KI nutzt, um synthetische Daten für betriebliche Arbeitsabläufe zu erstellen und Unternehmen dabei zu helfen, ihre Datensilos aufzubrechen. Rockfish lässt sich unter anderem in Datenbankanbieter wie AWS und Azure integrieren und hilft Benutzern bei der Auswahl der besten Konfiguration für ihre Daten basierend auf Unternehmensrichtlinien oder Datennutzung.
Synthetische Daten sind in der KI-Welt zunehmend zu einem heißen Thema geworden, aber als das Unternehmen im Juni 2022 startete, gab es bereits eine wachsende Dynamik. Girish sagte, Rockfish wolle sicherstellen, dass es ein Produkt entwickelt, das sich von seinen Mitbewerbern abhebt Auch eine Lösung, die Unternehmen täglich und nicht nur ab und zu nutzen würden.
Aus diesem Grund ist das Produkt des Unternehmens auf die kontinuierliche Datenerfassung ausgelegt und konzentriert sich auf Betriebsdaten, zu denen Daten zu Finanztransaktionen, Cybersicherheit und Lieferketten gehören. Diese Bereiche produzieren ständig Daten für Unternehmen und verändern sich auch ständig. Girish glaubt, dass die Fokussierung hier Rockfish dabei hilft, sich von anderen Mitbewerbern abzuheben.
Laut Girish arbeitet das Unternehmen mittlerweile mit mehreren Unternehmenskunden zusammen, darunter der Streaming-Analyseplattform Conviva, sowie mit Regierungsbehörden wie der US-Armee und dem US-Verteidigungsministerium.
Rockfish kündigt eine 4-Millionen-Dollar-Seed-Runde unter der Leitung von Emergent Ventures an, an der sich unter anderem Foster Ventures, TEN13 und Dallas VC beteiligen. Damit beläuft sich die Gesamtfinanzierung des Unternehmens auf etwa 6 Millionen US-Dollar.
Anupam Rastogi, geschäftsführender Gesellschafter bei Emergent Ventures, sagte gegenüber TechCrunch, dass er Sekar schon lange vor der Gründung von Rockfish verfolgt habe. Er sagte, der Grund für die Investition des Unternehmens seien „Team, Markt und Produkt, in dieser Reihenfolge“. Darüber hinaus passte Rockfish aufgrund seines Fokus auf den Bau für Unternehmen besser zu Emergent als einige der anderen Akteure in der Branche.
„Das Team besteht aus hochqualifizierten Datenwissenschaftlern mit mehreren Doktortiteln“, sagte Rastogi. „Dies ist ein Raum, den wir als technisch sehr anspruchsvoll erachten, und diese technische Stärke am Tisch zu haben, ist wirklich von grundlegender Bedeutung.“ Sie haben einen Großteil der grundlegenden Arbeit in diesem Bereich geleistet, nicht nur im Unternehmen, sondern in der gesamten Branche.“
Obwohl Rockfish hofft, dass sein Fokus ihm einen Vorsprung gegenüber der Konkurrenz verschaffen wird, ändert das nichts an der Tatsache, dass synthetische Daten wahrscheinlich ein zunehmend überfüllter Markt sein werden. KI-Unternehmen greifen auf synthetische Daten zurück, wie mehrere Teilnehmer meinen Der Markt hat andere KI-Trainingsdaten erschöpft.
Es gibt bereits zahlreiche Startups, die den Markteintritt anstreben, darunter AI Tonicdas mehr als 45 Millionen US-Dollar an Risikofinanzierungen eingeworben hat; Hauptsächlich KIdie 31 Millionen US-Dollar an Risikokapitalmitteln aufbrachte; Und Wolkigdas 14,5 Millionen US-Dollar einbrachte, bevor es 2024 von SAS übernommen wurde, um nur einige zu nennen.
Girish sagte, das Unternehmen versuche, seinen Ansatz für synthetische Daten durch die Einbeziehung anderer Modelltypen wie Zustandsraummodelle, mathematische Modelle, die Zustandsvariablen verwenden, zu ergänzen. Das Unternehmen möchte außerdem seine End-to-End-Fähigkeiten verbessern.
„Es ist nicht so, dass man zufällige Daten aus dem Internet nimmt und synthetische Daten generiert“, sagte Girish. „Es gibt keine Garantie dafür, dass es funktioniert. Aber wenn wir das alles für Unternehmen zusammenfassen, ist es tatsächlich sehr relevant und realistisch. Das ist also der Schlüssel dazu, und die Möglichkeit, dies ständig tun zu können, ist für uns hilfreich.“