Hochwertige Daten können der Schlüssel zu hochwertiger KI sein. Mit Studien Angesichts der Tatsache, dass die Kuratierung von Datensätzen und nicht die Größe den wirklichen Einfluss auf die Leistung eines KI-Modells hat, ist es nicht verwunderlich, dass zunehmender Wert auf Praktiken zur Datensatzverwaltung gelegt wird. Entsprechend manche suchtKI-Forscher verbringen heute einen Großteil ihrer Zeit mit Datenaufbereitungs- und Organisationsaufgaben.
Die Brüder Vahan Petrosyan und Tigran Petrosyan spürten den Schmerz, viele Daten verwalten zu müssen, während sie im College Algorithmen trainierten. Vahan ging während seiner Doktorarbeit sogar so weit, ein Datenverwaltungstool zu entwickeln. Forschung zur Bildsegmentierung.
Einige Jahre später erkannte Vahan, dass Entwickler – und sogar Unternehmen – gerne für ähnliche Tools bezahlen würden. Also gründeten die Brüder eine Firma, Überkommentierenum es zu bauen.
„Während der Innovationsexplosion rund um Modelle und multimodale KI im Jahr 2023 ist der Bedarf an qualitativ hochwertigen Datensätzen gestiegen, da jede Organisation mehrere Anwendungsfälle hat, die spezielle Daten erfordern“, sagte Vahan in einer Erklärung. „Wir sahen eine Chance, eine benutzerfreundliche Low-Code-Plattform wie ein Schweizer Taschenmesser für moderne KI-Trainingsdaten aufzubauen.“
SuperAnnotate, zu dessen Kunden Databricks und Canva gehören, unterstützt Benutzer bei der Erstellung und Verfolgung großer KI-Trainingsdatensätze. Das Startup konzentrierte sich zunächst auf Beschriftungssoftware, bietet nun aber Tools zur Feinabstimmung, Iteration und Auswertung von Datensätzen an.
Mit der SuperAnnotate-Plattform können Benutzer Daten aus lokalen und Cloud-Quellen verbinden, um Datenprojekte zu erstellen, an denen sie mit Teamkollegen zusammenarbeiten können. Von einem Dashboard aus können Benutzer die Leistung von Modellen anhand der zum Trainieren verwendeten Daten vergleichen und diese Modelle dann in mehreren Umgebungen bereitstellen, wenn sie bereit sind.
SuperAnnotate bietet Unternehmen außerdem Zugang zu einem Marktplatz kollaborativer Mitarbeiter für Datenanmerkungsaufgaben. Anmerkungen sind im Allgemeinen Textstücke, die die Bedeutung oder Teile der Daten kennzeichnen, auf denen Modelle trainieren, und als Leitfaden für die Modelle dienen, indem sie ihnen „beibringen“, Dinge, Orte und Ideen zu unterscheiden.
Um ehrlich zu sein, Dort es gibt mehrere Reddit Themen über die Behandlung der verwendeten Datenannotatoren durch SuperAnnotate, und sie sind nicht schmeichelhaft. Kommentatoren klagen über Kommunikationsprobleme, unklare Erwartungen und niedrige Bezahlung.
SuperAnnotate behauptet seinerseits, dass es marktgerechte Preise zahlt und dass seine Anforderungen an Annotatoren nicht außerhalb der Branchennorm liegen. Wir haben das Unternehmen um detailliertere Informationen zu seinen Praktiken gebeten und werden diesen Artikel aktualisieren, sobald wir etwas hören.
Im Bereich der KI-Datenverwaltung gibt es mehrere Konkurrenten, darunter Start-ups wie KI-Skalen, Weka Und Datenzyklus. SuperAnnotate mit Sitz in San Francisco hat es jedoch geschafft, sich über Wasser zu halten und hat kürzlich in einer von Socium Ventures angeführten Serie-B-Runde unter Beteiligung von Nvidia, Databricks Ventures, Play Time Ventures und Defy.vc 36 Millionen US-Dollar eingesammelt.
Das neue Kapital, das die Gesamteinnahmen von SuperAnnotate auf knapp über 53 Millionen US-Dollar erhöht, wird für die Erweiterung des derzeitigen Teams von etwa 100 Mitarbeitern, für Produktforschung und -entwicklung sowie für die Erweiterung des Kundenstamms von SuperAnnotate aus etwa 100 Unternehmen verwendet.
„Unser Ziel ist es, eine Plattform zu schaffen, die sich vollständig an die sich verändernden Bedürfnisse von Unternehmen anpassen kann und eine umfassende Anpassung bei der Datenfeinabstimmung bietet“, sagte Vahan.