Start IT/Tech Die Umarmung von Gesichtsforschern versuchen, eine offenere Version von AI Deepseks „Argumenting“...

Die Umarmung von Gesichtsforschern versuchen, eine offenere Version von AI Deepseks „Argumenting“ -Modell aufzubauen

20
0
Deepseek bewegt Chatgpt als beste App im App Store

Nur eine Woche nach dem Start von Deepseek seine Start R1 „Argumentation“ – welche Märkte an einen tizzierten Markt geschickt – Umarme Gesichtsforscher versuchen, das Kratzermodell in dem zu replizieren, was sie als „offenes Wissen“ bezeichnen.

Umarmen Sie den Leiter der Forschung Leandro von Werra und mehrere Ingenieure des Unternehmens startete die Open-R1Ein Projekt, das versucht, ein offenes Duplikat und alle seine Komponenten zu erstellen, einschließlich der Daten, die zum Training verwendet werden.

Die Ingenieure sagten, sie seien gezwungen, für Deepseks „Black Box“ -Philosophie zu handeln. Technisch gesehen ist der R1 „offen“, da das Modell zugelassen ist, was bedeutet, dass es weitgehend ohne Einschränkungen implementiert werden kann. R1 ist jedoch nicht “Open SourceDenn viele der Tools, die zum Aufbau verwendet werden, sind im Geheimnis eingewickelt. Wie viele hochfliegende KI -Unternehmen hasst es Deepseek, seine geheime Sauce zu enthüllen.

„Modell R1 ist beeindruckend, aber es gibt keinen offenen Datensatz, Erfahrungsdetails oder Zwischenmodelle, was die Replikation und die zusätzliche Forschung erschwert“, sagte Elie Bakouch, eine der Open-R1-Gesichtsingenieure mit Gesichtsgedichten, bis zu TechCrunch. „In der vollständigen Architektur von R1 wird R1 nicht nur um Transparenz geöffnet-es macht ihr Potenzial aus.“

Nicht so offen

Deepseek, ein chinesisches KI -Labor, das zum Teil von einem quantitativen Hedgefonds finanziert wurde, hat letzte Woche R1 veröffentlicht. In mehreren Benchmarks entspricht R1 und übertrifft sogar die Leistung von OpenAIs O1 Argumentationsmodell.

Als Argumentationsmodell quietscht der R1 effektiv, was Hilft, einige der Fallen zu vermeiden, die normalerweise auf Modellen stolpern. Die Argumentationsmodelle dauern im Vergleich zu einem typischen nicht farmenden Modell etwas mehr Sekunden bis zu Lösungen. Der Vorteil ist, dass sie in Bereichen wie Physik, Naturwissenschaften und Mathematik tendenziell zuverlässiger sind.

R1 fiel nach der Deepseek Chatbot -App, die einen freien Zugriff auf R1 bietet, nach dem konventionellen Bewusstsein. stieg die Spitze der Apple App Store -Charts an. Die Geschwindigkeit und Effizienz, mit der der R1 entwickelt wurde – Deepseek startete das Modell nur wenige Wochen nach dem Start von OpenAI – Leitete viele Wall Street -Analysten und Technologen Frage, ob die USA ihre Führung in der KI -Rasse beibehalten können.

Das Open-R1-Projekt befasst sich weniger mit der KI-Meisterschaft als „das schwarze Modell des Modelltrainings vollständig zu eröffnen“, sagte Bakouch gegenüber TechCrunch. Er merkte an, dass es eine Herausforderung ist, das Modell eingehend zu untersuchen, da R1 nicht mit Trainingscode oder Schulungsanweisungen offenbart wurde – insgesamt weniger, sein Verhalten zu lenken.

„Die Kontrolle über den Datensatz und den Prozess ist entscheidend für die Bereitstellung eines Modells in sensiblen Bereichen“, sagte Bakouch. „Es hilft auch, Vorurteile im Modell zu verstehen und zu beheben. Forscher benötigen mehr Fragmente (…), um die Grenzen dessen zu überwinden, was möglich ist. ”

Schritte zur Replikation

Der Zweck des Open-R1-Projekts besteht darin, R1 in wenigen Wochen zu replizieren und sich teilweise im umarmenden Face Scientific Cluster, einem dedizierten Forschungsserver mit 768 GPUS NVIDIA H100, zu stützen.

Umarmte Gesichtsingenieure planen, den Science -Cluster zu erkunden, um Datensätze zu generieren, die ähnlich wie bei Deepseek zum Erstellen von R1 verwendet werden. Um eine Trainingspipeline aufzubauen, fordert das Team die Hilfe der KI und der breiteren Technologiegemeinschaften auf, das Gesicht und Github zu umarmen, wo das Open-R1-Projekt durchgeführt wird.

„Wir müssen sicherstellen, dass wir die Algorithmen und Rezepte (korrekt) implementieren“, sagte von Werra, „aber es ist etwas ein Anstrengung der Community von der Community, bei dem Sie so viele Augen wie möglich im Problem haben.“

Es gibt viel Interesse. Das Open-R1-Projekt hat in nur drei Tagen in GitHub 10.000 Sterne angesammelt. Stars sind eine Möglichkeit für Github -Benutzer, anzuzeigen, dass sie ein Projekt mögen oder es nützlich finden.

Wenn das Open-R1-Projekt erfolgreich ist, können KI-Forscher auf der Spitze der Trainingspipeline basieren und an der Entwicklung der Open-Source-Argumentationsmodelle der nächsten Generation arbeiten, sagte Bakouch. Er erwartet, dass das Open-R1-Projekt nicht nur eine starke Open-Source-Replikation von R1 erzeugt, sondern auch eine Basis für die besten Modelle.

„Anstatt eine Nullsumme zu sein, kommt Open Source -Entwicklung sofort zu allen zugute, einschließlich Grenzlabors und Modellanbietern, wie jeder dieselben Innovationen verwenden kann“, sagte Bakouch.

Während einige KI -Experten Bedenken hinsichtlich des Potenzials von Open Source -KI -Missbrauch ausgelöst haben, ist Bakouch der Ansicht, dass die Vorteile die Risiken übersteigen.

„Wenn das R1 -Rezept repliziert wird, kann jeder, der einige GPUs mieten kann, eine eigene R1 -Variante mit eigenen Daten aufbauen und die Technologie überall weiter verbreiten“, sagte er. „Wir freuen uns sehr über die jüngsten Open Source -Veröffentlichungen, die die Rolle der Öffnung bei AI stärken. Es ist eine wichtige Änderung des Feldes, die die Erzählung verändert, dass nur eine Handvoll Laboratorien Fortschritte machen können und dass die Open Source spät ist. ”

Quelle link