Start IT/Tech Die Forscher haben ein KI -Argumentationsmodell für den gleichen Grund mit Openais...

Die Forscher haben ein KI -Argumentationsmodell für den gleichen Grund mit Openais O1 für weniger als 50 US -Dollar erstellt

6
0
Die Forscher haben ein KI -Argumentationsmodell für den gleichen Grund mit Openais O1 für weniger als 50 US -Dollar erstellt

Die Schlösser sind offen für die billige Konstruktion von KI -Argumentationsmodellen.

Forscher aus Stanford und der University of Washington haben ein Modell entwickelt, das vergleichbar ist Openi O1 und Tief R1 -Modelle in Mathematik und Codierung – für weniger als 50 US -Dollar Cloud -Berechnungskredite.

Darüber hinaus wurde das Modell für nur 1.000 Fragen und nur 26 Minuten geschult und 16 Nvidia H100 GPUs dauerten. Der Forscher von Stanford, Niklas Muennighoff, sagte in einer E -Mail an Mashable, dass die Kosten eine Schätzung basierend auf der GPU -Laufzeit und der Anzahl der verwendeten H100 -GPUs sind.

In der KI-Industrie der letzten Zeit geht es darum, wie neue Ansätze für den Vor- und Nachbildungsprozess die Computerkosten enorm sparen können, wie sich die störenden Auswirkungen von Deepseek belegen. Darüber hinaus können Entwickler nun auf vorhandenen KI-Modellen für nur wenige oder keine Kosten über APIs, Open-Source-Zugriff und sogar Modelle mit geschlossener Quelle aufbauen, indem sie ihre Daten destillieren, damit die Kosten noch mehr gesenkt werden.

Mashable Lichtgeschwindigkeit

Nach dem des Teams Forschungspapier Was am vergangenen Freitag veröffentlicht wurde, wurde S1 in einem Datensatz geschult, der aus „1.000 sorgfältig komponierten Fragen in Kombination mit Argumentationsspuren und Antworten destilliert wurde Gemini Thinking Experimental. „Das Gemini-Denken-Experimentalmodell von Google ist mit den täglichen Grenzen über AI Studio zugänglich. Obwohl es sich um ein Modell mit geschlossenen Quellen handelt, haben die Forscher es eindeutig nicht daran gehindert, seine Antworten zu verwenden.

Anschließend verwendeten die Forscher ein „Off the Plank“ -Verformat aus Alibabaa-Ulllenom Lab, Qwen, und führten die kontrollierte Verfeinerung seines zusammengesetzten Datensatzes durch. Das Team erstellte dann ein Token -Budget, um die Höhe der Berechnungszeit für das Testen des Modells zu vereinbaren. Wenn S1 das Budget im Denken von Token übernahm, wurde es abgeschnitten und gezwungen, die Antwort zu generieren, die es sich ausgedacht hat. Wenn die Forscher wollten, dass das Modell mehr „Test -Time -Aussagen“ für ein Problem ausgibt, forderte sie das Modell einfach auf, „zu warten“, was seine Denkzeit verlängerte und zu genaueren Ergebnissen führte.

Durch die Kontrolle und Berechnung der Zeit, die für ein Problem aufgewendet wurde, konnten die Forscher nachweisen, wie ein größeres Denken zu einer verbesserten Leistung führt.

S1 ist ein Beispiel für Open-Source-Argumentationsmodelle, die für einen Bruchteil der Kosten von Flaggschiff-Modellen von Google und OpenAI entwickelt wurden. Im Januar veröffentlichten UC Berkeley-Forscher ein Open-Source-Argumentationsmodell namens Sky-T1, das 450 US Blog -Beitrag. Es gibt auch die Open Source RSTAR-MATH Argumentationsmodell von Microsoft Asia -Forschern, Tulu 3 des Nicht -Profit -Forschungsinstituts AI2, und das Suggingface hat eine eigene Initiative Replizieren Sie Deepseeks R1.

Wenn Modelle mit hoher Qualität zugänglicher und billiger werden, sind wir uns Fangen Sie an, eine Kraftverschiebung zu sehen Von den wenigen AI -Heaven -Batters bis zu den vielen.



Quelle link

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein