OpenAI startet O3-Mini, sein jüngstes Modell der „Argumentation“

Von

31 Januar 2025

Openai wurde am Freitag ein neues Modell von AI, O3-Mini, dem neuesten Unternehmen Die Familie der Argumentationsmodelle.

Offen Sah das Modell im Dezember zuerst an Neben einem fähigeren System namens O3, der Start jedoch zu einer entscheidenden Zeit für das Unternehmen, dessen Ambitionen – und Herausforderungen – offenbar jeden Tag wachsen.

Openai kämpft gegen die Wahrnehmung, dass es sich um ein Zertifizierungsfeld im IA -Rennen um Chinesische Unternehmen wie DeepseekDiese OpenAI behauptet, seine IP gestohlen zu haben. Der ChatGPT -Hersteller hat es jedoch geschafft, Dutzende von Entwicklern zu erobern, und versucht es, es zu versuchen Finden Sie Ihre Beziehung zu Washington Wie er gleichzeitig a verfolgt Ehrgeiziges RechenzentrumsprojektAngeblich auch Fundamente setzen Für eine der größten Finanzierungsrunden eines Technologieunternehmens in der Geschichte.

Das führt uns zu O3-Mini. OpenAI startet sein neues Modell als „mächtig“ und „erschwinglich“.

„Die heutigen Startmarken (…) Ein wichtiger Schritt, um die Zugänglichkeit für die fortschrittliche KI im Dienst unserer Mission zu erweitern“, sagte eine OpenAI -orientierte Tür gegenüber TechCrunch.

Effizientere Argumentation

Im Gegensatz zu den meisten großen Sprachmodellen prüfen Argumentationsmodelle wie O3-Mini-Mini, bevor die Ergebnisse bereitgestellt werden. Es hilft ihnen Vermeiden Sie einige der Fallen Dies stolpert normalerweise in Modelle. Diese Argumentationsmodelle dauern etwas länger, um Lösungen zu erreichen. Der Austausch ist jedoch, dass sie tendenziell zuverlässigere Nr. Perfekte Probe-In-Domänen wie Physik sind.

O3-mini wird für STEM-Probleme angepasst, insbesondere für Programmierung, Mathematik und Wissenschaften. OpenAI gibt an, dass das Modell die Familie O1, O1 und O1-Mini in Bezug auf die Fähigkeiten weitgehend bewusst ist, aber schneller funktioniert und weniger kostet.

Das Unternehmen behauptete, dass externe Tester O3-Minis Antworten auf O1-Minis mehr als die Hälfte der Zeit bevorzugten. O3-mini machte offenbar auch 39% weniger „große Fehler“ in „schwierigen realen Fragen“ in A/B -Tests. gegen O1-Mini und produzierte „leichtere“ Antworten, die Antworten etwa 24% schneller bieten.

O3-mini steht allen Benutzern über zur Verfügung Chatgpt Von Freitag, aber Benutzer, die für die ChatGPT -Pläne des Unternehmens und des Teams bezahlen, haben einen höheren Preis von 150 Konsultationen pro Tag, während Chatgpt Pro -Abonnenten unbegrenzten Zugriff haben. Openai sagte Chatgpt Gov).

Benutzer mit Premium-Chatgpt-Plänen können O3-Mini mit dem Menü Suspended auswählen. Kostenlose Benutzer können auf die Schaltfläche „Grund“ in der Chat-Leiste klicken oder berühren oder ein „regeens“ -Chatgpt haben.

Ab Freitag wird O3-Mini auch über die OpenAI-API verfügbar sein, um Entwickler auszuwählen, wird jedoch zunächst nicht zur Analyse von Bildern unterstützt. Entwickler können den Grad der „Argumentationsanstrengungen“ (niedrig, mittel oder hoch) auswählen, um O3-mini zu machen „, basierend auf deren Verwendung und Latenzanforderungen mehr zu denken.

Der 3-mini kostet 0,55 USD pro Million Cache-Input-Token und 4,40 USD pro Million Produktionstoken, wobei eine Million Token ungefähr 750.000 Wörter beträgt. Dies ist 63% billiger als O1-Mini und wettbewerbsfähig mit Deepseks R1-Argumentationspreisen. Deepseek berechnet 0,14 USD pro Million Cache -Input -Token und 2,19 USD pro Million Produktionstoken für den Zugang zu R1 über seine API.

In ChatGPT ist O3-Mini als mittlere Argumentationsanstrengung definiert, die OpenAI „einen ausgewogenen Austausch zwischen Geschwindigkeit und Genauigkeit“ bietet. Bezahlte Benutzer haben die Möglichkeit, „O3-Mini-Alto“ im Models-Selektor auszuwählen, wodurch die OpenAI als Gegenleistung für langsamere Antworten „überlegene Intelligenz“ bezeichnet.

Unabhängig davon, welche Version von O3-Mini-Chatgpt-Benutzern auswählen, funktioniert das Modell mit der Suche, um aktualisierte Antworten mit relevanten Webquellen-Links zu finden. OpenAiai warnt, dass Funktionalität ein „Prototyp“ ist, da es daran arbeitet, die Forschung in ihre Argumentationsmodelle zu integrieren.

„Obwohl O1 unser breiteres Modell des allgemeinen Denkens bleibt, bietet O3-Mini eine spezielle Alternative für technische Bereiche, die Genauigkeit und Geschwindigkeit erfordern“, schrieb Openai am Freitag in einem Blog-Beitrag. „Der Start von O3-Mini markiert einen weiteren Schritt in OpenAs Mission, um die Grenzen der wirtschaftlichen Intelligenz zu überwinden.“

Werbung gibt es zuhauf

O3-mini ist bis heute weder das mächtigste Modell von Openai noch das R1-Argumentationsmodell von Deepseek in jeder Referenz.

O3-mini gewinnt R1 bei Aime 2024, ein Test, der misst, wie Modelle komplexe Anweisungen verstehen und darauf reagieren, aber mit hoher Anstrengung, zu begründen. Es übertrifft auch den R1 im Test -Focused Test Test (0,1 Punkt), jedoch nur mit hohem Argumentationsaufwand. In der geringen Argumente ist der O3-Mini R1 in der Diamond GPQA, die Modelle mit Fragen der Physik, Biologie und Chemie auf Doktorarbeit testet.

Um fair zu sein, reagiert der O3-Mini viele Konsultationen zu einer wettbewerbsfähigen Kosten und Latenz. In der Post vergleicht Openai seine Leistung mit der Familie O1:

„Mit geringer Begründung erzielt O3-mini eine vergleichbare Leistung mit O1-Mini, während O3-Mini mit O1 eine vergleichbare Leistung erzielt“, schreibt Openai. „O3-mini mit mittlerer Begründung entspricht der O1-Leistung in Mathematik, Codierung und Naturwissenschaften und bietet gleichzeitig schnellere Antworten. In der Zwischenzeit übertrifft O3-Mini O1-Mini und O1. ”

Es ist erwähnenswert, dass der Leistungsvorteil von O3-Mini gegenüber O1 in einigen Bereichen gering ist. In Aime 2024 gewinnt O3-Mini O1 mit nur 0,3 Prozentpunkten, wenn sie als hoher Argumentationsanstrengung definiert sind. Und in GPQA Diamond überschreitet O3-Mini auch bei hohen Argumentationsanstrengungen den O1-Score nicht.

OpenAI gibt an, dass O3-mini so „sicher“ oder sicherer ist als die O1-Familie, dank der Bemühungen der roten Teams und ihrer „beratenden Ausrichtung“ -Methodik, die die Modelle „über Politik“ OpenAI-Sicherheit nachdenken, während sie die Beantwortung des Fragen. Nach Angaben des Unternehmens „übertrifft O3-Mini“ signifikant „eines der Hauptmodelle von OpenAI, Gpt-4oin „Challenge Security and Jailbreak Assessments“.

Quelle link

OpenAI startet O3-Mini, sein jüngstes Modell der „Argumentation“

Effizientere Argumentation

Werbung gibt es zuhauf

Kommentieren Sie den Artikel Antwort abbrechen

Kategorie

Effizientere Argumentation

Werbung gibt es zuhauf

Verwandte ArtikelMehr vom Autor

Dieser maximierte Alienware Area-51 hat einen RTX 5080, 64 GB RAM und 4 TB SSD für etwas mehr als 5.000 US-Dollar

Dieser Cyberpowerpc RTX 5080 Gaming PC hat 64 GB RAM und 4TB SSD für 2.699,99 USD

Künstliche Intelligenz verbessert die Behandlung der personalisierten Krebs

Kommentieren Sie den Artikel Antwort abbrechen

Kategorie

Verwandte Artikel Mehr vom Autor