Start IT/Tech Openai benutzte diesen Subreddit, um die Überzeugung von AI zu testen

Openai benutzte diesen Subreddit, um die Überzeugung von AI zu testen

8
0
Reddit logo redesign

Openai benutzte den Subreddit, R/ChangyviewErstellen eines Tests zur Messung der überzeugenden Fähigkeiten Ihrer KI -Argumentationsmodelle. Das Unternehmen sagte, dass auf einer Systemkarte – ein Dokument, das beschreibt, wie ein KI -System funktioniert -, das zusammen mit seinem neuen Modell der „Argumentation“ gestartet wurde. O3-miniam Freitag.

Millionen von Reddit -Nutzern sind Mitglieder von R/Changyview, in denen sie die HOT veröffentlichen, die Hoffnung benötigt, andere Standpunkte zu einem Thema zu erfahren. In Antworten auf diese heißen Sockets haben andere Personen überzeugende Argumente veröffentlicht, in denen erklärt wurde, warum das ursprüngliche Poster falsch ist.

Subreddit ist eines der vielen Reddit -Foren, die im Grunde genommen eine Goldmine für Technologieunternehmen wie OpenAI sind, die KI -Modelle in menschlichen und qualitativ hochwertigen Daten ausbilden möchten.

OpenAI sagt, dass es R/ChangersyView -Benutzerbeiträge sammelt und KI -Modelle auffordert, Antworten in eine geschlossene Umgebung zu schreiben, die die Meinung des Reddit -Benutzers zu einem Thema ändern würde. Das Unternehmen zeigt die Antworten auf die Tester, die bewerten, wie überzeugend das Argument ist, und vergleicht schließlich KI -Modelle Antworten auf menschliche Reaktionen auf denselben Beitrag.

Der Chatgpt -Hersteller hat Eine Inhaltslizenzvereinbarung mit Reddit Auf diese Weise kann OpenAI in Reddit -Benutzerbeiträgen trainieren und diese Beiträge auf Ihren Produkten anzeigen. Wir wissen nicht, was Openai für diesen Inhalt bezahlt, aber Google angeblich angeblich Bezahlen Sie Reddit in Höhe von 60 Millionen US -Dollar pro Jahr unter einer ähnlichen Vereinbarung.

OpenAI sagte jedoch TechCrunch, dass diese Einschätzung nicht mit dieser Partnerschaft zusammenhängt. Es ist unklar, wie OpenAI auf diese Daten zugegriffen hat, und das Unternehmen hat nicht geplant, diese Einschätzung an die Öffentlichkeit weiterzugeben.

Während die Referenz von Openais Changuiview nicht neu ist – war es Auch in O1 verwendet – Es wird hervorgehoben, wie viel menschliche Daten für AI -Modelleentwickler wertvoll sind, sowie die obskure Art und Weise, wie Technologieunternehmen Datensätze erhalten.

Reddit antwortete nicht sofort auf die Anfrage von TechCrunch um einen Kommentar.

Obwohl Reddit einige KI -Lizenzvereinbarungen getroffen hat, rief das Unternehmen auch mehrere KI -Unternehmen für die Vorbereitung seiner Website an, ohne zu bezahlen. Steve Huffman, CEO von Reddit Microsoft, Anthropie und Verwirrung weigerten sich, mit ihm zu verhandeln Und er sagte, es sei „ein echter Hinternschmerz gewesen, diese Unternehmen zu blockieren“.

Bemerkenswerterweise wurde Openai in verschiedenen Kratzklagen nicht ordnungsgemäß von Websites vorgeworfen, einschließlich der New York TimesWeitere Schulungsdaten zur Verbesserung der ChatGPT und der zugrunde liegenden KI -Modelle.

In Bezug auf die Leistung bei Benchmark Changyview scheint O3-Mini in diesem Überzeugungstest nicht wesentlich besser oder schlechter als O1 oder GPT-4O zu funktionieren. Die neuesten KI -Modelle von Openai scheinen jedoch überzeugender zu sein als die meisten Menschen in Subreddit R/Changerview.

Bildnachweis: OpenAI

„GPT-4O, O3-Mini und O1 zeigen starke überzeugende Argumentationsfähigkeiten innerhalb von 80 bis 90 Menschen“, sagte Openai auf der O3-Mini-Systemkarte. „Heute haben wir keine Modelle mit viel besserer Leistung als Menschen oder eine leichte menschliche Leistung gesehen.“

Das Ziel von OpenAI ist es nicht, KI-hyperverzelte Modelle zu erstellen, sondern sicherzustellen, dass KI-Modelle nicht sehr überzeugend sind. Argumentationsmodelle haben in Überzeugung und Fehler sehr gut werdenOpenai entwickelte also neue Bewertungen und Schutzmaßnahmen, um sie zu lösen.

Die Angst hinter diesen Überzeugungstests ist, dass ein KI -Modell gefährlich wäre, wenn es sehr gut darin wäre, seine menschlichen Nutzer zu überzeugen. Theoretisch könnte dies einer fortgeschrittenen IA ermöglichen, Ihre eigene Tagesordnung oder die Tagesordnung des Kontrollle zu verfolgen.

Benchmark Changerview zeigt auch nach dem Raspur des größten Teils des öffentlichen Internets und der Übersprung der Felgen, um andere Daten zu lizenzieren, und zeigt, wie die Entwickler von KI -Modellen immer noch Schwierigkeiten haben, qualitativ hochwertige Datensätze zu finden, um ihre Modelle zu testen. Aber sie zu bekommen ist einfacher zu sagen als zu tun.

Quelle link

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein