Warum ist Qi ein schlechter Test für dort

Von

5 Februar 2025

Während Ein neuer Auftritt in der PresseSam Altman, CEO von OpenAI, sagte, er habe in den letzten Jahren die AI -Qi schnell verbessert.

„Viel oder weniger scheint es so – das ist nicht wissenschaftlich korrekt, dies ist nur eine Vibration oder spirituelle Reaktion – jedes Jahr bewegen wir eine Standard -IQ -Abweichung“, sagte Altman.

Altman ist nicht der erste, der Qi verwendet, eine Schätzung der Intelligenz einer Person als Referenz für den AI -Fortschritt. AI -Influencer In den sozialen Medien gaben Tests des Modells IQ und klassifizierten die Ergebnisse.

Aber viele Experten sagen, Qi sei ein schlechtes Maß für die Fähigkeiten eines Modells – und ein Betrüger.

„Es mag sehr verlockend sein, die gleichen Maßnahmen zu verwenden, die wir für Menschen verwenden, um Fähigkeiten oder Fortschritte zu beschreiben, aber es ist wie beim Vergleich von orangefarbenen Äpfeln“, sagte Sandra Wachter, ein Forscher, der die Technologie und die Regulierung von Oxford untersucht, gegenüber TechCrunch.

In seinen Kommentaren zur Pumpe hat Altman IQ mit Intelligenz ausgestattet. IQ -Tests sind jedoch relativ – nicht objektiv – Maßnahmen von Rechts Arten von Intelligenz. Es gibt manche Konsens Dieses Qi ist ein vernünftiger Test der abstrakten Logik und der Argumentation. Aber es misst nicht praktisch Intelligenz – Wissen, wie man Dinge zum Laufen bringt – und es ist bestenfalls ein augenblicklicher.

„Qi ist ein Instrument zur Messung der menschlichen Fähigkeiten – nicht weniger umkämpft – basierend auf dem, was Wissenschaftler glauben, dass die menschliche Intelligenz ist“, bemerkte Wachter. „Sie können jedoch nicht dasselbe Maß verwenden, um KI -Ressourcen zu beschreiben. Ein Auto ist schneller als Menschen, und ein U -Boot ist besser im Tauchgang. Das bedeutet jedoch nicht, dass Autos oder U -Boote die menschliche Intelligenz überwinden. Sie liegen falsch mit einem Aspekt der Leistung mit menschlicher Intelligenz, was viel komplexer ist. ”

Sich in einem QI -Test abheben, dessen Ursprung Einige Historiker Nachverfolgung der Eugenik, die weithin diskreditierte wissenschaftliche Theorie, dass Menschen durch selektive Schöpfung verbessert werden können, muss ein Testkreditnehmer eine haben Starkes Arbeitsgedächtnis und Wissen westlicher kultureller Normen. Dies lädt natürlich die Gelegenheit zur Voreingenommenheit ein, und deshalb ist der Grund Ein Psychologe namens Qi -Tests „Ideologisch verderbbare mechanische Modelle der Intelligenz.

Die Tatsache, dass ein Modell in einem IQ -Test gut abschneidet, zeigt mehr über die Testversagen als die Leistung des Modells, so OS Keyes, ein Doktorand an der Washington University, der Ethik studiert.

„(Diese) Tests sind sehr einfach zu spielen, wenn Sie praktisch unendlich viel Gedächtnis und Geduld haben“, sagte Keyes. „IQ -Tests sind eine sehr begrenzte Möglichkeit, Kognition, Segentation und Intelligenz zu messen, was wir vor der Erfindung des digitalen Computers selbst wissen.“

KI hat wahrscheinlich auch einen unfairen Vorteil in IQ -Tests, wenn man bedenkt, dass Modelle große Mengen an Gedächtnis und internalisiertes Wissen zur Verfügung haben. Häufig werden Modelle in öffentlichen Webdaten geschult, und das Web ist voller Beispielfragen aus IQ -Tests.

„Die Tests wiederholen sehr ähnliche Muster – eine sehr unfehlbare Methode, um Ihren IQ zu erhöhen, besteht darin, die IQ -Tests zu üben. Dies ist im Wesentlichen das, was alle (Modell) getan haben“ . „Wenn ich etwas lerne, stecke ich es im Gegensatz zu KI nicht klarer in mein Gehirn und kann es nicht ohne Rauschverlust oder Signal verarbeiten.“

Schließlich fügten die Tests von Qi-Tendentians, wie sie für Menschen projiziert wurden, zu, dass Cook-Desed die allgemeinen Problemlösungsfähigkeiten bewertet. Sie sind unangemessen für eine Technologie, die sich auf die Problemlösung auf eine ganz andere Weise befasst als die der Menschen.

„Eine Krähe kann ein Werkzeug verwenden, um eine Boxbehandlung wiederherzustellen, aber das bedeutet nicht, dass es sich für Harvard anmelden kann“, sagte Cook. „Wenn ich ein Mathematikproblem löste, wetteifert mein Gehirn auch um Ihre Fähigkeit, Wörter auf der Seite richtig zu lesen, damit ich auf dem Heimweg oder wenn Sie jetzt im Raum zu kalt sind. Mit anderen Worten, menschliche Gehirne befassen sich mit viel mehr, wenn sie ein Problem lösen – ein Problem, Qi -Tests oder nicht – und es mit viel weniger Hilfe (als da) tun. “

All dies zeigt auf Die Notwendigkeit besserer KI -TestsHeidy Khlaaf, Wissenschaftler -Schale des KI -Instituts, sagte TechCrunch.

„In der Computergeschichte vergleichen wir die Rechenfähigkeiten nicht mit denen des Menschen, gerade weil die Art des Berechnung bedeutet, dass Systeme immer in der Lage waren, Aufgaben über die menschliche Kapazität hinaus zu erledigen“, sagte Khlaaf. „Diese Idee, dass wir die Leistung von Systemen mit menschlichen Fähigkeiten direkt vergleichen, ist ein aktuelles Phänomen, das stark umstritten ist und die Kontroverse von immer erweiterten und bewegenden und bewegenden Beratern beinhaltet, um KI -Systeme zu bewerten.“

Quelle link

Warum ist Qi ein schlechter Test für dort

Kommentieren Sie den Artikel Antwort abbrechen

Kategorie

Verwandte ArtikelMehr vom Autor

Schalte Smartphone -Potenzial: NVIDIAs KI -Revolution

Wie ein chinesisches KI -Startup das Silicon Valley aufschüttelt und was es für Nvidia bedeutet

Fizz bringt Alum Tiktok, um seinen Markt- und Empfehlungsmechanismus aufzubauen

Kommentieren Sie den Artikel Antwort abbrechen

Kategorie

Verwandte Artikel Mehr vom Autor