Start IT/Tech DeepMind States

DeepMind States

5
0
DeepMind logo

Ein KI -System, das von Google DeepMind, dem führenden AI -Forschungslabor von Google, entwickelt wurde, scheint den durchschnittlichen Goldmedaillengewinner bei der Lösung von Geometrieproblemen in einem internationalen Mathematikwettbewerb übertroffen zu haben.

Das System, Alphageometry2 genannt, ist eine verbesserte Version eines Systems, Alphageometrie, Dieser DeepMind hat letzten Januar veröffentlicht. In einem Neu -veröffentlichte StudieDeepMind -Forscher hinter Alpageometry2 sagen, dass ihre KI in den letzten 25 Jahren 84% aller Geometrieprobleme bei den internationalen Mathematischen Olympischen Spielen (IMO), einem Mathematikwettbewerb für Schüler, lösen kann.

Warum kümmert sich DeepMind um einen Mathe -Wettbewerb in der High School? Nun, das Labor ist der Ansicht, dass der Schlüssel zur fähigsten KI darin besteht, neue Wege zu entdecken, um herausfordernde Geometrieprobleme speziell zu lösen Euklidische Geometrieprobleme.

Nachweis mathematischer Theoreme oder logisch erklären, warum ein Theorem (zum Beispiel der Pythagoran -Theorem) wahr ist, erfordert Argumentation und die Fähigkeit, aus einer Vielzahl möglicher Schritte in Richtung einer Lösung zu wählen. Diese Fähigkeiten zur Problemlösung könnten das Recht sein, dass DeepMind-Cabess ein nützlicher Bestandteil der zukünftigen allgemeinen Gebrauchsmodelle ist.

Tatsächlich zeigte DeepMind im vergangenen Sommer ein System, das Alphagometrie2 mit Alphapach kombinierte, ein KI von Mathematik und Wissenschaften – beispielsweise bei komplexen technischen Berechnungen zu helfen.

Alphageometry2 verfügt über mehrere zentrale Elemente, darunter ein Sprachmodell der Gemini -Familie von AI -Modellen von Google und einen „symbolischen Mechanismus“. Das Gemini -Modell hilft dem symbolischen Mechanismus, der mathematische Regeln verwendet, um Problemlösungen zu schließen, um praktikable Beweise für einen bestimmten Geometrie -Theorem zu erreichen.

Ein Diagramm typischer Geometrieprobleme bei einer IMI -Prüfung.Bildnachweis:Google (öffnet sich in einem neuen Fenster)

Die Geometrieprobleme der Olympischen Spiele basieren auf Diagrammen, bei denen „Gebäude“ hinzugefügt werden müssen, bevor sie aufgelöst werden, z. B. Punkte, Linien oder Kreise. Das Gemini -Modell von Alpageometry2 sorgt dafür, dass Gebäude nützlich sein können, um ein Diagramm hinzuzufügen, das der Motor auf Abzug bezieht.

Grundsätzlich schlägt das Gemini -Modell von Alpageometry2 Schritte und Konstruktionen in einer formalen mathematischen Sprache für den Mechanismus vor, der diese Schritte nach der logischen Konsistenz überprüft. Ein Forschungsalgorithmus ermöglicht es Alphageometry2, verschiedene Forschungen durch parallele Lösungen durchzuführen und möglicherweise nützliche Entdeckungen auf einer allgemeinen Wissensbasis zu speichern.

Alfageometrie 2 betrachtet ein Problem, das „gelöst“ werden soll, wenn es um Beweise geht, das die Vorschläge des Zwillingsmodells mit den bekannten Prinzipien des symbolischen Mechanismus kombiniert.

Aufgrund der Komplexität der Evidenzübersetzung in einem Format, das AI verstehen kann, gibt es eine Mangel an verwendbaren Daten des Geometrie -Trainings. So erstellte DeepMind seine eigenen synthetischen Daten, um das Alpageometrie -Sprachmodell2 zu trainieren und über 300 Millionen Theoreme und Tests mit variabler Komplexität zu erzeugen.

Das DeepMind -Team hat im Vergleich zu IMO -Wettbewerben in den letzten 25 Jahren (von 2000 bis 2024) 45 Geometrieprobleme ausgewählt, einschließlich linearer Gleichungen und Gleichungen, die sich um eine bewegliche geometrische Objekte um eine Ebene um eine Ebene erfordern. Sie „übersetzten“ sie dann in einen größeren Satz von 50 Problemen. (Aus technischen Gründen mussten einige Probleme in zwei unterteilt werden.)

Dem Artikel zufolge löste der Alfageometry2 42 der 50 Probleme, wodurch die durchschnittliche Punktzahl des 40,9 Goldmedaillengewinners gereinigt wurde.

Es ist wahr, dass es Einschränkungen gibt. Die technische Besonderheit verhindert, dass Alphageometrie2 Probleme mit einer variablen Anzahl von Punkten, nichtlinearen Gleichungen und Ungleichheiten lösen. Und Alphageometrie2 ist nicht technisch Das erste KI -System zur Erzielung der Leistung von Goldmedaillenniveau in der Geometrie, obwohl es das erste ist, der es mit solch einer Reihe von Problemen erreicht.

Alphageometry2 hat sich auch bei anderen schwierigeren Problemen in der IMO verschlechtert. Für eine zusätzliche Herausforderung wählte das DeepMind -Team Probleme aus – insgesamt 29 -, die von Mathematikexperten für Prüfungen nominiert worden waren, aber noch nicht in einem Wettbewerb aufgetreten sind. Alfageometry2 konnte nur 20 von ihnen lösen.

Die Ergebnisse der Studie werden jedoch wahrscheinlich die Debatte darüber ernähren, ob KI-Systeme auf der Manipulation von Symbolen basieren sollten-oder setzt Symbole manipuliert, die Wissen anhand von Regeln oder angeblich hirnartigen Netzwerken darstellen.

Alphageometry2 verwendet einen hybriden Ansatz: Das Gemini -Modell hat eine neuronale Netzwerkarchitektur, während sein symbolischer Mechanismus Regeln basiert.

Die Befürworter neuronaler Netzwerktechniken argumentieren, dass intelligentes Verhalten und Spracherkennung der Bildgenerierung aus nichts weiter als riesigen Daten- und Computermengen entstehen können. Im Gegensatz zu symbolischen Systemen, die Aufgaben lösen, werden neuronale Netzwerke versuchen, Aufgaben anhand statistischer Ansätze und Lernbeispiele zu lösen.

Neuronale Netze sind der Eckpfeiler der leistungsstarken KI -Systeme als Openai O1s „Argumenting“ -Modell. Aber wenn sie Anhänger der symbolischen KI beanspruchen, sind sie nicht das Ende von allem; Die symbolische KI kann besser positioniert sein, um das Wissen über die Welt effizient zu kodifizieren, den Weg durch komplexe Szenarien und „erklären“, wie sie zu einer Antwort gekommen sind, argumentieren diese Anhänger.

„Es ist erstaunlich, den Kontrast zwischen fortgesetzten und spektakulären Fortschritten in diesen Arten von Referenzparametern und in der Zwischenzeit Sprachmodelle, einschließlich der neuesten mit“ Argumentation „, weiterhin einige einfache Sinnesprobleme zu machen“ Der auf AI spezialisierte Professor der Universität für Informatik sagte gegenüber TechCrunch. „Ich glaube nicht, dass alles Rauch und Spiegel ist, aber es zeigt, dass wir immer noch nicht wissen, was das Verhalten vom nächsten System erwartet. Diese Systeme sind wahrscheinlich sehr wirkungsvoll, daher müssen wir sie dringend verstehen und die Risiken, die sie viel besser ausgehen. ”

Alfageometrie2 kann zeigen, dass die beiden Ansätze – Manipulation von Symbolen und neuronalen Netzwerken – Manipulation – kombiniert Sie sind ein vielversprechender Weg, um auf der Suche nach verallgemeinerbarer KI zu folgen. Laut dem Artikel DeepMind konnte O1, das auch eine neuronale Netzwerkarchitektur hat, keine der IMO -Probleme lösen, die Alfageometry2 reagieren konnte.

Dies ist möglicherweise nicht für immer der Fall. In dem Artikel gab das DeepMind -Team vor, vorläufige Beweise dafür zu finden, dass das Alpageometrie -Sprachmodell2 ohne Hilfe des symbolischen Mechanismus teilweise Lösungen für Probleme erzeugen konnte.

„(Die Ergebnisse) unterstützen Ideen, die große Sprachmodelle autark sein können, ohne von externen Werkzeugen (wie symbolischen Motoren) abhängig zu sein“ Halluzinationen Sie sind vollständig behoben, die Tools bleiben für Mathematik -Apps unerlässlich. ”

Quelle link

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein