Openai gab mir eine Woche zum Testen Ihr neuer KI -Agent, BetreiberEin System, das Aufgaben unabhängig für Sie im Internet ausführen kann.
Der Betreiber ist das nächste, was ich je in der Technologieindustrie gesehen habe Sicht der AI -Agenten – Systeme, die die langweiligen Teile des Lebens automatisieren und uns befreit, um die Dinge zu tun, die wir wirklich lieben. Nach meinen Erfahrungen mit dem OpenAI -Agenten zu urteilen, sind die wirklich „selbstgesteuerten“ KI -Systeme jedoch immer noch unerreichbar.
Offen trainierte ein neues Modell für den StrombedienerDies kombiniert das visuelle Verständnis von GPT-4O mit O1-Argumentationsressourcen.
Dieses Modell scheint für grundlegende Aufgaben gut zu funktionieren. Ich schaute mir die Klicktasten im Bediener an, segelte auf den Websites auf den Menüs und füllte Formulare aus. KI war gelegentlich erfolgreich in der unabhängigen Handlung und arbeitet viel schneller als die webbasierten Agenten, die ich je gesehen habe Anthropisch Und Google.
Aber während meiner Prüfung sah ich, wie ich dem OpenAI -Agenten mehr half, als ich möchte. Es sah so aus, als würde ich in jedem Problem ein Trainingsinstitut haben, während ich bestimmte Aufgaben von meinem Teller abweichen wollte.
Während meines Tests musste ich oft mehrere Fragen beantworten, Berechtigungen erteilen, persönliche Informationen ausfüllen und dem Agenten helfen, wenn sie stecken blieb.
In Bezug auf das Auto ist der Betreiber wie das Fahren eines Autos mit Geschwindigkeitsregelung, die den Fuß der Pedale nimmt und das Auto fahren lässt, ist weit davon entfernt, der vollständige Autopilot zu sein.
Laut OpenAI sind die häufigen Pausen des Bedieners entworfen.
Der KI -Fütterungsbetreiber sowie die KI -Chatbots wie OpenAI -Chatgpt können nicht über einen längeren Zeitraum zuverlässig arbeiten und sind anfällig für die gleiche Halluzination. Aus diesem Grund möchte OpenAI dem System nicht viel Entscheidungsbefugnis oder vertrauliche Informationen vom Benutzer bereitstellen. Vielleicht ist es eine sichere Wahl von OpenAI, reduziert aber die Praktikabilität des Betreibers.
OpenAIs erster Agent ist jedoch ein beeindruckender Beweis für das Konzept – und die Schnittstelle – für eine KI, die die Vorderseite jeder Website verwenden kann. Um jedoch wirklich unabhängige KI -Systeme zu schaffen, müssen Technologieunternehmen zuverlässigere KI -Modelle erstellen, die keine solche Richtung erfordern.
Ein bisschen zu ‚Hände an‘
Mein Operator -Versuch fiel mit der Woche zusammen, als ich die Wohnung wechselte, sodass ich die Hilfe des OpenAI -Agenten bei der Änderung der Logistik hatte.
Ich bat den Betreiber, mir zu helfen, eine neue Parklizenz zu kaufen. Der OpenAI -Agent sagte zu mir: „Natürlich“, also öffnete er ein Fenster zum Browser auf meinem PC -Bildschirm.
Der Betreiber suchte in seinem Browser einen Parkplatz von São Francisco und führte mich zum richtigen Standort der Stadt und sogar auf der richtigen Seite.
Mit dem Bediener können Sie weiterhin den Rest Ihres Computers verwenden, während er funktioniert, etwas, das für Google’s Project Mariner nicht gesagt werden kann. Dies liegt daran, dass der OpenAI -Agent nicht wirklich am Computer arbeitet, sondern irgendwo in der Cloud.
Für meine Parklizenz musste ich die Erlaubnis des Betreibers erteilen, einige Male verschiedene Prozesse zu starten. Es blieb auch aufgehört, mich zu bitten, Formulare mit persönlichen Informationen auszufüllen – z. B. meinen Namen, meine Telefonnummer und meine E -Mail -Adresse. Manchmal ist auch der Bediener verloren gegangen und hat ihn gezwungen, die Kontrolle über den Browser zu übernehmen und den Agenten wieder auf die Schienen zu bringen.
In einem weiteren Test bat ich den Betreiber, mich in einem griechischen Restaurant zu einer Reservierung zu machen. Für ihr Guthaben fand der Betreiber mich einen guten Platz in meiner Gegend zu angemessenen Preisen. Aber ich musste über ein halbes Dutzend Fragen entlang des Flusses beantworten.
Wenn Sie sechs oder öfter eingreifen müssen, um eine Reserve über einen KI -Agenten zu buchen, wann ist es einfacher, dies alleine zu tun? Dies ist eine Frage, die ich mir viel gestellt habe, als ich den Bediener getestet habe.
Agent-to-the-Platform
In einigen meiner Tests fand ich Websites, die den Bediener aus irgendeinem Grund blockierten. Zum Beispiel habe ich versucht, einen Elektriker mit TaskRabbit zu buchen, aber Openai Agent sagte mir, er habe einen Fehler und fragte, ob er einen alternativen Dienst nutzen könne. Expedia, Reddit und YouTube verhinderten auch den AI -Agenten daran, auf ihre Plattformen zuzugreifen.
Andere Dienste nehmen jedoch den Open Arms -Betreiber ein. Instacart, Uber und eBay haben mit OpenAI für den Start des Bedieners zusammengearbeitet, sodass der Agent im Namen des Menschen seine Websites navigieren kann.
Diese Unternehmen bereiten sich auf eine Zukunft vor, in der eine Untergruppe der Benutzerinteraktion von einem AI -Agenten erleichtert wird.
„Kunden verwenden Instacart in einer Vielzahl verschiedener Einstiegspunkte“, sagte Daniel Danker, Produktdirektor von Instalurt, in einem Interview mit TechCrunch. „Wir sehen den Bediener als möglicherweise eine andere dieser Eingabepunkte.“
Lassen Sie den OpenAI -Agenten die Instacart -Website im Namen einer Person nutzen, um Instacart von seinen Kunden zu trennen. Laut Danker möchte Instacart jedoch Kunden treffen, wo immer sie sind.
„Wir sind sehr optimistisch in Bezug auf unseren Glauben, ähnlich wie OpenAI, dass Agentensysteme einen großen Einfluss auf die Art und Weise haben, wie Verbraucher mit digitalen Eigenschaften interagieren“, sagte der AI-Direktor Nitzan Mekel-Bobrov in einem Interview mit TechCrunch.
Obwohl KI-Agenten steigen, sagt Mekel-Bobrov, dass sie erwarten, dass Benutzer immer die eBay-Website erreichen, und bemerkt, dass „Online-Ziele nirgendwo hin gehen“.
Vertrauensprobleme
Ich hatte einige Probleme, dem Betreiber zu vertrauen, nachdem er ein paar Mal halluziert und fast mehrere hundert Dollar gekostet hatte.
Zum Beispiel bat ich den Agenten, mir eine Garage in der Nähe meiner neuen Wohnung zu finden. Es schlug schließlich zwei Garagen vor, die laut ihm nur ein paar Minuten dauern würden, um zu laufen.
Die Garagen waren nicht nur außerhalb meiner Preisklasse, sondern waren auch wirklich weit von meiner Wohnung entfernt. Einer war 20 Minuten zu Fuß und der andere bis 30 Minuten zu Fuß. Es stellt sich heraus, dass der Bediener die falsche Adresse angab.
Genau aus diesem Grund stellt OpenAI Ihrem Agenten nicht die Nummer Ihrer Kreditkarte, Passwörter oder E -Mail -Zugriffs zur Verfügung. Wenn Openai mich nicht hier eingreifen würde, hätte der Betreiber Hunderte von Dollar an einem Parkplatz verschwendet, den ich nicht brauchte.
Andulações wie diese sind ein wichtiges Hindernis für wirklich nützliche autonome Agenten – diejenigen, die unbequeme Aufgaben von Ihrem Teller übernehmen können. Niemand wird den Agenten vertrauen, wenn sie wahrscheinlich grundlegende Fehler machen, insbesondere Fehler mit echten Konsequenzen.
Mit dem Bediener scheint OpenAI einige beeindruckende Tools aufgebaut zu haben, mit denen KI -Systeme im Internet navigieren können. Diese Tools werden jedoch nicht viel dauern, bis die zugrunde liegende KI sicher das tun kann, was Benutzer bitten. Bis dahin werden die Menschen an Assistenzmakler gebunden – nicht umgekehrt. Und diese Art von Niederlage den Punkt.