OperatorDer Agent von OpenAI, der mehrstufige Aufgaben autonom ausführen kann, ist da.
Der Der ChatGPT-Ersteller hat einen Vorschaumodus für Operator eingeführt am Donnerstag, in dem detailliert beschrieben wird, wie es funktioniert und wozu es fähig ist. Der Betreiber kann im Internet surfen, Aufgaben wie die Berechnung von Rückerstattungen für eine stornierte Bestellung ausführen und Kunden mit bestimmten Kriterien in einer internen Verkaufsdatenbank finden. Es kann auch Besorgungen erledigen und E-Mails versenden.
Auf einem Computer kann der Bediener verschiedene Aufgaben ausführen, z. B. Dateien herunterladen, PDFs kombinieren, Tabellenkalkulationen analysieren und Bilder exportieren.
Offene KI ist sein Versprechen erfüllen von 2025 zum Jahr der Agenten-KI machen. Das Unternehmen startete letzte Woche Aufgaben für ChatGPT, mit dem Benutzer zukünftige Eingabeaufforderungen automatisieren können, z. B. das Versenden einer täglichen Übersicht über technische Neuigkeiten oder das Planen von Erinnerungen. Während viele dieser Aufgaben bereits über einfache Tools wie Google Alerts und Kalender möglich sind, ist dies ein frühes Beispiel dafür, dass KI-Bots dem Benutzer die Arbeit abnehmen. In Kombination mit der Freigabe von Operator und der Möglichkeit, komplexere Aufgaben autonom auszuführen, können Sie beginnen, etwas zu sehen Die Vision von OpenAI, ChatGPT zu einem unverzichtbaren Werkzeug zu machen sein Kernprodukt zu nutzen.
Zerstörbare Lichtgeschwindigkeit
Das dem Operator zugrunde liegende Modell ist ein Computer-Using Agent (CUA), der den Vision-Modus von GPT-4o kombiniert, um über Screenshots mit grafischen Benutzeroberflächen (GUIs) zu „sehen“, was auf dem Bildschirm des Benutzers angezeigt wird, was es dem Operator ermöglicht, mit dem Bildschirm zu interagieren (durch Klicken auf Schaltflächen). , Tippen, Scrollen usw.).
Betreiber im Einsatz, auf der Suche nach einem Campingplatz in Yosemite mit Picknicktischen.
Bildnachweis: Open AI
Der Sicherheitsansatz von OpenAI mit Operator
Sicherheit ist für einen halbautonomen KI-Agenten wie Operator eindeutig ein großes Anliegen. OpenAI gibt an, Risiken auf verschiedene Weise berücksichtigt zu haben. Der Betreiber schränkt den Missbrauch ein, indem er schädliche oder illegale Aufgaben blockiert und keinen Zugriff auf Websites auf der schwarzen Liste wie Glücksspiel- und Unterhaltungsseiten für Erwachsene sowie Drogen- oder Waffengeschäfte bietet.
Und OpenAI schaut Ihnen bei der Nutzung von Operator über die Schulter. In der Ankündigung heißt es, dass „Benutzerinteraktionen in Echtzeit durch automatisierte Sicherheitsprüfungen überprüft werden, die die Einhaltung von Nutzungsrichtlinien sicherstellen sollen und die Möglichkeit haben, Warnungen oder Sperren für verbotene Aktivitäten auszugeben“, und dass das Unternehmen über „automatisierte Erkennungs- und menschliche Überprüfungspipelines“ verfügt Identifizieren Sie verbotene Verwendungen in vorrangigen Politikbereichen, einschließlich der Sicherheit von Kindern und irreführenden Aktivitäten.
Da der Bediener ohne menschliche Aufsicht kostspielige Fehler machen kann, bittet das Modell um eine Bestätigung, „bevor er eine Bestellung aufgibt, eine E-Mail sendet usw., damit der Benutzer die Arbeit des Modells überprüfen kann, bevor sie dauerhaft wird.“ Der Betreiber ist derzeit auch von „Aufgaben mit höherem Risiko wie Bankgeschäften“ ausgeschlossen.
Verfügbarkeit des Betreibers
Hier sehen wir das neue Premium-Abonnement von OpenAI. ChatGPT Pro. Der Operator im Vorschaumodus ist in den USA nur für diejenigen verfügbar, die als Pro-Benutzer 200 US-Dollar pro Monat zahlen. Aber im Laufe der Zeit geht OpenAI davon aus, die Verfügbarkeit auf Plus-, Team- und Enterprise-Benutzer auszuweiten.