Google steht möglicherweise kurz davor, einen KI-Agenten vorzustellen, der einen Webbrowser bedienen kann, um Benutzern bei der Automatisierung alltäglicher Aufgaben zu helfen. berichtet, dass das Unternehmen an einem „computernutzenden Agenten“ unter dem Codenamen Project Jarvis arbeitet und dieser möglicherweise bereits im Dezember zur Vorschau bereit sein könnte. Laut Quellen, mit denen gesprochen wurde Die InformationenJarvis „reagiert auf die Befehle einer Person, indem er häufig Screenshots von dem aufnimmt, was auf seinem Computerbildschirm angezeigt wird, und die Aufnahmen interpretiert, bevor er Aktionen ausführt, wie zum Beispiel auf eine Schaltfläche klickt oder etwas in ein Textfeld eingibt.“
Berichten zufolge funktioniert Jarvis nur mit Webbrowsern – insbesondere Chrome –, um bei häufigen Aufgaben wie Recherche, Einkaufen und Flugbuchungen zu helfen. Dies geschieht, während Google die Fähigkeiten seiner Gemini AI weiter ausbaut, deren Next-Gen-Modell voraussichtlich im Dezember vorgestellt wird, wie von berichtet . Gemini Live, Googles KI-Chatbot, diesen Monat, und die Gemini-Integration hat es kürzlich geschafft , und andere Anwendungen.
Die Nachricht von Jarvis kommt Tage später Aber scheinbar umfangreichere Funktion für seine Claude AI, die angeblich mit Computerkenntnissen ausgestattet wurde, damit sie „eine breite Palette von Standardtools und Softwareprogrammen verwenden kann, die für Menschen entwickelt wurden“. Das ist jetzt in einer öffentlichen Betaversion verfügbar.