Google arbeitet an einem KI-Tool, das Ihren Computer mit einem einfachen Befehl übernehmen könnte. Entsprechend Die InformationenDas Tool, intern Project Jarvis genannt, kann im Chrome-Browser im Internet surfen und Aufgaben wie den Kauf von Produkten und die Buchung von Flügen ausführen.
Berichten zufolge funktioniert das Tool, indem es Screenshots eines Computerbildschirms erstellt und „die Aufnahmen interpretiert, bevor Aktionen wie das Klicken auf eine Schaltfläche oder das Eingeben in ein Textfeld ausgeführt werden“, ähnlich wie bei Microsoft umstritten Abrufen Diese Funktion wird jedoch zum Speichern und Abrufen des Computerverhaltens eines Benutzers verwendet.
Ein besserer Vergleich der Fähigkeiten von Jarvis ist die Analysefunktion Anthropic gestartet letzte Woche für sein Claude Large Language Model (LLM), das JavaScript-Code schreiben und ausführen kann. Allerdings ist Jarvis im Gegensatz zu Claude, das auf Programmierer für die Bedienung von Softwareanwendungen zugeschnitten ist, Berichten zufolge browserbasiert, und man könnte sich vorstellen, dass es an ein eher Mainstream-Publikum zum Einkaufen, Buchen von Flügen und für verschiedene Produktivitätsaufgaben vermarktet wird.
Zerstörbare Lichtgeschwindigkeit
Die Steigerung der Produktivität und die Automatisierung bestimmter alltäglicher Aufgaben ist die Richtung, in die Google viele seiner KI-Produkte auf der Suche nach Killer-Anwendungsfällen eingeschlagen hat. Google verfügt über KI-Funktionen für Workspace-Apps wie das Zusammenfassen und Schreiben von Text in Gmail und Docs, aber die Konkurrenz war hart. Google ist hinter OpenAI zurückgeblieben, das kürzlich eine angebliche Einführung gestartet hat Argumentationsmodell namens o1 Das könnte sich bald dahingehend weiterentwickeln, dass es über autonomere Webbrowsing-Funktionen verfügt.
Dem Bericht zufolge könnte Project Jarvis im Dezember mit der Veröffentlichung der neuesten Version seines Gemini LLM starten.
Themen
Künstliche Intelligenz
Google