Start IT/Tech Was genau ist ein KI-Agent?

Was genau ist ein KI-Agent?

7
0
Illustration of a robotic agent helping workers do their jobs.

KI-Agenten sollen das nächste große Ding in der KI sein, es gibt jedoch keine genaue Definition dessen, was sie sind. Bisher kann man sich nicht darüber einig werden, was genau einen KI-Agenten ausmacht.

In seiner einfachsten Form lässt sich ein KI-Agent am besten als KI-gestützte Software beschreiben, die eine Reihe von Aufgaben für Sie erledigt, die in der Vergangenheit ein menschlicher Kundendienstmitarbeiter, eine Personalabteilung oder ein IT-Helpdesk-Mitarbeiter hätte erledigen können kann letztendlich jede Aufgabe umfassen. Sie bitten es, Dinge zu tun, und es erledigt diese für Sie, manchmal über mehrere Systeme hinweg und geht weit über die einfache Beantwortung von Fragen hinaus. Zum Beispiel Perplexity letzten Monat hat einen KI-Agenten auf den Markt gebracht, der Menschen bei ihren Weihnachtseinkäufen unterstützt (Und ist nicht der Einzige). Und Google hat es letzte Woche angekündigt sein erster KI-Agent namens Project Marinermit dem Sie Flüge und Hotels finden, Haushaltsgegenstände kaufen, Rezepte finden und andere Aufgaben erledigen können.

Scheint einfach zu sein, oder? Allerdings wird es durch mangelnde Klarheit erschwert. Selbst unter Technologiegiganten besteht kein Konsens. Google sieht sie je nach Aufgabe als aufgabenbasierte Assistenten: Codierungshilfe für Entwickler; Helfen Sie Marketingfachleuten, ein Farbschema zu erstellen. Helfen Sie einem IT-Experten, ein Problem aufzuspüren, indem Sie Protokolldaten abfragen.

Für Asana kann ein Agent als zusätzlicher Mitarbeiter fungierenSich wie jeder gute Kollege um die zugewiesenen Aufgaben kümmern. Gebirge, Ein Startup, das vom ehemaligen Salesforce-Co-CEO Bret Taylor und dem Google-Veteranen Clay Bavor gegründet wurde, sieht Agenten als Tools für das Kundenerlebnis, die Menschen dabei helfen, Maßnahmen zu ergreifen, die weit über die alten Chatbots hinausgehen, um bei der Lösung komplexerer Problemstellungen zu helfen.

Das Fehlen einer zusammenhängenden Definition lässt Raum für Verwirrung darüber, was genau diese Dinge bewirken werden, aber unabhängig davon, wie sie definiert sind, helfen Agenten dabei, Aufgaben automatisiert und mit so wenig menschlicher Interaktion wie möglich zu erledigen.

Rudina Seseri, Gründerin und geschäftsführende Gesellschafterin von Glasswing Ventures, sagt, es sei noch am Anfang und das könnte die fehlende Einigung erklären. „Es gibt keine einheitliche Definition dessen, was ein ‚KI-Agent‘ ist. Die häufigste Ansicht ist jedoch, dass ein Agent ein intelligentes Softwaresystem ist, das seine Umgebung wahrnimmt, darüber nachdenkt, Entscheidungen trifft und autonom handelt, um bestimmte Ziele zu erreichen“, sagte Seseri gegenüber TechCrunch.

Sie sagt, dass sie eine Reihe von KI-Technologien nutzen, um dies zu erreichen. „Diese Systeme integrieren verschiedene KI/ML-Techniken, wie etwa die Verarbeitung natürlicher Sprache, maschinelles Lernen und Computer Vision, um in dynamischen Bereichen autonom oder zusammen mit anderen menschlichen Agenten und Benutzern zu arbeiten.“

Aaron Levie, Mitbegründer und CEO von Box, sagt, dass KI-Agenten im Laufe der Zeit, wenn die KI immer leistungsfähiger wird, in der Lage sein werden, viel mehr für den Menschen zu tun, und es sind bereits Dynamiken im Spiel, die diese Entwicklung vorantreiben werden.

„Bei KI-Agenten gibt es mehrere Komponenten in einem sich selbst verstärkenden Schwungrad, die dazu beitragen werden, die Leistung von KI-Agenten kurz- und langfristig erheblich zu verbessern: GPU-Preis/Leistung, Modelleffizienz, Softwarequalität und Intelligenzmodell, KI-Frameworks.“ und Infrastrukturverbesserungen“, schrieb Levie Es ist LinkedIn kürzlich.

Dies ist eine optimistische Sicht auf die Technologie, die davon ausgeht, dass in all diesen Bereichen Wachstum stattfinden wird, auch wenn dies nicht unbedingt selbstverständlich ist. Rodney Brooks, Pionier der MIT-Robotik, wies kürzlich in einem Interview mit TechCrunch darauf hin KI muss sich mit viel schwierigeren Problemen auseinandersetzen als die meisten Technologien, und es wird nicht unbedingt so schnell wachsen wie beispielsweise Chips nach dem Mooreschen Gesetz.

„Wenn ein Mensch sieht, dass ein KI-System eine Aufgabe ausführt, verallgemeinert er diese sofort auf ähnliche Dinge und schätzt die Kompetenz des KI-Systems ein; nicht nur die Leistung dabei, sondern auch die Kompetenz dazu“, sagte Brooks während des Interviews. „Und sie sind oft sehr zu optimistisch, weil sie ein Modell der Leistung einer Person bei einer Aufgabe verwenden.“

Das Problem besteht darin, dass es schwierig ist, systemübergreifend zu arbeiten, und dies wird durch die Tatsache erschwert, dass einige Legacy-Systeme keinen grundlegenden API-Zugriff haben. Während wir die von Levie angesprochenen ständigen Verbesserungen sehen, kann es schwieriger sein, Software auf mehrere Systeme zugreifen zu lassen und dabei gleichzeitig möglicherweise auftretende Probleme zu lösen, als viele denken.

Wenn das der Fall ist, könnten alle überschätzen, wozu KI-Agenten in der Lage sein sollten. David Cushman, Forschungsleiter bei HFS Research, sieht die aktuellen Bots eher wie Asana: Assistenten, die Menschen dabei helfen, bestimmte Aufgaben zu erledigen, um ein benutzerdefiniertes strategisches Ziel zu erreichen. Die Herausforderung besteht darin, einer Maschine zu helfen, Eventualitäten wirklich automatisiert zu bewältigen, und wir sind offensichtlich noch lange nicht annähernd so weit.

„Ich denke, das ist der nächste Schritt“, sagte er. „Hier agiert KI unabhängig und effektiv im großen Maßstab. Hier legen also Menschen die Richtlinien und Leitplanken fest und wenden zahlreiche Technologien an, um den Menschen aus dem Verkehr zu ziehen – wenn es doch nur darum geht, den Menschen zu behalten In den Zyklus mit GenAI“, sagte er. Der Schlüssel hier sei also, sagte er, dem KI-Agenten die Kontrolle zu überlassen und echte Automatisierung anzuwenden.

Jon Turow, Partner bei Madrona Ventures, sagt, dass dies die Schaffung einer KI-Agenten-Infrastruktur erfordert, eines Technologie-Stacks, der speziell für die Erstellung der Agenten (wie auch immer Sie sie definieren) entwickelt wurde. In einem aktuellen Blogbeitrag hat Turow beschrieben Beispiele für KI-Agenten derzeit in freier Wildbahn arbeiten und wie sie heute gebaut werden.

Nach Ansicht von Turow erfordert die zunehmende Verbreitung von KI-Agenten – und er gibt auch zu, dass die Definition noch etwas schwer fassbar ist – einen Technologie-Stack wie jede andere Technologie. „All dies bedeutet, dass unsere Branche noch viel zu tun hat, um eine Infrastruktur aufzubauen, die KI-Agenten und die von ihnen abhängigen Anwendungen unterstützt“, schrieb er in dem Artikel.

„Mit der Zeit wird sich das Denken allmählich verbessern, Grenzmodelle werden mehr Arbeitsabläufe vorantreiben und Entwickler werden sich auf Produkte und Daten konzentrieren wollen – die Dinge, die sie auszeichnen. Sie möchten, dass die zugrunde liegende Plattform einfach skalierbar, leistungsstark und zuverlässig funktioniert.“

Beachten Sie hier auch, dass Sie wahrscheinlich mehrere Modelle und nicht ein einziges LLM benötigen, damit die Agenten funktionieren. Dies ist sinnvoll, wenn Sie diese Agenten als eine Sammlung verschiedener Aufgaben betrachten. „Ich glaube zum jetzigen Zeitpunkt nicht, dass ein großes Sprachmodell, zumindest kein öffentlich verfügbares, monolithisches großes Sprachmodell, in der Lage ist, Agentenaufgaben zu bewältigen. Ich glaube nicht, dass sie immer noch in der Lage sind, die mehrstufigen Überlegungen anzustellen, die mich wirklich für einen zukünftigen Agenten begeistern würden. Ich denke, wir kommen näher, aber wir sind noch nicht am Ziel“, sagte Fred Havemeyer, Leiter der US-amerikanischen Software- und KI-Forschung bei Macquarie US Equity Research.

„Ich denke, die effektivsten Agenten werden wahrscheinlich mehrere Sammlungen verschiedener Modelle mit einer Routing-Schicht sein, die Anfragen oder Eingabeaufforderungen an den effektivsten Agenten und das effektivste Modell sendet. Und ich denke, es wäre wie ein interessanter (automatisierter) Vorgesetzter, der eine Art Funktion delegiert.“

Letztlich strebt die Branche nach Ansicht von Havemeyer das Ziel an, dass die Agenten unabhängig agieren. „Wenn ich über die Zukunft der Agenten nachdenke, möchte und hoffe ich, Agenten zu sehen, die wirklich autonom sind und in der Lage sind, abstrakte Ziele anzunehmen und dann alle einzelnen Schritte zwischen ihnen völlig unabhängig zu begründen“, sagte er. TechCrunch.

Tatsache ist jedoch, dass wir uns in Bezug auf diese Agenten immer noch in einer Übergangsphase befinden und nicht wissen, wann wir diesen von Havemeyer beschriebenen Endzustand erreichen werden. Während das, was wir bisher gesehen haben, eindeutig ein vielversprechender Schritt in die richtige Richtung ist, brauchen wir noch einige Durchbrüche und Durchbrüche, damit KI-Agenten so funktionieren können, wie man es sich heute vorstellt. Und es ist wichtig zu verstehen, dass wir noch nicht am Ziel sind.

Diese Geschichte wurde ursprünglich am 13. Juli 2024 veröffentlicht und wurde aktualisiert, um neue Agenten von Perplexity und Google einzubeziehen.

Quelle link

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein