In meiner über 40-jährigen Tätigkeit im Technologiesektor habe ich noch nie einen so schnellen Fortschritt erlebt wie bei der generativen KI (GAI). Seit der Einführung von ChatGPT sind etwa zwei Jahre vergangen, und in dieser Zeit haben wir nicht nur neue Konkurrenten, sondern auch erhebliche Verbesserungen an GAI-Systemen gesehen.
Schon in seiner Anfangsphase war ChatGPT bemerkenswert leistungsfähig. Er konnte Fragen zu praktisch jedem Thema beantworten und mit Aufsätzen, Artikeln, Gedichten, Musik, Bildern und sogar Computercodes helfen. Durch eine Reihe zusätzlicher Verbesserungen sind diese Systeme nun noch leistungsfähiger geworden.
Bleiben Sie auf dem Laufenden
Bis vor etwa einem Jahr wusste ChatGPT beispielsweise nichts von den Entwicklungen nach September 2021. Jetzt ist es immer noch auf dem neuesten Stand. Als ich fragte: „Welche wichtigen Dinge sind heute in den Nachrichten passiert?“ hat ein zeitnahes Update zu wichtigen Neuigkeiten bereitgestellt.
Zu den weiteren Verbesserungen von ChatGPT gehört die Möglichkeit, Dateien hochzuladen. Sie können beispielsweise ein Dokument hochladen und ihn bitten, es für Sie umzuschreiben oder zusammenzufassen. ChatGPT hat kürzlich die Möglichkeit hinzugefügt, Dokumente von Google Drive hochzuladen, darunter auch Dokumente. Im März 2023 wurde GPT-4 eingeführt, das über fortschrittliches Denken und Kreativität verfügt.
Zusammenführung von Suche und GAI mit in Telefonen und PCs integrierter KI
Durch die kürzlich erfolgte Integration der Suchfunktion für zahlende Abonnenten (20 $/Monat) kommt ChatGPT näher an die Fähigkeiten von Google heran. Mittlerweile hat Google seine Gemini-GAI-Modelle in die Suche integriert und bietet neben den herkömmlichen Ergebnissen auch eine Zusammenfassung der Suchthemen. Als ich Google bat, „Apple Watches und Pixel Watches zu vergleichen“, bot es einen prägnanten 200-Wörter-Vergleich mit Links zu Rezensionen und anderen Webinhalten.
Viele der Dienste von GAI umfassen mittlerweile eine Zwei-Wege-Sprachfunktion. Sie können Fragen per Stimme stellen und sie können mit einer computergenerierten Stimme antworten, die jetzt wie ein echter Mensch klingt. Sowohl Apple als auch Google beginnen damit, generative KI in ihre Smartphone-Betriebssysteme zu integrieren. Google setzt bei seinen neuen Pixel 9-Telefonen voll auf KI. Durch Drücken der Taste zum Aktivieren von Google Assistant können Sie Fragen mit Ihrer Stimme stellen und die Antwort hören. Sie können auch ein Gespräch beginnen. Ich fragte mein Pixel 9 „Wer ist Dustin Hoffman?“ und während er mir von ihm erzählte, drückte ich die Mikrofontaste und unterbrach ihn mit der Frage „Wann wurde er geboren“, gefolgt von „Mit wem ist er verheiratet?“ und die natürliche Stimme antwortete meine Fragen? Fragen.
Microsoft hat sein Copilot-GAI-System in Windows 11 integriert. Apple integriert das, was es „Apple Intelligence“ nennt, in iPhone, iPad und Mac. Mit anderen Worten: Siri wird viel intelligenter.
Die Quelle kennen und Fehler machen
Eines der Dinge, die mich bei manchen GAI-Systemen frustrieren, ist, dass ich nicht weiß, woher die Informationen kommen. Diese Systeme haben Zugriff auf das gesamte öffentliche Internet. Wenn Sie die Quelle der Informationen nicht kennen, können Sie ihr nicht wirklich vertrauen. Kürzlich habe ich mir den Finger verbrannt, und neben einigen hervorragenden Ratschlägen stand dort auch: „Nehmen Sie bei Bedarf ein rezeptfreies Schmerzmittel wie Ibuprofen oder Paracetamol ein, um die Schmerzen zu lindern und Schwellungen zu reduzieren.“ Ich wusste zufällig, dass Paracetamol (wie Tylenol) Schwellungen nicht reduziert, also fragte ich: „Sind Sie sicher, dass Paracetamol Schwellungen reduziert?“ und gestand: „Sie haben Recht, es noch einmal zu überprüfen! Paracetamol lindert Schwellungen nicht.“
Übrigens, wenn Sie diese Suche versuchen, erhalten Sie möglicherweise eine andere Antwort. ChatGPT und andere GAI-Systeme lernen und überarbeiten ständig Ihre Antworten. Selbst wenn sie nichts Neues gelernt haben, erhalten Sie möglicherweise eine andere Antwort, da jede Antwort sofort generiert wird.
Perplexity.AI ist ein GAI-System, das Links zu Quellen bereitstellt. Ich habe die gleiche Frage zu meiner Verbrennung gestellt und sie hat auch fälschlicherweise gesagt, dass Paracetamol „bei Schmerzen und Entzündungen helfen würde“. Als ich auf den Link klickte, wurde ich zu einer Seite des britischen National Health Service weitergeleitet, die genaue Informationen enthielt.
Google und Meta sind alle dabei
Google hat sein Bard-GAI-System im März 2023 auf den Markt gebracht. Offensichtlich arbeitete Google an GAI, aber erst die Popularität von ChatGPT brachte dem Unternehmen einen großen Aufschwung. Im Februar 2024 wurde Bard zum Zwilling, was sich im vergangenen Jahr deutlich weiterentwickelt hat. Im Google One-Abonnement ist jetzt ein Gemini Advanced enthalten, das außerdem 2 Terabyte Speicherplatz und weitere Vorteile bietet. Während es von Gemini noch eine kostenlose Version gibt, verfügt die erweiterte Version über ein leistungsfähigeres KI-Modell und zusätzliche Funktionen. Obwohl die kostenlose Vorlage beispielsweise zeichnen kann, kann derzeit nur die erweiterte Version Personen zeichnen, aber keine der Versionen zeichnet fotorealistische Bilder von identifizierbaren Personen, Kindern oder anderen Bildern, die gegen ihre Richtlinien verstoßen.
Meta, dem Facebook und Instagram gehören, ist ebenfalls ein wichtiger Akteur im Bereich der generativen KI. Es verfügt über eine eigene unabhängige Meta.AI-Website, die ähnlich wie ChatGPT und Gemini funktioniert, KI aber auch in seine anderen Produkte integriert. Meta AI Assistant ist jetzt auf WhatsApp, Messenger, Instagram und Ray-Ban Meta-Datenbrillen verfügbar.
Besonders interessant ist die Integration von Meta AI in seine Datenbrillen. Ich habe ein Paar und habe die KI-Funktion verwendet, um Schilder und Speisekarten auf Auslandsreisen zu übersetzen und Sehenswürdigkeiten zu identifizieren. Sie können auch Fragen stellen wie „Wie hoch ist der Eiffelturm“, „Wo steht er“ und „Welche Fluggesellschaften fliegen von San Francisco nach Paris“. Aber man kann auch Fehler machen. Ich habe gefragt, „welche Fluggesellschaften nonstop von San Jose, Kalifornien, nach Los Angeles fliegen“, und dazu gehörte auch Air France, die diese Route offensichtlich nicht anbietet. Ich teilte ihr mit, dass Air France diese Strecke nicht fliegt, und sie entschuldigte sich. Als ich das nächste Mal nachfragte, war Air France nicht dabei. Fairerweise muss man sagen, dass es sich möglicherweise um den Codeshare-Partner von Air France, Delta, handelt, der diese Strecke fliegt.
Beeindruckend, aber nicht narrensicher
Alle diese GAI-Systeme haben sich so weit entwickelt, dass ich sie mittlerweile als sehr gut bezeichnen kann. Aber gut zu sein hat seine Gefahren. Da sie meistens Recht haben, ist es verlockend, ihnen zu vertrauen. Wie ich bereits erwähnt habe, können sie Fehler machen, daher kann es problematisch und potenziell gefährlich sein, ihnen zu vertrauen. Abgesehen davon, dass ich keine wichtigen Entscheidungen auf der Grundlage Ihrer Informationen treffe, würde ich vorsichtig sein, bevor ich sie als einzige Quelle in Artikeln, Aufsätzen oder sogar Social-Media-Beiträgen verwende. Sie sind ein nützliches Rechercheinstrument, aber bevor Sie sich darauf verlassen, überprüfen Sie die Informationen unbedingt bei einer vertrauenswürdigen Quelle und geben Sie diese Quelle an, wenn Sie anderen Bericht erstatten.
Larry Magid ist CEO von ConnectSafely, einer gemeinnützigen Internetsicherheitsorganisation, die finanzielle Unterstützung von einigen der in diesem Artikel genannten Unternehmen erhält. Kontaktieren Sie ihn unter larry@larrymagid.com.