Nach Ansicht einiger Scharfschützen könnten die lang erwarteten Sehfähigkeiten von ChatGPT bald verfügbar sein.
Android-Autorität Ich habe einige Codezeilen in Advanced gefunden Sprachmodus Teil der neuesten Beta-Version von ChatGPT v1.2024.317, die sich auf etwas namens „Live-Kamera“ bezieht. Der Code scheint eine Warnung an Benutzer zu sein, die Live-Kamera nicht „für Live-Navigation oder Entscheidungen zu verwenden, die sich auf Ihre Gesundheit oder Sicherheit auswirken könnten“.
Eine weitere Zeile im Code scheint Anzeigefunktionen anzuweisen und besagt: „Tippen Sie auf das Kamerasymbol, damit ChatGPT Ihre Umgebung sehen und darüber sprechen kann.“
Zerstörbare Lichtgeschwindigkeit
Die sich weiterentwickelnden Funktionen von ChatGPT: Vision, Stimme und mehr
Die Fähigkeit von ChatGPT, Informationen visuell zu verarbeiten, war eine Schlüsselfunktion, die auf der debütierte OpenAI-Veranstaltung letzten Mai gestartet GPT-4o. Demos der Veranstaltung zeigten, wie GPT-4o eine mobile oder Desktop-Kamera verwenden kann, um Motive zu identifizieren und sich Details des Filmmaterials zu merken. In einer bestimmten Demo wurde GPT-4o gezeigt, wie er einen Hund identifizierte, der mit einem Tennisball spielte, und sich daran erinnerte, dass sein Name „Bowser“ war.
Seit dem OpenAI-Event und dem anschließenden frühen Zugang einiger glücklicher Alpha-Tester wurde nicht mehr viel über GPT-4o mit Vision gesagt. Inzwischen wurde OpenAI ausgeliefert Erweiterter Abstimmungsmodus für ChatGPT Plus- und Team-Benutzer im September.
Wenn der Vision-Modus von ChatGPT unmittelbar bevorsteht, wie der Code vermuten lässt, können Benutzer bald beide Komponenten der neuen GPT-4o-Funktionen testen, die im letzten Frühjahr angeteasert wurden.
Der Tweet wurde möglicherweise gelöscht
OpenAI war in letzter Zeit trotz Berichten beschäftigt sinkende Erträge mit zukünftigen Modellen. Es wurde letzten Monat gestartet ChatGPT-Suchedas das KI-Modell mit dem Internet verbindet und Echtzeitinformationen bereitstellt. Es ist Gerüchte an einer Art Agent zu arbeiten, der im Namen des Benutzers mehrstufige Aufgaben ausführen kann, wie etwa das Schreiben von Code und das Surfen im Internet, möglicherweise für eine Veröffentlichung im Januar geplant.