Start IT/Tech OpenAI bringt Video in den erweiterten Sprachmodus von ChatGPT

OpenAI bringt Video in den erweiterten Sprachmodus von ChatGPT

59
0
OpenAI bringt Video in den erweiterten Sprachmodus von ChatGPT

Der erweiterte Sprachmodus von ChatGPT verfügt jetzt über Video- und Bildschirmfreigabefunktionen.

Die Funktion wurde letzten Mai veröffentlicht GPT-4oaber nur die Audiomodalität war live. Jetzt ermöglicht ChatGPT den Benutzern, mit einer Telefonkamera zu chatten, und das Model „sieht“, was Sie sehen.

Im Livestream demonstrierten CPO Kevin Weil und andere OpenAI-Teammitglieder, wie ChatGPT beim Zubereiten von Kaffee zum Übergießen hilft. Durch die Ausrichtung der Kamera auf das Geschehen zeigte AVM, dass sie das Prinzip der Kaffeemaschine verstanden und das Team beim Zubereiten ihres Getränks angeleitet haben. Das Team zeigte auch, wie ChatGPT die Bildschirmfreigabe unterstützt, indem es eine offene Nachricht auf einem Telefon versteht, während Weil einen Weihnachtsbart trägt.

Zerstörbare Lichtgeschwindigkeit

Die lang erwartete Ankündigung kommt einen Tag nach Google enthüllt die nächste Generation seines Flaggschiffmodells Gemini 2.0. Der neue Gemini 2.0 kann auch visuelle und akustische Eingaben verarbeiten und verfügt über mehr Agentenfähigkeiten, was bedeutet, dass er im Namen des Benutzers mehrstufige Aufgaben ausführen kann. Die Agentenfunktionen von Gemini 2.0 existieren derzeit als Forschungsprototyp unter drei verschiedenen Namen: Project Astra für einen universellen KI-Assistenten, Project Mariner für spezifische KI-Aufgaben und Project Jules für Entwickler.

Um nicht zu übertreffen, zeigte die Demo von OpenAI, wie die Vision-Modalität von ChatGPT Objekte genau identifizierte – und sogar unterbrechbar war. Und ja, dazu gehörte auch eine Weihnachtsmann-Stimmenoption im Sprachmodus, komplett mit einer tiefen, fröhlichen Stimme und vielen „Ho-ho-hos“. Sie können mit der OpenAI-Version des Weihnachtsmanns chatten, indem Sie in ChatGPT auf das Schneeflockensymbol tippen. Es gibt noch kein Wort darüber, ob der echte Weihnachtsmann seine Stimme für das KI-Training beigesteuert hat oder ob OpenAI seine Stimme verwendet hat ohne vorherige Genehmigung.

Seltsamerweise wird der Benutzer bei der Auswahl der Stimme des Weihnachtsmanns in der ChatGPT-App gewarnt, dass die Stimme nur für Personen ab 13 Jahren gedacht ist.

Ab heute ist die Video- und Bildschirmfreigabe für ChatGPT Plus- und Pro-Benutzer verfügbar, während Enterprise und Edu ab Januar verfügbar sein werden.



Quelle link