OpenAI bringt Video in den erweiterten Sprachmodus von ChatGPT

Von

12 Dezember 2024

Der erweiterte Sprachmodus von ChatGPT verfügt jetzt über Video- und Bildschirmfreigabefunktionen.

Die Funktion wurde letzten Mai veröffentlicht GPT-4oaber nur die Audiomodalität war live. Jetzt ermöglicht ChatGPT den Benutzern, mit einer Telefonkamera zu chatten, und das Model „sieht“, was Sie sehen.

SIEHE AUCH:

Sora von OpenAI ist offiziell da

Im Livestream demonstrierten CPO Kevin Weil und andere OpenAI-Teammitglieder, wie ChatGPT beim Zubereiten von Kaffee zum Übergießen hilft. Durch die Ausrichtung der Kamera auf das Geschehen zeigte AVM, dass sie das Prinzip der Kaffeemaschine verstanden und das Team beim Zubereiten ihres Getränks angeleitet haben. Das Team zeigte auch, wie ChatGPT die Bildschirmfreigabe unterstützt, indem es eine offene Nachricht auf einem Telefon versteht, während Weil einen Weihnachtsbart trägt.

Zerstörbare Lichtgeschwindigkeit

Die lang erwartete Ankündigung kommt einen Tag nach Google enthüllt die nächste Generation seines Flaggschiffmodells Gemini 2.0. Der neue Gemini 2.0 kann auch visuelle und akustische Eingaben verarbeiten und verfügt über mehr Agentenfähigkeiten, was bedeutet, dass er im Namen des Benutzers mehrstufige Aufgaben ausführen kann. Die Agentenfunktionen von Gemini 2.0 existieren derzeit als Forschungsprototyp unter drei verschiedenen Namen: Project Astra für einen universellen KI-Assistenten, Project Mariner für spezifische KI-Aufgaben und Project Jules für Entwickler.

Um nicht zu übertreffen, zeigte die Demo von OpenAI, wie die Vision-Modalität von ChatGPT Objekte genau identifizierte – und sogar unterbrechbar war. Und ja, dazu gehörte auch eine Weihnachtsmann-Stimmenoption im Sprachmodus, komplett mit einer tiefen, fröhlichen Stimme und vielen „Ho-ho-hos“. Sie können mit der OpenAI-Version des Weihnachtsmanns chatten, indem Sie in ChatGPT auf das Schneeflockensymbol tippen. Es gibt noch kein Wort darüber, ob der echte Weihnachtsmann seine Stimme für das KI-Training beigesteuert hat oder ob OpenAI seine Stimme verwendet hat ohne vorherige Genehmigung.

Seltsamerweise wird der Benutzer bei der Auswahl der Stimme des Weihnachtsmanns in der ChatGPT-App gewarnt, dass die Stimme nur für Personen ab 13 Jahren gedacht ist.

Der Tweet wurde möglicherweise gelöscht

Ab heute ist die Video- und Bildschirmfreigabe für ChatGPT Plus- und Pro-Benutzer verfügbar, während Enterprise und Edu ab Januar verfügbar sein werden.

Quelle link

Verwandte ArtikelMehr vom Autor

Mit der neuesten Funktion von ChatGPT kann der Benutzer Merkmale wie „gesprächig“ und „Gen Z“ zuweisen.

American Primeval-Rezension: Kann die schmutzige Western-Miniserie von Netflix am besten Yellowstone sein?

Autonome Fahrzeuge erleben einen Moment und andere Vibes von der CES 2025

Kategorie

Verwandte Artikel Mehr vom Autor