Eulerpool News

OpenAI erweitert ChatGPT mit visuellem Advanced Voice Mode - Einführung mit Hindernissen

13. Dezember 2024, 07:34 Uhr · Quelle: Eulerpool News
OpenAI hat den Advanced Voice Mode von ChatGPT um eine visuelle Komponente erweitert, die es Abonnenten ermöglicht, Objekte in Echtzeit zu erfassen und zu analysieren. Allerdings steht das Feature nicht allen Nutzern sofort zur Verfügung, und es gibt Verzögerungen bei der Einführung in Europa.

OpenAI hat mit der neuesten Erweiterung von ChatGPT einen spannenden Meilenstein erreicht: Der Advanced Voice Mode, bekannt für seine menschenähnlichen Konversationsfähigkeiten, erhält nun eine visuelle Komponente. Abonnenten von ChatGPT Plus, Team oder Pro können jetzt mit der App Objekte mit ihrer Handykamera erfassen, worauf ChatGPT in nahezu Echtzeit reagiert.

Das Feature geht über die Erkennung von physischen Objekten hinaus und versteht auch das, was auf einem Display angezeigt wird, zum Beispiel kann es Menüeinstellungen erklären oder mathematische Probleme kommentieren. Um den Advanced Voice Mode mit Vision zu nutzen, genügt ein Klick auf das Mikrofonsymbol neben der Chat-Leiste und anschließend auf das Videosymbol links unten.

Zum Teilen des Bildschirms wird über das Drei-Punkte-Menü „Bildschirm teilen“ ausgewählt. Die globale Einführung des Advanced Voice Modes mit Vision startete am Donnerstag und soll innerhalb einer Woche abgeschlossen sein. Allerdings erhalten nicht alle Nutzer Zugang. Speziell ChatGPT Enterprise- und Edu-Kunden müssen sich bis Januar gedulden, und in der EU sowie in weiteren europäischen Ländern ist derzeit noch kein Zeitplan bekannt.

Vor Kurzem zeigte OpenAI-Präsident Greg Brockman in der Sendung "60 Minutes" von CNN eine eindrucksvolle Demo. Er testete Anderson Coopers Anatomiekenntnisse, während Cooper Körperteile an ein Whiteboard skizzierte. ChatGPT konnte erkennen, was gezeichnet wurde – nicht ohne jedoch bei einer Geometrieaufgabe einen Fehler zu machen, was auf mögliche Schwächen bei komplexeren Aufgaben hinweist.

Die Funktion wurde bereits mehrfach verschoben, da OpenAI die Ankündigung des visuellen Advanced Voice Modes zu einem Zeitpunkt machte, als die Entwicklung noch nicht abgeschlossen war. Versprechen für eine frühere Einführung konnten nicht eingehalten werden, wodurch die Erwartungshaltung der Nutzer überspannt wurde.

Während OpenAI vor der Einführung der visuellen Funktion stand, konzentrierte man sich darauf, den rein stimmlichen Advanced Voice Mode auf zusätzliche Plattformen und für Nutzer in der EU zu erweitern. Interessanterweise arbeiten auch Konkurrenten wie Google und Meta an ähnlichen Technologien. Google hat in dieser Woche sein eigenes Projekt für videoanalysierende, KI-gestützte Gespräche, Projekt Astra, für eine ausgewählte Gruppe von Android-Testern verfügbar gemacht.

AI
[Eulerpool News] · 13.12.2024 · 07:34 Uhr
[0 Kommentare]
Neues Krypto-Fintech will digitale Vermögen bankfähig machen
Ein misslungener Wohnungskauf wird zum Ausgangspunkt eines Fintechs Jean Meyer wollte lediglich eine Wohnung kaufen. Dass aus diesem Plan ein Start-up entstehen würde, ahnte er nicht. Rund 200.000 Euro hielt er damals in Kryptowährungen – legal erworben, regulär verwahrt, sauber dokumentiert. Doch sobald er die Summe von einer Kryptobörse zu seiner Bank transferieren wollte, begann ein […] (00)
vor 1 Stunde
Öl-Pipeline in Brandenburg defekt
Gramzow (dpa) - Nach dem Auslaufen großer Mengen Rohöl aus einem Leck an einer Pipeline im Nordosten Brandenburgs prüfen Feuerwehr, Behörden und die betroffene Raffinerie PCK das Ausmaß der Schäden. Brandenburgs Umweltministerin Hanka Mittelstädt (SPD) geht davon aus, dass zwischen 250.000 und 350.000 Liter ausgelaufen sein könnten, wie sie der Deutschen Presse-Agentur in Potsdam sagte. Laut PCK […] (00)
vor 2 Minuten
Jamie Lee Curtis
(BANG) - Jamie Lee Curtis wird über die Weihnachtszeit eine Pause von den sozialen Medien einlegen. Die 67-jährige Schauspielerin verriet, dass sie während der Festtage eine "lange" digitale Auszeit von Instagram und Co. nehmen wird. Jamie freut sich darauf, Zeit offline zu verbringen. Bei der Premiere ihres neuen Films 'Ella McCay' erklärte sie gegenüber 'E! News': "Ich werde gleich eine richtig […] (00)
vor 1 Stunde
Mike Ybarra prophezeit fulminantes Call of Duty-Comeback dank Battlefield-Druck
Während Call of Duty: Black Ops 7 kommerziell sicherlich kein Desaster darstellt, fehlt dem Titel jene kulturelle Durchschlagskraft, die seine Vorgänger über Monate hinweg im Gespräch hielt. Doch genau in dieser Phase der vermeintlichen Schwäche meldet sich eine prominente Stimme zu Wort, die Hoffnung verbreitet. Mike Ybarra, ehemaliger Führungskader bei Microsoft, sieht in der aktuellen Krise […] (00)
vor 8 Minuten
«PONIES»: Sky startet Emilia-Clarke-Serie
Der Pay-TV-Sender zeigt ab 16. Januar den neuen Kalter-Krieg-Thriller, in dem Emilia Clarke und Haley Lu Richardson als unerwartete CIA-Agentinnen eine Moskauer Verschwörung aufdecken. Sky und WOW starten am 16. Januar 2026 die neue Spionage-Thriller-Serie PONIES, eine achtteilige Peacock-Produktion, die wöchentlich in Doppelfolgen veröffentlicht und zusätzlich auf Sky Atlantic ausgestrahlt wird. Die Handlung führt ins Moskau des Jahres 1977, […] (00)
vor 1 Stunde
Media Day Team Red Bull-Bora-hansgrohe
Palma de Mallorca (dpa) - Die Sitzordnung in den Central Studios von Mallorca dürfte Remco Evenepoel vermutlich weniger gefallen haben. Nicht der belgische Superstar mit dem großen Ego und dem noch größeren Preisschild wurde in der Mitte des Podiums platziert, sondern Deutschlands Radsport-Hoffnung Florian Lipowitz bekam bei der ersten Zusammenkunft des Red-Bull-Rennstalls für 2026 diese Rolle […] (00)
vor 13 Minuten
Kostenloses Stock Foto zu 50 €, anlagestrategie, banknoten
Die US-Notenbank hat am 10. Dezember ihre dritte Zinssenkung in Folge um 25 Basispunkte beschlossen und damit den Lockerungskurs bestätigt, auf den die meisten Händler gewartet haben. Während die Entscheidung die Kryptomärkte kurzzeitig belebte, kippte die Stimmung rund um Ethereum (ETH) in den sozialen Medien innerhalb weniger Stunden von Euphorie zu Frustration, als die Preise stark einbrachen. […] (00)
vor 59 Minuten
Digitale Optimierung des innerbetrieblichen Transports mit der COSYS IBT Software
Zürich, 11.12.2025 (PresseBox) - Innerbetriebliche Transporte gehören in vielen Unternehmen zu den grundlegenden täglichen Abläufen. Materialien, Bauteile, Dokumente und Lademittel werden stetig zwischen Lager, Produktion, Versand- oder Verwaltungsabteilungen bewegt. Trotz dieser Bedeutung laufen viele dieser Prozesse weiterhin ohne digitale Unterstützung. Das führt zu Verzögerungen, fehlender […] (00)
vor 1 Stunde
 
US-Präsident Trump
Washington (dpa) - Für den Betrag von einer Million US-Dollar (rund 855.000 Euro) können sich […] (01)
iPhone 16 dominiert weltweiten Smartphone-Verkauf im dritten Quartal 2025
Nach dem neuen Analysebericht der Marktforschungsfirma Counterpoint Research übertraf das […] (00)
Bericht: iPhone Fold ist Game-Changer für Markt faltbarer Smartphones
Laut einem Analysebericht der Marktforschungsfirma IDC ist das iPhone Fold ein Game-Changer, der den […] (00)
Bäckerei (Archiv)
Berlin - Mehrere Branchen wollen die ab 1. Januar 2026 geplante Aktivrente offensiv einführen. […] (00)
«Doc Caro» fährt weiter Achterbahn
Am Vorabend war das Dinner für extrem saftige Quoten gut. Am 9. Oktober 2024 holte Carola Holzner mit […] (00)
Anno 117: Pax Romana – Umfangreiche Patches optimieren Kampagne und Ökonomie
Die Veröffentlichung des ersten großen Content- und Balance-Updates (Patch 1.3) für Anno 117: […] (00)
Compliance-Verdacht: EY soll interne Daten der Autobahn GmbH genutzt haben
Eine E-Mail mit Sprengkraft Was damals wie eine routinierte IT-Abfrage wirkte, entpuppt sich […] (00)
Dangbei – Feiert die Weihnachtszeit mit Angeboten auf Amazon
Dangbei, ein führender Innovator im Bereich smarter Projektionstechnologie, feiert die […] (00)
 
 
Suchbegriff