Multimedia

ChatGPT kann jetzt mit dir sprechen und dich hören

Der Chatbot von OpenAI wird um drei virtuelle Sinne ergänzt: Er kann jetzt sehen, hören und sprechen. Die KI erkennt neu Bilder und Sprachnachrichten.

20 Minuten
ChatGPT erhält das bisher größte Update seit langem. Nun kann der Chatbot von OpenAI Bilder sehen und interpretieren.
ChatGPT erhält das bisher größte Update seit langem. Nun kann der Chatbot von OpenAI Bilder sehen und interpretieren.
REUTERS

ChatGPT wird noch intelligenter und erhält ein großes Upgrade. Er wird virtuell um mehrere Sinne erweitert – so kann der Chatbot jetzt sehen, hören und sprechen. Das Update umfasst die von Nutzern seit langem geforderte Erkennung von Bildern und das Erkennen von Spracheingaben. Das Update wird in den nächsten Tagen für die App-Versionen auf Android und iOS verfügbar sein, die Bilderkennung wird auch in der Webversion erhältlich sein.

ChatGPT erkennt jetzt Bilder

Ob für iOS, Android oder die Web-Versionen, ChatGPT wird bei den kostenpflichtigen Versionen mit einem Plus-Zeichen ergänzt, mit dem ein oder mehrere Bilder hochgeladen werden können. "Behebe Probleme mit deinem Grill, erkunde den Inhalt deines Kühlschranks für Rezept-Ideen oder analysiere komplexe Grafiken", gibt OpenAI als Beispiele in der Mitteilung an. Mit dem Zeichenwerkzeug auf Mobile können bestimmte Stellen markiert werden, auf die sich der Chatbot fokussieren soll.

1/8
Gehe zur Galerie
    Mach ein Foto und ChatGPT sagt dir alles darüber, was du siehst. Das neue Update von OpenAI bietet mehrere neue Funktionen für den KI-Chatbot.
    Mach ein Foto und ChatGPT sagt dir alles darüber, was du siehst. Das neue Update von OpenAI bietet mehrere neue Funktionen für den KI-Chatbot.
    OpenAI

    ChatGPT hört und spricht Sprachnachrichten

    Wer keine Lust hat, komplexe oder längere Sachverhalte in mehreren Zeilen abzutippen, kann das Anliegen nun laut aufsagen und der Chatbot gibt mündlich Antwort. "Sprich mit ChatGPT während du unterwegs bist, frage nach einer Gutenachtgeschichte für die Kinder oder kläre eine Debatte am abendlichen Esstisch", so OpenAI. Diese Funktion wird es zunächst nur für die Mobile-Version geben. Sie muss in den Einstellungen aktiviert werden. Danach kann mittels eines Kopfhörer-Buttons zwischen fünf Stimmen gewählt werden. Ob und wann es die Sprach-Funktion auf Deutsch gibt, ist noch nicht bekannt.

    Das sind die Einschränkungen

    Damit die neuen Funktionen der KI nicht für unlautere Zwecke ausgenutzt werden, hat OpenAI einige Einschränkungen eingebaut. So spricht der Voice Chat nur mit vom Unternehmen abgesegnete Stimmen von echten Synchronsprechern. Die Bildfunktion wird außerdem keine direkten Aussagen und Analysen zu Menschen machen, um die Privatsphäre zu schützen. Das beinhaltet etwa Gesichtserkennung oder Aussagen zum Gesundheitszustand der Person.

    Sprachnachrichten und Bilder werden in den nächsten zwei Wochen für zahlende Nutzer mit Plus- oder Enterprise-Abo veröffentlicht. Ein Abo kostet in Österreich rund 20 Euro im Monat. Für Gratis-Nutzer kommt das Upgrade erst später.