Loading market data...

OpenAI voegt spraak- en beeldmogelijkheden toe aan ChatGPT

OpenAI voegt spraak- en beeldmogelijkheden toe aan ChatGPT

OpenAI heeft nieuwe spraak- en beeldverwerkingsfuncties geïntroduceerd voor ChatGPT, waarmee gebruikers met de chatbot kunnen praten en foto's kunnen uploaden die de AI kan analyseren. De update breidt de tool uit van tekstgebaseerde interacties en voegt een extra laag gemak toe die kan veranderen hoe mensen de dienst dagelijks gebruiken.

Wat de nieuwe functies doen

Met de spraakfunctionaliteit kunnen gebruikers nu rechtstreeks met ChatGPT praten in plaats van te typen. Het systeem herkent natuurlijke spraak en antwoordt in een conversatietoon. Voor beeldverwerking kunnen mensen een foto maken of er een uploaden uit hun camerarol, waarna de AI beschrijft wat het ziet, objecten identificeert of vragen over de inhoud beantwoordt. Het bedrijf zegt dat beide functies werken op de desktop- en mobiele versies van ChatGPT.

Hoe het de gebruikerservaring verandert

Voor iemand die het avondeten kookt en een snelle vervanging nodig heeft, betekent spraakinvoer dat ze niet hoeven te stoppen om te typen. Een reiziger kan een foto maken van een buitenlands straatbord en de chatbot vragen het te vertalen of uit te leggen. De combinatie van spraak en zicht brengt ChatGPT dichter bij een handsfree assistent die context begrijpt uit zowel gesproken woorden als visuele aanwijzingen. De functies worden de komende weken uitgerold naar gebruikers, hoewel OpenAI geen exacte datum voor volledige beschikbaarheid heeft genoemd.

Waar de technologie past

Andere AI-chatbots bieden al spraakinvoer of beeldherkenning, maar het integreren van beide in een enkel, veelgebruikt product zoals ChatGPT is een opmerkelijke stap. OpenAI heeft geleidelijk multimodale mogelijkheden toegevoegd – eerder dit jaar introduceerde het de mogelijkheid om afbeeldingen te genereren met DALL-E, en nu brengt het perceptie in de andere richting. Het bedrijf presenteert de update als een manier om AI intuïtiever te maken, zodat mensen kunnen communiceren zoals ze van nature doen: door te spreken en te laten zien in plaats van alleen te typen.

De uitrol begint eerst bij ChatGPT's Plus-abonnees, met een uitbreiding naar de gratis laag die later wordt verwacht. Er is geen exacte tijdlijn gegeven voor wanneer alle gebruikers toegang krijgen.