Loading market data...

OpenAI tilføjer tale- og billedfunktioner til ChatGPT

OpenAI tilføjer tale- og billedfunktioner til ChatGPT

OpenAI har introduceret nye tale- og billedbehandlingsfunktioner til ChatGPT, så brugere kan tale med chatboten og uploade billeder, som AI'en kan analysere. Opdateringen udvider værktøjet ud over tekstbaserede interaktioner og tilføjer et lag af bekvemmelighed, der kan ændre, hvordan folk bruger tjenesten dagligt.

Hvad de nye funktioner gør

Med talefunktionen kan brugere nu tale direkte til ChatGPT i stedet for at skrive. Systemet genkender naturlig tale og svarer i en samtaleagtig tone. Til billedbehandling kan folk tage et billede eller uploade et fra deres kamerarulle, og AI'en vil beskrive, hvad den ser, identificere objekter eller besvare spørgsmål om indholdet. Virksomheden siger, at begge funktioner fungerer på desktop- og mobilversionerne af ChatGPT.

Sådan ændrer det brugeroplevelsen

For en, der laver mad og har brug for en hurtig erstatning, betyder taleinput, at de ikke behøver at stoppe op og skrive. En rejsende kan tage et billede af et udenlandsk gadeskilt og bede chatboten om at oversætte eller forklare det. Kombinationen af tale og syn bringer ChatGPT tættere på en håndfri assistent, der forstår kontekst fra både talte ord og visuelle signaler. Funktionerne rulles ud til brugerne i løbet af de næste par uger, selvom OpenAI ikke har angivet en præcis dato for fuld tilgængelighed.

Hvor teknologien passer ind

Andre AI-chatbots tilbyder allerede taleinput eller billedgenkendelse, men at integrere begge i et enkelt, bredt anvendt produkt som ChatGPT er et bemærkelsesværdigt skridt. OpenAI har gradvist tilføjet multimodale evner – tidligere i år introducerede de muligheden for at generere billeder med DALL-E, og nu bringer de perception i den modsatte retning. Virksomheden præsenterer opdateringen som en måde at gøre AI mere intuitiv, så folk kan kommunikere, som de naturligt ville: ved at tale og vise frem for kun at skrive.

Udrulningen begynder først med ChatGPT's Plus-abonnenter, og en udvidelse til gratisniveauet forventes senere. Der er ikke angivet nogen præcis tidslinje for, hvornår alle brugere får adgang.