Loading market data...

OpenAI legger til tale- og bildefunksjoner i ChatGPT

OpenAI legger til tale- og bildefunksjoner i ChatGPT

OpenAI har introdusert nye tale- og bildebehandlingsfunksjoner for ChatGPT, slik at brukere kan snakke med chatboten og laste opp bilder som AI-en kan analysere. Oppdateringen utvider verktøyet utover tekstbaserte interaksjoner og legger til et lag med bekvemmelighet som kan endre hvordan folk bruker tjenesten daglig.

Hva de nye funksjonene gjør

Med talefunksjonen kan brukere nå snakke direkte til ChatGPT i stedet for å skrive. Systemet gjenkjenner naturlig tale og svarer i en samtalevennlig tone. Når det gjelder bildebehandling, kan folk ta et bilde eller laste opp ett fra kamerarullen, og AI-en vil beskrive hva den ser, identifisere objekter eller svare på spørsmål om innholdet. Selskapet sier at begge funksjonene fungerer på skrivebords- og mobilversjonene av ChatGPT.

Hvordan det endrer brukeropplevelsen

For noen som lager middag og trenger en rask erstatning, betyr taleinndata at de ikke trenger å stoppe og skrive. En reisende kan ta et bilde av et utenlandsk gateskilt og be chatboten om å oversette eller forklare det. Kombinasjonen av tale og syn bringer ChatGPT nærmere en håndfri assistent som forstår kontekst fra både talte ord og visuelle ledetråder. Funksjonene rulles ut til brukere i løpet av de neste ukene, men OpenAI har ikke spesifisert en nøyaktig dato for full tilgjengelighet.

Hvor teknologien passer inn

Andre AI-chatboter tilbyr allerede taleinndata eller bildegjenkjenning, men å integrere begge i ett enkelt, mye brukt produkt som ChatGPT er et bemerkelsesverdig steg. OpenAI har gradvis lagt til multimodale evner – tidligere i år introduserte de muligheten til å generere bilder med DALL-E, og nå bringer de persepsjon i den andre retningen. Selskapet rammer inn oppdateringen som en måte å gjøre AI mer intuitiv på, slik at folk kan kommunisere slik de naturlig ville gjort: ved å snakke og vise i stedet for bare å skrive.

Utrullingen begynner med ChatGPTs Plus-abonnenter først, med en gratisnivå-utvidelse forventet senere. Ingen nøyaktig tidslinje er gitt for når alle brukere får tilgang.