OpenAI a introdus noi funcționalități de procesare a vocii și imaginilor pentru ChatGPT, permițând utilizatorilor să vorbească cu chatbotul și să încarce poze pe care AI-ul să le analizeze. Actualizarea extinde instrumentul dincolo de interacțiunile bazate pe text, adăugând un nivel de confort care ar putea schimba modul în care oamenii folosesc serviciul zi de zi.
Ce fac noile funcționalități
Cu funcția de voce, utilizatorii pot vorbi acum direct cu ChatGPT în loc să tasteze. Sistemul recunoaște limbajul natural și răspunde într-un ton conversațional. Pentru procesarea imaginilor, oamenii pot face o fotografie sau pot încărca una din galeria lor, iar AI-ul va descrie ce vede, va identifica obiecte sau va răspunde la întrebări despre conținut. Compania spune că ambele funcționalități funcționează pe versiunile desktop și mobile ale ChatGPT.
Cum schimbă experiența utilizatorului
Pentru cineva care gătește cina și are nevoie rapid de un înlocuitor, introducerea vocală înseamnă că nu trebuie să se oprească pentru a tasta. Un călător ar putea face o poză unui indicator stradal străin și să ceară chatbotului să îl traducă sau să îl explice. Combinația dintre voce și viziune aduce ChatGPT mai aproape de un asistent hands-free care înțelege contextul atât din cuvinte rostite, cât și din indicii vizuale. Funcționalitățile sunt lansate treptat utilizatorilor în următoarele săptămâni, deși OpenAI nu a specificat o dată exactă pentru disponibilitatea completă.
Unde se încadrează tehnologia
Alte chatboturi AI oferă deja introducere vocală sau recunoaștere a imaginilor, dar integrarea ambelor într-un singur produs larg utilizat, cum este ChatGPT, reprezintă un pas notabil. OpenAI a adăugat treptat capacități multimodale – mai devreme anul acesta a introdus capacitatea de a genera imagini cu DALL-E, iar acum aduce percepția în direcția opusă. Compania prezintă actualizarea ca pe o modalitate de a face AI-ul mai intuitiv, permițând oamenilor să comunice așa cum ar face-o în mod natural: vorbind și arătând, nu doar tastând.
Lansarea începe mai întâi cu abonații Plus ai ChatGPT, iar extinderea la nivelul gratuit este așteptată ulterior. Nu a fost dat un termen exact pentru momentul în care toți utilizatorii vor avea acces.



