Loading market data...

Az OpenAI hang- és képfunkciókkal bővíti a ChatGPT-t

Az OpenAI hang- és képfunkciókkal bővíti a ChatGPT-t

Az OpenAI új hang- és képfeldolgozó funkciókat vezetett be a ChatGPT számára, lehetővé téve a felhasználók számára, hogy beszéljenek a chatbotbal, és képeket töltsenek fel az AI elemzéséhez. A frissítés a szöveges interakciókon túlra bővíti az eszközt, egy olyan kényelmi réteget adva hozzá, amely megváltoztathatja, hogyan használják az emberek a szolgáltatást a mindennapokban.

Mit tesznek az új funkciók

A hangfunkcióval a felhasználók mostantól közvetlenül beszélhetnek a ChatGPT-vel a gépelés helyett. A rendszer felismeri a természetes beszédet, és beszélgető hangnemben válaszol. A képfeldolgozás esetében az emberek lefotózhatnak vagy feltölthetnek egy képet a galériájukból, és az AI leírja, mit lát, azonosítja a tárgyakat, vagy válaszol a tartalommal kapcsolatos kérdésekre. A cég szerint mindkét funkció működik a ChatGPT asztali és mobil verzióján is.

Hogyan változtatja meg a felhasználói élményt

Valaki számára, aki vacsorát főz és gyors helyettesítő összetevőre van szüksége, a hangbemenet azt jelenti, hogy nem kell megállnia és gépelnie. Egy utazó lefotózhat egy idegen utcai táblát, és megkérheti a chatbotot, hogy fordítsa le vagy magyarázza el. A hang és a látás kombinációja közelebb viszi a ChatGPT-t egy kézmentes asszisztenshez, amely megérti a kontextust mind a kimondott szavakból, mind a vizuális jelekből. A funkciók a következő hetek során fokozatosan elérhetővé válnak a felhasználók számára, bár az OpenAI nem határozott meg pontos dátumot a teljes elérhetőségre.

Hová illeszkedik a technológia

Más AI chatbotok már kínálnak hangbemenetet vagy képfelismerést, de mindkettő integrálása egyetlen, széles körben használt termékbe, mint a ChatGPT, figyelemre méltó lépés. Az OpenAI fokozatosan adta hozzá a multimodális képességeket – korábban idén bevezette a képek generálásának lehetőségét a DALL-E segítségével, most pedig az érzékelést hozza a másik irányba. A cég a frissítést úgy állítja be, hogy az AI-t intuitívabbá tegye, lehetővé téve az emberek számára, hogy úgy kommunikáljanak, ahogy természetesen tennék: beszélve és mutatva, nem csak gépelve.

A bevezetés először a ChatGPT Plus előfizetőivel kezdődik, az ingyenes csomag bővítése később várható. Nem adtak meg pontos idővonalat arra, hogy mikor kap hozzáférést az összes felhasználó.