OpenAI přidává hlasové a obrazové funkce do ChatGPT

Co nové funkce umožňují

Díky hlasové funkci mohou uživatelé nyní mluvit přímo s ChatGPT místo psaní. Systém rozpoznává přirozenou řeč a odpovídá konverzačním tónem. Pro zpracování obrazu mohou lidé vyfotit nebo nahrát fotografii ze svého alba a AI popíše, co vidí, identifikuje objekty nebo odpoví na otázky ohledně obsahu. Společnost uvádí, že obě funkce fungují na desktopové i mobilní verzi ChatGPT.

Jak to mění uživatelský zážitek

Pro někoho, kdo vaří večeři a potřebuje rychlou náhradu, znamená hlasový vstup, že nemusí zastavit a psát. Cestovatel by mohl vyfotit cizí pouliční ceduli a požádat chatbot o překlad nebo vysvětlení. Kombinace hlasu a vidění posouvá ChatGPT blíže k hands-free asistentovi, který rozumí kontextu z mluvených slov i vizuálních podnětů. Funkce se uživatelům zpřístupňují v průběhu několika příštích týdnů, OpenAI však neuvedla přesné datum plné dostupnosti.

Kam tato technologie zapadá

Jiní AI chatboti již nabízejí hlasový vstup nebo rozpoznávání obrazu, ale integrovat obojí do jediného, široce používaného produktu jako ChatGPT je výrazným krokem. OpenAI postupně přidává multimodální schopnosti – dříve v tomto roce představila možnost generovat obrázky pomocí DALL-E a nyní přináší vnímání opačným směrem. Společnost rámuje aktualizaci jako způsob, jak učinit AI intuitivnější a umožnit lidem komunikovat přirozeně: mluvením a ukazováním, nejen psaním.

Zavádění začíná nejprve u předplatitelů ChatGPT Plus, později se očekává rozšíření na bezplatnou úroveň. Nebyl uveden přesný časový harmonogram, kdy všichni uživatelé získají přístup.

Co nové funkce umožňují

Jak to mění uživatelský zážitek

Kam tato technologie zapadá

Related Articles