Loading market data...

OpenAI додає голосові можливості та аналіз зображень до ChatGPT

OpenAI додає голосові можливості та аналіз зображень до ChatGPT

OpenAI представила нові функції голосу та обробки зображень для ChatGPT, що дозволяють користувачам спілкуватися з чат-ботом голосом і завантажувати знімки для аналізу ШІ. Оновлення розширює інструмент за межі текстових взаємодій, додаючи зручність, яка може змінити те, як люди користуються сервісом щодня.

Що роблять нові функції

Завдяки голосовій можливості користувачі тепер можуть говорити безпосередньо з ChatGPT замість введення тексту. Система розпізнає природне мовлення та відповідає розмовним тоном. Для обробки зображень люди можуть зробити фото або завантажити його з галереї, і ШІ опише побачене, ідентифікує об'єкти або відповість на запитання про вміст. Компанія заявляє, що обидві функції працюють у настільній та мобільній версіях ChatGPT.

Як це змінює досвід користувача

Для того, хто готує вечерю й потребує швидкої заміни інгредієнта, голосове введення означає, що не потрібно зупинятися й друкувати. Мандрівник може сфотографувати іноземний дорожній знак і попросити чат-бота перекласти або пояснити його. Поєднання голосу та зору наближає ChatGPT до помічника без використання рук, який розуміє контекст як із вимовлених слів, так і з візуальних підказок. Функції поступово впроваджуються для користувачів протягом наступних кількох тижнів, хоча OpenAI не вказала точної дати повної доступності.

Місце технології в загальному контексті

Інші AI-чат-боти вже пропонують голосове введення або розпізнавання зображень, але інтеграція обох функцій в єдиний широко використовуваний продукт, як ChatGPT, є помітним кроком. OpenAI поступово додає мультимодальні можливості — раніше цього року вона представила здатність генерувати зображення за допомогою DALL-E, а тепер розширює сприйняття в іншому напрямку. Компанія позиціонує оновлення як спосіб зробити ШІ більш інтуїтивним, дозволяючи людям спілкуватися так, як вони звикли: говорити та показувати, а не лише друкувати.

Розгортання починається з передплатників ChatGPT Plus, а розширення на безкоштовний тариф очікується пізніше. Точний термін, коли всі користувачі отримають доступ, не вказано.