أعلنت OpenAI عن إضافة ميزات جديدة للصوت ومعالجة الصور إلى ChatGPT، مما يتيح للمستخدمين التحدث إلى الشات بوت وتحميل الصور لتحليلها بواسطة الذكاء الاصطناعي. يُوسّع هذا التحديث الأداة لتتجاوز التفاعلات النصية، مضيفًا طبقة من السهولة قد تغير طريقة استخدام الناس للخدمة يوميًا.
ما تفعله الميزات الجديدة
بفضل ميزة الصوت، يمكن للمستخدمين الآن التحدث مباشرة إلى ChatGPT بدلاً من الكتابة. يتعرف النظام على الكلام الطبيعي ويستجيب بنبرة محادثة. أما بالنسبة لمعالجة الصور، فيمكن للأشخاص التقاط صورة أو تحميل واحدة من ألبوم الكاميرا، وسيصف الذكاء الاصطناعي ما يراه، أو يتعرف على الأشياء، أو يجيب عن أسئلة حول المحتوى. تقول الشركة إن كلتا الميزتين تعملان على إصدارات سطح المكتب والهواتف المحمولة من ChatGPT.
كيف يغير ذلك تجربة المستخدم
بالنسبة لشخص يطبخ العشاء ويحتاج إلى بديل سريع، فإن الإدخال الصوتي يعني أنه لا يحتاج للتوقف والكتابة. يمكن للمسافر أن يلتقط صورة للافتة شارع أجنبية ويطلب من الشات بوت ترجمتها أو شرحها. الجمع بين الصوت والرؤية يُقرّب ChatGPT من مساعد يعمل بدون استخدام اليدين ويفهم السياق من الكلمات المنطوقة والإشارات البصرية. سيتم طرح الميزات للمستخدمين خلال الأسابيع القليلة القادمة، رغم أن OpenAI لم تحدد تاريخًا دقيقًا للتوفّر الكامل.
أين تندمج هذه التقنية
تقدم شات بوتات ذكاء اصطناعي أخرى بالفعل الإدخال الصوتي أو التعرف على الصور، لكن دمج كلتيهما في منتج واحد واسع الاستخدام مثل ChatGPT يُعد خطوة ملحوظة. كانت OpenAI تضيف تدريجيًا قدرات متعددة الوسائط—في وقت سابق من هذا العام، قدمت القدرة على إنشاء الصور باستخدام DALL-E، والآن تجلب الإدراك في الاتجاه المعاكس. تقدم الشركة هذا التحديث كوسيلة لجعل الذكاء الاصطناعي أكثر بديهية، مما يسمح للأشخاص بالتواصل بالطريقة الطبيعية: بالتحدث والإظهار بدلاً من الكتابة فقط.
يبدأ الطرح مع مشتركي ChatGPT Plus أولاً، مع توقع توسعة لطبقة المستخدمين المجانيين لاحقًا. لم يُعطَ جدول زمني محدد لموعد حصول جميع المستخدمين على الوصول.



