OpenAI ने ChatGPT के लिए नई वॉयस और इमेज प्रोसेसिंग सुविधाएं पेश की हैं, जिससे उपयोगकर्ता चैटबॉट से बात कर सकते हैं और एआई द्वारा विश्लेषण के लिए तस्वीरें अपलोड कर सकते हैं। यह अपडेट टूल को टेक्स्ट-आधारित इंटरैक्शन से आगे ले जाता है, जिसमें सुविधा की एक नई परत जुड़ती है जो लोगों के दैनिक उपयोग के तरीके को बदल सकती है।
नई सुविधाएं क्या करती हैं
वॉयस क्षमता के साथ, उपयोगकर्ता अब टाइप करने के बजाय सीधे ChatGPT से बात कर सकते हैं। सिस्टम प्राकृतिक भाषण को पहचानता है और बातचीत के लहजे में जवाब देता है। इमेज प्रोसेसिंग के लिए, लोग एक फोटो खींच सकते हैं या अपने कैमरा रोल से अपलोड कर सकते हैं, और एआई यह बताएगा कि वह क्या देखता है, वस्तुओं की पहचान करेगा, या सामग्री के बारे में सवालों का जवाब देगा। कंपनी का कहना है कि दोनों सुविधाएं ChatGPT के डेस्कटॉप और मोबाइल संस्करणों पर काम करती हैं।
यह उपयोगकर्ता अनुभव को कैसे बदलता है
रात का खाना पकाने वाले किसी व्यक्ति के लिए जिसे तुरंत किसी सामग्री का विकल्प चाहिए, वॉयस इनपुट का मतलब है कि उन्हें रुककर टाइप नहीं करना पड़ेगा। कोई यात्री किसी विदेशी सड़क के संकेत की तस्वीर ले सकता है और चैटबॉट से इसका अनुवाद या व्याख्या करने के लिए कह सकता है। वॉयस और विज़न का संयोजन ChatGPT को एक हैंड्स-फ्री असिस्टेंट के करीब ले जाता है जो बोले गए शब्दों और दृश्य संकेतों दोनों से संदर्भ समझता है। ये सुविधाएं अगले कुछ हफ्तों में उपयोगकर्ताओं के लिए उपलब्ध हो रही हैं, हालांकि OpenAI ने पूर्ण उपलब्धता के लिए कोई सटीक तारीख नहीं बताई है।
यह तकनीक कहां फिट बैठती है
अन्य AI चैटबॉट पहले से ही वॉयस इनपुट या इमेज रिकॉग्निशन प्रदान करते हैं, लेकिन दोनों को ChatGPT जैसे एकल, व्यापक रूप से उपयोग किए जाने वाले उत्पाद में एकीकृत करना एक उल्लेखनीय कदम है। OpenAI धीरे-धीरे मल्टीमॉडल क्षमताएं जोड़ रहा है—इस वर्ष की शुरुआत में इसने DALL-E के साथ इमेज जनरेट करने की क्षमता पेश की, और अब यह दूसरी दिशा में धारणा ला रहा है। कंपनी इस अपडेट को AI को और अधिक सहज बनाने के तरीके के रूप में प्रस्तुत करती है, जिससे लोग वैसे ही संवाद कर सकें जैसे वे स्वाभाविक रूप से करते हैं: केवल टाइप करने के बजाय बोलकर और दिखाकर।
रोलआउट पहले ChatGPT के प्लस सब्सक्राइबर्स के साथ शुरू होता है, और बाद में मुफ्त टियर के विस्तार की उम्मीद है। सभी उपयोगकर्ताओं को कब एक्सेस मिलेगा, इसकी कोई सटीक समय-सीमा नहीं दी गई है।




