जेमिनी ओम्नी क्या करता है
जेमिनी ओम्नी कई डेटा प्रकारों — टेक्स्ट, इमेज, ऑडियो और वीडियो — को संभालने के लिए बनाया गया है, लेकिन इसका फोकस वीडियो पर है। यह शुरू से नए क्लिप बना सकता है, मौजूदा फुटेज को संपादित कर सकता है, और यहां तक कि सुसंगत कथाएं भी बना सकता है। भौतिकी और वास्तविक दुनिया की अंतःक्रियाओं की समझ का मतलब है कि यह बिना स्पष्ट गड़बड़ियों के यथार्थवादी गति, प्रकाश और वस्तु व्यवहार उत्पन्न कर सकता है।
यह इसे पहले के AI वीडियो टूल्स से अलग करता है, जो अक्सर स्थिरता के साथ संघर्ष करते थे या अप्राकृतिक गतिविधियां उत्पन्न करते थे। गूगल का कहना है कि मॉडल की भौतिक दुनिया में वस्तुओं के चलने और अंतःक्रिया करने के तरीके की जानकारी इसे अधिक सहज और विश्वसनीय परिणाम उत्पन्न करने में मदद करती है।
यह कैसे काम करता है
कंपनी ने तकनीकी विशिष्टताएं जारी नहीं की हैं, लेकिन जेमिनी ओम्नी बड़े भाषा मॉडल की क्षमताओं को जनरेटिव वीडियो मॉडल के साथ जोड़ता हुआ प्रतीत होता है। उपयोगकर्ता टेक्स्ट विवरण, संदर्भ इमेज, या मोटे स्टोरीबोर्ड इनपुट कर सकते हैं, और मॉडल प्रॉम्प्ट से मेल खाने वाला वीडियो आउटपुट करता है। यह एक कच्चे वीडियो को लेकर प्राकृतिक भाषा कमांड का उपयोग करके संपादन भी लागू कर सकता है — पृष्ठभूमि बदलना, समय समायोजित करना, या तत्व जोड़ना।
गूगल का कहना है कि मॉडल "दृश्यों को समझने के लिए उन्नत भौतिकी और वास्तविक दुनिया के ज्ञान का लाभ उठाता है"। इसका संभवतः मतलब है कि यह प्रशिक्षण डेटा से पैटर्न कॉपी करने के बजाय यह अनुकरण करता है कि प्रकाश कैसे पड़ता है, वस्तुएं कैसे छाया डालती हैं, और गति कैसे संवेग का अनुसरण करती है।
वीडियो निर्माण अधिकांश लोगों के लिए एक भारी काम है — इसमें कौशल, समय और महंगे सॉफ्टवेयर की आवश्यकता होती है। जेमिनी ओम्नी का उद्देश्य उन बाधाओं को दूर करना है। एक मार्केटर एक स्क्रिप्ट से उत्पाद डेमो उत्पन्न कर सकता है। एक शिक्षक एक पाठ योजना को एनिमेटेड एक्सप्लेनर में बदल सकता है। मॉडल की कहानी कहने की क्षमता रचनाकारों को बिना प्रोडक्शन क्रू के शॉर्ट फिल्में या सोशल मीडिया सामग्री बनाने में मदद कर सकती है।
यह लॉन्च रचनात्मक वर्कफ़्लो में AI को शामिल करने के लिए गूगल के प्रयास को भी संकेत करता है। अन्य टेक कंपनियों ने वीडियो जनरेशन मॉडल जारी किए हैं — उदाहरण के लिए OpenAI का Sora और Meta का Make-A-Video — लेकिन जेमिनी ओम्नी का भौतिकी-आधारित यथार्थवाद पर जोर एक अलग दृष्टिकोण प्रदान करता है।
गूगल ने जेमिनी ओम्नी के लिए मूल्य निर्धारण, उपलब्धता या रिलीज़ की तारीख की घोषणा नहीं की है। कंपनी ने कहा कि वह पहले चुनिंदा परीक्षकों को मॉडल रोल आउट करेगी, उसके बाद व्यापक पहुंच होगी। यह स्पष्ट नहीं है कि यह टूल मुफ्त होगा, सब्सक्रिप्शन-आधारित होगा, या Google Cloud सेवाओं से जुड़ा होगा।
अभी के लिए, रचनाकार और डेवलपर केवल अधिक जानकारी की



