Perplexity ने Nvidia GB200 रैक पर Qwen3 235B मॉडल की सेवा शुरू कर दी है, यह एक ऐसा कदम है जो अनुमान प्रदर्शन में बड़ी वृद्धि प्रदान करता है। Crypto Briefing द्वारा पहली बार रिपोर्ट की गई यह तैनाती, AI हार्डवेयर में Nvidia की निरंतर अग्रणी स्थिति को रेखांकित करती है और बड़े मॉडल सेवा के प्रतिस्पर्धी गतिशीलता को बदल सकती है।
GB200 पर अनुमान में वृद्धि
GB200 रैक पर स्विच करने से Perplexity को 235-बिलियन-पैरामीटर Qwen3 मॉडल चलाने की गति में उल्लेखनीय वृद्धि मिली है। अनुमान थ्रूपुट और विलंबता दोनों में सुधार हुआ है, हालांकि कंपनी ने विशिष्ट बेंचमार्क जारी नहीं किए हैं। यह वृद्धि Nvidia के Grace CPU और Blackwell GPU के कड़े एकीकरण से आती है, जो डेटा-स्थानांतरण अड़चनों को कम करता है।
Nvidia की हार्डवेयर बढ़त
यह तैनाती AI चिप दौड़ में Nvidia के आगे निकलने का एक और उदाहरण है। GB200 रैक विशेष रूप से इस प्रकार के उच्च-पैरामीटर कार्यभार के लिए डिज़ाइन किए गए हैं, और Perplexity की पसंद से पता चलता है कि हार्डवेयर वहां प्रदर्शन करता है जहां इसकी आवश्यकता है। प्रतिस्पर्धी जैसे AMD और Intel को बड़े पैमाने पर उस प्रदर्शन से मेल खाने के लिए कठिन चुनौती का सामना करना पड़ता है।
मॉडल तैनाती में तेजी
बेहतर अनुमान के साथ, Perplexity अपडेट और नए मॉडल तेजी से रोल आउट कर सकता है। Qwen3 235B एक सघन, शक्तिशाली मॉडल है, और इसे कुशलतापूर्वक चलाने का मतलब है प्रशिक्षण और उत्पादन के बीच कम समय। यह गति मायने रखती है क्योंकि बड़े भाषा मॉडल तैनात करने की दौड़ तेज हो रही है।
यह कदम अन्य अनुमान प्रदाताओं पर अपने हार्डवेयर को अपग्रेड करने या पीछे रह जाने का दबाव डाल सकता है। यदि Perplexity इस बढ़त को बनाए रखता है, तो यह अधिक AI डेवलपर्स को आकर्षित कर सकता है जिन्हें उच्च-थ्रूपुट, कम-विलंबता सेवा की आवश्यकता है। आने वाले महीनों में पता चलेगा कि क्या प्रतिद्वंद्वी अंतर को कम कर सकते हैं या क्या Nvidia का GB200 भारी मॉडलों के लिए वास्तविक मानक बन जाएगा।




