پرپلکسیتی شروع به ارائه مدلهای Qwen3 235B روی رکهای Nvidia GB200 کرده است، که این اقدام بهبود چشمگیری در عملکرد استنتاج ایجاد میکند. این استقرار که اولین بار توسط Crypto Briefing گزارش شد، بر سرآمدی مداوم نویدیا در زمینه سختافزار هوش مصنوعی تأکید دارد و میتواند دینامیک رقابتی ارائه مدلهای بزرگ را تغییر دهد.
بهبودهای استنتاج روی GB200
تغییر به رکهای GB200 به پرپلکسیتی امکان اجرای سریعتر مدل Qwen3 با 235 میلیارد پارامتر را داده است. نرخ پردازش و تأخیر زمانی استنتاج هر دو بهبود یافتهاند، هرچند شرکت هنوز ارقام دقیق را انتشار نداده است. این بهبودها نتیجه یکپارچهسازی نزدیک CPU گریس و GPU بلکول نویدیا است که گلوگاههای انتقال داده را کاهش میدهد.
برتری سختافزاری نویدیا
این استقرار مثال دیگری از پیشی گرفتن نویدیا در مسابقه تراشههای هوش مصنوعی است. رکهای GB200 بهطور خاص برای این گونه بارهای کاری با پارامترهای بالا طراحی شدهاند و انتخاب پرپلکسیتی نشان میدهد که این سختافزار در موارد حیاتی عملکرد مطلوبی ارائه میدهد. رقبایی مانند AMD و Intel برای همسوایی با این عملکرد در مقیاس بزرگ با چالشهای زیادی روبرو هستند.
تسریع در استقرار مدل
با بهبود استنتاج، پرپلکسیتی میتواند بهروزرسانیها و مدلهای جدید را سریعتر ارائه دهد. مدل Qwen3 235B یک مدل چگال و قدرتمند است و اجرای کارآمد آن به معنای کاهش زمان بین آموزش و تولید است. این سرعت در حالی اهمیت دارد که رقابت برای استقرار مدلهای زبانی هرچه بزرگتر داغتر میشود.
این اقدام ممکن است سایر ارائهدهندگان استنتاج را تحت فشار قرار دهد تا سختافزار خود را ارتقا دهند یا ریسک عقب ماندن را بپذیرند. اگر پرپلکسیتی این برتری را حفظ کند، ممکن است جذب توسعهدهندگان هوش مصنوعی بیشتری شود که به ارائه با نرخ پردازش بالا و تأخیر زمانی کم نیاز دارند. چند ماه آینده نشان خواهد داد که آیا رقبا میتوانند شکاف را پر کنند یا GB200 نویدیا به استاندارد واقعی برای مدلهای سنگین تبدیل خواهد شد.




