پرپلکسیتی مدل Qwen3 235B را روی رک‌های Nvidia GB200 استقرار داد و عملکرد استنتاج را بهبود بخشید

پرپلکسیتی شروع به ارائه مدل‌های Qwen3 235B روی رک‌های Nvidia GB200 کرده است، که این اقدام بهبود چشمگیری در عملکرد استنتاج ایجاد می‌کند. این استقرار که اولین بار توسط Crypto Briefing گزارش شد، بر سرآمدی مداوم نویدیا در زمینه سخت‌افزار هوش مصنوعی تأکید دارد و می‌تواند دینامیک رقابتی ارائه مدل‌های بزرگ را تغییر دهد.

بهبود‌های استنتاج روی GB200

تغییر به رک‌های GB200 به پرپلکسیتی امکان اجرای سریع‌تر مدل Qwen3 با 235 میلیارد پارامتر را داده است. نرخ پردازش و تأخیر زمانی استنتاج هر دو بهبود یافته‌اند، هرچند شرکت هنوز ارقام دقیق را انتشار نداده است. این بهبودها نتیجه یکپارچه‌سازی نزدیک CPU گریس و GPU بلکول نویدیا است که گلوگاه‌های انتقال داده را کاهش می‌دهد.

برتری سخت‌افزاری نویدیا

این استقرار مثال دیگری از پیشی گرفتن نویدیا در مسابقه تراشه‌های هوش مصنوعی است. رک‌های GB200 به‌طور خاص برای این گونه بارهای کاری با پارامترهای بالا طراحی شده‌اند و انتخاب پرپلکسیتی نشان می‌دهد که این سخت‌افزار در موارد حیاتی عملکرد مطلوبی ارائه می‌دهد. رقبایی مانند AMD و Intel برای هم‌سوایی با این عملکرد در مقیاس بزرگ با چالش‌های زیادی روبرو هستند.

تسریع در استقرار مدل

با بهبود استنتاج، پرپلکسیتی می‌تواند به‌روزرسانی‌ها و مدل‌های جدید را سریع‌تر ارائه دهد. مدل Qwen3 235B یک مدل چگال و قدرتمند است و اجرای کارآمد آن به معنای کاهش زمان بین آموزش و تولید است. این سرعت در حالی اهمیت دارد که رقابت برای استقرار مدل‌های زبانی هرچه بزرگ‌تر داغ‌تر می‌شود.

این اقدام ممکن است سایر ارائه‌دهندگان استنتاج را تحت فشار قرار دهد تا سخت‌افزار خود را ارتقا دهند یا ریسک عقب ماندن را بپذیرند. اگر پرپلکسیتی این برتری را حفظ کند، ممکن است جذب توسعه‌دهندگان هوش مصنوعی بیشتری شود که به ارائه با نرخ پردازش بالا و تأخیر زمانی کم نیاز دارند. چند ماه آینده نشان خواهد داد که آیا رقبا می‌توانند شکاف را پر کنند یا GB200 نویدیا به استاندارد واقعی برای مدل‌های سنگین تبدیل خواهد شد.

بهبود‌های استنتاج روی GB200

برتری سخت‌افزاری نویدیا

تسریع در استقرار مدل

Related Articles