Loading market data...

NVIDIA GB200 NVL72 از زمان‌بندی آگاه از توپولوژی Slurm برای بارهای کاری هوش مصنوعی در مقیاس اگزاسکیل استفاده می‌کند

NVIDIA GB200 NVL72 از زمان‌بندی آگاه از توپولوژی Slurm برای بارهای کاری هوش مصنوعی در مقیاس اگزاسکیل استفاده می‌کند

چرا توپولوژی برای هوش مصنوعی اهمیت دارد

زمان‌بند Slurm چیدمان فیزیکی گره‌های محاسباتی و پیوندهای شبکه را در نظر می‌گیرد. برای یک سیستم GPU متراکم مانند GB200 NVL72، این به معنای قرار دادن کارها به گونه‌ای است که تأخیر ارتباطی بین GPUها به حداقل برسد. زمان‌بندی آگاه از توپولوژی گلوگاه‌ها را هنگام آموزش مدل‌هایی که در صدها یا هزاران شتاب‌دهنده پخش شده‌اند کاهش می‌دهد. این رویکرد به جلوگیری از موقعیت‌هایی کمک می‌کند که GPUهای یک کار در سوئیچ‌های مختلف یا گره‌های دور از هم پراکنده شده‌اند، که می‌تواند انتقال داده‌ها را متوقف کند.

باز کردن توان عملیاتی اگزاسکیل

انویدیا می‌گوید با ترکیب زمان‌بندی Slurm با معماری GB200 NVL72، این سیستم می�