Perplexity פורסת את Qwen3 235B על מתלי GB200 של Nvidia, משפרת את ההסקה

שיפורי הסקה על GB200

המעבר למתלי GB200 מעניק ל-Perplexity שיפור ניכר במהירות שבה היא יכולה להריץ את מודל Qwen3 בעל 235 מיליארד הפרמטרים. תפוקת ההסקה והשהייה השתפרו שניהם, אם כי החברה לא פרסמה מדדים ספציפיים. השיפורים נובעים מהאינטגרציה ההדוקה של מעבד Grace של Nvidia ו-GPU Blackwell, שמקצצת צווארי בקבוק בהעברת נתונים.

יתרון החומרה של Nvidia

פריסה זו היא דוגמה נוספת ל-Nvidia המובילה במרוץ שבבי ה-AI. מתלי GB200 מתוכננים בדיוק עבור סוגים אלה של עומסי עבודה בעלי פרמטרים גבוהים, והבחירה של Perplexity מרמזת שהחומרה מספקת היכן שחשוב. מתחרים כמו AMD ו-Intel עומדים בפני עלייה תלולה כדי להתאים ביצועים אלה בקנה מידה.

האצת פריסת מודלים

עם הסקה טובה יותר, Perplexity יכולה להשיק עדכונים ומודלים חדשים מהר יותר. ה-Qwen3 235B הוא מודל צפוף ועוצמתי, והרצתו ביעילות פירושה פחות זמן בין אימון לייצור. מהירות זו חשובה ככל שהמרוץ לפריסת מודלי שפה גדולים יותר מתחמם.

המהלך עשוי ללחוץ על ספקי הסקה אחרים לשדרג את החומרה שלהם או להסתכן בפיגור. אם Perplexity תשמור על יתרון זה, היא עשויה למשוך מפתחי AI נוספים הזקוקים לשרת בתפוקה גבוהה ובשהייה נמוכה. החודשים הקרובים יראו האם המתחרים יכולים לצמצם את הפער או ש-GB200 של

שיפורי הסקה על GB200

יתרון החומרה של Nvidia

האצת פריסת מודלים

Related Articles