Perplexity начало развертывание моделей Qwen3 235B на стойках Nvidia GB200, что обеспечивает значительный прирост производительности вывода. Как впервые сообщило издание Crypto Briefing, эта реализация подчеркивает продолжающееся лидерство Nvidia в области AI-оборудования и может изменить конкурентную динамику в сегменте обслуживания крупных моделей.
Прирост производительности вывода на GB200
Переход на стойки GB200 позволил Perplexity заметно ускорить обработку 235-миллиардной параметрической модели Qwen3. Улучшились как пропускная способность вывода, так и задержки, хотя компания пока не опубликовала конкретных показателей. Прирост достигнут благодаря тесной интеграции процессоров Nvidia Grace и GPU Blackwell, что устраняет узкие места при передаче данных.
Преимущество оборудования Nvidia
Эта реализация еще раз подтверждает, что Nvidia вырываеться вперед в гонке AI-чипов. Стойки GB200 специально спроектированы для работы с высокопараметрическими нагрузками, и выбор Perplexity демонстрирует, что аппаратное решение действительно эффективно в ключевых аспектах. Конкуренты, такие как AMD и Intel, сталкиваются с непростой задачей — соответствовать такой производительности в масштабах производства.
Ускорение развертывания моделей
Благодаря улучшенной производительности вывода Perplexity может быстрее запускать обновления и новые модели. Qwen3 235B представляет собой мощную плотную модель, и ее эффективная эксплуатация сокращает время между обучением и выводом в производство. Эта скорость становится критически важной, поскольку гонка по развертыванию все более крупных языковых моделей набирает обороты.
Этот шаг может оказать давление на других провайдеров вывода, вынуждая их модернизировать оборудование или рискуя отстать. Если Perplexity сохранит это преимущество, платформа, вероятно, привлечет больше AI-разработчиков, которым необходима высокопроизводительная и низколатентная обработка. В ближайшие месяцы станет ясно, сумеют ли конкуренты сократить разрыв или стойки Nvidia GB200 станут де-факто стандартом для работы с тяжелыми моделями.




