Perplexity, Nvidia GB200 raklarında Qwen3 235B modellerini hizmete sunmaya başladı; bu adım, çıkarım performansında büyük kazanımlar sağlıyor. Crypto Briefing tarafından ilk olarak bildirilen bu dağıtım, Nvidia'nın yapay zeka donanımındaki sürekli liderliğini vurguluyor ve büyük modellerin hizmet verme konusundaki rekabet dinamiklerini değiştirebilir.
GB200'de Çıkarım Kazanımları
GB200 raklarına geçiş, Perplexity'nin 235 milyar parametreli Qwen3 modelini ne kadar hızlı çalıştırabildiğinde belirgin bir artış sağlıyor. Çıkarım aktarım hızı ve gecikme süresi her ikisi de iyileşti, ancak şirket belirli ölçüm sonuçlarını henüz açıklamadı. Bu kazanımlar, veri aktarımı darboğazlarını azaltan Nvidia'nın Grace CPU ve Blackwell GPU'nun sıkı entegrasyonundan kaynaklanıyor.
Nvidia'nın Donanım Üstünlüğü
Bu dağıtım, Nvidia'nın yapay zeka çip yarışında öne çıktığının bir başka örneğidir. GB200 rakları, tam olarak bu tür yüksek parametreli iş yükleri için tasarlanmıştır ve Perplexity'nin seçimi, donanımın kritik noktalarda performans sunduğunu gösteriyor. AMD ve Intel gibi rakipler, bu performansı ölçekli bir şekilde eşleştirmek için zorlu bir yol almak zorunda kalıyor.
Model Dağıtımını Hızlandırma
Daha iyi çıkarım ile Perplexity, güncellemeleri ve yeni modelleri daha hızlı yayınlayabilir. Qwen3 235B, yoğun ve güçlü bir modeldir ve etkili bir şekilde çalıştırılması, eğitim ile üretim arasındaki süreyi kısaltır. Daha büyük dil modellerini dağıtmak için yapılan yarış kızışırken bu hız önem kazanıyor.
Bu adım, diğer çıkarım sağlayıcılarını donanımlarını güncellemeye zorlayabilir veya geride kalmaları riskini artırabilir. Perplexity bu üstünlüğü korursa, yüksek aktarım hızı ve düşük gecikme süresi gerektiren yapay zeka geliştiricilerini çekmeye başlayabilir. Önümüzdeki aylar, rakiplerin farkı kapatıp kapatamayacağını veya Nvidia'nın GB200'ün ağır modeller için fiili standart haline gelip gelmeyeceğini gösterecek.




