Perplexity telah mula menyediakan model Qwen3 235B pada rak Nvidia GB200, satu langkah yang memberikan peningkatan prestasi inferens yang besar. Penggunaan ini, pertama kali dilaporkan oleh Crypto Briefing, menekankan kepimpinan berterusan Nvidia dalam perkakasan AI dan boleh mengubah dinamik persaingan dalam penyajian model besar.
Peningkatan inferens pada GB200
Peralihan kepada rak GB200 memberikan Perplexity peningkatan yang ketara dalam kelajuan menjalankan model Qwen3 dengan 235 bilion parameter. Daya pemprosesan inferens dan kependaman kedua-duanya bertambah baik, walaupun syarikat itu belum mengeluarkan penanda aras khusus. Peningkatan ini datang daripada integrasi rapat CPU Grace dan GPU Blackwell Nvidia, yang mengurangkan kesesakan pemindahan data.
Kehebatan perkakasan Nvidia
Penggunaan ini adalah satu lagi contoh Nvidia mendahului dalam perlumbaan cip AI. Rak GB200 direka khusus untuk beban kerja parameter tinggi seperti ini, dan pilihan Perplexity menunjukkan bahawa perkakasan tersebut memberikan prestasi di tempat yang penting. Pesaing seperti AMD dan Intel menghadapi cabaran yang sukar untuk menandingi prestasi tersebut pada skala besar.
Mempercepatkan penggunaan model
Dengan inferens yang lebih baik, Perplexity boleh melancarkan kemas kini dan model baharu dengan lebih pantas. Qwen3 235B adalah model yang padat dan berkuasa, dan menjalankannya dengan cekap bermakna kurang masa antara latihan dan pengeluaran. Kelajuan itu penting apabila persaingan untuk menggunakan model bahasa yang semakin besar semakin sengit.
Langkah ini boleh memberi tekanan kepada penyedia inferens lain untuk menaik taraf perkakasan mereka atau berisiko ketinggalan. Jika Perplexity mengekalkan kelebihan ini, ia mungkin menarik lebih ramai pembangun AI yang memerlukan penyajian daya pemprosesan tinggi dan kependaman rendah. Beberapa bulan akan datang akan menunjukkan sama ada pesaing dapat merapatkan jurang atau jika GB200 Nvidia menjadi standard de facto untuk model berat.




