Loading market data...

Perplexity nasazuje model Qwen3 235B na racky Nvidia GB200 a zvyšuje výkon inference

Perplexity nasazuje model Qwen3 235B na racky Nvidia GB200 a zvyšuje výkon inference

Zlepšení inference na GB200

Přechod na racky GB200 poskytuje Perplexity znatelné zrychlení při spouštění modelu Qwen3 s 235 miliardami parametrů. Propustnost inference i latence se zlepšily, ačkoli společnost nezveřejnila konkrétní benchmarky. Zisky plynou z těsné integrace procesoru Grace a GPU Blackwell od Nvidie, která snižuje úzká místa přenosu dat.

Hardwarová výhoda Nvidie

Toto nasazení je dalším příkladem toho, jak Nvidia získává náskok v závodě AI čipů. Racky GB200 jsou navrženy přesně pro tento typ úloh s vysokým počtem parametrů a volba Per