Loading market data...

Perplexity ottaa käyttöön Qwen3 235B:n Nvidia GB200 -telineissä, tehostaa inferenssiä

Perplexity ottaa käyttöön Qwen3 235B:n Nvidia GB200 -telineissä, tehostaa inferenssiä

Inferenssihyödyt GB200:ssä

Siirtyminen GB200-telineisiin antaa Perplexitylle huomattavan nosteen siinä, kuinka nopeasti se pystyy ajamaan 235 miljardin parametrin Qwen3-mallia. Sekä inferenssin läpäisykyky että viive paranivat, vaikka yritys ei ole julkaissut tarkkoja vertailulukuja. Parannukset johtuvat Nvidian Grace-suorittimen ja Blackwell-grafiikkasuorittimen tiiviistä integraatiosta, joka vähentää tiedonsiirtopullonkauloja.

Nvidian laitteistoetu

Tämä käyttöönotto on toinen esimerkki Nvidian karkaamisesta tekoälypiirikilpailussa. GB200-telineet on suunniteltu juuri tällais