Inferenssihyödyt GB200:ssä
Siirtyminen GB200-telineisiin antaa Perplexitylle huomattavan nosteen siinä, kuinka nopeasti se pystyy ajamaan 235 miljardin parametrin Qwen3-mallia. Sekä inferenssin läpäisykyky että viive paranivat, vaikka yritys ei ole julkaissut tarkkoja vertailulukuja. Parannukset johtuvat Nvidian Grace-suorittimen ja Blackwell-grafiikkasuorittimen tiiviistä integraatiosta, joka vähentää tiedonsiirtopullonkauloja.
Nvidian laitteistoetu
Tämä käyttöönotto on toinen esimerkki Nvidian karkaamisesta tekoälypiirikilpailussa. GB200-telineet on suunniteltu juuri tällais




