Kaksi uutta laitteistoalustaa ottaa tähtäimeensä biljoonan parametrin tekoälymallien valtavat laskentatehovaatimukset. NVIDIA:n Vera Rubin -alusta ja Groqin 3 LPX -arkkitehtuuri lupaavat yhdessä 35-kertaisen tehokkuusparannuksen, yhtiöt kertovat. Ilmoitus tulee samaan aikaan, kun kehittäjät työntävät mallikokoja kauas nykyisen infrastruktuurin taloudellisesti kestävien rajojen yli.
Skaalausongelma
Biljoonan parametrin mallin harjoittaminen vaatii valtavaa muistikaistanleveyttä ja yhteenliitäntänopeutta. Nykyisissä järjestelmissä ilmenee usein pullonkauloja, jotka venyttävät harjoitusajot monen kuukauden projekteiksi. Vera Rubin -alusta ja Groq 3 LPX on kumpikin suunniteltu ratkaisemaan eri osia tästä yhtälöstä. NVIDIA:n lähestymistapa keskittyy tiiviisiin laskentaklustereihin, kun taas Groqin LPX-sarja tähtää deterministiseen matalan viiveen suoritukseen. Yhdessä ne väittävät vähentävänsä energiankulutusta ja harjoitusaikaa kertoimella 35.
Mitä 35-kertainen luku tarkoittaa
Tehokkuusluku ei ole yksittäinen vertailuarvo vaan ennuste järjestelmätason parannuksista – piiriarkkitehtuurista datan liikutteluun. Biljoonan parametrin mallilla 35-kertainen parannus voisi muuttaa vuoden mittaisen harjoitussyklin viikkojen asiaksi. Kumpikaan yhtiö ei ole vielä julkaissut riippumattomia testituloksia, mutta molemmat viittaavat arkkitehtonisiin valintoihin, jotka vähentävät hukkaan meneviä syklejä ja muistiliikennettä. Vera Rubin -alusta käyttää uutta yhteenliitäntäverkkoa, ja Groq 3 LPX nojaa deterministiseen suoritusmalliin, joka välttää perinteisen välimuistin ylikuormituksen.
Miksi ajoitus on tärkeää
Ponnistus tulee samaan aikaan, kun suuret kielimallit ja multimodaaliset tekoälyjärjestelmät ylittävät rutiininomaisesti sadan miljardin parametrin rajan. Biljoonan parametrin mallit nähdään laajalti seuraavana rajapyykkinä, mutta niiden käytännön käyttöönotto on jumissa kustannusten takia. Laitteistovalmistajat kilpailevat tarjotakseen ratkaisuja, jotka tekevät malleista taloudellisesti kannattavia. NVIDIA ja Groq lähestyvät samaa ongelmaa eri suunnista, ja 35-kertainen väite on maamerkki molemmille.
Kumpikaan yhtiö ei ole ilmoittanut yleisen saatavuuden päivämääriä Vera Rubin -alustalle tai Groq 3 LPX:lle. Beetajärjestelmien odotetaan saapuvan valituille kumppaneille myöhemmin tänä vuonna. Todellinen testi tulee, kun riippumattomat laboratoriot ja pilvipalveluntarjoajat testaavat laitteiston todellisilla biljoonan parametrin työkuormilla. Siihen asti 35-kertainen luku on lupaus, joka odottaa todistusta.



