NVIDIA Vera Rubin og Groq 3 LPX sikter mot 35x effektivitetshopp for AI med trillioner parametere

To nye maskinvareplattformer tar sikte på de brutale beregningskravene til AI-modeller med trillioner parametere. NVIDIAs Vera Rubin-plattform og Groqs 3 LPX-arkitektur lover til sammen en 35x effektivitetsgevinst, ifølge selskapene. Kunngjøringen kommer mens utviklere presser modellstørrelser langt utover hva dagens infrastruktur kan håndtere på en kostnadseffektiv måte.

Oppskaleringsproblemet

Å trene en modell med en trillion parametere krever enorm minnebåndbredde og sammenkoblingshastighet. Dagens systemer støter ofte på flaskehalser som gjør treningsøkter til flermånedersprosjekter. Vera Rubin-plattformen og Groq 3 LPX er hver designet for å løse ulike deler av den ligningen. NVIDIAs tilnærming fokuserer på tette dataklynger, mens Groqs LPX-serie retter seg mot deterministisk lav-latens utførelse. Til sammen hevder de å redusere energiforbruk og treningstid med en faktor på 35.

Hva 35x-tallet betyr

Effektivitetstallet er ikke en enkelt benchmark, men en projeksjon av forbedringer på systemnivå – fra brikkearkitektur til dataflyt. For en modell med en trillion parametere kan en 35x gevinst gjøre om en årlang treningssyklus til et spørsmål om uker. Ingen av selskapene har publisert uavhengige testresultater ennå, men begge peker på arkitektoniske valg som reduserer bortkastede sykluser og minnetrafikk. Vera Rubin-plattformen bruker en ny sammenkoblingsstruktur, og Groq 3 LPX er avhengig av en deterministisk utførelsesmodell som unngår tradisjonell cache-overhead.

Hvorfor timing betyr noe

Fremstøtet kommer ettersom store språkmodeller og multimodale AI-systemer rutinemessig krysser grensen på hundre milliarder parametere. Modeller med trillioner parametere blir allment sett på som neste grense, men praktisk utrulling stopper på grunn av kostnadene. Maskinvareprodusenter kappes om å levere løsninger som gjør disse modellene økonomisk levedyktige. NVIDIA og Groq angriper det samme problemet fra ulike vinkler, og 35x-påstanden er et markering for begge.

Ingen av selskapene har kunngjort generelle tilgjengelighetsdatoer for Vera Rubin-plattformen eller Groq 3 LPX. Betasystemer forventes å nå utvalgte partnere senere i år. Den virkelige testen kommer når uavhengige laboratorier og skyleverandører setter maskinvaren gjennom prøvelser med faktiske arbeidsmengder på trillioner parametere. Inntil da forblir 35x-tallet et løfte som venter på bevis.

Oppskaleringsproblemet

Hva 35x-tallet betyr

Hvorfor timing betyr noe

Related Articles