Dvě nové hardwarové platformy míří na brutální výpočetní nároky modelů AI s bilionem parametrů. Platforma NVIDIA Vera Rubin a architektura Groq 3 LPX společně slibují kombinované 35násobné zvýšení účinnosti, jak uvádějí společnosti. Oznámení přichází v době, kdy vývojáři posouvají velikosti modelů daleko za hranice toho, co současná infrastruktura dokáže levně zvládnout.
Problém škálování
Trénování modelu s bilionem parametrů vyžaduje obrovskou šířku pásma paměti a rychlost propojení. Dnešní systémy často narážejí na úzká hrdla, která mění trénovací běhy na několikaměsíční projekty. Platforma Vera Rubin a Groq 3 LPX jsou navrženy tak, aby řešily různé části této rovnice. Přístup NVIDIA se zaměřuje na husté výpočetní clustery, zatímco řada LPX od Groq cílí na deterministické provedení s nízkou latencí. Dohromady tvrdí, že snižují spotřebu energie a dobu trénování až 35krát.
Co znamená číslo 35x
Údaj o účinnosti není jediným benchmarkem, ale projekcí systémových vylepšení – od architektury čipů po pohyb dat. U modelu s bilionem parametrů by 35násobný zisk mohl změnit roční trénovací cyklus na záležitost týdnů. Žádná ze společností dosud nezveřejnila nezávislé výsledky testů, ale obě poukazují na architektonická rozhodnutí, která snižují zbytečné cykly a paměťový provoz. Platforma Vera Rubin využívá novou propojovací architekturu a Groq 3 LPX spoléhá na deterministický model provedení, který se vyhýbá tradiční režii ukládání do mezipaměti.
Proč na načasování záleží
Tento tlak přichází v době, kdy velké jazykové modely a multimodální systémy AI běžně překračují hranici sta miliard parametrů. Modely s bilionem parametrů jsou všeobecně považovány za další hranici, ale jejich praktické nasazení brzdí náklady. Výrobci hardwaru závodí v dodávkách řešení, která by tyto modely učinila ekonomicky životaschopnými. NVIDIA a Groq řeší stejný problém z různých úhlů a tvrzení o 35násobném zisku je pro obě vytyčením pozice.
Žádná ze společností dosud neoznámila data všeobecné dostupnosti platformy Vera Rubin ani Groq 3 LPX. Beta systémy by se měly k vybraným partnerům dostat ještě letos. Skutečný test nastane, až nezávislé laboratoře a poskytovatelé cloudových služeb prověří hardware na skutečných úlohách s bilionem parametrů. Do té doby zůstává číslo 35x slibem čekajícím na důkaz.



