NVIDIA lanserade en ny serie AI-modeller på konferensen CVPR 2026 i Seattle på måndagen, som riktar sig till tre områden som är avgörande för fysisk AI: robotgrepp, autonom körning och träning av virtuella agenter. Företaget uppgav att modellerna är utformade för att skalas – från laboratorieexperiment till verkliga tillämpningar i fabriker, på vägar och i simuleringsmiljöer.
Tre domäner för fysisk AI
Modellerna täcker uppgifter som länge varit svåra för robotar och självkörande system. En modell fokuserar på grepp – förmågan för en robotarm att plocka upp okända föremål utan att krossa eller tappa dem. En annan är byggd för autonom körning och hanterar perception och beslutsfattande i trafiken. Den tredje riktar sig mot virtuella agenter, som företag tränar i simulerade världar innan de släpps lösa i verkliga miljöer.
NVIDIA släppte inga detaljerade prestandabenchmarks, men tillkännagivandet signalerar att företaget ser dessa tre områden som de viktigaste flaskhalsarna för fysisk AI. Företaget har investerat kraftigt i robotikchips, simuleringsplattformar som Isaac Sim och beräkningssystem för fordon. Dessa modeller knyter samman hårdvarusatsningarna med ett mjukvarulager.
Varför skalning är viktigt
Att träna en robot att plocka upp en vattenflaska är en sak. Att lära den att plocka upp vilken flaska som helst – oavsett form, ljus eller vinkel – i en hastighet som ett lager kräver är en annan. Detsamma gäller för en självkörande bil som måste hantera en snöig natt i Detroit eller en kaotisk korsning i Mumbai. NVIDIA:s budskap är att dess nya modeller kan skalas över dessa variationer utan att tränas om från grunden.
Den virtuella agentmodellen riktar sig till företag som bygger digitala tvillingar eller tränar AI-assistenter. Istället för att scripta varje interaktion låter modellen agenten lära sig genom att agera i en simulerad miljö. Detta tillvägagångssätt har blivit populärt inom logistik och spel, men NVIDIA vill driva in det i tillverkning och sjukvård.
En konferens med fokus på vision
CVPR – Conference on Computer Vision and Pattern Recognition – är den största årliga sammankomsten för forskare inom datorseende. Det är en naturlig plats för NVIDIA att presentera arbete inom perception och styrning. Företaget har varit en återkommande deltagare vid evenemanget och använder det ofta för att lansera hårdvara eller verktyg med öppen källkod. I år låg tonvikten på modeller som överbryggar gapet mellan att se och att agera.
Tillkännagivandet innehöll inget specifikt releasedatum för modellerna eller några pilotkunder. NVIDIA brukar göra sina AI‑modeller tillgängliga via sina utvecklarplattformar eller som förtränade vikter för forskare. Dessa detaljer kan komma fram under de kommande veckorna i takt med att konferenssessionerna fortsätter.
För tillfället är slutsatsen tydlig: NVIDIA satsar på att nästa våg av AI inte kommer att begränsas till chattbotar eller bildgeneratorer. Fysisk AI – maskiner som interagerar med den röriga, oförutsägbara fysiska världen – är målet, och företaget lägger nya modeller ovanpå den hårdvara det redan säljer.




