NVIDIA presentó una nueva línea de modelos de IA en la conferencia CVPR 2026 en Seattle el lunes, dirigidos a tres áreas críticas para la IA física: agarre robótico, conducción autónoma y entrenamiento de agentes virtuales. La empresa indicó que los modelos están diseñados para escalar, pasando de experimentos en laboratorio a implementaciones en fábricas, carreteras y entornos de simulación.
Tres dominios de la IA física
Los modelos abarcan tareas que históricamente han sido desafiantes para robots y sistemas de conducción autónoma. Un modelo se enfoca en el agarre —la capacidad de un brazo robótico para recoger objetos desconocidos sin aplastarlos ni dejarlos caer—. Otro está diseñado para la conducción autónoma, gestionando la percepción y la toma de decisiones en tráfico. El tercero se centra en agentes virtuales, que las empresas entrenan en entornos simulados antes de desplegarlos en escenarios reales.
NVIDIA no publicó benchmarks detallados de rendimiento, pero el anuncio señala que la empresa considera estas tres áreas como los principales cuellos de botella para la IA física. La compañía ha invertido fuertemente en chips para robótica, plataformas de simulación como Isaac Sim y sistemas de cómputo para automóviles. Estos modelos conectan esos esfuerzos en hardware con una capa de software.
Por qué la escalabilidad es importante
Entrenar a un robot para recoger una botella de agua es una cosa. Enseñarle a recoger cualquier botella —sin importar su forma, iluminación o ángulo— a la velocidad que requiere un almacén es otra. Lo mismo ocurre con un automóvil autónomo que debe manejar una noche nevada en Detroit o una intersección caótica en Mumbai. La propuesta de NVIDIA es que sus nuevos modelos pueden escalar en estas variaciones sin necesidad de reentrenarlos desde cero.
El modelo de agente virtual está dirigido a empresas que construyen gemelos digitales o entrenan asistentes de IA. En lugar de programar cada interacción, el modelo permite que el agente aprenda mediante la práctica dentro de un entorno simulado. Ese enfoque se ha vuelto popular en logística y juegos, pero NVIDIA busca impulsarlo hacia la manufactura y la atención médica.
Una conferencia centrada en la visión
CVPR —la Conferencia sobre Visión por Computadora y Reconocimiento de Patrones— es la mayor reunión anual de investigadores en visión por computadora. Es un escenario natural para que NVIDIA presente trabajos sobre percepción y control. La empresa ha asistido regularmente al evento, utilizando a menudo esta plataforma para presentar hardware o herramientas de código abierto. Este año, el énfasis estuvo en modelos que cierran la brecha entre ver y actuar.
El anuncio no incluyó una fecha específica de lanzamiento para los modelos ni mencionó clientes piloto. NVIDIA generalmente pone a disposición sus modelos de IA a través de sus plataformas para desarrolladores o como pesos preentrenados para investigadores. Esos detalles podrían surgir en las próximas semanas a medida que continúen las sesiones de la conferencia.
Por ahora, la conclusión es clara: NVIDIA apuesta a que la próxima ola de IA no se limitará a chatbots o generadores de imágenes. La IA física —máquinas que interactúan con el mundo físico caótico e impredecible— es el objetivo, y la empresa está integrando nuevos modelos en el hardware que ya vende.




