La incursión de Nvidia en la robótica humanoide marca un punto de inflexión en el desarrollo industrial de la inteligencia artificial física. No es un movimiento aislado ni un experimento lateral: es una declaración de intención clara.
Con el lanzamiento programado de su nueva plataforma Jetson Thor para la primera mitad de 2025, la compañía refuerza su posición no solo como líder en procesamiento gráfico, sino como proveedor estratégico de infraestructura para la era de los robots inteligentes.
Lo interesante de este anuncio no está solo en el hardware, sino en el ecosistema completo que Nvidia ha sabido construir. Plataformas como Isaac, Omniverse e Isaac Sim conforman un entorno de desarrollo coherente, integrable y cada vez más sofisticado, que facilita no solo el entrenamiento y simulación, sino también la implementación y operación de robots en condiciones del mundo real.
Este enfoque integral —hardware más software, simulación más inferencia, control más entrenamiento— coloca a Nvidia en un lugar privilegiado dentro de una industria que se perfila como una de las más lucrativas y transformadoras de las próximas dos décadas.
Según proyecciones de McKinsey, los ingresos del sector robótico podrían oscilar entre 190.000 y 910.000 millones de dólares para 2040.
Esa amplitud de margen no solo refleja el potencial del mercado, sino también su incertidumbre: todo dependerá de qué actores logren no solo desarrollar tecnología funcional, sino convertirla en productos viables, escalables y útiles para una diversidad de industrias y contextos.
En este sentido, Nvidia no está sola. El movimiento reciente de Google, que ha integrado su modelo multimodal Gemini 2.0 en sistemas de Apptronik, muestra que los grandes modelos de lenguaje están comenzando a encontrar aplicaciones tangibles en robots físicos.
Esta tendencia —el cruce entre LLMs y agentes físicos— es quizás la evolución más natural, pero también la más desafiante. Se trata de traducir la capacidad abstracta del lenguaje al mundo concreto de las acciones físicas: mover, manipular, adaptarse, interactuar.
Nvidia está trabajando precisamente sobre ese punto de fricción. Con proyectos como GR00T (Generalist Robot 00T), busca crear modelos fundacionales específicos para robótica humanoide, capaces de generalizar habilidades y aplicar razonamiento adaptable a contextos no vistos.
La creación del laboratorio GEAR para el desarrollo de inteligencia corporal generalista refuerza aún más esta ambición. Y no se trata solo de entrenar modelos: Nvidia está construyendo el andamiaje computacional necesario para que esos modelos puedan ser simulados, entrenados, evaluados y, finalmente, transferidos al mundo físico.
Pero mientras Nvidia lidera desde el frente de infraestructura, China avanza rápidamente por el flanco industrial. Con más de 50 startups activas en el segmento de robots humanoides solo entre 2023 y agosto de 2024, el ecosistema chino se está convirtiendo en el competidor más serio al dominio occidental en robótica física.
Y lo hace con una aproximación pragmática: combinando cadenas de suministro eficientes en hardware con enfoques modulares en software y una adopción agresiva de modelos de IA a gran escala.
Uno de los principales retos de los fabricantes chinos ha sido históricamente la falta de un entorno de desarrollo de software robusto y estandarizado, en especial en módulos críticos como percepción, planificación y generación de acciones. Pero esto está cambiando.
Empresas como AgiBot, UBTECH, Unitree o Fourier Intelligence están desarrollando sus propios stacks integrados, muchos de ellos basados en arquitecturas cerebrales/cerebelosas duales, lo que permite combinar razonamiento abstracto con control motor fino.
La diversidad de propuestas es abrumadora. Desde el Unitree G1 con sus más de 40 motores articulares y autoaprendizaje continuo, hasta el GR-2 de Fourier con 53 grados de libertad y capacidad de carga útil real, pasando por el CyberOne de Xiaomi o los robots de propósito general de AgiBot, el hardware chino ya no es una promesa: es una realidad operativa. Y a eso se suma una ola de servicios de soporte en la nube, algoritmos propietarios y entornos de simulación cada vez más sofisticados.
Lo que está en juego no es solo la carrera por quién construye el robot más capaz, sino quién domina el stack completo: desde la percepción hasta el control, desde el modelo de lenguaje hasta el actuador, desde el entrenamiento hasta el despliegue.
Nvidia apuesta por una solución integral basada en estándares globales, colaboración con desarrolladores y simulación hiperrealista. China, en cambio, apuesta por volumen, verticalización y velocidad de iteración.
Ambos enfoques tienen ventajas claras. Nvidia proporciona interoperabilidad, escalabilidad técnica y robustez a largo plazo. El ecosistema chino ofrece velocidad, costos ajustados y una integración profunda entre investigación, fabricación y despliegue comercial.
Lo más probable es que el mercado no tenga un solo ganador, sino múltiples zonas de especialización. Algunos actores se centrarán en robots industriales, otros en asistentes personales, otros en robots para entornos hostiles, de cuidado, de educación o de logística.
Pero la plataforma que logre abstraer el mayor número de casos de uso, ofrecer un entorno robusto para entrenamiento y validación, y garantizar una implementación sin fricciones será la que capture más valor.
En ese sentido, Nvidia está jugando una partida estratégica. Con Jetson Thor apunta a convertirse en la opción predeterminada para el cómputo en robots humanoides, del mismo modo que sus GPUs lo son hoy para el entrenamiento de IA generativa. Y al hacerlo, se posiciona no como fabricante de robots, sino como el habilitador esencial de la robótica inteligente global.
La carrera está servida. Y no es solo por quién fabrica el mejor robot, sino por quién define las reglas del juego.