EmbodiedAI

Embodied AI: La inteligencia artificial que sale del mundo digital para habitar el físico

Embodied AI: La inteligencia artificial que sale del mundo digital para habitar el físico

Jeremy Kahn analiza la evolución de la IA física, desde los modelos generalistas hasta la autonomía de los robots y drones, en un mundo donde la tecnología interactúa cada vez más con el entorno real

La inteligencia artificial ya no es solo software que vive en la nube: ahora está tomando forma física, interactuando con el mundo real y cambiando la forma en que trabajamos, nos movemos y vivimos. Su evolución ha dado un paso crucial: ahora, la IA no solo analiza información, sino que interactúa con el mundo físico. Esta transformación está redefiniendo la relación entre humanos y máquinas, impulsando avances en sectores como la salud, la movilidad, la industria y la logística.

El Future Trends Forum de la Fundación Innovación Bankinter ha profundizado en esta revolución, reuniendo a expertos internacionales para explorar su impacto tecnológico, económico y social. El resultado de este análisis será un informe que se publicará próximamente y que servirá como hoja de ruta para comprender los retos y oportunidades de la IA en el mundo físico.

La serie de artículos que hoy arrancamos anticipa algunas de las claves de ese informe, comenzando con la visión de uno de los expertos que han participado en el foro; Jeremy Kahn, Editor de Inteligencia Artificial en Fortune Magazine y autor del libro Mastering AI: A Survival Guide to Our Superpowered Future. Con una visión global sobre la evolución de la IA, Kahn ha seguido de cerca el desarrollo de la IA física y su potencial para transformar industrias clave. Con él, exploramos los desafíos históricos y los avances recientes que están marcando el futuro de la IA física, desde el desarrollo de modelos más generalistas hasta la evolución de la autonomía en robots, drones y vehículos.

Si quieres ver la ponencia de Jeremy Kahn, puedes hacerlo en este vídeo:

Jeremy Kahn: «Advances in AI» #EmbodiedAI

Los ciclos de hype y estancamiento de la IA física

La inteligencia artificial ha evolucionado a través de ciclos de entusiasmo y decepción, y la historia de la IA física no es una excepción. En 2005, el DARPA Grand Challenge generó grandes expectativas sobre los vehículos autónomos, con la creencia de que en una década estarían en todas las carreteras. Sin embargo, la realidad ha sido mucho más compleja. La autonomía total sigue siendo un desafío y su adopción está siendo más lenta de lo previsto.

En 2016, la atención se desplazó hacia la IA generativa con el éxito de DeepMind y AlphaGo, así como con la aparición del paper Attention Is All You Need en 2017, que sentó las bases de los transformers. Durante años, la IA física ha quedado en segundo plano mientras el mundo se enfocaba en los modelos de lenguaje como ChatGPT.

Ahora, según Kahn, la IA física está resurgiendo con fuerza gracias a nuevas estrategias en su desarrollo.

El cambio de paradigma en IA física: de múltiples modelos a modelos generalistas

Históricamente, la IA física operaba con una combinación de modelos específicos. Cada uno de estos modelos cumplía una función independiente: percepción, toma de decisiones y mapeo. Este enfoque, aunque efectivo en entornos controlados, dificultaba la integración y la escalabilidad. Sin embargo, en los últimos años, la tendencia ha cambiado hacia modelos unificados, capaces de combinar múltiples capacidades en una sola red neuronal.

Los modelos de «mundo» y su impacto

Uno de los avances más significativos es la implementación de world models o modelos de mundo. Estos modelos buscan replicar una representación interna del entorno que permita a los sistemas de IA entender y actuar de manera más eficiente. En lugar de separar percepción y decisión, la idea es fusionarlas en un único modelo entrenado para interpretar el mundo y tomar decisiones en función de esa comprensión.

Ejemplos destacados incluyen:

  • Wayve con su modelo Gaia, aplicado a coches autónomos.
  • World Labs, fundada en 2024 por la reconocida investigadora en inteligencia artificial Fei-Fei Li, que busca desarrollar modelos de mundo en 3D y que a día de hoy ya es una startup unicornio.

El interés en estos modelos no es casualidad; con el desarrollo de estos modelos unificados, la IA física podría alcanzar un punto de inflexión.

Pero la clave para que estos modelos sean realmente efectivos no está solo en la representación del entorno, sino en cómo pueden trasladarse a diferentes aplicaciones sin necesidad de empezar desde cero. Aquí es donde entran en juego los modelos fundacionales en robótica.

Modelos fundacionales en robótica: el «GPT» de los robots

La evolución hacia modelos fundacionales en robótica sigue un camino similar al de los Large Language Models (LLMs) en el procesamiento del lenguaje. Así como los LLMs han revolucionado la generación de texto, los modelos fundacionales en robótica buscan proporcionar capacidades generalistas que puedan aplicarse a múltiples tipos de robots sin necesidad de entrenamiento adicional.

Estos modelos fundacionales se benefician directamente de los avances en modelos de mundo. Mientras que un modelo de mundo permite a un sistema de IA construir una comprensión global del entorno, un modelo fundacional utiliza ese conocimiento para actuar en diferentes escenarios y con distintos tipos de hardware. En otras palabras, los modelos de mundo aportan la percepción y el contexto, mientras que los modelos fundacionales proporcionan la capacidad de ejecución flexible y generalista.

Empresas como Physical Intelligence y Covariant están desarrollando modelos capaces de operar diferentes robots con una mínima personalización. Esta aproximación permitiría desplegar sistemas de IA física en distintos entornos sin programaciones específicas, reduciendo costes y acelerando la adopción. La combinación de modelos de mundo y modelos fundacionales promete un futuro donde los robots podrán adaptarse rápidamente a nuevos entornos y tareas sin necesidad de entrenamiento extensivo, acercándonos a un punto de inflexión en la evolución de la IA física.

Los drones autónomos: el avance más radical de la IA física

Otro campo que está evolucionando rápidamente es el de los drones autónomos, una de las aplicaciones más avanzadas de la inteligencia artificial física. Tradicionalmente dependientes de operadores humanos o GPS, estos dispositivos están alcanzando un nivel de independencia sin precedentes, con implicaciones clave tanto en el ámbito militar como en el comercial.

En la guerra de Ucrania, los drones con creciente autonomía han marcado un hito en la aplicación de la IA en conflictos bélicos, redefiniendo las estrategias en el campo de batalla. En otros escenarios, como Israel, se han desarrollado modelos que mantienen la intervención humana en la toma de decisiones finales para evitar errores críticos. Esta evolución plantea un debate sobre los límites éticos y operativos de la IA en entornos de alto riesgo.

Fuera del ámbito militar, el potencial de los drones autónomos se está desplegando en sectores clave como la exploración submarina, el rescate y la explotación de recursos naturales. Empresas de diversos sectores están utilizando estos dispositivos para cartografiar los océanos, descubrir naufragios y realizar inspecciones en plataformas petroleras con una eficiencia sin precedentes. Estas innovaciones están impulsadas por la necesidad de superar la dependencia del GPS y mejorar la navegación basada en sensores avanzados y visión artificial.

El avance de los drones autónomos es un claro ejemplo de cómo la inteligencia artificial física está transformando industrias y redefiniendo las capacidades de las máquinas. Su desarrollo continuará marcando el futuro de sectores estratégicos, desde la seguridad y la logística hasta la exploración de entornos inexplorados.

¿Dónde encaja el humano en la IA física?

Kahn plantea una cuestión clave: ¿la IA física necesita un cuerpo propio o puede habitar el cuerpo humano? La respuesta no es sencilla, pero la tecnología avanza en direcciones que desafían esta dicotomía. Hoy en día, existen dispositivos que convierten al propio humano en la interfaz de la IA.

Las gafas inteligentes con IA integrada, como las Ray-Ban Meta, están diseñadas para mejorar la percepción del entorno y ofrecer asistencia en tiempo real. También han surgido dispositivos vestibles (wearables) con IA generativa, como los AI Pins, que actúan como asistentes personales avanzados sin necesidad de pantallas. Aún más disruptivas son las interfaces cerebro-computadora, que permiten controlar dispositivos con el pensamiento, un paso más hacia la fusión entre humanos y tecnología.

Este concepto de «Embodied AI» por tanto, no solo abarca robots autónomos, sino también sistemas donde el cuerpo humano se convierte en la plataforma física de la inteligencia artificial. A medida que estas tecnologías avanzan, la frontera entre biología y tecnología se vuelve cada vez más difusa, redefiniendo el papel del humano en la evolución de la IA física.

¿Es el «momento ChatGPT» para la IA física?

Kahn plantea que la IA generativa vivió su gran momento en 2022 con ChatGPT, pero la IA física aún no ha tenido su «explosión mediática».

Algunas señales indican que ese momento podría estar cerca:

  • OpenAI, tras abandonar la robótica en 2019, ha reiniciado su programa de IA física.
  • Empresas como NVIDIA y Tesla están invirtiendo masivamente en modelos de mundo para robots.
  • El uso de lenguaje natural facilitará la interacción con robots, reduciendo la necesidad de programación especializada.

En los próximos años, podríamos ver un «momento ChatGPT» para robots, con modelos más generalistas y versátiles.

En definitiva, la evolución de la IA física está acelerándose gracias a tres grandes tendencias:

  • De modelos separados a modelos generalistas
  • Drones y sistemas autónomos con mayor independencia
  • Interfaces más naturales entre humanos y máquinas

Kahn deja claro que el avance de la IA física es una transformación en la forma en que la humanidad interactúa con la tecnología.

La gran pregunta no es si la IA física cambiará nuestra forma de interactuar con el mundo, es ¿Hasta qué punto queremos delegar tareas y decisiones críticas a máquinas cada vez más autónomas?

¿Estamos listos para compartir nuestro espacio con una inteligencia que, además de procesar datos, también actúa?

No te pierdas la ponencia de Jeremy Kahn.

Te puede interesar

Materiales del futuro: diseñados por algoritmos, pensados para la sostenibilidad 

Materiales del futuro: diseñados por algoritmos, pensados para la sostenibilidadÂ[...]

La innovación en materiales ya no se basa únicamente en la extracción de recursos naturales: ahora se diseñan a medi[…]

Leer más
De  ITER a  IFMIF‑DONES: los grandes proyectos que cambiarán la industria europea 

De  ITER a  IFMIF‑DONES: los grandes proyectos que cambiarán la industria e[...]

Descubrimos las infraestructuras científicas de vanguardia que posicionan a Europa en la carrera por la energía del fu[…]

Leer más
Robots que entienden: el desafío de la interacción humano-máquina 

Robots que entienden: el desafío de la interacción humano-máquina 

Descubrimos la evolución de los modelos de lenguaje e IA física aplicada a la robótica cognitiva y sus implicaciones […]

Leer más

Últimas noticias

Materiales del futuro: diseñados por algoritmos, pensados para la sostenibilidad 

Materiales del futuro: diseñados por algoritmos, pensados para la sostenibilidadÂ[...]

La innovación en materiales ya no se basa únicamente en la extracción de recursos naturales: ahora se diseñan a medi[…]

Leer más
Interfaces inteligentes: el aula del futuro se diseña con IA

Interfaces inteligentes: el aula del futuro se diseña con IA

Cómo la inteligencia artificial y las neurotecnologías están transformando la educación sin perder la centralidad de[…]

Leer más
Más allá del carbono: sistemas resilientes para un planeta en tensión

Más allá del carbono: sistemas resilientes para un planeta en tensión

Abandonar el paradigma fragmentado del «menos carbono» para adoptar una mirada sistémica no es solo deseable: es impres[…]

Leer más