EmbodiedAI
Embodied AI: La inteligencia artificial que sale del mundo digital para habitar el fÃsico

Jeremy Kahn analiza la evolución de la IA fÃsica, desde los modelos generalistas hasta la autonomÃa de los robots y drones, en un mundo donde la tecnologÃa interactúa cada vez más con el entorno real
La inteligencia artificial ya no es solo software que vive en la nube: ahora está tomando forma fÃsica, interactuando con el mundo real y cambiando la forma en que trabajamos, nos movemos y vivimos. Su evolución ha dado un paso crucial: ahora, la IA no solo analiza información, sino que interactúa con el mundo fÃsico. Esta transformación está redefiniendo la relación entre humanos y máquinas, impulsando avances en sectores como la salud, la movilidad, la industria y la logÃstica.
El Future Trends Forum de la Fundación Innovación Bankinter ha profundizado en esta revolución, reuniendo a expertos internacionales para explorar su impacto tecnológico, económico y social. El resultado de este análisis será un informe que se publicará próximamente y que servirá como hoja de ruta para comprender los retos y oportunidades de la IA en el mundo fÃsico.
La serie de artÃculos que hoy arrancamos anticipa algunas de las claves de ese informe, comenzando con la visión de uno de los expertos que han participado en el foro; Jeremy Kahn, Editor de Inteligencia Artificial en Fortune Magazine y autor del libro Mastering AI: A Survival Guide to Our Superpowered Future. Con una visión global sobre la evolución de la IA, Kahn ha seguido de cerca el desarrollo de la IA fÃsica y su potencial para transformar industrias clave. Con él, exploramos los desafÃos históricos y los avances recientes que están marcando el futuro de la IA fÃsica, desde el desarrollo de modelos más generalistas hasta la evolución de la autonomÃa en robots, drones y vehÃculos.
Si quieres ver la ponencia de Jeremy Kahn, puedes hacerlo en este vÃdeo:
Jeremy Kahn: «Advances in AI» #EmbodiedAI
Los ciclos de hype y estancamiento de la IA fÃsica
La inteligencia artificial ha evolucionado a través de ciclos de entusiasmo y decepción, y la historia de la IA fÃsica no es una excepción. En 2005, el DARPA Grand Challenge generó grandes expectativas sobre los vehÃculos autónomos, con la creencia de que en una década estarÃan en todas las carreteras. Sin embargo, la realidad ha sido mucho más compleja. La autonomÃa total sigue siendo un desafÃo y su adopción está siendo más lenta de lo previsto.
En 2016, la atención se desplazó hacia la IA generativa con el éxito de DeepMind y AlphaGo, asà como con la aparición del paper Attention Is All You Need en 2017, que sentó las bases de los transformers. Durante años, la IA fÃsica ha quedado en segundo plano mientras el mundo se enfocaba en los modelos de lenguaje como ChatGPT.
Ahora, según Kahn, la IA fÃsica está resurgiendo con fuerza gracias a nuevas estrategias en su desarrollo.
El cambio de paradigma en IA fÃsica: de múltiples modelos a modelos generalistas
Históricamente, la IA fÃsica operaba con una combinación de modelos especÃficos. Cada uno de estos modelos cumplÃa una función independiente: percepción, toma de decisiones y mapeo. Este enfoque, aunque efectivo en entornos controlados, dificultaba la integración y la escalabilidad. Sin embargo, en los últimos años, la tendencia ha cambiado hacia modelos unificados, capaces de combinar múltiples capacidades en una sola red neuronal.
Los modelos de «mundo» y su impacto
Uno de los avances más significativos es la implementación de world models o modelos de mundo. Estos modelos buscan replicar una representación interna del entorno que permita a los sistemas de IA entender y actuar de manera más eficiente. En lugar de separar percepción y decisión, la idea es fusionarlas en un único modelo entrenado para interpretar el mundo y tomar decisiones en función de esa comprensión.
Ejemplos destacados incluyen:
- Wayve con su modelo Gaia, aplicado a coches autónomos.
- World Labs, fundada en 2024 por la reconocida investigadora en inteligencia artificial Fei-Fei Li, que busca desarrollar modelos de mundo en 3D y que a dÃa de hoy ya es una startup unicornio.
El interés en estos modelos no es casualidad; con el desarrollo de estos modelos unificados, la IA fÃsica podrÃa alcanzar un punto de inflexión.
Pero la clave para que estos modelos sean realmente efectivos no está solo en la representación del entorno, sino en cómo pueden trasladarse a diferentes aplicaciones sin necesidad de empezar desde cero. Aquà es donde entran en juego los modelos fundacionales en robótica.
Modelos fundacionales en robótica: el «GPT» de los robots
La evolución hacia modelos fundacionales en robótica sigue un camino similar al de los Large Language Models (LLMs) en el procesamiento del lenguaje. Asà como los LLMs han revolucionado la generación de texto, los modelos fundacionales en robótica buscan proporcionar capacidades generalistas que puedan aplicarse a múltiples tipos de robots sin necesidad de entrenamiento adicional.
Estos modelos fundacionales se benefician directamente de los avances en modelos de mundo. Mientras que un modelo de mundo permite a un sistema de IA construir una comprensión global del entorno, un modelo fundacional utiliza ese conocimiento para actuar en diferentes escenarios y con distintos tipos de hardware. En otras palabras, los modelos de mundo aportan la percepción y el contexto, mientras que los modelos fundacionales proporcionan la capacidad de ejecución flexible y generalista.
Empresas como Physical Intelligence y Covariant están desarrollando modelos capaces de operar diferentes robots con una mÃnima personalización. Esta aproximación permitirÃa desplegar sistemas de IA fÃsica en distintos entornos sin programaciones especÃficas, reduciendo costes y acelerando la adopción. La combinación de modelos de mundo y modelos fundacionales promete un futuro donde los robots podrán adaptarse rápidamente a nuevos entornos y tareas sin necesidad de entrenamiento extensivo, acercándonos a un punto de inflexión en la evolución de la IA fÃsica.
Los drones autónomos: el avance más radical de la IA fÃsica
Otro campo que está evolucionando rápidamente es el de los drones autónomos, una de las aplicaciones más avanzadas de la inteligencia artificial fÃsica. Tradicionalmente dependientes de operadores humanos o GPS, estos dispositivos están alcanzando un nivel de independencia sin precedentes, con implicaciones clave tanto en el ámbito militar como en el comercial.
En la guerra de Ucrania, los drones con creciente autonomÃa han marcado un hito en la aplicación de la IA en conflictos bélicos, redefiniendo las estrategias en el campo de batalla. En otros escenarios, como Israel, se han desarrollado modelos que mantienen la intervención humana en la toma de decisiones finales para evitar errores crÃticos. Esta evolución plantea un debate sobre los lÃmites éticos y operativos de la IA en entornos de alto riesgo.
Fuera del ámbito militar, el potencial de los drones autónomos se está desplegando en sectores clave como la exploración submarina, el rescate y la explotación de recursos naturales. Empresas de diversos sectores están utilizando estos dispositivos para cartografiar los océanos, descubrir naufragios y realizar inspecciones en plataformas petroleras con una eficiencia sin precedentes. Estas innovaciones están impulsadas por la necesidad de superar la dependencia del GPS y mejorar la navegación basada en sensores avanzados y visión artificial.
El avance de los drones autónomos es un claro ejemplo de cómo la inteligencia artificial fÃsica está transformando industrias y redefiniendo las capacidades de las máquinas. Su desarrollo continuará marcando el futuro de sectores estratégicos, desde la seguridad y la logÃstica hasta la exploración de entornos inexplorados.
¿Dónde encaja el humano en la IA fÃsica?
Kahn plantea una cuestión clave: ¿la IA fÃsica necesita un cuerpo propio o puede habitar el cuerpo humano? La respuesta no es sencilla, pero la tecnologÃa avanza en direcciones que desafÃan esta dicotomÃa. Hoy en dÃa, existen dispositivos que convierten al propio humano en la interfaz de la IA.
Las gafas inteligentes con IA integrada, como las Ray-Ban Meta, están diseñadas para mejorar la percepción del entorno y ofrecer asistencia en tiempo real. También han surgido dispositivos vestibles (wearables) con IA generativa, como los AI Pins, que actúan como asistentes personales avanzados sin necesidad de pantallas. Aún más disruptivas son las interfaces cerebro-computadora, que permiten controlar dispositivos con el pensamiento, un paso más hacia la fusión entre humanos y tecnologÃa.
Este concepto de «Embodied AI» por tanto, no solo abarca robots autónomos, sino también sistemas donde el cuerpo humano se convierte en la plataforma fÃsica de la inteligencia artificial. A medida que estas tecnologÃas avanzan, la frontera entre biologÃa y tecnologÃa se vuelve cada vez más difusa, redefiniendo el papel del humano en la evolución de la IA fÃsica.
¿Es el «momento ChatGPT» para la IA fÃsica?
Kahn plantea que la IA generativa vivió su gran momento en 2022 con ChatGPT, pero la IA fÃsica aún no ha tenido su «explosión mediática».
Algunas señales indican que ese momento podrÃa estar cerca:
- OpenAI, tras abandonar la robótica en 2019, ha reiniciado su programa de IA fÃsica.
- Empresas como NVIDIA y Tesla están invirtiendo masivamente en modelos de mundo para robots.
- El uso de lenguaje natural facilitará la interacción con robots, reduciendo la necesidad de programación especializada.
En los próximos años, podrÃamos ver un «momento ChatGPT» para robots, con modelos más generalistas y versátiles.
En definitiva, la evolución de la IA fÃsica está acelerándose gracias a tres grandes tendencias:
- De modelos separados a modelos generalistas
- Drones y sistemas autónomos con mayor independencia
- Interfaces más naturales entre humanos y máquinas
Kahn deja claro que el avance de la IA fÃsica es una transformación en la forma en que la humanidad interactúa con la tecnologÃa.
La gran pregunta no es si la IA fÃsica cambiará nuestra forma de interactuar con el mundo, es ¿Hasta qué punto queremos delegar tareas y decisiones crÃticas a máquinas cada vez más autónomas?
¿Estamos listos para compartir nuestro espacio con una inteligencia que, además de procesar datos, también actúa?
No te pierdas la ponencia de Jeremy Kahn.