EmbodiedAI
IA fÃsica y sentido común: ¿es el cuerpo la clave para la inteligencia artificial general?

La inteligencia artificial ha logrado avances sorprendentes, pero sigue sin resolver uno de sus problemas fundamentales: la falta de sentido común. Ramón López de Mántaras analiza por qué la IA necesita un cuerpo fÃsico para entender el mundo y cómo la Embodied AI podrÃa ser la clave para alcanzar una inteligencia más avanzada
La inteligencia artificial está en plena transformación. De ser un sistema puramente digital basado en datos, está evolucionando hacia modelos que interactúan con el mundo fÃsico, lo que abre nuevas posibilidades y desafÃos en múltiples sectores. En este contexto, el Future Trends Forum de la Fundación Innovación Bankinter ha reunido a expertos internacionales para analizar el impacto y el futuro de la IA fÃsica (Embodied AI). Durante el foro, se han abordado las oportunidades y retos de esta tecnologÃa, desde su aplicación en la automatización y la robótica hasta su influencia en la comprensión del entorno y la toma de decisiones.
En esta serie de artÃculos, hemos explorado las perspectivas de destacados especialistas como Jeremy Kahn y Antonio Damasio sobre el futuro de la IA fÃsica. Ahora, nos adentramos en la visión de Ramón López de Mántaras, quien analiza una de las grandes limitaciones de la inteligencia artificial actual: su falta de sentido común y su incapacidad para comprender el mundo como lo hacen los humanos.
Puedes ver la ponencia completa de Ramón López de Mántaras en el Future Trends Forum aquÃ:
¿Puede la IA entender el mundo como los humanos?
La inteligencia artificial ha alcanzado niveles impresionantes de desempeño en tareas especÃficas, desde el procesamiento del lenguaje natural hasta la visión por computadora y la toma de decisiones en entornos definidos. Sin embargo, persiste una diferencia fundamental entre la forma en que los humanos entienden el mundo y cómo lo hace la IA. Ramón López de Mántaras, Profesor Investigador Emérito del CSIC y exdirector del Instituto de Investigación en Inteligencia Artificial del CSIC, advierte que la IA carece de un elemento esencial en la cognición humana: el conocimiento de sentido común.
El sentido común permite a los humanos interpretar la realidad sin necesidad de datos previos explÃcitos. No necesitamos procesar millones de ejemplos para saber que, si soltamos un vaso en el aire, caerá al suelo y probablemente se romperá. Esta capacidad surge de la combinación de nuestra experiencia directa con el entorno y la integración de múltiples fuentes de información sensorial. En cambio, los sistemas de IA dependen completamente de los datos con los que han sido entrenados y carecen de un entendimiento real de las relaciones causales entre los eventos del mundo.
López de Mántaras subraya que el problema no es solo técnico, sino filosófico y epistemológico. Mientras que los humanos construimos nuestro conocimiento a través de la interacción con el entorno, la IA se basa en correlaciones estadÃsticas dentro de un conjunto de datos. Esto genera limitaciones evidentes. Un modelo de lenguaje puede generar respuestas sofisticadas, pero si se le pregunta sobre una situación fuera de su entrenamiento, es probable que falle estrepitosamente o que simplemente produzca una respuesta plausible pero incorrecta.
El investigador menciona que esta falta de comprensión se vuelve crÃtica en aplicaciones donde la IA debe operar en entornos no estructurados. Un humano puede inferir rápidamente que, si hay agua derramada en el suelo, es peligroso caminar sobre ella. Un robot con IA tradicional, en cambio, necesitarÃa que se le programara especÃficamente para reconocer ese peligro o haber sido entrenado con datos suficientes que incluyan casos similares. La capacidad de generalización en la IA sigue siendo un reto no resuelto.
Además, López de Mántaras resalta que la IA actual no puede construir conocimiento de manera autónoma. En los humanos, el aprendizaje no se basa solo en la acumulación de datos, sino en la capacidad de experimentar, abstraer conceptos y aplicar lo aprendido a nuevas situaciones. En cambio, los sistemas de IA actuales no pueden hacer descubrimientos por sà mismos ni generar hipótesis basadas en la experiencia directa. Solo pueden extrapolar patrones de datos previos, lo que limita su capacidad para responder de manera flexible ante situaciones inéditas.
Para superar estas limitaciones, el investigador propone que la IA debe avanzar hacia sistemas que integren un modelo del mundo basado en la interacción fÃsica con su entorno. Sin esta capacidad, la IA seguirá siendo una herramienta poderosa, pero fundamentalmente diferente de la inteligencia humana.
El problema del sentido común en la IA
Los grandes modelos de lenguaje han generado la ilusión de que la IA comprende el mundo. Sin embargo, como explica López de Mántaras, estos sistemas se limitan a recombinar patrones lingüÃsticos aprendidos de grandes volúmenes de texto, sin una verdadera capacidad de razonamiento. Este fenómeno, conocido como data contamination, pone en entredicho si estos modelos realmente «piensan» o simplemente repiten información.
El investigador menciona estudios recientes que demuestran que cuando se enfrenta a preguntas sobre eventos hipotéticos no incluidos en su entrenamiento, el rendimiento de la IA cae drásticamente. Esto sugiere que los modelos actuales no tienen un conocimiento estructurado del mundo, sino que dependen de la presencia de patrones en sus datos de entrenamiento.
Este problema, conocido como el problema de la medición en IA, ha llevado a expertos como Demis Hassabis y Yann LeCun a reconocer que los modelos actuales no son el camino hacia una inteligencia artificial general. En su lugar, López de Mántaras propone una alternativa: integrar a la IA en el mundo fÃsico. Otra vÃa que ha cobrado interés en los últimos años es el desarrollo de arquitecturas neuro-simbólicas, que combinan el poder del aprendizaje automático con enfoques simbólicos tradicionales para mejorar la capacidad de razonamiento de la IA. Estas arquitecturas buscan integrar representación del conocimiento y aprendizaje adaptativo, permitiendo que los sistemas no solo reconozcan patrones, sino que también razonen sobre ellos. Esta fusión de enfoques podrÃa ayudar a superar las limitaciones de los modelos puramente conexionistas y acercar la IA a una verdadera comprensión del mundo.
Embodied AI: el papel del cuerpo en la inteligencia
La idea de que la inteligencia requiere una interacción fÃsica con el entorno no es nueva. John Locke, en el siglo XVII, afirmaba que el conocimiento humano se basa en la experiencia sensorial, lo que implica que sin una interacción directa con el mundo, no es posible desarrollar una comprensión real. Esta visión fue reforzada siglos después por Maurice Merleau-Ponty, uno de los principales exponentes de la fenomenologÃa, quien subrayó que el cuerpo no es solo un objeto en el mundo, sino el medio a través del cual lo comprendemos. En un sentido similar, Ludwig Wittgenstein planteó que «los lÃmites de mi lenguaje son los lÃmites de mi mundo», sugiriendo que nuestra capacidad de conceptualizar la realidad está directamente vinculada a la forma en que la experimentamos.
Para que la IA alcance una verdadera comprensión del mundo, debe contar con un cuerpo multisensorial que le permita interactuar con su entorno y aprender de forma similar a los humanos. Inspirado en esta idea, López de Mántaras desarrolló un proyecto en el que un robot humanoide aprendÃa relaciones causa-efecto al tocar un teclado y escuchar los sonidos resultantes. Este estudio demostró que los robots pueden adquirir conocimiento estructurado sobre el mundo a partir de la interacción fÃsica, un principio fundamental del aprendizaje humano según Jean Piaget.
Este concepto se alinea con lo planteado en otras ponencias del Future Trends Forum. Jeremy Kahn analizó cómo los modelos de mundo permiten a la IA interpretar su entorno y actuar con mayor autonomÃa. Antonio Damasio fue más allá, señalando que sin una base biológica, la IA no puede desarrollar conciencia ni emociones genuinas.
¿Es la IA fÃsica el camino hacia la inteligencia general?
El concepto de inteligencia artificial general (AGI, por sus siglas en inglés) ha sido una meta ambiciosa en el campo de la IA desde sus inicios. Se refiere a una inteligencia artificial que no solo sobresalga en tareas especÃficas, sino que pueda razonar, adaptarse y aprender de manera flexible en distintos contextos, igual que un ser humano. Hasta ahora, el progreso en IA ha sido impresionante, pero limitado a dominios bien definidos. Los sistemas actuales pueden derrotar a los mejores jugadores de ajedrez o generar texto coherente, pero siguen sin ser capaces de extrapolar conocimientos a nuevos escenarios o entender el mundo con la profundidad y flexibilidad de la mente humana.
Ramón López de Mántaras sostiene que la IA fÃsica podrÃa ser un paso fundamental en este camino, ya que permitirÃa a las máquinas desarrollar conocimiento a través de la experiencia directa con el mundo. Un ejemplo de este enfoque es PLATO (Physics Learning through Auto-encoding and Tracking Objects), un sistema desarrollado por DeepMind que aprende relaciones causales básicas observando vÃdeos, inspirado en la psicologÃa del desarrollo infantil. En experimentos, PLATO ha sido capaz de inferir conceptos como la persistencia de los objetos sin necesidad de entrenamiento con etiquetas explÃcitas. Este tipo de avances sugiere que dotar a la IA de una capacidad perceptiva similar a la de los humanos en su infancia podrÃa ser clave para acercarnos a una inteligencia más generalizada.
Este enfoque presenta una diferencia clave con respecto a los modelos actuales de IA. Mientras que los sistemas basados en redes neuronales dependen enteramente de los datos con los que han sido entrenados, una IA fÃsica equipada con sensores avanzados y capacidades de interacción podrÃa generar su propio conocimiento a medida que experimenta el mundo. Esto la acercarÃa a un aprendizaje más similar al humano, donde la experiencia directa moldea la comprensión y la toma de decisiones.
No obstante, López de Mántaras advierte que este camino no está exento de obstáculos. La construcción de robots autónomos con capacidad de aprendizaje generalizado aún está en sus primeras etapas. Aunque hay avances en robótica y aprendizaje por refuerzo, la integración de múltiples fuentes de información sensorial y su traducción en conocimiento estructurado sigue siendo un reto abierto. Además, la IA fÃsica introduce problemas adicionales en términos de hardware, consumo energético y adaptación a entornos complejos y dinámicos.
Otro desafÃo crÃtico es el desarrollo de arquitecturas de IA que permitan combinar información procedente de diversas experiencias y aplicarla de manera flexible en situaciones novedosas. Actualmente, la mayorÃa de los sistemas de IA fÃsica se diseñan para tareas especÃficas, como la manipulación de objetos o la navegación en entornos conocidos. Para acercarse a la inteligencia general, estos sistemas necesitarÃan una capacidad de abstracción y transferencia de conocimientos que hoy sigue siendo limitada.
López de Mántaras concluye que, aunque la IA fÃsica representa un avance importante hacia la inteligencia artificial general, todavÃa estamos lejos de alcanzar un sistema que pueda igualar la versatilidad cognitiva de los humanos. Sin embargo, explorar esta vÃa es fundamental para superar las limitaciones de los modelos actuales y avanzar hacia una IA que no solo procese datos, sino que también entienda el mundo a través de la experiencia.