Formacion
«¡Te he robado la nariz!»: para enseñar física básica a una IA, trátala como a un bebé

¿Y si el futuro de la IA pasa por tratarla como un bebé? DeepMind, empresa de Google, ha creado un nuevo modelo computacional que puede representar un gran salto en el desarrollo del área de machine learning y el modo en que la IA aprende física básica.
En la actualidad, numerosas empresas utilizan machine learning o aprendizaje automático para el funcionamiento de su negocio. Esta aplicación de la inteligencia artificial se usa en multitud de operaciones ventajosas, como el análisis de grandes cantidades de datos, que luego aplican para operaciones comerciales, recomendarnos películas que nos van a gustar, detección de anomalías o clasificación de imágenes. Google, por ejemplo, es una de estas empresas: gracias a áreas como el machine learning, entre otras, se ha construido un negocio que, solo en 2021, ingresó 256,74 mil millones de dólares.
La física básica: asignatura pendiente de la IA
El machine learning es, además, una de las áreas de investigación más relevantes, hoy día, en el campo de la ciencia y la medicina. Se usa, por ejemplo, para el estudio genético del paciente, el registro de la actividad cerebral para el diagnóstico temprano de enfermedades como la epilepsia en niños o el Alzhéimer o para conocer qué efectividad tendrá un determinado tratamiento.
En este sentido, Darío Gil, director mundial de IBM Research, en una charla para la Fundación Innovación Bankinter, afirma que los sistemas de aprendizaje automático están cristalizando ahora. “Se está dando una evolución esencial que afecta a la calidad, precisión y capacidad de nuestras máquinas de aprender. Uno de los hitos más significativos en este sentido es el reconocimiento de patrones. Asimismo, las máquinas también serán capaces de aprender a través de interacciones”.
En esa misma charla, Gil muestra un vídeo en el que podemos ver cómo John Cannell, miembro del equipo de robótica con más de dos décadas de experiencia, enseña cómo empujar un objeto a través de sencillas órdenes: lo señala y, a continuación, extiende el brazo (el objeto se mueve). En ese preciso momento, el robot asocia la palabra ‘empujar’ al acto que acaba de aprender, pudiendo replicarlo posteriormente de manera instantánea.
PLATO: aprende como un bebé para convertirte en adulto

La física, sin embargo, representa un hueso duro de roer para los investigadores de inteligencia artificial y el área de machine learning. Además, resulta hasta paradójico: a día de hoy el aprendizaje automático es capaz de analizar millones de datos en un abrir y cerrar de ojos, pero es incapaz de aprender cuestiones básicas de la física (no podemos atravesar objetos, si abrimos la mano y soltamos algo, este cae al suelo, etc.). Un área de desarrollo básico para que las empresas que utilizan machine learning puedan sacarle todo el provecho a la inteligencia artificial.
En este sentido del progreso y la cristalización de los sistemas del machine learning encontramos en el reciente descubrimiento de DeepMind un nuevo paso adelante. Un equipo de investigadores de esta empresa propiedad de Google y que se dedica a desarrollos de inteligencia artificial, ha creado un modelo de computación para comprobar si la IA puede aprender física básica a través de animaciones visuales.
Precisamente así es como el ser humano aprende física básica: observando. La psicología del desarrollo afirma que, por ejemplo, un bebé reconoce el movimiento de los objetos mirándolos. A partir de esta premisa, los investigadores de DeepMind, liderados por Luis S. Piloto, han desarrollado un modelo de software llamado Physics Learning through Auto-encoding and Tracking Objects (PLATO): se les enseña a las máquinas una gran cantidad de videos con imágenes de objetos como cubos o bolas. Fueron decenas de horas en las que la máquina observaba su comportamiento, sometidos a diferentes movimientos e interacciones entre sí.
PLATO fue capaz de aprender características de la física básica gracias a la muestra de las imágenes, como la continuidad (un objeto sigue una trayectoria ininterrumpida de movimiento y no se teletransporta de manera mágica); solidez (no podemos atravesar objetos, ni ellos entre sí); y la persistencia de la forma.
A medida que aprende todo aquello que es plausible y correcto dentro de la física elemental gracias a lo que muestra el vídeo, también se confunde cuando algo se sale de la norma. PLATO fue capaz de aplicar lo aprendido en los vídeos a objetos diferentes a cubos o bolas. Esto es debido a que, en adición a las imágenes reales, también se le mostraba vídeos con sucesos fantásticos, como un objeto que desaparece por arte de magia.
Un nuevo paso en la investigación de la mente humana
Piloto asegura que “PLATO podría ser una poderosa herramienta para investigar cómo las personas aprendemos física básica”. Y conecta su descubrimiento con algo que Alan Turing ya predijo en 1950: que quizá sería más conveniente fabricar computadoras que emularan la mente de un niño, en lugar de hacer lo propio con una de adulto.
El descubrimiento de DeepMind supone un nuevo avance para las empresas que utilizan machine learning e inteligencia artificial, áreas que hasta hace poco parecía fruto de la imaginación febril de un apasionado de la ciencia ficción y que ahora, más que futuro, suena a rabioso presente.