Akademia
Aplicando machine learning para innovar: entrevista a David Barbas (Akademia)

En la Fundación Innovación Bankinter estamos muy orgullosos de los alumni que han participado en nuestro programa Akademia. El programa cuenta con un diseño e implementación que lo hace único: desde el proceso de selección de alumnos, pasando por el contenido de las sesiones y acabando en los docentes que las imparten. Esto hace que […]
En la Fundación Innovación Bankinter estamos muy orgullosos de los alumni que han participado en nuestro programa Akademia.
El programa cuenta con un diseño e implementación que lo hace único: desde el proceso de selección de alumnos, pasando por el contenido de las sesiones y acabando en los docentes que las imparten. Esto hace que los alumni sean personas con pasión por la innovación y con muchas ganas de aportar nuevos puntos de vista y nuevas soluciones en sus respectivos campos.
En esta ocasión entrevistamos a David Barbas, graduado en Informática por la UPV y Máster en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital, y está especializado en aprendizaje automático –machine learning-.
David es un entusiasta del aprendizaje automático con especial interés en las aplicaciones de visión por ordenador. Lo que más le apasiona es el potencial de los últimos avances en aprendizaje automático para crear soluciones innovadoras a problemas del mundo real. Trabaja como Ingeniero de Machine Learning en NUTAI, empresa de ingeniería dedicada al diseño e instalación de sistemas de automatización industrial.
A continuación, reproducimos la entrevista que mantuvimos con David:
Tras tu paso por Akademia, ¿cambió tu manera de ver la innovación y cómo llevarla a cabo?
Creo que, tras hacer el curso de Academia, puedo decir que te abre la mente. Cuando acababa las sesiones me sentía muy motivado y muy satisfecho. Akademia te aporta puntos de vista diferentes y muy prácticos en comparación con lo que ves durante la carrera, que está más enfocado a la investigación: aprendí que la innovación es una cosa práctica, que todos podemos aprender y en la que todos podemos trabajar.
¿Qué es lo que más te gustó del programa y por qué?
Lo que más me gustó fue el claustro de profesores y ponentes, profesionales muy especializados y con mucha experiencia. En particular, me gustó mucho cómo Fernando Alfaro nos abría la mente enseñándonos los pilares de la innovación.
Cuando yo cursé Akademia fue justo durante la pandemia del COVID y lo hicimos en remoto. Lo bueno es que nos juntamos estudiantes de varias universidades de distintas carreras y fue una experiencia muy enriquecedora.
¿Cómo te has formado en el campo de la inteligencia artificial y en particular en machine learning?
Empecé a formarme en inteligencia artificial (IA) cuando cursé en la carrera la especialización en Informática de Computación, muy relacionada con algoritmia y machine learning. Luego he ido haciendo distintos cursos y he participado en algunas competiciones de Kaggle. Es una plataforma que recomiendo para aprender: permite competir en habilidades de modelado predictivo, explorar y publicar conjuntos de datos, y aprender nuevas habilidades a través de desafíos y micro cursos.
El primer proyecto grande que hice de machine learning fue mi Trabajo Final de Grado (TFG), sobre detección de imágenes falsas y noticias falsas. Tras ello, cursé el Máster, donde aprendí temas más avanzados de IA.
A los pocos meses de acabar el Máster, decidí enfocar mi carrera profesional para convertirme en experto en machine learning y curse un Bootcamp de Google especializado en TensorFlow, que es la biblioteca de código abierto desarrollada por Google para el aprendizaje automático y las redes neuronales profundas, que proporciona una suite de herramientas y funciones para la creación y entrenamiento de modelos de inteligencia artificial.
¿Qué proyectos de IA en los que has participado te han llamado más la atención y por qué?
Para empezar, Akademia me gustó mucho. El enfoque es muy distinto al de Kaggle, por ejemplo, porque en Kaggle normalmente te facilitan los datos y es cuestión de jugar con ellos hasta dar con la solución. En Akademia eres tú el que tiene que buscar los datos relevantes de fuentes públicas para dar con la solución al problema planteado.
Por otro lado, en el Bootcamp de Google participé en una competición que era para detección de coágulos de sangre que producen embolias. Fue muy interesante porque se trataba de analizar imágenes muy grandes donde las redes neuronales tienen que analizar detalles muy pequeños.
Ahora me encuentro desarrollando un proyecto personal con unos compañeros para la prevenión de incendios: el enfoque que le damos es parecido al caso de Akademia, es decir, beber de información pública. Además, queremos combinar estos datos con nueva información recogida con drones para predecir la probabilidad de incendio, analizar zonas de riesgo potencial y prevenir los incendios dando alertas en una fase muy temprana. De esa forma, dotamos de recursos a las autoridades pertinentes para que se aumente la vigilancia y poda en las zonas de mayor riesgo. Aquí podéis conocer un poco más en detalle el proyecto.
En mi trabajo estoy en un proyecto de detección de defectos en chapa metálica para la industria automovilística. Se trata de detectar defectos lo antes posible en la línea de producción, para ahorrar los costes asociados a la detección tardía.
¿En qué campos tienen más potencial las soluciones de machine learning?
En general, todas las aplicaciones que se están desarrollando de machine learning son muy dependientes de los datos: se necesitan muchos datos, muy variados y que sean fiables. Así que, para que una solución triunfe, es fundamental el proceso de recogida de datos. En este aspecto, las soluciones IoT pueden aportar ventajas competitivas para el entrenamiento de las redes neuronales en soluciones de machine learning en los campos de Agritech y de Sostenibilidad y Medioambiente.
En otro orden de cosas, la inteligencia artificial generativa como ChatGPT es tan impresionante porque ha sido entrenado con millones y millones de datos de Internet. Mi conclusión es que los datos (tamaño de la muestra, calidad y fiabilidad) son la clave para realizar las aplicaciones más innovadoras y disruptivas de machine learning.
¿Dónde ves las oportunidades profesionales dentro de machine learning?
Dentro de los proyectos de machine learning, te puedes especializar en diversos nichos. Hay perfiles profesionales de matemáticas y física, que están más enfocados en los modelos matemáticos y perfiles de ingenieros de software, más enfocados en la programación y desarrollo. Para dedicarte a machine learning, lo mejor es estar en un equipo multidisciplinar. Dependiendo del campo al que te dediques, puede ser más fácil o difícil destacar. Para desarrollar algoritmos de visión, por ejemplo, te enfrentas a muchos investigadores con mucha experiencia y recorrido, y es difícil destacar. En cambio, en el campo de las aplicaciones prácticas -médicas, de sostenibilidad o de Industria 4.0-, es más fácil abordar las soluciones y es más fácil poder destacar. Un ejemplo claro es la agricultura de precisión donde, mediante recogida de datos satelitales y de dispositivos IoT, puedes diseñar algoritmos para optimizar cultivos o para predecir cosechas.
¿Qué modelos de machine learning son mejores en función de lo que queramos resolver?
La clave es cuál es el problema que quieres resolver y cuántos datos tienes. Por norma general, si no tienes muchos datos, se suele ir a machine learning tradicional, esto es, regresiones y algoritmos SVMs (Support Vector Machine) o algoritmos K-means.
Si dispones de muchos datos, vas a deep learning. Por ejemplo, para aplicaciones de visión por computador y análisis de imágenes y vídeos, se utilizan redes neuronales convolucionales. Y para generación de texto, análisis de texto y traducción, el estado del arte son los Transformers. Por su parte, para la predicción de secuencias se utilizan redes neuronales recurrentes, como es el caso de aplicaciones de reconocimiento del habla. En todos estos casos, insistiendo en lo que dije antes, es fundamental disponer de muchos datos, fiables, de calidad y bien etiquetados.
Otro campo muy interesante es el de las redes adversariales, que se suelen utilizar para generar datos sintéticos. Un caso reciente de redes adversariales que ha tenido mucha repercusión es en la generación de radiografías de pulmón durante la pandemia del COVID: como no había muchas radiografías de enfermos de COVID, se utilizó esta tecnología para generar radiografías que simularan las de pacientes afectados por la enfermedad. En el otro lado de la balanza, las imágenes falsas y los deep fakes también se crean utilizando esta tecnología.
¿Qué le recomendarías a un estudiante de una carrera no técnica que quiera aprende IA, en concreto machine learning?
Lo primero, es mirar todos los tutoriales y cursos que hay en Kaggle. Antes de entrar en nada de machine learning, tendrían que aprender un poco de Python, cosa que pueden hacer en esa misma plataforma.
Luego, pueden mirar las competiciones que se lanzan en Kaggle, porque seguro que encuentran alguna que les motive. O encontrar datos que les puedan parecer interesantes para hacer algún desarrollo concreto. Para profundizar un poco más en machine learning, mi recomendación es que hagan el Bootcamp de Google, cuyo único requisito es conocer Python.
También animo a todo el mundo que quiera seguir aprendiendo a que se apunte a hackathones que tengan que ver con machine learning. Me apunté a uno justo antes de entrar en Akademia, que trataba de gestión de stocks en hospitales. Fue una experiencia muy divertida y acabamos ganando, lo cual me motivó aún más para profundizar en el tema.
¡Muchas gracias, David! ¡Y muchos éxitos en tu carrera de experto de machine learning!
Si quieres conocer los testimonios de otros alumni de Akademia, aquí puedes verlos.
Si quieres saber más sobre el programa Akademia, te invitamos a visitar la web de la Fundación.