Introducción del curso
En la actualidad, la imagen se considera como uno de los métodos de extracción no invasiva de información con mayor potencial, en diversos campos tales como la industria farmacéutica, agroalimentaria, cerámica, metalúrgica, ...
Con la introducción de cámaras en color, hiperespectrales y los avances en la instrumentación médica, las imágenes han comenzado a adquirir unas dimensiones que hacen necesario su análisis por medio de técnicas avanzadas de análisis de datos, con el fin de extraer información relevante, tanto desde el punto de adquisición de conocimiento acerca de los procesos, como de su monitorización u obtención de predicciones/clasificaciones.
Este curso pretende ofrecer técnicas de análisis de imágenes que pueden ir desde la escala de grises (un solo canal de información) hasta las imágenes hiperespectrales.
El curso introduce los métodos estadísticos multivariantes basados en estructuras latentes (tales como el Análisis de Componentes Principales (PCA), la Regresión por Mínimos Cuadrados Parciales (PLS) o la Resolución Multivariante de Curvas (MCR), así como técnicas de Machine Learning (como el Deep Learning o los autoencoders), particularizándolos para el análisis de imágenes. Ello hace que el tratamiento de las mismas requiera de unos procesados y desplegados especiales con el fin de poder analizarlas mediante estos métodos.
Su estudio permite desarrollar métodos para la comprensión de los fenómenos subyacentes en las imágenes, la detección de defectos y monitorización de procesos en entornos donde no es sencillo o posible introducir sensores de otro tipo, la predicción de características de calidad, o la detección de defectos en los mismos, así como el desarrollo de algoritmos especializados en el diagnóstico temprano del cáncer.
Finalmente, el curso también cubre el análisis de imágenes empleando técnicas de Deep Learning, basadas en Redes Neuronales Convolucionales (CNNs, del inglés) y Autoencoders. Los participantes aprenderán los fundamentos de dichas arquitecturas de red neuronal y su mecanismo de entrenamiento con el objetivo de desarrollar modelos predictivos que den solución a tareas de regresión, clasificación, segmentación y detección de anomalías.
Todas las técnicas que cubre el curso permiten desarrollar métodos para la detección de defectos y monitorización de procesos (industriales o de cualquier otro tipo) en entornos donde no es sencillo o posible introducir sensores que no sean basados en imagen; la predicción de características de calidad (e.g. en alimentos) o la detección de defectos en los mismos; así como el desarrollo de algoritmos especializados en el diagnóstico temprano del cáncer.
Al terminar el curso, el asistente podrá:
• Crear las estructuras de datos necesarias para analizar las imágenes
• Distinguir entre los modelos básicos de Análisis Multivariante de Imágenes: PCA, PLS, MCR
• Analizar distintos tipos de imágenes con diferentes fines: exploratorio y predictivo
• Introducirse en el mundo de la IA aplicada a las imágenes, a través de los modelos de CNN’s y autoencoders.
Las sesiones están diseñadas para proporcionar tanto el conocimiento teórico como las habilidades prácticas necesarias para aplicar estos métodos en contextos industriales reales.
Sesión 1 (2,5 horas)
1. Introducción al análisis de imagen
• ¿Qué es una imagen?
• Resolución espacial: el píxel
• Tipos de imagen: escala de grises, color, multi e hiperespectral, funcional.
• Análisis de imagen: repaso de técnicas clásicas
o Textura: estadísticos de primer orden (histograma) y de segundo orden (matrices de coocurrencia), transformadas texturales, wavelets.
o Color
2. Análisis Multivariante de Imágenes (MIA)
a) Enfoque basado en el píxel
i. Estructura de los datos
ii. Desdoblamiento
iii. Pérdida de la información espacial
iv. Preprocesado
v. Aplicaciones (descriptivo, segmentación, MIA-MSPC, clasificación y predicción)
b) Enfoque basado en la imagen
i. Estructura de los datos
ii. Desdoblamiento
iii. Pérdida de la información espacial
iv. Preprocesado
v. Aplicaciones (MIA-MSPC, clasificación y predicción)
c) Modelos básicos en MIA: PCA y PLS
Al final de la sesión, los participantes serán capaces de:
• Tener una idea básica del concepto de imagen, sus diferentes tipos y las técnicas clásicas de análisis de imagen.
• Entender cómo se puede analizar una imagen de manera alternativa por medio de modelos basados en estructuras latentes.
• Diferenciar los dos enfoques básicos de MIA y entender la conveniencia de aplicar uno u otro en cada situación.
Sesión 2 (2,5 horas)
MIA basado en el píxel
• Concepto
• Análisis descriptivo: score images, loading plots, score plots.
• Trabajo de ordenador: analizar ejemplos de descriptiva
Al final de la sesión, los participantes serán capaces de:
• Entender bien la manera en que se analiza una imagen cuando el interés se centra en lo que ocurre dentro de ella.
• Comprender la manera en que se interpretan las nuevas imágenes (score images) obtenidas a partir de la original, por medio de los loading plots.
• Aplicar en ejemplos reales los conceptos vistos en la parte teórica, a partir de código facilitado durante el curso.
Sesión 3 (2,5 horas): Monitorización de procesos y detección de fallos mediante MIA
1. Detección y localización de defectos inespecíficos: T2, RSS images. Ejemplos
2. b. Monitorización de defectos específicos. Segmentación y detección supervisada. Ejemplos
Al final de la sesión, los participantes serán capaces de:
• Entender la problemática de la dificultad o imposibilidad de monitorizar determinados tipos de procesos por medio de sistemas o sensores “tradicionales”, y de cómo solucionarla por medio de MIA.
• Diferenciar entre los tipos de monitorización, específica e inespecífica, y del porqué de aplicar unos gráficos (score plots) u otros (T2 y RSS images) en cada caso.
Sesión 4 (2,5 horas): Aplicación a problemas reales
Al final de la sesión, los participantes serán capaces de:
• Aplicar en ejemplos reales los conceptos vistos en las sesiones anteriores, a partir de código facilitado durante el curso.
Sesión 5 (2,5 horas): MIA basado en la imagen
• Concepto
• Técnicas de clasificación.
• Técnicas de predicción.
Al final de la sesión, los participantes serán capaces de:
• Diferenciar entre el tipo de estructuras asociadas al enfoque basado en el píxel respecto de las derivadas del enfoque basado en la imagen.
• Entender la conveniencia de aplicar el enfoque basado en la imagen cuando el objetivo es monitorizar un proceso y no detectar defectos o fenómenos dentro de una imagen; o bien clasificar una imagen (toda ella) dentro de un tipo, o predecir algún parámetro de calidad de un proceso o de la propia imagen a partir de la misma.
Sesión 6 (2,5 horas): Análisis de imagen hiperespectral (HIA) (y otros)
1. Introducción. Tipos de imágenes hiperespectrales
2. Resolución Multivariate de Curvas (MCR)
• Ley de Beer-Lambert
• ALS y restricciones
3. Técnicas de preprocesado en imagen hiperespectral:
• SNV
• Derivatives
• MSC
4. Monitorización de procesos, detección de defectos y clasificación en imagen hiperespectral
5. Otras aplicaciones: ultrasonidos y láser
Al final de la sesión, los participantes serán capaces de:
• Entender la conveniencia de utilizar información hiperespectral cuando se desea utilizar información química o físico-química; y comprender la diferencia conceptual entre una imagen hiperespectral y una de color.
• Comprender por qué PCA no es un buen modelo para el análisis de imágenes hiperespectrales, cuando lo que se desea en descubrir los fenómenos físicos, químicos o biológicos existentes en la imagen.
• Comprender el MCR, sus diferencias respecto de PCA, y sus ventajas para este tipo de imágenes.
• Conocer las técnicas básicas de preprocesado de imágenes hiperespectrales.
• Entender las distintas aplicaciones del HIA, y conocer algunos campos de aplicación nuevos.
Sesión 7 (2,5 horas): Aplicación a problemas reales
Al final de la sesión, los participantes serán capaces de:
• Aplicar en ejemplos reales los conceptos vistos en la parte de HIA, a partir de código facilitado durante el curso.
Sesión 8: Deep Learning para el análisis de imagen: Redes Neuronales Convolucionales (2,5 horas)
1. Introducción. Deep Learning para el análisis de imagen
2. Filtrado de imagen. Concepto de Kernel. Operación convolución
3. Métodos de agregación. Bloque convolución. Red neuronal convolucional
4. Entrenamiento de una red neuronal convolucional. Forward & backpropagation
a. Resolución de tareas de regresión
b. Resolución de tareas de clasificación
5. Trasferencia de conocimiento. Adaptación de dominio mediante la técnica de fine-tuning
6. Arquitecturas de red neuronal convolucional existentes. ImageNet.
Al final de la sesión, los participantes serán capaces de:
• Comprender como entrenar una red neuronal convolucional, así como validar el modelo predictivo resultante
• Resolver tareas de clasificación y regresión basadas en deep learning para el análisis de imagen
• Conocer las arquitecturas existentes de CNN y las técnicas más comunes para la transferencia del conocimiento entre modelos basados en imagen
Sesión 9: Autoencoders (2,5 horas)
1. Arquitecturas de red neuronal encoder-decoder
2. Entrenamiento de autoencoders para la reconstrucción de imagen
a. Aplicación a la resolución de tareas de detección de anomalías
b. Aplicación a la resolución de tareas de segmentación
Al final de la sesión, los participantes serán capaces de:
• Comprender como entrenar una red neuronal convolucional encoder-decoder, así como validar el modelo predictivo resultante
• Resolver tareas de detección de anomalías y segmentación de imagen basadas en deep learning
Sesión 10: Aplicación a problemas reales (2,5 horas)
Al final de la sesión, los participantes serán capaces de:
• Aplicar en ejemplos reales los conceptos vistos en la parte correspondiente a las dos sesiones anteriores (CNNs y Autoencoders), a partir de código facilitado durante el curso.