Curso

ANÁLISIS DE DATOS Y REPRESENTACIÓN CON R

  • Desde: 30/11/23
  • Hasta: 4/4/24
  • Campus de Valencia
  • Idioma: Castellano
  • Online

Preinscripción desde el 12/7/23

Promovido por:
Centro de Gestión de la Calidad y del Cambio

Responsable de la actividad:
José Manuel Jabaloyes Vivas


Inscripción online cerrada

Modalidad

Presencial Online Emisión en directo

0 horas


0 horas


100 horas*

Horario

Online
HORARIO DE 16:00 A 19:00 HORA ESPAÑOLA
LOS DÍAS:
30 de noviembre
4, 7, 11, 14, 18 y 21 de diciembre
8, 11, 15, 18, 22, 25 y 29 de enero
1, 5, 8, 12, 15, 19, 22, 26, y 29 de febrero
4, 7, 11, 14, 18, 21, 25 Y 28 de marzo
1 y 4 de abril
(cursando 1 h más el último día)

(*) En esta actividad se realizarán clases a distancia con emisión en directo

Lugar de impartición
SESIONES SÍNCRONAS A DISTANCIA
Certificación

Aprovechamiento

Modalidad

ONLINE

Curso

2023-2024

ECTS

10

Campus

Valencia

0 h

Presenciales

100 h

Online

Precio Colectivo
1.000 € Público en general 
1.000,00 € - Público en general

Objetivos

MOD 1
Objetivos y Competencias. R es una herramienta de software libre ampliamente utilizada en
ciencia de datos puesto que permite realizar cálculos y análisis estadísticos, la creación de gráficos
y la generación de informes de forma rápida y sencilla. El módulo pretende introducir a los participantes
en el uso del lenguaje de programación R para, una vez conocido su funcionamiento básico, utilizarlo
en los siguientes módulos. Así, los participantes aprenderán, entre otros, el proceso de instalación de R,
el uso de funciones, trabajar con diferentes tipos de datos, o los conceptos básicos de visualización.
Además, descubrirá librerías de R para su posterior uso en RStudio.

MOD 2
Objetivos y Competencias. El objetivo del módulo es introducir diferentes herramientas estadísticas
básicas que ayudarán a los participantes a comprender conceptos que se introducirán en los
siguientes módulos. Se presentarán diferentes distribuciones de probabilidad (continuas y discretas)
y herramientas de inferencia estadística. Los participantes aprenderán a identificar los diferentes
tipos de distribuciones de probabilidad´, a realizar estimación de diferentes parámetros poblacionales
y contrates de hipótesis.

MOD 3

Objetivos y Competencias. Se introducirá a los participantes en la importancia del
preprocesamiento de los datos como etapa esencial en el proceso de descubrimiento de la
información, así como en las herramientas y técnicas de análisis de datos que dan soporte a la tarea
de preprocesamiento. Los participantes aplicarán los conocimientos adquiridos para la preparación
y transformación de los datos contenidos en una base de datos ejemplo.

MOD 4
Objetivos y Competencias. El análisis exploratorio de datos, o EDA, es un enfoque para el análisis
de datos que permite resumir sus características principales y ayuda a obtener una mejor
comprensión del conjunto de datos, descubrir relaciones entre diferentes variables y la extracción de
variables importantes en función del problema a resolver. En este módulo los participantes se
familiarizarán con el análisis exploratorio de datos de forma que podrán crear tablas, gráficos y
estadísticos para el análisis de datos unidimensionales, bidimensionales y multidimensionales. A
partir de una base de datos, los participantes realizarán un análisis y extraerán conclusiones sobre
los mismos.

MOD 5
Objetivos y Competencias. El módulo introducirá al alumno en el aprendizaje automático no
supervisado. En el módulo se incluyen algoritmos para el aprendizaje no supervisado como K-means
y EM. Los participantes aprenderán a reconocer un problema de aprendizaje no supervisado y a
aplicar los diferentes algoritmos en ejemplos prácticos.

MOD 6
Objetivos y competencias. Los participantes aprenderán las características del aprendizaje
supervisado y la diferencia entre problemas de clasificación y regresión. Posteriormente, se
introducirán los conceptos y características de diferentes tipos de modelos comenzado por un modelo
“clásico”, el modelo de regresión lineal, para a continuación abordar modelos más avanzados como,
por ejemplo, Ridge, Lasso, SVM y redes neuronales. Además, se introducirán diferentes métodos de
ajuste de los hiperparámetros de los modelos y el proceso de validación de los mismos. Se trabajarán
diferentes casos de aplicación tanto en el contexto de clasificación como de regresión.

Acción formativa dirigida a

Personas con Titulación universitaria


Profesores

  • Isabel Martón Lluch Profesor/a Titular de Universidad
  • Ana Isabel Sanchez Galdon Catedrático/a de Universidad

Metodología didáctica y sistemas de evaluación

ASISTENCIA Y ENTREGABLES

Temas a desarrollar

MÓDULO 0. PRESENTACIÓN Y OBJETIVOS DEL CURSO

MÓDULO 1. INTRODUCCIÓN A LA PROGRAMACIÓN EN R PARA CIENCIA DE DATOS

RStudio y R Markdown

1. Introducción a R y RStudio
2. Creación y manipulación de objetos en R
3. Importación y exportación de datos en R
4. Uso de librerías en R.
5. Utilización de R Markdown para la generación de informes

Estructuras y gráficos en R

1. Vectores, matrices y data.frame
2. Funciones
3. Introducción a los gráficos. Uso de ggplot2
4. Condicionales y bucles

Objetivos y Competencias. R es una herramienta de software libre ampliamente utilizada en
ciencia de datos puesto que permite realizar cálculos y análisis estadísticos, la creación de gráficos
y la generación de informes de forma rápida y sencilla. El módulo pretende introducir a los participantes
en el uso del lenguaje de programación R para, una vez conocido su funcionamiento básico, utilizarlo
en los siguientes módulos. Así, los participantes aprenderán, entre otros, el proceso de instalación de R,
el uso de funciones, trabajar con diferentes tipos de datos, o los conceptos básicos de visualización.
Además, descubrirá librerías de R para su posterior uso en RStudio.

MÓDULO 2. ESTADÍSTICA BÁSICA PARA CIENCIA DE DATOS

1. Distribuciones de probabilidad
2. Muestreo.
3. Estimación de parámetros
4. Test de hipótesis
5. Bootstraping

Objetivos y Competencias. El objetivo del módulo es introducir diferentes herramientas estadísticas
básicas que ayudarán a los participantes a comprender conceptos que se introducirán en los
siguientes módulos. Se presentarán diferentes distribuciones de probabilidad (continuas y discretas)
y herramientas de inferencia estadística. Los participantes aprenderán a identificar los diferentes
tipos de distribuciones de probabilidad´, a realizar estimación de diferentes parámetros poblacionales
y contrates de hipótesis.

MÓDULO 3. PREPROCESAMIENTO DE DATOS

1. Calidad y Naturaleza de los datos
2. Datos faltantes
3. Datos anómalos
4. Transformación

Objetivos y Competencias. Se introducirá a los participantes en la importancia del
preprocesamiento de los datos como etapa esencial en el proceso de descubrimiento de la
información, así como en las herramientas y técnicas de análisis de datos que dan soporte a la tarea
de preprocesamiento. Los participantes aplicarán los conocimientos adquiridos para la preparación
y transformación de los datos contenidos en una base de datos ejemplo.

MÓDULO 4. ANÁLISIS EXPLORATORIO DE DATOS (EDA)

1. ¿Qué es el AED?
2. Variable aleatoria y datos
3. Tipos de estudios
4. Herramientas exploratorias en ciencia de datos



MÓDULO 5. APRENDIZAJE AUTOMÁTICO NO SUPERVISADO

1. Aprendizaje automático no supervisado
2. Clustering
3. Algoritmos de agrupamiento: K-means y EM
4. Aplicaciones

Objetivos y Competencias. El módulo introducirá al alumno en el aprendizaje automático no
supervisado. En el módulo se incluyen algoritmos para el aprendizaje no supervisado como K-means
y EM. Los participantes aprenderán a reconocer un problema de aprendizaje no supervisado y a
aplicar los diferentes algoritmos en ejemplos prácticos.

MÓDULO 3. PREPROCESAMIENTO DE DATOS

1. Calidad y Naturaleza de los datos
2. Datos faltantes
3. Datos anómalos
4. Transformación

Objetivos y Competencias. Se introducirá a los participantes en la importancia del
preprocesamiento de los datos como etapa esencial en el proceso de descubrimiento de la
información, así como en las herramientas y técnicas de análisis de datos que dan soporte a la tarea
de preprocesamiento. Los participantes aplicarán los conocimientos adquiridos para la preparación
y transformación de los datos contenidos en una base de datos ejemplo.

MÓDULO 4. ANÁLISIS EXPLORATORIO DE DATOS (EDA)

1. ¿Qué es el AED?
2. Variable aleatoria y datos
3. Tipos de estudios
4. Herramientas exploratorias en ciencia de datos

Objetivos y Competencias. El análisis exploratorio de datos, o EDA, es un enfoque para el análisis
de datos que permite resumir sus características principales y ayuda a obtener una mejor
comprensión del conjunto de datos, descubrir relaciones entre diferentes variables y la extracción de
variables importantes en función del problema a resolver. En este módulo los participantes se
familiarizarán con el análisis exploratorio de datos de forma que podrán crear tablas, gráficos y
estadísticos para el análisis de datos unidimensionales, bidimensionales y multidimensionales. A
partir de una base de datos, los participantes realizarán un análisis y extraerán conclusiones sobre
los mismos.

MÓDULO 5. APRENDIZAJE AUTOMÁTICO NO SUPERVISADO

1. Aprendizaje automático no supervisado
2. Clustering
3. Algoritmos de agrupamiento: K-means y EM
4. Aplicaciones

Objetivos y Competencias. El módulo introducirá al alumno en el aprendizaje automático no
supervisado. En el módulo se incluyen algoritmos para el aprendizaje no supervisado como K-means
y EM. Los participantes aprenderán a reconocer un problema de aprendizaje no supervisado y a
aplicar los diferentes algoritmos en ejemplos prácticos.

MÓDULO 6. APRENDIZAJE AUTOMÁTICO SUPERVISADO

1. Introducción al aprendizaje automático supervisado. Regresión y clasificación.
2. Regresión lineal generalizada
3. Métodos de regularización. Regresión Ridge, Lasso y Elastic Net
4. Regresión logística
5. Support Vector Machine (SVM) y Support Vector Regresión (SVR)
6. Naive Bayes
7. Árboles de decisión, random forest y gradient boosting
8. Introducción a las redes neuronales
9. Métodos de remuestreo. Validación cruzada y Bootstrap.
10. Aplicaciones

Objetivos y competencias. Los participantes aprenderán las características del aprendizaje
supervisado y la diferencia entre problemas de clasificación y regresión. Posteriormente, se
introducirán los conceptos y características de diferentes tipos de modelos comenzado por un modelo
“clásico”, el modelo de regresión lineal, para a continuación abordar modelos más avanzados como,
por ejemplo, Ridge, Lasso, SVM y redes neuronales. Además, se introducirán diferentes métodos de
ajuste de los hiperparámetros de los modelos y el proceso de validación de los mismos. Se trabajarán
diferentes casos de aplicación tanto en el contexto de clasificación como de regresión.

Inscripción online cerrada