Volver a docencia

Descargar Guía PDF.
GUÍA DOCENTE DEL CURSO

Título
Análisis de Datos Funcionales
Profesor(es)
Mariano Valderrama Bonnet (http://www.ugr.es/local/valderra)
Ana María Aguilera del Pino (http://www.ugr.es/local/aaguiler)
Francisco Ocaña Lara (http://www.ugr.es/local/focana)
Descripción
Las variables funcionales se caracterizan por la evolución de una variable a lo largo del tiempo (proceso estocástico), de modo que los valores que toman son funciones en lugar de  vectores como en análisis multivariante clásico. La imposibilidad de medir la mayoría de estas variables continuamente en el tiempo, unida a la complejidad teórica de muchos de los métodos estadísticos disponibles para su análisis llevan a que se manejen resúmenes periódicos que constituyen las series temporales contenidas normalmente en los anuarios estadísticos. Aunque existen muchas técnicas para la modelización y predicción de datos temporales discretos, la mayoría de ellas, como por ejemplo la teoría clásica de Box-Jenkins, imponen que se verifiquen hipótesis bastante restrictivas como estacionariedad, observaciones igualmente espaciadas o pertenencia a una clase de procesos específica.

Estos problemas han planteado la necesidad de desarrollar metodologías potentes que permitan, en la práctica, la modelización y predicción a partir de datos funcionales dando lugar a una especialidad estadística muy reciente conocida con el nombre de Análisis de Datos Funcionales (FDA), que en la actualidad está siendo objeto de un estudio intensivo por parte de los investigadores. Los primeros trabajos en FDA estuvieron dedicados a la generalización de la técnica de reducción de dimensión Análisis en Componentes Principales (ACP) al caso funcional. Posteriormente las investigaciones en FDA se han centrado en el desarrollo de modelos de regresión funcional  y sus aplicaciones en diferentes campos como la economía, el medioambiente o las ciencias de la salud.
Objetivos Particulares
  • Conocer las nociones básicas sobre variables funcionales (procesos estocásticos) de segundo orden.
  • Manejar los métodos matemáticos de aproximación de funciones de cuadrado integrable (interpolación, aproximación mínimo cuadrática, …) a partir de bases de funciones (trigonométricas, splines, wavelets, ..).
  • Estudiar la técnica de reducción de dimensión Análisis en Componentes Principales Funcional (ACPF) y métodos de estimación a partir de observaciones en tiempo discreto de las funciones muestrales.
  • Conocer la formulación, estimación muestral e implementación computacional, así como la aplicación con datos reales e interpretación de resultados, de modelos de predicción en componentes principales (PCP) de una variable funcional.
  • Relacionar los modelos PCP con los modelos más generales de regresión lineal funcional.
  • Conocer la formulación, estimación muestral e implementación computacional, así como la aplicación con datos reales e interpretación de resultados, de modelos de regresión logística para estimar una variable binaria a partir de un predictor funcional relacionado.
Prerrequisitos y recomendaciones
Para realizar con éxito este curso el alumno debería tener una formación básica en análisis matemático, aproximación de funciones, procesos estocásticos, análisis multivariante y modelos de regresión. Está formación está garantizada para los alumnos que hayan realizado la Diplomatura en Estadística, la Licenciatura en Ciencias y Técnicas Estadísticas o la Licenciatura en Matemáticas. Para los alumnos que no tengan esta formación se recomienda realizar el curso del máster “Técnicas estadísticas multivariantes y aplicaciones”.
Contenidos
  1. Introducción al Análisis de Datos Funcionales.
  2. Representación de datos funcionales mediante bases de funciones.
  3. Análisis en componentes principales funcional: formulación, estimación y aproximación.
  4. Modelos de predicción en componentes principales (PCP) de variables funcionales. Aplicaciones en Turismo y Economía.
  5. Modelos de regresión lineal funcional: casos de respuesta escalar y respuesta funcional. Relación con los modelos PCP.
  6. Modelos de regresión logística funcional para respuesta binaria. Aplicaciones en Medioambiente y en Ciencias de la Salud.
Metodología El alumno estudiará, para cada uno de los contenidos enumerados,  los materiales y  referencias bibliográficas disponibles en la plataforma. Una vez estudiados los contenidos, el alumno realizará resúmenes  de cada uno de ellos en los que se ponga de manifiesto su capacidad de síntesis y de comprensión.

El profesor propondrá trabajos individuales sobre artículos científicos y material bibliográfico relacionado con los contenidos del curso. El alumno deberá  presentar  a través de la plataforma el trabajo realizado, junto con una  presentación resumida que será distribuida entre el resto de alumnos para su debate. El alumno podrá realizar también trabajos aplicados de modelización de datos funcionales mediante las técnicas estudiadas en el curso. Los datos podrán ser proporcionados por el profesor u obtenidos por el alumno de otra fuente de interés o mediante simulación. Para realizar la aplicación  implementará los algoritmos involucrados en el entorno de programación R y presentará los resultados en forma de artículo científico.

El alumno dispondrá de tutorías virtuales a través de la plataforma (en forma de correo, chat...) en las que el profesor estará disponible para hacer cualquier aclaración relacionada con el desarrollo del curso.
Bibliografía Aguilera, A.M., Escabias, M. and Valderrama, M.J. (2008): Discussion of different logistic models with functional data. Application to Systemic Lupus Erythematosus. Computational Statistics and Data Analysis, 1-13, in press.
Cardot, H., Ferraty, F. and Sarda, P. (1999): Functional linear model. Statistics and  Probability Letters, 45, 11-22.
Chiou, J-M., Müller, H-G. and Wang, J-L. (2004): Functional response model. Statistica Sinica, 14, 659-677.
Escabias, M., Aguilera, A.M. and Valderrama, M.J. (2004): Principal component estimation of functional logistic regression: discussion of two different. Journal of Nonparametric Statistics, 16 (3-4), 365-38.
Escabias, M., Aguilera, A.M. and Valderrama, M.J. (2005): Modeling environmental data by functional principal component logistic regression. Environmetrics, 16 (1), 95-107.
Ocaña, F.A., Aguilera, A.M. and Escabias, M. (2007): Computational considerations in functional principal component analysis. Computational Statistics, 22, 449-466.
Ramsay J.O. y Silverman B.W. (1997, 2005): Functional Data Analysis. (First and Second editions). Springer-Verlag.
Ramsay J.O. y Silverman B.W. (2002): Applied Functional Data Analysis. Springer-Verlag.
Ratcliffe, S. J., Leader, L. y Heller, G. Z. (2002a): Functional data analysis with application to periodically stimulated foetal heart rate data. I: Functional regression. Statistics in Medicine, 21, 1103-1114.
Ratcliffe, S. J., Heller, G. Z. y Leader, L. (2002b): Functional data analysis with application to periodically stimulated foetal heart rate data. II: Functional logistic regression. Statistics in Medicine, 21, 1115-1127.
Todorovic P. (1992): An Introduction to Stochastic Processes and their Applications. Springer-Verlag.
Valderrama M.J., Aguilera A.M. y Ocaña F.A. (2000): Predicción Dinámica mediante Análisis de Datos Funcionales. La Muralla, Madrid.
Yao, F., Müller, H-G. and Wang, J-L. (2005): Functional linear regression analysis for longitudinal data. The Annals of Statistics, 33(6), 2873-2903.
Criterios de evaluación
  • Realización de resúmenes de cada uno de los contenidos del curso y actividades relacionadas (hasta 6 puntos).
  • Trabajo individual sobre aspectos metodológicos o prácticos de los contenidos del curso (ver metodología).  Comprensión de conocimientos adquiridos (hasta 2 puntos). Capacidad de síntesis y presentación para su exposición y difusión en la plataforma (hasta 2 puntos). Programación en R y aplicación con datos reales (hasta  2 puntos adicionales).