estatística

This tag is associated with 3 posts

A COVID-19 nunha ollada matemática.


 

Rosa M. Crujeiras Casais

José Ameijeiras Alonso

 

 

 

Post realizado por José Ameijeiras Alonso, Investigador postdoctoral en la KU Leuven e membro do Statistics and Risk Section e pola Profesora do Dpto de Estatística, Análise Matemática e Optimización da USC  Rosa M. Crujeiras Casais 

 

 

Cando en decembro de 2019 se detectaron os primeiros casos de pneumonía en Wuhan (China), a sociedade occidental non era consciente do que isto suporía para os nosos hábitos, as nosas costumes, e sobre todo, para as nosas vidas. A COVID-19 ten provocado un cambio substancial na nosa maneira de vivir e de relacionarnos nos últimos meses; un cambio que se alongará nun futuro a medio prazo. Pero a COVID-19 trouxo tamén con ela numerosos desafíos, orientados a reducir ou controlar a súa pegada na sociedade. Dende a comunidade matemática, entendendo esta  de maneira xeral, como todas aquelas persoas que utilizamos os modelos matemáticos no noso día a día, tratamos de dar resposta a algunhas preguntas que poden axudar na toma de decisións. Estes modelos matemáticos permítennos entender a realidade dun proceso, como é a evolución da pandemia, e axúdannos a predicir que vai ocorrer nos próximos días.

Distintos grupos da comunidade matemática española xuntaron os seus esforzos ante o desafío aberto. Neste senso, e en consonancia coas demandas das autoridades, os esforzos centráronse no estudo da evolución das variables máis importantes para entender a evolución e o impacto da COVID-19. Estas variables son o número total de falecidos, de casos, de hospitalizados e de ingresos en UCI. As distintas propostas realizadas por estes grupos pódense resumir en cinco grandes bloques que se describirán brevemente máis adiante. Utilizando os resultados destas propostas, desenvolveuse un preditor cooperativo que toma distintas combinacións dos resultados obtidos polos distintos modelos para producir unha predición común e máis precisa da variable de estudo (véxase, por exemplo, o Capítulo 11 de Fuleky, 2020).

 

Dentro dos grandes bloques de modelos matemáticos que utilizaron os grupos que colaboraron nesta predición conxunta destacan os seguintes. Os modelos compartimentais (SIR, SEIR, …), véxase, por exemplo, Brauer et al.(2008). Nestes, a poboación asígnase a compartimentos con etiquetas, por exemplo, no modelo SIR, a poboación divídese en: Susceptible, Infeccioso ou Recuperado. Este tipo de modelos permiten observar a evolución dos individuos tendo en conta a relación que existe entre os compartimentos. Os métodos baseados en técnicas de aprendizaxe automática (machine learning) como son o boosting, os random forest, … (Clarke et al., 2009). As series de tempo (Shumway e Stoffer, 2017), que permiten analizar datos medidos en determinados momentos e ordenados cronoloxicamente. Os métodos estatísticos espazo-temporais (Gaetan e Guyon, 2010) que permiten analizar datos non só medidos cronoloxicamente se non tamén de xeito espacial. Os modelos de regresión, entendidos dende un punto de vista xeral (Harrell, 2015), onde se inclúen modelos non lineais, modelos de datos funcionais ou modelos de regresión xeneralizada. Este último bloque é onde os autores desta entrada, Rosa M. Crujeiras e Jose Ameijeiras Alonso, realizaron a súa contribución. Aplicando unha versión do modelo de Richards (1959), desenvolveron unha plataforma web que permite visualizar o modelado e a predición das variables de interese á hora de estudar a evolución da pandemia causada pola COVID-19

 

Bibliografía

Allen, L. J., Brauer, F., Van den Driessche, P., e Wu, J. (2008). Mathematical epidemiology. Berlin: Springer.

Clarke, B., Fokoue, E., e Zhang, H. H. (2009). Principles and theory for data mining and machine learning. 
New York: Springer Science & Business Media.

Fuleky, P. (2020). Macroeconomic Forecasting in the Era of Big Data: Theory and Practice. Suíza: Springer Nature.

Gaetan, C., e Guyon, X. (2010). Spatial statistics and modeling. New York: Springer.

Harrell Jr, F. E. (2015). Regression modeling strategies: with applications to linear models, logistic and ordinal regression, 
and survival analysis. New York: Springer Science & Business Media.

Richards, F. J. (1959). A Flexible Growth Function for Empirical Use. Journal of Experimental Botany10 (2): 290–300

Shumway, R. H., e Stoffer, D. S. (2017). Time series analysis and its applications: with R examples. Suíza: Springer Nature.

Practicamente a totalidade desta bibliografía pode ser consultada nestes momentos a través de SIR e Springer Link. 
Entrada do blog onde se explica como acceder á colección de ebooks de matemática e estatística de Springer.

Incorporación da Colección Histórica de Matemáticas e Estatística aos ebooks de Springer


 
O investimento dos proxectos de investigación da facultade fixo posible, un ano máis, o aumento da colección de libros electrónicos de matemáticas e estatística da editorial Springer.
 
Conxuntamente, a compra deste ano e a do ano anterior supoñen o acceso a máis de 11.372 títulos coas seguintes características:    
 
  • Acceso perpetuo á colección histórica da editorial (abrangue o período 1929-1989) e aos ebooks publicados nos anos 2017 e 2018 na área de matemáticas e estatística.
  • Acceso temporal ata novembro de 2019 aos libros electrónicos da editorial na nosa área publicados no período 2010-2016.
 
Este é o link que leva directamente aos ebooks:
 https://goo.gl/g8ZtJD

Do espazo e do tempo: unha perspectiva aleatoria


Sección A propósito dos libros

 

Post realizado por Rosa M. Crujeiras Casais Profesora do Dpto de Estatística, Análise Matemática e Optimización e Vicerreitora de Comunicación e Coordinación da USC 

Rosa M. Crujeiras

 

A metodoloxía estatística clásica, considerando como tal os procedementos paramétricos para a construción de intervalos de confianza ou a formulación e resolución de contrastes de hipóteses, soe fundamentarse sobre a premisa de que as mostras das variables de interese son obtidas baixo deseño aleatorio, é dicir, as observacións recollidas poden asumirse como realizacións de variables aleatorias independentes. Sen embargo, en ámbitos prácticos, a hipótese de independencia non se sostén, e as observacións recollidas poden gardar certa relación.

Isto é o que ocorre cando se observan datos ao longo do tempo (series de tempo) ou nunha rexión do espazo. Exemplos deste tipo de datos xorden en numerosos campos aplicados como a ecoloxía (62-1263), as ciencias medioambientais (62-1268), a econometría (62-1218) ou a epidemioloxía (62-1262). As observacións de variables recollidas no espazo soen exhibir características semellantes segundo as súas localizacións espaciais, e este factor debe ser tido en conta en calquera procedemento descritivo ou inferencial: observacións próximas no espazo tenden a ser semellantes. Se ben os traballos iniciais para o tratamento deste tipo de datos aparecen nas décadas dos cincuenta e sesenta, coas achegas feitas por Krige, Matheron ou Matèrn houbo que agardar ata case rematado o século para dispor dun texto de referencia: Statistics for Spatial Data, de N.A. Cressie (62-553), publicado no 1999. Este volume divídese en tres partes, atendendo aos distintos tipos de procesos que poden presentar dependencia espacial: procesos xeoestatísticos (aqueles cuxa variación no espazo se produce de maneira continua, por exemplo, cando se miden concentracións de metais no solo), procesos reticulares (con variación no espazo discreta, como os que modelan os datos datos recollidos en zonas xeográficas como comarcas, concellos,…) e procesos puntuais (onde a variación espacial é aleatoria, como por exemplo, a asociada a distribucións de especies vexetais). O texto de Cressie converteuse nun referente para a comunidade da estatística espacial, xa que recollía os avances realizados dende distintas perspectivas nun mesmo texto, cunha labor de unificación e relación importante, e sobre todo, sentando as bases para futuras investigacións.

Tamén no mesmo ano, M. Stein publica Interpolation of Spatial Data (62 1012), cun enfoque moito máis formal e dirixido fundamentalmente a unha audiencia con formación matemática, e J.P. Chilès e P. Delfiner presentan un libro sobre o tratamento de procesos xeoestatísticos (62-1026).

Quizais chegados a este punto poida xurdir a pregunta de porqué, se o problema do modelado de datos espaciais aflora medio século antes, non é ata o fin de século que aparece un libro de referencia. A miña impresión, se ben pode estar errada, é que a recompilación e ordenación realizada por N.A. Cressie xustifícase pola aparición dunha necesidade real de análise deste tipo de procesos. Como en tantos outros ámbitos da estatística, a necesidade do desenvolvemento de técnicas veu xustificada, motivada e acrecentada polas melloras técnicas tanto nos dispositivos de medición e recollida de información, como no almacenamento da mesma. Pensemos, por exemplo, na análise de datos tomados por satélite.

Agora ben, este desenvolvemento tecnolóxico que permitiu a recollida de cantidades inxentes de datos, dando lugar ao fenómeno do big data, puxo ante a comunidade científica o reto de desenvolver técnicas de descrición e inferencia para procesos que non só varían no espazo, se non que tamén o fan no tempo. P. Diggle (2014, 3rd Ed.) con Statistical Analysis of Spatial and Spatio-Temporal Point Patterns (62-1303) e o propio N.A. Cressie xunto con C. Wikle (2011) con Statistics for Spatio-Temporal Data (62-1261) elaboraron dous volumes interesantes. O primeiro céntrase na análise de patróns puntuais espazo-temporais, unha liña que tivo e está a ter o seu impacto no contexto epidemiolóxico. Pola súa banda, Cressie e Wikle describen dunha maneira directa a modelización de procesos espazo-temporais dende unha perspectiva Bayesiana. Tamén se suma a este enfoque o recente texto de Blangiardo e Cameletti (2015, 62-1310).

Son todos os que están, pero non están todos os que son… a nosa biblioteca conta no seu fondo con outras moitos textos relevantes para o estudo dos procesos espaciais e espazo temporais, de carácter teórico (62-1275) e aplicado (62-1325).

QR

Horarios

Facultade de Matemáticas USC

BUSCa no catálogo

Bibliografía Recomendada das asignaturas