Este repositorio contiene el código R para reproducir y replicar el análisis de datos del Trabajo de Fin de Máster "Modelos espaciales y espaciotemporales en disease mapping" realizado por Ander Bodegas Díez (bajo la supervisión de Aritz Adin y Jaione Etxeberria) en el Máster de Modelización e Investigación Matemática, Estadística y Computación de la Universidad Pública de Navarra.
Esta carpeta contiene los ficheros con los que se ha realizado el tercer capítulo del trabajo, en el que se ilustra el funcionamiento de los modelos con los datos reales de cáncer.
-
Datos_gb_f.csv y Datos_gb_m.csv
Bases de datos de incidencia y mortalidad po cáncer en la isla de Gran Bretaña para 11 causas (leucemia, mama, cérvix, melanoma, hígado, colorrectal, páncreas, estómago, pulmón, vejiga y esófago) desagregadas por área y año. Cada fichero contiene las siguientes variables:
- Code: código identificador del área (S=142 regiones)
- Year: identificador del año (periodo 2002-2019)
- Population: población en riesgo
- Count_All: número total de casos registrados
- Deaths_All: número total de muertes registradas
- Count_xxx: número total de casos registrados para cada una de las 11 causas
- Deaths_xxx: número total de muertes registradas para cada una de las 11 causas
*Fuente de datos: Sistema nacional de salud para Inglaterra (NHS England), Gales (NHS Wales) y Escocia (NHS Scotland).
-
Esta carpeta contiene la cartografía (archivos shapefile) de las regiones de Gran Bretaña (106 clinical commissioning group0s para Inglaterra, 22 local authorities para Gales y 14 health boards para Escocia), además de la matriz de adyacencia espacial.
-
Este archivo contiene la matriz de adyacencia (binaria) correspondiente al grafo de vecindad de las 142 regiones bajo estudio. El grafo original ha sido modificado (se han añadido 9 conexiones extra) para conectar las islas y así obtener un grafo conexo.
El código de R correspondiente al tercer capítulo del trabajo, en el que se ilustra el funcionamiento de los modelos con los datos reales de cáncer.
-
Este script realiza el análisis espacial (datos de incidencia por cáncer de pulmón en mujeres en el año 2019) ajustando los modelos en INLA, permitiendo reproducir todos los mapas y gráficos presentados en el trabajo. Para analizar otras causas disponibles en la base de datos original, es posible elegir el tipo de cáncer, el sexo, el tipo de dato (incidencia o mortalidad) y el umbral para las probabilidades de exceso, además de otras opciones al comienzo del script.
-
Este script realiza el análisis espaciotemporal (datos de incidencia por cáncer de pulmón en mujeres durante el periodo 2002-2019) ajustando los modelos en INLA, permitiendo reproducir todos los mapas y gráficos presentados en el trabajo. Al igual que en el caso espacial, es posible seleccionar datos correspondientes a otras causas de la base de datos orginal para replicar el estudio realizado.
-
En esta carpeta se guardan los diferentes mapas y gráficos que crean los dos scripts mencionados. En particular, en la carpeta Espacial se guardarán los resultados de Modelos_Espaciales.R y en EspacioTemporal se guardarán los de Modelos_EspacioTemporales.R.
Este Trabajo Fin de Máster ha sido realizado bajo la financiación de las Ayudas de Iniciación a la Investigación de la Universidad Pública de Navarra en el ámbito de sus Institutos de Investigación durante el curso académico 2021/2022 (resolución nº 602/2022).