Patricia Luengo Carretero

Data Scientist & Docente & UX/UI Designer

Un modelo de Inteligencia Artificial para predecir la severidad de un incendio forestal

Este proyecto ha sido desarrollado como parte del Trabajo de Fin de Máster en Ciencia de Datos, obteniendo una calificación de Matrícula de Honor (9.78). Ha sido publicado en el repositorio oficial de la Universitat Oberta de Catalunya (UOC) y puede consultarse en el siguiente enlace:

Acceder al TFM

Objetivo

El objetivo principal de FireGroundAI es utilizar los datos históricos de incendios forestales ocurridos en España y de los que se disponen datos desde 1968 para predecir la severidad de un incendio forestal en la actualidad en función de varios factores que se observan al inicio del evento. El modelo desarrollado permitirá ayudar en la predicción de la gravedad de un incendio y facilitar la planificación de recursos para la lucha contra el fuego.

Objetivos Secundarios:

  • Enriquecer y consolidar el conjunto de datos con información adicional proveniente de diferentes fuentes.
  • Analizar los factores principales que influyen en el comportamiento de los incendios forestales.
  • Comparar distintos modelos predictivos y elegir el más adecuado para resolver este tipo de problemas.

Metodología

El enfoque para resolver este problema se divide en varias etapas:

  1. Consolidación de la Base de Datos:
    • Unificación de localizaciones geográficas (coordenadas) a formato de latitud y longitud.
    • Incorporación de la altitud, superficie y población
    • Índice FWI
    • Densidad de incendios
    • Densidad de población
    • Obtención de distintas variables meteorológicas de AEMET.
  2. Análisis Exploratorio de los Datos:
    • Revisión de los datos para detectar valores atípicos, faltantes o nulos.
    • Imputación de valores faltantes
    • Análisis univariante de las variables numéricas y categóricas
    • Análisis multivariante de las variables numéricas y categóricas
    • Análisis por clase de incendio: conato, incendio y gif.
  3. Selección de Características:
    • Regresión Logística Multiclase.
    • Random Forest
  4. Modelos Predictivos: Se aplican diferentes enfoques de modelos de predicción.
    • Regresión Logística Multiclase
    • Árboles de decisión
    • Gradient Boosting
    • Redes neuronales
  5. Evaluación de Modelos:
    • Se evalúa el rendimiento de los modelos utilizando métricas como precisionrecallF1-score y curva rocárea bajo la curva (AUC) y matriz de confusión.
  6. Validación del modelo:
    • Será validado utilizando datos de incendios forestales correspondientes al año 2017 que serán excluidos del proceso de entrenamiento.

Puedes ver más sobre este trabajo en el repositorio de GitHub.

«Cómo podrías renacer sin antes haber quedado reducido a ceniza.»
— Friedrich Nietzsche