Cómo creé un proyecto de ciencia de datos después del ciclo de vida CRISP-DM | de Gustavo Santos | noviembre 2024

Cómo creé un proyecto de ciencia de datos después del ciclo de vida CRISP-DM | de Gustavo Santos | noviembre 2024

Un proyecto de principio a fin que utiliza el marco CRISP-DM

Imagen creada por IA. OpenAI. Marco del ciclo de vida del proyecto CRISP-DM para ciencia de datos. DALL-E, 2024.

CRISP-DM significa Proceso estándar entre industrias para la minería de datosun marco de minería de datos abierto a cualquiera que quiera utilizarlo.

Su primera versión fue creada por SPSS, Daimler-Benz y NCR. Luego, un grupo de empresas lo desarrolló y lo convirtió en CRISP-DM, que es uno de los marcos más conocidos y adoptados en la ciencia de datos en la actualidad.

El proceso consta de 6 fases y es flexible. Es más bien un organismo vivo donde puedes (y probablemente deberías) ir y venir entre fases, iterando y mejorando los resultados.

Las fases son:

Comprensión empresarial

Entendiendo los datos

Preparación de datos

Modelado

Evaluación

Despliegue

Las flechas pequeñas muestran un camino natural desde la comprensión empresarial hasta la implementación, donde las interacciones ocurren directamente, mientras que el círculo denota una relación cíclica entre fases. Esto significa que el proyecto no termina con la implementación, sino que puede reiniciarse debido a nuevos problemas comerciales desencadenados por el proyecto o…