Parte 1: aprovechar la regresión lineal y los árboles de decisión para imputar variaciones en series de tiempo.
Datos faltantes en el análisis de series temporales – ¿Esto te suena familiar?
¿Le suena demasiado familiar la falta de datos en sus conjuntos de datos debido a un mal funcionamiento del sensor, transmisión o cualquier tipo de mantenimiento?
Bueno, los valores faltantes descarrilan sus predicciones y sesgan su análisis.
Entonces, ¿cómo los arreglas?
Métodos tradicionales puede parecer relleno o interpolación directa – pero ¿es suficiente??
¿Qué sucede cuando sus datos tienen patrones complejos, tendencias no lineales o alta variabilidad? Las técnicas simples fallarían y darían resultados inestables.
¿Qué pasaría si hubiera formas más inteligentes de afrontar este desafío?
Esto es exactamente lo que hace el aprendizaje automático: desde análisis de regresión hasta K-vecinos más cercanos y redes neuronales, que no implican más que adaptarse y llenar los vacíos con precisión.
¿Curioso? Echemos un vistazo más de cerca a cómo estos métodos avanzados cambiarán su análisis de series temporales.
Imputaremos los datos faltantes utilizando un conjunto de datos que usted mismo puede generar fácilmente…