Al analizar datos, a menudo es necesario comparar dos modelos de regresión para determinar cuál se ajusta mejor a un dato determinado. A menudo un modelo es un más simple versión de un mas complejo modelo que incluye parámetros adicionales. Sin embargo, más parámetros no siempre garantizan que un modelo más complejo sea realmente mejor, ya que simplemente podrían sobreajustar los datos.
Para determinar si la complejidad adicional es estadísticamente significativopodemos usar lo que llamamos Prueba F para modelos anidados. Esta técnica estadística evalúa si la reducción en la suma de cuadrados residual (RSS) debido a los parámetros adicionales es significativa o simplemente se debe al azar.
En este artículo, explico la prueba F para modelos anidados, luego presento un algoritmo paso a paso, demuestro su implementación usando pseudocódigo y proporciono código Matlab que puede ejecutar inmediatamente o reimplementar en su sistema favorito (aquí elegí Matlab porque me dio acceso rápido a estadísticas y funciones de ajuste, en las que no quería perder el tiempo). A lo largo del artículo, veremos ejemplos de pruebas F para modelos anidados que funcionan en algunos contextos, incluidos algunos ejemplos que integré en el código de muestra de Matlab.