Corrección de la heteroscedasticidad

Teniendo en cuenta la información mostrada en el siguiente video, donde a partir de los datos de 20 empresas sobre beneficios (B) y ventas (V) se estima un modelo lineal para explicar los beneficios en función de la ventas, se contrasta la presencia de heteroscedasticidad y se aplican Mínimos Cuadrados Ponderados (MCP).

Es inmediato que el modelo estimado por MCO es B(t) = 10'2229 + 0'0112223 * V(t) para t=1,2,3...,20. Además se obtiene un coeficiente de determinación de 0'642619.

Al representar los residuos por número de observación se observa que para distintos grupos de observaciones (por ejemplo, de la 1 a la 7, de la 8 a 16 y de la 17 a la 20) se obtiene una dispersión distinta, lo cual nos hace pensar en que las perturbaciones tienen varianza no constante. De igual forma, en el gráfico de los residuos frente a la variable que suponemos que produce la heteroscedasticidad (las ventas) observamos que conforme aumenta las ventas aumenta la dispersión de los residuos. Todo lo anterior me indica que, basándome en los métodos gráficos, hay presencia de heteroscedasticidad en el modelo considerado.

A partir del test de White (método analítico), decidimos rechazar la hipótesis nula de homocedasticidad en el modelo ya que el p-valor obtenido es de 0'04256. Esto se debe a que el p-valor se define como el mínimo valor de significatividad a partir del cual se rechaza la hipótesis nula. Es decir, para valores mayores que 0'04256 se rechaza la hipótesis nula y para valores menores no se rechaza. Puesto que en este caso estamos trabajando a un 5% de significación, es evidente que 0'05 es mayor que 0'04256, por lo que la decisión a tomar es rechazar la hipótesis nula, lo cual conduce a que hay presencia de heteroscedasticidad en el modelo.

Como es sabido, para aplicar el test de White es necesario plantear una regresión auxiliar donde se expliquen los residuos al cuadrado a partir de las variables originales, sus cuadrados y sus productos cruzados omitiendo las repeticiones. En este caso, los regresores de la variable auxiliar serán una constante, las ventas y su cuadrado (todas las demás posibilidades son repeticiones de estas). De esta forma la estimación por MCO de esta regresión será B(t) = -5'17545 + 0'0833682 * V(t) - 0'000132827 * V(t)^2 para t=1,2,...,20, con un coeficiente de determinación de 0'315679. Por último, puesto que el estadístico experimental se obtiene multiplicando el número de observaciones por el coeficiente de determinación de la regresión auxiliar, es claro que dicho valor corresponde a 20 * 0'315679 = 6'313575.

Puesto que hay presencia de heteroscedasticidad en el modelo, la estimación realizada por MCO no es óptima. Por tanto, para corregir este problema, como es sabido, hay que transformar los datos originales. Observando el video, es evidente que la manera de transformar los datos es dividiendo entre la raíz cuadrada de V. A partir de estos datos transformados, se vuelve a realizar la estimación por MCO obteniéndose que B(t) = 10'2147 + 0'063917 * V(t) con un coeficiente de determinación de 0'993125. Además, realizando una vez más el test de White se obtiene un p-valor de 0'197533, que al ser mayor que 0'05 nos indica que no rechazamos la hipótesis nula de homocedasticidad en las varianzas en las perturbaciones. Por tanto, el problema ha sido corregido.

The Camtasia Studio video content presented here requires JavaScript to be enabled and the latest version of the Macromedia Flash Player. If you are you using a browser with JavaScript disabled please enable it now. Otherwise, please update your version of the free Flash Player by downloading here.