Muchas veces el interés se centra en probar hipótesis sobre los coeficientes de regresión individuales. Estas pruebas serían útiles para determinar el valor de cada uno de los regresares del modelo de regresión. Por ejemplo, el modelo podría ser más eficaz con la inclusión de variables adicionales o quizá con la eliminación de una o más de las variables que están ya en el modelo.

Agregar una variable al modelo de regresión ocasiona siempre que la suma de cuadrados de regresión se incremente y que la suma de cuadrados del error se decremente. Es necesario decidir si el incremento de la suma de cuadrados de regresión es suficiente para garantizar el uso de la variable adicional en el modelo. Además, agregar una variable no importante al modelo en realidad puede incrementar el cuadrado medio del error, reduciéndose así la utilidad del modelo.

Las hipótesis para probar la significación de cualquier coeficiente de regresión individual, por ejemplo βj, son


Si H0:βj = 0 no se rechaza, entonces esto indica que xj puede eliminarse del modelo. El estadístico de prueba para esta hipótesis es


donde Cjj es el elemento de la diagonal de (X'X)-1 correspondiente a βj. La hipótesis nula H0:βj = 0 se rechazasi |t0|>tα/2, n-k-1.Observe que se trata en realidad de una prueba parcial o marginal, ya que el coeficiente de regresión βj depende de todos los demás regresares xi(i≠j) que están en el modelo.

Al denominador de la ecuación 10-28, √(σ2Cjj),se le llama con frecuencia error estándar (se) del coeficiente de regresión βj. Es decir,


Por lo tanto, una manera equivalente de escribir el estadístico de prueba de la ecuación 10-28 es


La mayoría de los programas de computadora de regresión proporcionan la prueba t para cada parámetro del modelo. Por ejemplo, considere la tabla 10-4, la cual contiene la salida de Minitab para el ejemplo 10-1. En la sección superior de esta tabla se da la estimación de mínimos cuadrados de cada parámetro, el error estándar, el estadístico t y el valor P correspondiente. Se concluiría que ambas variables, la temperatura y la velocidad de alimentación, contribuyen de manera significativa en el modelo.

También puede examinarse directamente la contribución de una variable particular, por ejemplo xj, ala suma de cuadrados de regresión, dado que otras xvariables (i≠j) están incluidas en el modelo. El procedimiento para hacer esto es la prueba general de la significación de la regresión o, como se denomina con frecuencia, el método de suma de cuadrados extra. Este procedimiento también puede usarse para investigar la contribución de un subconjunto de los regresores al modelo. Considere el modelo de regresión con k regresores:


donde y es (n x 1), X es(n x p), β es(p x 1)Ɛ es(n x 1) y p =k+ 1. Querría determinarse si el subconjunto de regresares x1, x2, ..., xr (r < k) contribuye significativamente al modelo de regresión. Sea que se haga la partición del vector de los coeficientes de regresión de la siguiente manera:


donde β1 es (r x 1) y β2 es [(p - r) X 1]. Quieren probarse las hipótesis


El modelo puede escribirse como


donde X1 representa las columnas de X asociadas con β1Xrepresenta las columnas de X asociadas con β2.

Para el modelo completo (incluyendo tanto a β1como a β2) se sabe que β = (X'X)-1X'y. Además, la suma de cuadrados de regresión para todas las variables incluyendo la ordenada al origen es 


y


A SSR (β) se le llama la suma de cuadrados de regresión debida a β. Para encontrar la contribución de los términos en β1 a la regresión, se ajusta el modelo suponiendo que la hipótesis nula H0:β1 = 0 es verdadera. 

El modelo reducido se encuentra a partir de la ecuación 10-32 con β1 = 0:


El estimador de mínimos cuadrados de β2 es β'2 = (X'2X2)-1X'2y, y


La suma de cuadrados de regresión debida a β1 dado que β2 está ya en el modelo es


Esta suma de cuadrados tiene r grados de libertad. Es la "suma de cuadrados extra" debida a β1. Observe que SSR(β1|β2) es el incremento en la suma de cuadrados de regresión debido a la inclusión de las variables x1, x2, ..., xr en el modelo.

Ahora bien, SSR(β1|β2) es independiente de MSE, y la hipótesis nula β1 = 0 puede probarse con el estadístico


Si F0 > Fα,r,n-p, se rechaza H0, y se concluye que al menos uno de los parámetros en β1 es diferente de cero y, por consiguiente, al menos una de las variables x1, x2, ..., xr en X1 contribuye significativamente al modelo de regresión. Algunos autores llaman a la prueba de la ecuación 10-36 la prueba F parcial.

La prueba F parcial es muy útil. Puede usarse para medir la contribución de xj como si fuera la últimavariable que se agregó al modelo, calculando


Éste es el incremento en la suma de cuadrados de regresión debido a que se agrega xj a un modelo que ya contiene a x1, ..., xj-1, xj+1, ..., xk. Observe que la prueba F parcial de una sola variable xj es equivalente a la prueba t de la ecuación 10-28. Sin embargo, la prueba F parcial es un procedimiento más general por cuanto puede medir el efecto de conjuntos de variables.

EJEMPLO 1O-6

Considere los datos de la viscosidad del ejemplo 10-1. Suponga que se quiere investigarla contribución de la variable x2 (velocidad de alimentación) al modelo. Es decir, las hipótesis que quieren probarse son


Esto requerirá la suma de cuadrados extra debida a β2, o


Entonces, por la tabla 10-4, donde se probó la significación de la regresión, se tiene


a la que se llamó en la tabla la suma de cuadrados del modelo. Esta suma de cuadrados tiene dos grados de libertad.

El modelo reducido es


El ajuste de mínimos cuadrados de este modelo es


y la suma de cuadrados de regresión para este modelo (con un grado de libertad) es


Observe que SSR(β1|β0) se muestra en la parte inferior de la salida de Minitab de la tabla 10-4 bajo el encabezado "Seq SS". Por lo tanto,


con 2-1 = 1 grado de libertad. Éste es el incremento en la suma de cuadrados de regresión que resulta de agregar x2 a un modelo que contenía ya a x1, yse muestra en la parte inferior de la salida de Minitab en la tabla 10-4. Para probar H0:β2 = 0, por el estadístico de prueba se obtiene


Observe que en el denominador de F0 se usa MSE del modelo completo (tabla 10-4). Entonces, puesto que F0.05, 1, 13 = 1.67, se rechazaría H0:β2 = 0 y se concluiría que x2 (velocidad de alimentación) contribuye significativamente al modelo.

Debido a que esta prueba F parcial incluye un solo regresor, es equivalente a la prueba t porque el cuadrado de una variable aleatoria t con v grados de libertad es una variable aleatoria F con 1 y v grados de libertad. Para ver esto, observe, por la tabla 10-4, que el estadístico t para H0:β2 = 0 dio como resultado t0 = 3.5203 y que t20 = (3.5203)2=12.3925 = F0.

Última modificación: sábado, 16 de marzo de 2024, 14:41