M. en I. AMBIENTAL: 3.1.- Un ejemplo

Un ingeniero de desarrollo de productos tiene interés en investigar la resistencia a la tensión de una fibra sintética nueva que se usará para hacer tela de camisas para caballero. El ingeniero sabe por experiencia previa que la resistencia a la tensión se afecta por el peso porcentual del algodón utilizado en la mezcla de materiales de la fibra. Además, sospecha que al aumentar el contenido de algodón se incrementará la resistencia, al menos en un principio. Sabe asimismo que el contenido de algodón deberá variar entre 10 y 40 por ciento para que el producto final tenga otras características de calidad que se desean (como la capacidad de ser sometido a un tratamiento de planchado permanente).

El ingeniero decide probar ejemplares en cinco niveles del peso porcentual del algodón: 15,20,25,30 Y35 por ciento. También decide probar cinco ejemplares en cada nivel del contenido de algodón.
Se trata de un ejemplo de un experimento con un solo factor con a =5 niveles del factor y n =5 réplicas. Las 25 corridas deberán realizarse de manera aleatoria. Para ilustrar cómo puede aleatorizarse el orden de las corridas, suponga que las corridas se numeran de la siguiente manera:

hora se selecciona un número aleatorio entre 1 y 25. Suponga que este número es 8. Entonces la observación número 8 (20% de algodón) se corre primero. Este proceso se repetiría hasta que las 25 observaciones tengan asignada una posición en la secuencia de prueba. Muchos paquetes de software de computadora para ayudar a los experimentadores a seleccionar y construir un diseño, aleatorizan el orden de las corridas utilizando números aleatorios de esta manera.
Suponga que la secuencia de prueba obtenida es:

Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras desconocidas-las cuales quizá varíen fuera de control durante el experimento-- contaminen los resultados. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodón, después se prueban los cinco ejemplares con 20% de algodón, etc.). Si la máquina empleada para probar la resistencia a la tensión presenta un efecto de calentamiento tal que entre más tiempo esté funcionando sean menores las lecturas de la resistencia a la tensión observadas, el efecto del calentamiento contaminará potencialmente los datos de la resistencia a la tensión y destruirá la validez del experimento.

Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En la tabla 3-1 se muestran las observaciones que obtiene para la resistencia a la tensión.

Siempre es una buena idea examinar gráficamente los datos experimentales. En la figura 3-1 se muestran los diagramas de caja para la resistencia a la tensión con cada nivel del peso porcentual de algodón, y en la figura 3-2 se ilustra un diagrama de dispersión de la resistencia a la tensión contra el peso porcentual del algodón. En la figura 3-2, los puntos rellenos son las observaciones individuales y los círculos huecos son los promedios de la resistencia a la tensión observada. Ambas gráficas indican que la resistencia a la tensión se incrementa cuando el contenido de algodón se incrementa, hasta cerca de 30% de algodón. Después de 30% de algodón, hay un marcado descenso de la resistencia a la tensión. No hay evidencia sólida que sugiera que la variabilidad de la resistencia a la tensión alrededor del promedio dependa del peso porcentual del algodón. Con base en este análisis gráfico simple, se tienen firmes sospechas de que 1) el contenido de algodón afecta la resistencia a la tensión y 2) alrededor de 30% de algodón produce la resistencia máxima.

Suponga que se quiere ser más objetivo en el análisis de los datos. Específicamente, imagine que quieren probarse las diferencias entre las resistencias a la tensión promedio con todos los niveles a =5 del peso porcentual del algodón. Por lo tanto, el interés se centra en probar la igualdad de las cinco medias. Pudiera parecer que este problema se resolvería realizando una prueba t para todos los pares de medias posibles. Sin embargo, no es ésta la mejor solución de este problema, porque llevaría a una distorsión considerable en el error tipo I. Por ejemplo, suponga que quiere probarse la igualdad de las cinco medias usando comparaciones por pares. Hay 10 pares posibles, y si la probabilidad de aceptar correctamente la hipótesis nula en cada prueba individual es de 1 - 𝛼 = 0.95, la probabilidad de aceptar correctamente la hipótesis nula en las 10 pruebas es de =0.60 si las pruebas son independientes. Por lo tanto, ha ocurrido un incremento sustancial en el error tipo I.

El procedimiento correcto para probar la igualdad de varias medias es el análisis de varianza. Sin embargo, el análisis de varianza tiene un rango de aplicaciones mucho más amplio que el problema anterior. Probablemente sea la técnica más útil en el campo de la inferencia estadística.

Última modificación: viernes, 26 de enero de 2024, 14:14