Investigadores de prácticamente todos los campos de estudio llevan a cabo experimentos, por lo general
para descubrir algo acerca de un proceso o sistema particular. En un sentido literal, un experimento es
una prueba. En una perspectiva más formal, un experimento puede definirse como una prueba o serie de
pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para
observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida.

Este libro trata de la planeación y realización de experimentos y del análisis de los datos resultantes a

fin de obtener conclusiones válidas y objetivas. La atención se centra en los experimentos de ingeniería y
las ciencias físicas y químicas. En ingeniería, la experimentación desempeña un papel importante en el diseño
de productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de procesos. El
objetivo en muchos casos sería desarrollar un proceso robusto, es decir, un proceso que sea afectado en
forma mínima por fuentes de variabilidad externas.

Como ejemplo de un experimento, suponga que un ingeniero metalúrgico tiene interés en estudiar el

efecto de dos procesos diferentes de endurecimiento, el templado en aceite y el templado en agua salada,
sobre una aleación de aluminio. El objetivo del experimentador es determinar cuál de las dos soluciones
de templado produce la dureza máxima para esta aleación particular. El ingeniero decide someter varios
ejemplares o muestras para ensayo de la aleación a cada medio de templado y medir la dureza de los
ejemplares después del templado. Para determinar cuál de las soluciones es la mejor, se usará la dureza
promedio de los ejemplares tratados en cada solución de templado.
Al examinar este sencillo experimento salen a relucir varias cuestiones importantes:
   1. ¿Estas dos soluciones son los únicos medios de templado de interés potencial?
   2. ¿Hay en este experimento otros factores que podrían afectar la dureza y que deberían investigarse
   o controlarse?
   3. ¿Cuántas muestras para ensayo de la aleación deberán probarse en cada solución de templado?
   4. ¿Cómo deberán asignarse las muestras para ensayo de prueba a las soluciones de templado y en
   qué orden deberán colectarse los datos?
   5. ¿Qué método de análisis de datos deberá usarse?
   6. ¿Qué diferencia en la dureza promedio observada entre los dos medios de templado se considerará importante?
   
Todas estas preguntas, y tal vez muchas más, tendrán que responderse satisfactoriamente antes de llevar a

cabo el experimento.

En cualquier experimento, los resultados y las conclusiones que puedan sacarse dependen en gran

medida de la manera en que se recabaron los datos. Para ilustrar este punto, suponga que el ingeniero
metalúrgico del experimento anterior utilizó ejemplares de una hornada para el templado en aceite y
ejemplares de una segunda hornada para el templado en agua salada. Entonces, cuando compare la dureza promedio,
el ingeniero no podrá saber qué parte de la diferencia observada es resultado de la solución

de templado y qué parte es el resultado de diferencias inherentes entre las hornadas. Por lo tanto, el método
utilizado para recabar los datos ha afectado de manera adversa las conclusiones que pueden sacarse

del experimento.

En general, los experimentos se usan para estudiar el desempeño de procesos y sistemas. El proceso o 
sistema puede representarse con el modelo ilustrado en la figura 1-1. El proceso puede por lo general
visualizarse como una combinación de máquinas, métodos, personas u otros recursos que transforman cierta entrada
(con frecuencia un material) en una salida que tiene una o más respuestas observables. 
Algunas variables del
proceso x1,x2, ...,xp son controlables, mientras que otras z1,z2, ..., zq son no controlables (aunque pueden serlo para
los fines de una prueba).
Los objetivos del experimento podrían comprender los siguientes:

   1. Determinar cuáles son las variables que tienen mayor influencia sobre la respuesta y.
   2. Determinar cuál es el ajuste de lasx que tiene mayor influencia para que y esté casi siempre cerca
   del valor nominal deseado.
   3. Determinar cuál es el ajuste de las x que tiene mayor influencia para que la variabilidad de y sea
   reducida.
   4. Determinar cuál es el ajuste de lasx que tiene mayor influencia para que los efectos de las variables no
   controlables z1,z2, ..., zq sean mínimos.            


Como se puede ver por el análisis anterior, los experimentos incluyen muchas veces varios factores.

Habitualmente, uno de los objetivos de la persona que realiza un experimento, llamada el experimentador,
es determinar la influencia que tienen estos factores sobre la respuesta de salida del sistema. Al enfo
que general
para planear y llevar a cabo el experimento se le llamaestrategia de experimentación. Existen 
varias estrategias
que podría usar un experimentador. Se ilustrarán algunas de ellas con un ejemplo muy 
sencillo.

Al autor le gusta mucho jugar golf. Desafortunadamente, no le agrada practicar, por lo que siempre

busca la manera más sencilla para bajar su puntuación. Algunos de los factores que él considera importantes, o que
podrían influir en su puntuación, son los siguientes:

   1. El tipo de palo usado (grande o normal).
   2. El tipo de pelota usada (de goma de balata o de tres piezas).
   3. Caminar cargando los palos de golf o hacer el recorrido en un carrito.
   4. Beber agua o cerveza durante el juego.
   5. Jugar en la mañana o en la tarde.
   6. Jugar cuando hace frío o cuando hace calor.
   7. El tipo de spikes usados en los zapatos de golf (metálicos o de hule).
   8. Jugar en un día con viento o en uno apacible.

Evidentemente, hay muchos otros factores que podrían considerarse, pero supongamos que éstos son los

de interés primario. Además, teniendo en cuenta su larga experiencia en el juego, el autor decide que los
factores 5 a18 pueden ignorarse; es decir, estos factores no son importantes porque sus efectos son tan pequeños
que carecen de valor práctico. Los ingenieros y los investigadores deben tomar a menudo este tipo 
de decisiones acerca
de algunos de los factores que examinan en experimentos reales.


Consideremos ahora cómo podrían probarse experimentalmente los factores 1 al 4 para determinar 
su efecto
sobre la puntuación del autor. Suponga que en el curso del experimento pueden jugarse un máximo de ocho rondas
de golf. Un enfoque consistiría en seleccionar una combinación arbitraria de estos 
factores, probarlos y ver qué ocurre.
Por ejemplo, suponga que se selecciona la combinación del palo 
grande, la pelota de goma de balata, el carrito y el agua,
y que la puntuación resultante es 87. Sin embargo, 
durante la ronda el autor notó varios tiros descontrolados con el
palo grande (en el golf, grande no siempre es sinónimo de bueno) y, en consecuencia, decide jugar otra ronda con el
palo normal, manteniendo 
los demás factores en los mismos niveles usados anteriormente. Este enfoque podría
continuar de manera casi indefinida, cambiando los niveles de uno (o quizá dos) de los factores para la prueba
siguiente, con 
base en el resultado de la prueba en curso. Esta estrategia de experimentación, conocida como
enfoque de 
la mejor conjetura, es común entre ingenieros y científicos. Funciona de manera adecuada si los
experimentadores cuentan con una gran cantidad de conocimientos técnicos o teóricos del sistema que están
estudiando, así como amplia experiencia práctica. Sin embargo, el enfoque de la mejor conjetura presenta 
al
menos dos desventajas. Primera, supóngase que la mejor conjetura inicial no produce los resultados deseados.
Entonces el experimentador tiene que hacer otra conjetura acerca de la combinación correcta de 
los niveles de
los factores. Esto podría continuar por mucho tiempo, sin garantía alguna de éxito. Segunda, supóngase que la
mejor conjetura inicial produce un resultado satisfactorio. Entonces, el experimentador se ve tentado a suspender
las pruebas, aun cuando no hay ninguna garantía de que se ha encontrado 
la mejor solución.

Otra estrategia de experimentación muy común en la práctica es el enfoque de un factor a la vez. Este

método consiste en seleccionar un punto de partida, o línea base de los niveles, para cada factor, para después
variar sucesivamente cada factor en su rango, manteniendo constantes los factores restantes en el nivel base.
Después de haber realizado todas las pruebas, se construye por lo general una serie de gráficas 
en las que se
muestra la forma en que la variable de respuesta es afectada al variar cada factor manteniendo los demás factores
constantes. En la figura 1-2 se presenta una serie de gráficas para el experimento 
del golf, utilizando como línea base
los niveles de los cuatro factores: el palo grande, la pelota de goma de balata, caminar y beber agua. La interpretación
de esta gráfica es directa; por ejemplo, debido
a que la pendiente de la curva de la manera de desplazarse es negativa,
se concluiría que hacer el recorrido en el 
carrito mejora la puntuación. Con base en estas gráficas de un factor a la vez,
la combinación óptima que 
se seleccionaría sería el palo normal, desplazarse en el carrito y beber agua. El tipo de pelota
de golf aprentemente carece de importancia.

La desventaja principal de la estrategia de un factor a la vez es que no puede tomar en consideración
cualquier posible interacción entre los factores. Hay una interacción cuando uno de los factores no
produce el mismo efecto en la respuesta con niveles diferentes de otro factor. En la figura 1-3 se muestra una

interacción entre los factores del tipo de palo y la bebida para el experimento del golf. Observe que si el
autor utiliza el palo normal, el tipo de bebida consumida prácticamente no tiene efecto alguno sobre su
puntuación, pero si utiliza el palo grande, se obtienen resultados mucho mejores cuando bebe agua en lugar
de cerveza. Las interacciones entre factores son muy comunes y, en caso de existir, la estrategia de un

factor a la vez casi siempre producirá resultados deficientes. Muchas personas no perciben esto y, en
consecuencia, los experimentos de un factor a la vez son comunes en la práctica. (De hecho, algunas
personas piensan que esta estrategia se relaciona con el método científico o que es un principio "sólido"
de ingeniería.) Los experimentos de un factor a la vez siempre son menos eficientes que otros métodos
basados en un enfoque estadístico del diseño experimental. El tema se analizará con mayor detalle en el
capítulo 5.

El enfoque correcto para trabajar con varios factores es conducir un experimento factorial. Se trata

de una estrategia experimental en la que los factores se hacen variar en conjunto, en lugar de uno a la vez.

El concepto de diseño experimental factorial es de suma importancia, y varios capítulos de este libro se
dedican a presentar experimentosfactoriales básicos, así como algunas variantes y casos especiales útiles.

Para ilustrar la forma en que se lleva a cabo un experimento factorial, considere el experimento de

golf y suponga que sólo dos de los factores son de interés, el tipo de palo y el tipo de pelota. En la figura
1-4 se muestra un experimento factorial para estudiar los efectos conjuntos de estos dos factores sobre la
puntuación de golf del autor. Observe que en este experimento factorial ambos factores tienen dos niveles y
que en el diseño se usan todas las combinaciones posibles de los niveles de ambos factores. Geométricamente,
las cuatro corridas forman los vértices de un cuadrado. A este tipo particular de experimento

factorial se le llama diseño factorial 22 (dos factores, cada uno con dos niveles). Debido a que el autor
considera razonable suponer que jugará ocho rondas de golf para investigar estos factores, un plan factible
sería jugar dos rondas de golf con cada combinación de los niveles de los factores, como se muestra en

la figura 1-4. Un diseñador de experimentos diría que se han hecho dos réplicas del diseño. Este diseño
experimental permitiría al experimentador investigar los efectos individuales (o los efectos principales)
de cada factor y determinar si existe alguna interacción entre los factores.

En la figura 1-5a se presentan los resultados obtenidos al realizar el experimento factorial de la figura

1-4. En los vértices del cuadrado se indican las puntuaciones de cada ronda de golfjugada con las cuatro
combinaciones de prueba. Observe que hay cuatro rondas de golf que proporcionan información acerca
del uso del palo normal y cuatro rondas que proporcionan información sobre el uso del palo grande. Al
encontrar la diferencia promedio de las puntuaciones que están en los lados derecho e izquierdo del

cuadrado (como en la figura 1-5b), se tiene una medida del efecto de cambiar del palo grande al palo normal, o


Es decir, en promedio, al cambiar del palo grande al normal la puntuación se incrementa 3.25 golpes por
ronda. De manera similar, la diferencia promedio de las cuatro puntuaciones de la parte superior del cuadrado y
de las cuatro puntuaciones de la parte inferior miden el efecto del tipo de pelota usado (ver la figura
1-5c):

Por último, puede obtenerse una medida del efecto de la interacción entre el tipo de pelota y el tipo de palo
restando la puntuación promedio en la diagonal de izquierda a derecha d
el cuadrado de la puntuación 

promedio de la diagonal de derecha a izquierda (ver la figura 1-5d), cuyo resultado es


Los resultados de este experimento factorial indican que el efecto del palo es mayor que el efecto de
la pelota o que el de la interacción. Podrían usarse pruebas estadísticas para determinar si cualquiera
de estos efectos difiere de cero. De hecho, el caso es que hay evidencia estadística razonablemente sólida
de que el efecto del palo difiere de cero y de que no es el caso para los otros dos efectos. Por lo tanto, tal
vez el autor debería jugar siempre con el palo grande.

En este sencillo ejemplo se pone de manifiesto una característica muy importante del experimento

factorial: en los diseños factoriales se hace el uso más eficiente de los datos experimentales. Note que este
experimento incluyó ocho observaciones, y que las ocho observaciones se usan para calcular los efectos
del palo, de la pelota y de la interacción. Ninguna otra estrategia de experimentación hace un uso tan eficiente
de los datos. Ésta es una característica importante y útil de los diseños factoriales.


El concepto de experimento factorial puede extenderse a tres factores. Suponga que el autor desea

estudiar los efectos del tipo de palo, el tipo de pelota y el tipo de bebida consumida sobre su puntuación
de golf. Suponiendo que los tres factores tienen dos niveles, puede establecerse un diseño factorial como
el que se muestra en la figura 1-6. Observe que hay ocho combinaciones de prueba de estos tres factores
con los dos niveles de cada uno de ellos y que estos ocho ensayos pueden representarse geométricamente
como los vértices de un cubo. Se trata de un ejemplo de un diseño factorial 23Como el autor sólo desea
jugar ocho rondas de golf, este experimento requeriría que se juegue una ronda con cada una de las combinaciones
de los factores representadas por los ocho vértices del cubo de la figura 1-6. Sin embargo, al

comparar esta situación con el diseño factorial de dos factores de la figura 1-4, el diseño factorial 23 produciría
la misma información acerca de los efectos de los factores. Por ejemplo, en ambos diseños hay

cuatro pruebas que proporcionan información acerca del palo normal y cuatro pruebas que proporcionan
información acerca del palo grande, suponiendo que se repite dos veces cada corrida del diseño de dos

factores de la figura 1-4.


En la figura 1-7 se ilustra la forma en que podrían investigarse los cuatro factores -el palo, la pelota,
la bebida y la manera de desplazarse (caminando o en carrito)- en un diseño factorial 24. Como en
cualquier diseño factorial, se usan todas las combinaciones posibles de los niveles de los factores. Puesto que

los cuatro factores tienen dos niveles, sigue siendo posible hacer la representación geométrica de este diseño
experimental mediante un cubo (en realidad un hipercubo).


En general, si hay k factores, cada uno con dos niveles, el diseño factorial requeriría 2k corridas. Por

ejemplo, el experimento de la figura 1-7 requiere 16 corridas. Evidentemente, cuando el número de factores de
interés aumenta, el número de corridas requeridas se incrementa con rapidez; por ejemplo, un

experimento con 10 factores en el que todos los factores tienen dos niveles requeriría 1024 corridas. Esto
pronto se vuelve impracticable en lo que se refiere al tiempo y los recursos. En el experimento del golf,
el autor sólo puede jugar ocho rondas, por lo que incluso el experimento de la figura 1-7 resulta demasiado largo.

Por fortuna, cuando se trabaja con cuatro, cinco o más factores, por lo general no es necesario probar

todas las combinaciones posibles de los niveles de los factores. Un experimento factorial fraccionado es
una variación del diseño factorial básico en la que sólo se realiza un subconjunto de las corridas. En la figura 1-8
se ilustra un diseño factorial fraccionado para la versión de cuatro factores del experimento del

golf. Este diseño requiere sólo 8 corridas en lugar de las 16 originales y se llamaría fracción un medio. Si el
autor sólo puede jugar ocho rondas de golf, éste es un excelente diseño en el cual estudiar los cuatro factores.
Proporcionará información adecuada acerca de los efectos principales de los cuatro factores, así

como cierta información acerca de la forma en que interactúan estos factores.

Los diseños factoriales fraccionados son muy comunes en la investigación y el desarrollo industrial,

así como en el mejoramiento de procesos. Estos diseños se analizarán en el capítulo 8


Última modificación: viernes, 24 de noviembre de 2023, 20:57