ANOVA. Análisis de la varianza con un factor | | UPV

Universitat Politècnica de València - UPV
11 Oct 201309:20

Summary

TLDREl análisis de varianza (ANOVA) es una herramienta estadística utilizada para determinar si existen diferencias significativas entre los grupos en un estudio. En este script, se aborda el caso de una fábrica de motores que compara cigüeñal de tres proveedores distintos, uno de los cuales es nuevo y más caro pero que alega mejores propiedades dinámicas. Se realiza una prueba con 10 cigüeñal de cada proveedor para evaluar su equilibrado dinámico. El objetivo es aprender a calcular la tabla de ANOVA y sacar conclusiones sobre la variabilidad de la variable respuesta (equilibrado dinámico). Se explica que el ANOVA descompone la variabilidad total en variabilidad entre tratamientos y variabilidad residual, utilizando sumas de cuadrados y grados de libertad. A través del cálculo del ratio F, se evalúa la significación del efecto de los diferentes proveedores. En el ejemplo, se encuentra que el ratio F es menor al valor crítico de la tabla, lo que conduce a aceptar la hipótesis nula de igualdad de medias entre los proveedores. Esto significa que no hay evidencia suficiente para cambiar al proveedor más caro, a pesar de su precio superior.

Takeaways

  • 🔍 Se detalló el análisis de la varianza (ANOVA) en presencia de un solo factor para aprender a calcular la tabla de ANOVA y sacar conclusiones sobre la variabilidad de la variable respuesta.
  • 🚀 Se presentó un ejemplo de una fábrica de motores que compara cigüeñales de tres proveedores para determinar si uno es superior en términos de equilibrado dinámico.
  • 📊 El objetivo es descomponer la variabilidad total de los datos en variabilidad debido a los tratamientos y variabilidad residual.
  • 🧮 Se utilizan fórmulas específicas para calcular las sumas de cuadrados totales, sumas de cuadrados de los tratamientos y sumas de cuadrados residuales.
  • ✅ Se realiza un análisis hipotético para determinar si existen diferencias significativas entre las medias de los equilibrados dinámicos de los proveedores.
  • 📉 Se calcula el cuadrado medio para la variabilidad observada y para los efectos de los tratamientos, comparándolos con el cuadrado medio residual.
  • 📈 El ratio F se calcula dividiendo el cuadrado medio de los tratamientos entre el cuadrado medio residual para evaluar la significancia del efecto.
  • 🎯 Se utiliza la tabla de la distribución F para determinar si el ratio F calculado es significativo, con un riesgo alfa del 5%.
  • ❌ Si el ratio F es menor al valor crítico de la tabla, se acepta la hipótesis nula de que no hay diferencia significativa entre los proveedores.
  • ✅ En el ejemplo, el ratio F encontrado (0.53) es menor al valor crítico (335), lo que indica que no hay diferencia significativa entre los proveedores.
  • 📚 Se aprendió una técnica para comparar medias de varias poblaciones y se aplicó el análisis de varianza en un contexto real para llegar a una conclusión.

Q & A

  • ¿Qué objetivo se tiene al analizar la varianza en presencia de un solo factor?

    -El objetivo es aprender a calcular la tabla de la varianza y sacar conclusiones sobre la variabilidad o no sobre la variable respuesta de los factores involucrados, en este caso uno solo de ellos.

  • ¿Cuál es el problema que enfrenta la fábrica de motores al considerar un tercer proveedor de cigüeñales?

    -El tercer proveedor ofrece cigüeñales más caras pero argumenta tener mejores propiedades dinámicas, específicamente un equilibrado dinámico menor, lo que es importante para la fábrica.

  • ¿Cómo decide la fábrica si los cigüeñales del nuevo proveedor son superiores a pesar del precio más alto?

    -La fábrica decide realizar una prueba comparando 10 cigüeñales del nuevo proveedor con 10 de cada uno de sus dos proveedores tradicionales para evaluar su equilibrado dinámico.

  • ¿Qué técnica estadística se utiliza para comparar la media de la variable respuesta entre los tres proveedores de cigüeñales?

    -Se utiliza el análisis de la varianza (ANOVA) para descomponer la variabilidad total de los datos y comparar las medias de varias poblaciones.

  • ¿Cuál es la hipótesis de igualdad que se plantea en el ANOVA para la comparación de los equilibrados dinámicos de los tres proveedores?

    -La hipótesis de igualdad planteada es que las tres medias de los equilibrados dinámicos de los proveedores son iguales frente a la hipótesis alternativa de la existencia de desigualdad en las medias.

  • ¿Cómo se calcula la suma de cuadrados totales en el ANOVA?

    -Para la suma de cuadrados totales se aplica una fórmula específica que considera las desviaciones de cada dato con respecto a la media general.

  • ¿Cómo se interpretan los resultados del análisis de varianza para determinar si hay un efecto significativo?

    -Se compara la suma de cuadrados asociada a cada efecto con la suma de cuadrados residual. Si el efecto no existe, el cuadrado medio asociado será similar al residual y el ratio F será cercano a 1. Si existe un efecto, el ratio F será mucho mayor que 1.

  • ¿Cuál es el riesgo alfa utilizado en el análisis y cómo afecta la comparación de proveedores?

    -El riesgo alfa del 5% se utiliza para determinar la probabilidad de obtener una conclusión errónea. Al comparar proveedores de manera individual (2 a 2), se incrementa la probabilidad de cometer un error tipo I.

  • ¿Cómo se calcula el ratio F en el ANOVA y qué representa?

    -El ratio F se calcula mediante el cociente de los cuadrados medios asociados a los efectos entre los cuadrados medios residuales. Representa la relación entre la varianza entre los grupos y la varianza dentro de los grupos.

  • ¿Qué conclusiones se pueden sacar de la tabla de ANOVA si el ratio F calculado es inferior al valor crítico de la tabla?

    -Si el ratio F calculado es inferior al valor crítico, se acepta la hipótesis nula de que no hay diferencia significativa entre los proveedores y, por lo tanto, no se justifica el cambio a un proveedor más caro.

  • ¿Cómo afecta el análisis de varianza la toma de decisiones en un diseño de experimentos que evalúa el efecto de un único factor?

    -El análisis de varianza permite descomponer la variabilidad total en componentes atribuibles a factores específicos y a una varianza residual. Esto ayuda a determinar si los cambios en la variable respuesta son significativos y justifican la selección de un factor o proveedor en particular.

Outlines

00:00

🔍 Análisis de Varianza con un Solo Factor

Este párrafo introduce el análisis de la varianza (ANOVA) en el contexto de un solo factor. Se describe un escenario en una fábrica de motores donde se evalúa la calidad de las cigüeñalas de tres proveedores distintos. El objetivo es aprender a calcular la tabla de la ANOVA y extraer conclusiones sobre la variabilidad de la variable respuesta (equilibrado dinámico) entre los factores (proveedores). Se destaca la importancia de la comparación de las medias de varias poblaciones y cómo el ANOVA permite descomponer la variabilidad total de los datos en variabilidad debido a los tratamientos y variabilidad residual.

05:03

📊 Procedimiento del ANOVA y Comparación de Medias

En este párrafo se profundiza en el proceso del ANOVA, explicando cómo se calculan las sumas de cuadrados totales, tratamientos y residuales, y cómo se utilizan para determinar si hay un efecto significativo debido a los diferentes proveedores. Se describen los pasos para calcular el cuadrado medio y se hace hincapié en la importancia de la relación entre los cuadradillos medios para determinar la presencia de un efecto. Finalmente, se muestra cómo se utiliza el cociente F para evaluar si las medias poblacionales son iguales o no, y cómo se interpreta el resultado a través de la tabla de la distribución F para un riesgo alfa del 5%.

Mindmap

Keywords

💡Análisis de varianza (ANOVA)

El análisis de varianza, también conocido como ANOVA, es una técnica estadística utilizada para determinar si hay diferencias significativas entre los grupos en un estudio. En el video, se utiliza para comparar el equilibrado dinámico de las cigüeñalas de tres proveedores diferentes y determinar si existe una diferencia significativa en su calidad.

💡Factor

En el contexto del análisis de varianza, un factor es una variable categórica que se utiliza para dividir los datos en grupos o condiciones. En el video, el factor es el proveedor de las cigüeñalas, con tres variantes posibles: los dos proveedores tradicionales y el nuevo proveedor.

💡Variable respuesta

La variable respuesta es la que se está midiendo o evaluando en un estudio. En el video, la variable respuesta es el equilibrado dinámico de las cigüeñalas, que es una propiedad dinámica importante para la fábrica de motores.

💡Sumas de cuadrados

Las sumas de cuadrados son cálculos estadísticos utilizados en el análisis de varianza para descomponer la variabilidad total de los datos en componentes asociados con los factores y el error. En el video, se calculan las sumas de cuadrados totales, de los tratamientos y residuales para analizar la variabilidad en los datos.

💡Grados de libertad

Los grados de libertad son un concepto estadístico que indica el número de observaciones independientes en un conjunto de datos que se pueden variar de forma independiente. En el análisis de varianza, se utilizan para calcular el tamaño de los contrastes y para determinar la significancia estadística de los resultados. En el video, se calculan los grados de libertad totales, de los tratamientos y residuales.

💡Cuadrado medio

El cuadrado medio, también conocido como el valor F, es el resultado de dividir una suma de cuadrados por sus grados de libertad. Se utiliza en el análisis de varianza para comparar las sumas de cuadrados de los factores y el error. En el video, se calcula el cuadrado medio total y el cuadrado medio residual para evaluar la significancia de las diferencias entre los proveedores.

💡Hipotésis de igualdad

La hipótesis de igualdad es la hipótesis nula en un análisis de varianza, que establece que no hay diferencia significativa entre los grupos. En el video, la hipótesis de igualdad sugiere que los equilibrados dinámicos medios de las cigüeñalas de los tres proveedores son iguales.

💡Hipotésis alternativa

La hipótesis alternativa es la hipótesis opuesta a la hipótesis nula, que sugiere que hay una diferencia significativa entre los grupos. En el video, la hipótesis alternativa es que al menos dos de los proveedores tienen equilibrados dinámicos medios diferentes.

💡Error de primera especie

El error de primera especie, también conocido como error tipo I, es el riesgo de rechazar la hipótesis nula cuando es verdadera. En el video, se menciona un riesgo alfa del 5%, lo que significa un 5% de probabilidad de cometer un error de primera especie al realizar el análisis de varianza.

💡F Ratio

El F Ratio, o valor F, es el cociente entre el cuadrado medio asociado a un factor y el cuadrado medio residual. Se utiliza para determinar si la variabilidad atribuible a un factor es significativamente mayor que la variabilidad residual. En el video, se calcula el F Ratio para evaluar si hay una diferencia significativa en el equilibrado dinámico de las cigüeñalas de los diferentes proveedores.

💡Tabla de la F

La tabla de la F, o tabla de Fisher, es una herramienta utilizada para encontrar el valor crítico de F a un nivel de significancia dado. En el análisis de varianza, se compara el F Ratio calculado con los valores de la tabla para determinar si los resultados son estadísticamente significativos. En el video, se utiliza la tabla de la F para comparar el F Ratio obtenido y decidir si se acepta o rechaza la hipótesis de igualdad.

Highlights

El objetivo del análisis de la varianza (ANOVA) es aprender a calcular la tabla de la ANOVA y sacar conclusiones sobre la variabilidad de la variable respuesta de los factores involucrados.

Un ejemplo práctico es la comparación de cigüeñales de diferentes proveedores en una fábrica de motores.

La fábrica evalúa si los cigüeñales de un nuevo proveedor, aunque más caros, ofrecen mejores propiedades dinámicas.

Se realiza una prueba comparando 10 cigüeñales del nuevo proveedor con 10 de cada uno de los proveedores tradicionales.

El equilibrado dinámico es la variable respuesta de interés, y se busca que sea lo menor posible.

La técnica de comparación de dos poblaciones normales podría usarse, pero sería menos eficiente en comparaciones múltiples.

El análisis de la varianza (ANOVA) es el método adecuado para comparar más de dos grupos.

La variabilidad total de los datos se descompone en variabilidad debida a los tratamientos y variabilidad residual.

Se calculan las sumas de cuadrados totales, de los tratamientos y residuales para descomponer la variabilidad.

Las sumas de cuadrados se dividen por sus grados de libertad para obtener los cuadrado medios.

El cuadrado medio residual es una estimación de la varianza de las poblaciones muestral, asumiendo igualdad de varianzas.

El cuadrado medio asociado a cada efecto permite determinar si hay un efecto significativo.

El ratio F se calcula como el cociente entre el cuadrado medio del efecto y el cuadrado medio residual.

Si el ratio F es mayor que 1, indica la presencia de un efecto significativo.

Se utiliza la tabla de la distribución F para determinar si el ratio F calculado es significativo a un nivel de alfa dado.

Si el ratio F calculado es menor que el valor crítico de la tabla, se acepta la hipótesis nula de igualdad de medias.

En el ejemplo dado, no se encontró evidencia suficiente de superioridad en los cigüeñales del nuevo proveedor.

La hipótesis nula de que no hay diferencia significativa entre los proveedores fue aceptada.

El análisis de la varianza (ANOVA) permite comparar medias de varias poblaciones de manera eficiente y得出结论 (concluir en español) sobre su homogeneidad.

Transcripts

play00:04

en la continuación del análisis del a

play00:06

nova nos vamos a detener en el análisis

play00:09

de la varianza cuando estamos en

play00:12

presencia de un solo factor cuando

play00:15

analizamos un solo factor el objetivo

play00:19

será

play00:22

aprender a calcular la tabla de la nova

play00:26

y sacar conclusiones sobre la

play00:29

variabilidad o no sobre la variable

play00:31

respuesta de los factores involucrados

play00:34

en este caso uno solo de ellos y lo

play00:38

vamos a ver sobre un ejemplo en una

play00:41

fábrica de motores que tiene dos

play00:43

proveedores de cigüeñales que menor que

play00:46

mecaniza le aparece un tercer proveedor

play00:48

que ofrece sus cigüeñal es algo más caro

play00:51

pero argumentando sus mejores

play00:54

propiedades dinámicas concretamente que

play00:57

su equilibrado dinámico es menor lo cual

play01:00

es importante la factoría decide hacer

play01:03

una prueba comparando 10 cigüeñales del

play01:06

nuevo proveedor con 10 de cada uno de

play01:08

sus dos proveedores tradicionales en los

play01:11

resultados que obtienen del experimento

play01:14

son los que se muestran

play01:16

a continuación la pregunta es hay

play01:20

evidencia suficiente respecto a la

play01:23

superioridad de los cigüeñales del nuevo

play01:25

pruebo el proveedor para cambiar a este

play01:27

pese al ligero incremento del precio

play01:30

este ejemplo en un caso particular de

play01:34

diseño de experimentos donde se estudia

play01:36

el efecto de un único factor el

play01:38

proveedor con tres variantes son los

play01:41

tres por proveedores a comparar sobre la

play01:44

media de la variable respuesta que es el

play01:47

equilibrado dinámico que debe ser el

play01:49

menor el menor posible

play01:52

dado que ya conocemos la técnica de

play01:54

comparación de dos poblaciones normales

play01:57

podríamos realizar en este caso la

play02:00

comparación utilizando

play02:03

el análisis realizando la comparación de

play02:07

las parejas 2 a 2 y si en vez de

play02:10

tratarse de tres proveedores hubieran

play02:12

cinco cuántas parejas de tratamiento

play02:14

habría que compartir suponiendo que los

play02:17

proveedores fueran idénticos en cada

play02:19

comparar en cada comparación se se opera

play02:22

como un riesgo alfa del 5% la

play02:25

probabilidad de obtener una conclusión

play02:27

errónea sería del 5% en el caso de

play02:31

hacerlo 2 a 2 como conclusión a estas

play02:34

preguntas podemos llegar a la conclusión

play02:36

de que sería un procedimiento muy

play02:38

laborioso por una parte y que se

play02:41

incrementaría la probabilidad global de

play02:43

cometer un error de primera especial por

play02:46

lo tanto la técnica adecuada en este

play02:49

caso en la nova es el análisis de la

play02:51

varianza

play02:53

en el ejemplo trataremos de cumplimentar

play02:57

los siguientes objetivos dar una idea

play02:59

intuitiva del fundamento de la 'nova

play03:01

calcular la tabla de la varianza y cómo

play03:04

se interpreta su contenido lo que con

play03:06

posterioridad nos va a permitir aprender

play03:09

una técnica sencilla para comparar

play03:13

medias de varias poblaciones y en la

play03:15

nova resultados significativos la idea

play03:19

de la nova es descomponer la

play03:20

variabilidad total de los datos en la

play03:24

variabilidad debida a la diferencia

play03:26

entre los tratamientos más una variedad

play03:29

residual como cuantificamos de donde

play03:33

salen estos valores veamos los en el

play03:35

ejemplo de los proveedores de cigüeñales

play03:37

donde tenemos un solo factor con tres

play03:40

variantes la variable respuesta en el

play03:43

equilibrado dinámico y el objetivo final

play03:45

ver si hay diferencia entre los

play03:47

equilibrados dinámicos medios cigüeñales

play03:50

de los tres proveedores es decir

play03:52

plantearnos la el test de hipótesis de

play03:56

igualdad en este caso de las tres medias

play03:58

frente a la hipótesis alternativa de la

play04:00

existencia de desigualdad de las medias

play04:04

en al menos dos

play04:08

y los vamos a realizar mediante la nova

play04:11

para ello obtenemos las medias de cada

play04:15

uno de los tratamientos y la media de

play04:20

todos los datos y a continuación pues

play04:23

vamos a obtener esta variabilidad vamos

play04:27

descomponer la variabilidad total de los

play04:29

datos en la variabilidad debida al

play04:32

primer tratamiento más una variabilidad

play04:34

residual calculando para ello las sumas

play04:37

de cuadrados correspondientes como lo

play04:40

hacemos pues para la suma de cuadrados

play04:42

totales aplicamos esta fórmula

play04:47

para la suma de los cuadrados de los

play04:49

tratamientos aplicamos

play04:53

la otra la suma de los cuadrados de las

play04:55

desviaciones de la media de cada

play04:57

proveedor con respecto a la media

play04:59

general

play05:03

y la suma de cuadrados residuales que es

play05:06

la suma de los cuadrados de las

play05:07

desviaciones de cada dato con respecto a

play05:10

las medias de su tratamiento pues lo

play05:13

calculamos de esta forma que se muestra

play05:17

como demostramos si hay significación o

play05:21

no del efecto la comparación de la suma

play05:23

de cuadrados asociadas a cada efecto con

play05:26

la suma de cuadrado residual es la que

play05:28

nos permite estudiar ese dicho efecto es

play05:30

o no significativo para llevar a cabo

play05:34

esta comparación cada suma de cuadrados

play05:36

se divide por su grado de libertad

play05:38

obteniéndose el estadístico del

play05:40

denominado cuadrado medio

play05:44

se determinan los grados de libertad

play05:46

restándole 1 al número de datos para el

play05:49

total 1 el número de tratamientos para

play05:52

el caso de los mismos y los residuales

play05:54

pues será la diferencia en el ejemplo

play05:58

serían 29 2 y 27 grados de libertad y

play06:02

respectivamente de esta manera el

play06:05

cuadrado medio total en la varianza de

play06:07

los datos observados el cuadrado medio

play06:09

residual es una estimación de la

play06:12

varianza de las poblaciones muestra da

play06:14

asumiendo igualdad de varianzas para

play06:16

todas las poblaciones y el cuadrado

play06:19

medio asociado a cada efecto es el que

play06:22

nos va a permitir

play06:24

si a calcular si hay o no efecto si el

play06:28

efecto no existe en la población el

play06:30

cuadrado me dio otra estimación de la

play06:32

varianza independiente del cuadrado

play06:35

medio residual y si existe un efecto

play06:37

real entonces esta relación tiene que

play06:41

ser mayor a 1 para ello realizamos el

play06:44

test

play06:45

efe

play06:46

en este caso encontramos el valor del f

play06:50

ratio f calculada mediante este cociente

play06:53

si no existe un efecto real el cuadrado

play06:57

medio este va a ser muy parecido al

play06:59

residual y por lo tanto esto va a valer

play07:01

igual a 1s existe pues todo lo contrario

play07:06

este valor será muy superior al otro

play07:08

valor como lo encontramos pues aquí

play07:13

tenemos la fórmula que nos permite

play07:15

encontrar este estadístico y si se

play07:18

cumple pues el mismo se va a comportar

play07:20

como una efe de fisher con estos grados

play07:23

de de libertad

play07:26

y si esto sucede pues entonces

play07:28

aceptaríamos la hipótesis de que las

play07:31

medias poblacionales hoy son iguales y

play07:33

por lo tanto no hay diferencia

play07:35

significativa entre los diferentes

play07:38

proveedores por el caso contrario si no

play07:43

pasa pues

play07:45

no habría esa diferencia significativa

play07:49

haciendo los cálculos y poniéndolo en

play07:52

esta que es la tabla resumen de la nova

play07:54

poniendo todos los valores aquí

play07:57

dividimos estos dos cuadrados y

play07:59

obtenemos el f ratio

play08:02

y buscamos en la tabla

play08:05

de la fd ficha del valor correspondiente

play08:07

con un error de primera especie del 5%

play08:12

observamos que como este valor es 0.53

play08:16

es mucho menor que el 335 que sale en la

play08:20

tabla con lo cual aceptamos la hipótesis

play08:22

nula de que no hay diferencia

play08:24

significativa entre los proveedores esto

play08:27

lo observamos lo mismo que hemos dicho

play08:29

anteriormente en la tabla el valor

play08:32

buscado encontrado en la tabla es de 335

play08:35

en la f correspondiente para un alfa del

play08:38

5% esta sería la zona de rechazo y está

play08:42

en la zona de aceptación y vemos que

play08:44

nuestro valor de 0 53 está en la zona de

play08:48

aceptación con lo cual aceptamos la

play08:50

hipótesis es nula de igualdad de medias

play08:57

hemos visto sobre este ejemplo la idea

play09:00

básica del a nova y hemos aprendido a

play09:03

aplicar las fórmulas obtenidas en el

play09:06

ejemplo he explicado y llegar a una

play09:09

conclusión reales realizando el análisis

play09:13

efe de comparación de varianzas

play09:16

correspondientes

Rate This

5.0 / 5 (0 votes)

関連タグ
AnovaDiseño experimentalCigüeñalesProveedoresMotoresComparaciónEstablecimientoEconomíaEstadísticaDecisión empresarial
英語で要約が必要ですか?