ANOVA. Análisis de la varianza con un factor | | UPV
Summary
TLDREl análisis de varianza (ANOVA) es una herramienta estadística utilizada para determinar si existen diferencias significativas entre los grupos en un estudio. En este script, se aborda el caso de una fábrica de motores que compara cigüeñal de tres proveedores distintos, uno de los cuales es nuevo y más caro pero que alega mejores propiedades dinámicas. Se realiza una prueba con 10 cigüeñal de cada proveedor para evaluar su equilibrado dinámico. El objetivo es aprender a calcular la tabla de ANOVA y sacar conclusiones sobre la variabilidad de la variable respuesta (equilibrado dinámico). Se explica que el ANOVA descompone la variabilidad total en variabilidad entre tratamientos y variabilidad residual, utilizando sumas de cuadrados y grados de libertad. A través del cálculo del ratio F, se evalúa la significación del efecto de los diferentes proveedores. En el ejemplo, se encuentra que el ratio F es menor al valor crítico de la tabla, lo que conduce a aceptar la hipótesis nula de igualdad de medias entre los proveedores. Esto significa que no hay evidencia suficiente para cambiar al proveedor más caro, a pesar de su precio superior.
Takeaways
- 🔍 Se detalló el análisis de la varianza (ANOVA) en presencia de un solo factor para aprender a calcular la tabla de ANOVA y sacar conclusiones sobre la variabilidad de la variable respuesta.
- 🚀 Se presentó un ejemplo de una fábrica de motores que compara cigüeñales de tres proveedores para determinar si uno es superior en términos de equilibrado dinámico.
- 📊 El objetivo es descomponer la variabilidad total de los datos en variabilidad debido a los tratamientos y variabilidad residual.
- 🧮 Se utilizan fórmulas específicas para calcular las sumas de cuadrados totales, sumas de cuadrados de los tratamientos y sumas de cuadrados residuales.
- ✅ Se realiza un análisis hipotético para determinar si existen diferencias significativas entre las medias de los equilibrados dinámicos de los proveedores.
- 📉 Se calcula el cuadrado medio para la variabilidad observada y para los efectos de los tratamientos, comparándolos con el cuadrado medio residual.
- 📈 El ratio F se calcula dividiendo el cuadrado medio de los tratamientos entre el cuadrado medio residual para evaluar la significancia del efecto.
- 🎯 Se utiliza la tabla de la distribución F para determinar si el ratio F calculado es significativo, con un riesgo alfa del 5%.
- ❌ Si el ratio F es menor al valor crítico de la tabla, se acepta la hipótesis nula de que no hay diferencia significativa entre los proveedores.
- ✅ En el ejemplo, el ratio F encontrado (0.53) es menor al valor crítico (335), lo que indica que no hay diferencia significativa entre los proveedores.
- 📚 Se aprendió una técnica para comparar medias de varias poblaciones y se aplicó el análisis de varianza en un contexto real para llegar a una conclusión.
Q & A
¿Qué objetivo se tiene al analizar la varianza en presencia de un solo factor?
-El objetivo es aprender a calcular la tabla de la varianza y sacar conclusiones sobre la variabilidad o no sobre la variable respuesta de los factores involucrados, en este caso uno solo de ellos.
¿Cuál es el problema que enfrenta la fábrica de motores al considerar un tercer proveedor de cigüeñales?
-El tercer proveedor ofrece cigüeñales más caras pero argumenta tener mejores propiedades dinámicas, específicamente un equilibrado dinámico menor, lo que es importante para la fábrica.
¿Cómo decide la fábrica si los cigüeñales del nuevo proveedor son superiores a pesar del precio más alto?
-La fábrica decide realizar una prueba comparando 10 cigüeñales del nuevo proveedor con 10 de cada uno de sus dos proveedores tradicionales para evaluar su equilibrado dinámico.
¿Qué técnica estadística se utiliza para comparar la media de la variable respuesta entre los tres proveedores de cigüeñales?
-Se utiliza el análisis de la varianza (ANOVA) para descomponer la variabilidad total de los datos y comparar las medias de varias poblaciones.
¿Cuál es la hipótesis de igualdad que se plantea en el ANOVA para la comparación de los equilibrados dinámicos de los tres proveedores?
-La hipótesis de igualdad planteada es que las tres medias de los equilibrados dinámicos de los proveedores son iguales frente a la hipótesis alternativa de la existencia de desigualdad en las medias.
¿Cómo se calcula la suma de cuadrados totales en el ANOVA?
-Para la suma de cuadrados totales se aplica una fórmula específica que considera las desviaciones de cada dato con respecto a la media general.
¿Cómo se interpretan los resultados del análisis de varianza para determinar si hay un efecto significativo?
-Se compara la suma de cuadrados asociada a cada efecto con la suma de cuadrados residual. Si el efecto no existe, el cuadrado medio asociado será similar al residual y el ratio F será cercano a 1. Si existe un efecto, el ratio F será mucho mayor que 1.
¿Cuál es el riesgo alfa utilizado en el análisis y cómo afecta la comparación de proveedores?
-El riesgo alfa del 5% se utiliza para determinar la probabilidad de obtener una conclusión errónea. Al comparar proveedores de manera individual (2 a 2), se incrementa la probabilidad de cometer un error tipo I.
¿Cómo se calcula el ratio F en el ANOVA y qué representa?
-El ratio F se calcula mediante el cociente de los cuadrados medios asociados a los efectos entre los cuadrados medios residuales. Representa la relación entre la varianza entre los grupos y la varianza dentro de los grupos.
¿Qué conclusiones se pueden sacar de la tabla de ANOVA si el ratio F calculado es inferior al valor crítico de la tabla?
-Si el ratio F calculado es inferior al valor crítico, se acepta la hipótesis nula de que no hay diferencia significativa entre los proveedores y, por lo tanto, no se justifica el cambio a un proveedor más caro.
¿Cómo afecta el análisis de varianza la toma de decisiones en un diseño de experimentos que evalúa el efecto de un único factor?
-El análisis de varianza permite descomponer la variabilidad total en componentes atribuibles a factores específicos y a una varianza residual. Esto ayuda a determinar si los cambios en la variable respuesta son significativos y justifican la selección de un factor o proveedor en particular.
Outlines
🔍 Análisis de Varianza con un Solo Factor
Este párrafo introduce el análisis de la varianza (ANOVA) en el contexto de un solo factor. Se describe un escenario en una fábrica de motores donde se evalúa la calidad de las cigüeñalas de tres proveedores distintos. El objetivo es aprender a calcular la tabla de la ANOVA y extraer conclusiones sobre la variabilidad de la variable respuesta (equilibrado dinámico) entre los factores (proveedores). Se destaca la importancia de la comparación de las medias de varias poblaciones y cómo el ANOVA permite descomponer la variabilidad total de los datos en variabilidad debido a los tratamientos y variabilidad residual.
📊 Procedimiento del ANOVA y Comparación de Medias
En este párrafo se profundiza en el proceso del ANOVA, explicando cómo se calculan las sumas de cuadrados totales, tratamientos y residuales, y cómo se utilizan para determinar si hay un efecto significativo debido a los diferentes proveedores. Se describen los pasos para calcular el cuadrado medio y se hace hincapié en la importancia de la relación entre los cuadradillos medios para determinar la presencia de un efecto. Finalmente, se muestra cómo se utiliza el cociente F para evaluar si las medias poblacionales son iguales o no, y cómo se interpreta el resultado a través de la tabla de la distribución F para un riesgo alfa del 5%.
Mindmap
Keywords
💡Análisis de varianza (ANOVA)
💡Factor
💡Variable respuesta
💡Sumas de cuadrados
💡Grados de libertad
💡Cuadrado medio
💡Hipotésis de igualdad
💡Hipotésis alternativa
💡Error de primera especie
💡F Ratio
💡Tabla de la F
Highlights
El objetivo del análisis de la varianza (ANOVA) es aprender a calcular la tabla de la ANOVA y sacar conclusiones sobre la variabilidad de la variable respuesta de los factores involucrados.
Un ejemplo práctico es la comparación de cigüeñales de diferentes proveedores en una fábrica de motores.
La fábrica evalúa si los cigüeñales de un nuevo proveedor, aunque más caros, ofrecen mejores propiedades dinámicas.
Se realiza una prueba comparando 10 cigüeñales del nuevo proveedor con 10 de cada uno de los proveedores tradicionales.
El equilibrado dinámico es la variable respuesta de interés, y se busca que sea lo menor posible.
La técnica de comparación de dos poblaciones normales podría usarse, pero sería menos eficiente en comparaciones múltiples.
El análisis de la varianza (ANOVA) es el método adecuado para comparar más de dos grupos.
La variabilidad total de los datos se descompone en variabilidad debida a los tratamientos y variabilidad residual.
Se calculan las sumas de cuadrados totales, de los tratamientos y residuales para descomponer la variabilidad.
Las sumas de cuadrados se dividen por sus grados de libertad para obtener los cuadrado medios.
El cuadrado medio residual es una estimación de la varianza de las poblaciones muestral, asumiendo igualdad de varianzas.
El cuadrado medio asociado a cada efecto permite determinar si hay un efecto significativo.
El ratio F se calcula como el cociente entre el cuadrado medio del efecto y el cuadrado medio residual.
Si el ratio F es mayor que 1, indica la presencia de un efecto significativo.
Se utiliza la tabla de la distribución F para determinar si el ratio F calculado es significativo a un nivel de alfa dado.
Si el ratio F calculado es menor que el valor crítico de la tabla, se acepta la hipótesis nula de igualdad de medias.
En el ejemplo dado, no se encontró evidencia suficiente de superioridad en los cigüeñales del nuevo proveedor.
La hipótesis nula de que no hay diferencia significativa entre los proveedores fue aceptada.
El análisis de la varianza (ANOVA) permite comparar medias de varias poblaciones de manera eficiente y得出结论 (concluir en español) sobre su homogeneidad.
Transcripts
en la continuación del análisis del a
nova nos vamos a detener en el análisis
de la varianza cuando estamos en
presencia de un solo factor cuando
analizamos un solo factor el objetivo
será
aprender a calcular la tabla de la nova
y sacar conclusiones sobre la
variabilidad o no sobre la variable
respuesta de los factores involucrados
en este caso uno solo de ellos y lo
vamos a ver sobre un ejemplo en una
fábrica de motores que tiene dos
proveedores de cigüeñales que menor que
mecaniza le aparece un tercer proveedor
que ofrece sus cigüeñal es algo más caro
pero argumentando sus mejores
propiedades dinámicas concretamente que
su equilibrado dinámico es menor lo cual
es importante la factoría decide hacer
una prueba comparando 10 cigüeñales del
nuevo proveedor con 10 de cada uno de
sus dos proveedores tradicionales en los
resultados que obtienen del experimento
son los que se muestran
a continuación la pregunta es hay
evidencia suficiente respecto a la
superioridad de los cigüeñales del nuevo
pruebo el proveedor para cambiar a este
pese al ligero incremento del precio
este ejemplo en un caso particular de
diseño de experimentos donde se estudia
el efecto de un único factor el
proveedor con tres variantes son los
tres por proveedores a comparar sobre la
media de la variable respuesta que es el
equilibrado dinámico que debe ser el
menor el menor posible
dado que ya conocemos la técnica de
comparación de dos poblaciones normales
podríamos realizar en este caso la
comparación utilizando
el análisis realizando la comparación de
las parejas 2 a 2 y si en vez de
tratarse de tres proveedores hubieran
cinco cuántas parejas de tratamiento
habría que compartir suponiendo que los
proveedores fueran idénticos en cada
comparar en cada comparación se se opera
como un riesgo alfa del 5% la
probabilidad de obtener una conclusión
errónea sería del 5% en el caso de
hacerlo 2 a 2 como conclusión a estas
preguntas podemos llegar a la conclusión
de que sería un procedimiento muy
laborioso por una parte y que se
incrementaría la probabilidad global de
cometer un error de primera especial por
lo tanto la técnica adecuada en este
caso en la nova es el análisis de la
varianza
en el ejemplo trataremos de cumplimentar
los siguientes objetivos dar una idea
intuitiva del fundamento de la 'nova
calcular la tabla de la varianza y cómo
se interpreta su contenido lo que con
posterioridad nos va a permitir aprender
una técnica sencilla para comparar
medias de varias poblaciones y en la
nova resultados significativos la idea
de la nova es descomponer la
variabilidad total de los datos en la
variabilidad debida a la diferencia
entre los tratamientos más una variedad
residual como cuantificamos de donde
salen estos valores veamos los en el
ejemplo de los proveedores de cigüeñales
donde tenemos un solo factor con tres
variantes la variable respuesta en el
equilibrado dinámico y el objetivo final
ver si hay diferencia entre los
equilibrados dinámicos medios cigüeñales
de los tres proveedores es decir
plantearnos la el test de hipótesis de
igualdad en este caso de las tres medias
frente a la hipótesis alternativa de la
existencia de desigualdad de las medias
en al menos dos
y los vamos a realizar mediante la nova
para ello obtenemos las medias de cada
uno de los tratamientos y la media de
todos los datos y a continuación pues
vamos a obtener esta variabilidad vamos
descomponer la variabilidad total de los
datos en la variabilidad debida al
primer tratamiento más una variabilidad
residual calculando para ello las sumas
de cuadrados correspondientes como lo
hacemos pues para la suma de cuadrados
totales aplicamos esta fórmula
para la suma de los cuadrados de los
tratamientos aplicamos
la otra la suma de los cuadrados de las
desviaciones de la media de cada
proveedor con respecto a la media
general
y la suma de cuadrados residuales que es
la suma de los cuadrados de las
desviaciones de cada dato con respecto a
las medias de su tratamiento pues lo
calculamos de esta forma que se muestra
como demostramos si hay significación o
no del efecto la comparación de la suma
de cuadrados asociadas a cada efecto con
la suma de cuadrado residual es la que
nos permite estudiar ese dicho efecto es
o no significativo para llevar a cabo
esta comparación cada suma de cuadrados
se divide por su grado de libertad
obteniéndose el estadístico del
denominado cuadrado medio
se determinan los grados de libertad
restándole 1 al número de datos para el
total 1 el número de tratamientos para
el caso de los mismos y los residuales
pues será la diferencia en el ejemplo
serían 29 2 y 27 grados de libertad y
respectivamente de esta manera el
cuadrado medio total en la varianza de
los datos observados el cuadrado medio
residual es una estimación de la
varianza de las poblaciones muestra da
asumiendo igualdad de varianzas para
todas las poblaciones y el cuadrado
medio asociado a cada efecto es el que
nos va a permitir
si a calcular si hay o no efecto si el
efecto no existe en la población el
cuadrado me dio otra estimación de la
varianza independiente del cuadrado
medio residual y si existe un efecto
real entonces esta relación tiene que
ser mayor a 1 para ello realizamos el
test
efe
en este caso encontramos el valor del f
ratio f calculada mediante este cociente
si no existe un efecto real el cuadrado
medio este va a ser muy parecido al
residual y por lo tanto esto va a valer
igual a 1s existe pues todo lo contrario
este valor será muy superior al otro
valor como lo encontramos pues aquí
tenemos la fórmula que nos permite
encontrar este estadístico y si se
cumple pues el mismo se va a comportar
como una efe de fisher con estos grados
de de libertad
y si esto sucede pues entonces
aceptaríamos la hipótesis de que las
medias poblacionales hoy son iguales y
por lo tanto no hay diferencia
significativa entre los diferentes
proveedores por el caso contrario si no
pasa pues
no habría esa diferencia significativa
haciendo los cálculos y poniéndolo en
esta que es la tabla resumen de la nova
poniendo todos los valores aquí
dividimos estos dos cuadrados y
obtenemos el f ratio
y buscamos en la tabla
de la fd ficha del valor correspondiente
con un error de primera especie del 5%
observamos que como este valor es 0.53
es mucho menor que el 335 que sale en la
tabla con lo cual aceptamos la hipótesis
nula de que no hay diferencia
significativa entre los proveedores esto
lo observamos lo mismo que hemos dicho
anteriormente en la tabla el valor
buscado encontrado en la tabla es de 335
en la f correspondiente para un alfa del
5% esta sería la zona de rechazo y está
en la zona de aceptación y vemos que
nuestro valor de 0 53 está en la zona de
aceptación con lo cual aceptamos la
hipótesis es nula de igualdad de medias
hemos visto sobre este ejemplo la idea
básica del a nova y hemos aprendido a
aplicar las fórmulas obtenidas en el
ejemplo he explicado y llegar a una
conclusión reales realizando el análisis
efe de comparación de varianzas
correspondientes
Browse More Related Video
5.0 / 5 (0 votes)