ANOVA. Introducción | | UPV

Universitat Politècnica de València - UPV
11 Oct 201309:09

Summary

TLDREl análisis de la variabilidad en experimentos es fundamental en la mejora de las prácticas profesionales, especialmente en la ingeniería. En este script, se aborda el método de ANOVA (ANálisis de la VArianza), desarrollado por Fisher en la década de 1930, que es esencial en el estudio de observaciones influenciadas por múltiples factores. A través de un ejemplo práctico, se muestra cómo descomponer la variabilidad total en términos asociados a los efectos de cada factor y sus posibles interacciones, más una parte residual. Se utiliza un experimento de cultivo de trigo para ilustrar cómo se evalúan los efectos de la variedad y la dosis de abono en el rendimiento. Se exploran diferentes escenarios hipotéticos para entender cómo la variabilidad se puede atribuir a los factores estudiados, su interacción y otros factores no controlados. El ANOVA permite investigar la significación de estos efectos y es una herramienta clave en el análisis de modelos de regresión lineal y diseño de experimentos.

Takeaways

  • 📚 El análisis de varianza (ANOVA) es un método estadístico desarrollado por Sir Ronald Fisher en los años 1930 para el estudio de observaciones que dependen de varios factores.
  • 🌱 Se utiliza ANOVA para descomponer la variabilidad total en términos asociados a los efectos de cada uno de los factores estudiados y sus posibles interacciones, más una parte residual.
  • 🧑‍🤝‍🧑 El análisis de ANOVA es fundamental en el análisis de modelos de regresión lineal y diseño de experimentos, y no solo es útil para ingenieros sino para cualquier profesional.
  • 🌾 El ejemplo práctico proporcionado se centra en estudiar los efectos de la variedad de cultivo y la dosis de abono en el rendimiento de un cultivo de trigo.
  • 🔢 Se consideran dos variedades de trigo (A y B) y tres dosis de abono, lo que da un total de seis tratamientos posibles.
  • 📈 La variable respuesta es el rendimiento de trigo, que se considera una variable aleatoria y se desea estudiar el efecto de dos factores en ella: la variedad y la dosis de abono.
  • 📊 Se asignan dos parcelas a cada uno de los seis tratamientos posibles, formando muestras de las poblaciones correspondientes para el estudio.
  • 🧐 Se busca investigar si existe un efecto significativo del factor variedad, del factor dosis, y de una posible interacción entre ellos sobre la media de la respuesta.
  • 📊 A través de hipótesis irreales pero ilustrativas, se muestra cómo la variabilidad total se puede atribuir a efectos de la variedad, dosis de abono, y su interacción.
  • ➿ Se destaca que el efecto del abonado en el rendimiento es lineal, lo que implica la ausencia de interacción entre la variedad y la dosis de abono.
  • 🌡️ En casos más realistas, se reconoce que además de los factores de interés, otros factores no controlados (como la temperatura y la humedad) también pueden influir en los resultados.
  • 🔍 El análisis de ANOVA permite desglosar la variabilidad observada en un experimento para determinar la influencia de los factores estudiados y cuánto contribuyen a los rendimientos medios de la variable respuesta.

Q & A

  • ¿Qué es el análisis de varianza (ANOVA) y para qué se utiliza?

    -El análisis de varianza (ANOVA) es un método estadístico desarrollado por Ronald Fisher en los años 1930. Se utiliza para descomponer la variabilidad total observada en los datos en términos asociados a los efectos de cada uno de los factores estudiados y sus posibles interacciones, más una parte residual. Es fundamental en el análisis de modelos de regresión lineal y diseño de experimentos.

  • ¿Cómo se define la 'variabilidad total' en el contexto del ANOVA?

    -La variabilidad total en el contexto del ANOVA se refiere a la suma de las desviaciones al cuadrado de los valores observados con respecto a la media general de todos los datos. Incluye la variabilidad atribuible a los factores de interés y la variabilidad residual no explicada.

  • ¿Cuáles son los factores que se consideran en el ejemplo proporcionado en el guión?

    -En el ejemplo, se consideran dos factores: la variedad de cultivo de trigo (un factor cualitativo con dos variantes: A y B) y la dosis de abono (un factor cuantitativo con tres niveles).

  • ¿Cómo se seleccionan las parcelas para el estudio en el ejemplo dado?

    -Se disponen de 12 parcelas similares y se decide plantar dos parcelas con cada una de las seis combinaciones posibles de variedad y dosis de abono, lo que resulta en un total de seis tratamientos.

  • ¿Qué es la 'variable respuesta' en el estudio del ejemplo y cómo se mide?

    -La variable respuesta en el estudio es el rendimiento de la cosecha de trigo, que se mide como una variable aleatoria. Se analiza el efecto de los factores de interés sobre esta variable.

  • ¿Cómo se define la 'muestra' en el contexto del estudio del ejemplo?

    -En el contexto del estudio, la muestra corresponde a las parcelas asignadas a cada uno de los seis tratamientos. Cada tratamiento tiene dos parcelas, y el conjunto de los resultados de estas parcelas constituye los datos disponibles para el análisis.

  • ¿Cuáles son las hipótesis que se analizan en el ANOVA para el ejemplo dado?

    -Se analizan las siguientes hipótesis: existe un efecto de la variedad sobre la media de la respuesta, existe un efecto de la dosis sobre la media de la respuesta, y existe una interacción entre los efectos de los factores de variedad y dosis.

  • ¿Qué significa cuando se dice que el efecto del abonado es 'lineal' en el contexto del ANOVA?

    -Un efecto lineal del abonado implica que el impacto del abonado en el rendimiento de la cosecha de trigo varía de manera proporcional a la dosis de abono aplicada, sin interrupciones o cambios de tendencia en la relación.

  • ¿Qué se entiende por 'interacción' entre factores en el ANOVA?

    -Una interacción entre factores ocurre cuando el efecto de un factor en la variable respuesta depende del nivel de otro factor. En el ejemplo, si la influencia de la variedad en el rendimiento de la cosecha de trigo varía según la dosis de abono aplicada, entonces se dice que hay una interacción entre estos dos factores.

  • ¿Cómo se interpreta una mayor variabilidad en los rendimientos en el contexto del ANOVA?

    -Una mayor variabilidad en los rendimientos puede indicar la presencia de múltiples factores que influyen en la variable respuesta, incluida la interacción de los factores de estudio y otros factores no controlados o no medidos en el experimento, como podrían ser la temperatura o la humedad.

  • ¿Cómo se determina si los factores estudiados tienen una influencia significativa en los rendimientos medios?

    -Se compara la variabilidad atribuible a los factores de interés con la variabilidad residual. Si la variabilidad atribuible a los factores es significativamente mayor que la variabilidad residual, se concluye que los factores tienen un efecto significativo en los rendimientos medios.

Outlines

00:00

🌱 Introducción al Análisis de Varianza (ANOVA)

Este primer párrafo introduce el Análisis de Varianza (ANOVA) como uno de los métodos estadísticos más potentes para el desempeño de funciones profesionales, especialmente para los ingenieros. Se menciona que fue desarrollado por Fisher en los años 1930 y se destaca como técnica básica para el estudio de observaciones dependientes de múltiples factores. El ANOVA es fundamental en el análisis de modelos de regresión lineal y diseño de experimentos. Se presenta a través de un ejemplo sencillo que busca descomponer la variabilidad total observada en los datos en términos asociados a los efectos de cada factor estudiado y sus posibles interacciones, más una parte residual. El ejemplo concreto trata sobre los efectos de la variedad de cultivo y la dosis de abono en el rendimiento de un cultivo de trigo, utilizando dos variedades y tres dosis de abono en 12 parcelas similares.

05:02

📊 Efectos de la Varianza y Aplicación del ANOVA

El segundo párrafo profundiza en el análisis de la varianza total observada en los datos, mostrando cómo se puede descomponer en efectos de los factores de interés y una parte residual. Se plantean varios casos hipotéticos para ilustrar cómo se分配an los rendimientos en función de las variedades y dosis de abono. Se explora la influencia de la variedad y la dosis de abono en las medias del rendimiento, así como la posibilidad de una interacción entre ellos. Los casos analizados van desde una situación en la que no hay variabilidad (todos los rendimientos son iguales) hasta una en la que la variabilidad es alta y se deben tener en cuenta los efectos de la interacción entre los factores, además de otros factores no controlados como la temperatura y la humedad. El párrafo concluye con la importancia del ANOVA para determinar la influencia de los factores en los rendimientos medios de la variable respuesta y cómo este análisis puede ser aplicado para factores incluidos en el experimento y también para aquellos no considerados inicialmente.

Mindmap

Keywords

💡métodos estadísticos

Los métodos estadísticos son técnicas utilizadas para analizar y interpretar datos, con el fin de obtener conclusiones o hacer predicciones. En el video, se destaca que son potentes para el desempeño profesional, no solo de los ingenieros sino de cualquier profesional.

💡ANOVA (a nova)

ANOVA, o análisis de varianza, es un método estadístico desarrollado por Fisher en los años 1930. Se utiliza para determinar si existen diferencias significativas entre los grupos en un estudio. En el video, se describe como una herramienta fundamental en el análisis de modelos de regresión lineal y diseño de experimentos.

💡variabilidad total

La variabilidad total es el grado de cambio o dispersión en los datos observados. En el contexto del video, se refiere a cómo se descompone esta variabilidad en términos asociados a los efectos de los factores estudiados y sus posibles interacciones.

💡factores

Los factores son variables que influyen en el resultado de un estudio. En el video, se examinan dos factores específicos: la variedad de cultivo y la dosis de abono, y su efecto en el rendimiento de un cultivo de trigo.

💡interacciones

Las interacciones son efectos que ocurren cuando dos o más factores influyen el uno en el otro. En el análisis presentado, se busca determinar si hay una interacción entre la variedad y la dosis de abono en su efecto sobre el rendimiento del trigo.

💡rendimiento de trigo

El rendimiento de trigo se refiere a la cantidad de trigo producido por unidad de área. En el ejemplo dado, es la variable respuesta que se está analizando para ver cómo varía debido a diferentes factores como la variedad y la dosis de abono.

💡dosis de abono

La dosis de abono es la cantidad de nutrientes que se aplican a un cultivo para mejorar su crecimiento. En el video, se examinan tres niveles diferentes de dosis de abono y su impacto en el rendimiento del trigo.

💡variadas

Las variedades son diferentes especies o razas de un cultivo. En el contexto del video, se comparan dos variedades de trigo (A y B) para ver cómo afectan el rendimiento en combinación con diferentes dosis de abono.

💡parcelas

Las parcelas son áreas específicas de terreno donde se lleva a cabo un experimento agrícola. En el ejemplo, se utilizan 12 parcelas similares para plantar las seis combinaciones posibles de variedad y dosis de abono.

💡regresión lineal

La regresión lineal es un modelo estadístico que se utiliza para describir la relación entre una variable respuesta y una o más variables explicativas. En el video, se menciona como uno de los modelos de análisis en los que se aplica la técnica ANOVA.

💡diseño de experimento

El diseño de experimento es la planificación metódica de un estudio para maximizar la información obtenida. En el video, se destaca como una de las áreas donde la ANOVA es una herramienta clave, ayudando a analizar observaciones que dependen de múltiples factores.

Highlights

Estudiarán un método estadístico potente para el desempeño profesional de ingenieros y otros profesionales.

El método se refiere a ANOVA (Análisis de Varianza).

Desarrollado por Fisher en los años 1930 para la investigación agraria en Inglaterra.

ANOVA es fundamental en el análisis de modelos de regresión lineal y diseño de experimentos.

La idea básica es descomponer la variabilidad total en términos asociados a efectos de factores y sus interacciones.

Se utilizará un ejemplo sencillo para introducir la idea de ANOVA.

Estudio de los efectos de la variedad cultivada y la dosis de abono en el rendimiento de trigo.

Comparación de dos variedades y tres dosis de abono en 12 parcelas similares.

El rendimiento de trigo es la variable aleatoria del estudio.

Se analizan dos factores: variedad cualitativa y dosis de abonado cuantitativa.

Se definen seis tratamientos posibles y se asignan dos parcelas a cada uno.

Se busca investigar la influencia de la variedad, dosis y su interacción en la media de la respuesta.

Se plantean hipótesis sobre los rendimientos y su influencia en la variabilidad total.

Se analiza la variabilidad total y se atribuye a efectos de factores y su interacción.

Se observan casos en que la interacción entre la variedad y la dosis influye en el rendimiento.

Se destaca la importancia de controlar factores no medidos, como temperatura y humedad ambiental.

El análisis de varianza permite determinar la influencia de factores en los rendimientos medios.

Se destaca la utilidad de ANOVA para la toma de decisiones en la investigación y en la práctica profesional.

Transcripts

play00:03

vamos a estudiar uno de los métodos

play00:07

estadísticos más potentes para el

play00:10

desempeño de las funciones profesionales

play00:13

de los ingenieros y no solo de los de

play00:16

los ingenieros de cualquier profesional

play00:19

nos referimos al a nova

play00:23

vamos a tratar de lograr el objetivo de

play00:28

aprender sobre un ejemplo intuitivo la

play00:32

definición y la idea básica del de la

play00:36

nova

play00:37

él

play00:39

a nova fue desarrollado por allá por los

play00:41

años 1930 por fisher cuando trabajaba en

play00:45

una estación de investigación agraria en

play00:48

inglaterra y es la técnica básica para

play00:52

el estudio de observaciones que dependen

play00:54

de varios factores siendo por lo tanto

play00:57

la herramienta fundamental en el

play00:59

análisis de los modelos de regresión

play01:01

lineal y de diseño de experimento la

play01:05

idea básica de la nova la vamos a

play01:06

introducir mediante un ejemplo sencillo

play01:10

y esa idea consiste en descomponer la

play01:13

variabilidad total observada en unos

play01:15

datos en una serie de términos asociados

play01:19

a los efectos de cada uno de los

play01:21

factores estudiados y a sus posibles

play01:24

interacciones más una parte residual con

play01:27

la que después se van a comparar las

play01:29

primeras para investigar su posible

play01:32

significación ésta

play01:35

veamos ese ejemplo intuitivo que desean

play01:40

estudiar los efectos que la variedad

play01:42

cultivada y la dosis de abono tienen

play01:44

sobre el rendimiento de un cultivo de

play01:47

trigo se van a comparar dos variedades

play01:51

la ay la b y tres dosis de abonado se

play01:55

dispone de 12 parcelas similares y se

play01:57

decide plantar dos parcelas con cada una

play02:01

de las seis combinaciones posibles de

play02:03

variedad y dosis

play02:05

la variable respuesta será el

play02:08

rendimiento de trigo que va a ser una

play02:11

variable aleatoria

play02:13

y deseamos estudiar el efecto sobre esta

play02:16

variable de dos factores la variedad que

play02:19

es un factor cualitativo para el que se

play02:22

analizan dos variantes y la dosis de

play02:25

abonado que es un factor cuantitativo

play02:28

para el que para el cual se van a

play02:30

analizar tres niveles en total hay seis

play02:34

tratamientos posibles obtenido al

play02:36

combinar las dos variedades con las tres

play02:39

dosis a cada tratamiento le va a

play02:41

corresponder una población en la que

play02:44

estará definida la variable respuesta

play02:46

así la primera población va a estar

play02:48

constituida por todas las parcelas

play02:50

hipotéticas que podrían plantearse con

play02:53

la variedad y abonarse con 10 kilogramos

play02:57

por hectárea

play02:59

y como le vamos a asignar dos parcelas a

play03:02

cada tratamiento pues las mismas van a

play03:04

constituir la muestra de la población

play03:06

correspondiente y el conjunto de los

play03:10

resultados de las dos se muestra pues

play03:13

constituyen los datos disponibles para

play03:15

el estudio y deseamos a investigar

play03:19

existe un efecto del factor variedad

play03:22

sobre la media de la respuesta

play03:25

existe un efecto del factor dosis sobre

play03:28

la media de la respuesta existe una

play03:32

interacción entre los efectos de los dos

play03:35

factores variedad y dosis

play03:39

supongamos para ello varios ejemplos

play03:42

repito hipotéticos y no reales pero los

play03:45

vamos a utilizar para entender

play03:48

intuitivamente la idea de la nova

play03:51

supongamos aquí que tenemos

play03:54

los diferentes factores es decir el

play03:56

factor uno de abonado con sus tres

play04:02

variantes diferentes las tres dosis y

play04:05

tenemos las dos variedades en el factor

play04:07

dos con las dos variantes la variante 1

play04:11

y la variante 2

play04:13

y aquí tendremos el valor observado es

play04:16

decir el rendimiento para cada una de

play04:20

las parcelas

play04:22

i

play04:24

veamos el primer caso irreal porque en

play04:28

él nos planteamos que hemos obtenido los

play04:30

mismos rendimientos para todas las

play04:33

parcelas lo cuales no sería para nada

play04:38

probable es decir que la probabilidad de

play04:40

que esto pase es cero pero para para

play04:43

entender él

play04:47

el planteamiento de la nova pues no lo

play04:49

vamos a plantear el rendimiento medio

play04:51

por lo tanto va a ser 20 y la suma de

play04:54

los cuadrados de las desviaciones de

play04:56

cada

play04:58

valor nos va a dar 0 aquí tenemos esa

play05:01

suma de cuadrado fijaos como la

play05:04

obtenemos

play05:06

y esta es la suma de cuadrados totales

play05:09

nada influye la suma de cuadrados

play05:13

totales es igual a cero planteamos un

play05:16

segundo caso en la variante en la

play05:19

variedad una se obtiene el mismo

play05:21

rendimiento que en la segunda es decir

play05:23

el abonado no influye en este caso el

play05:26

rendimiento medio es 25 la suma de

play05:30

cuadrados la podemos obtener de fórmula

play05:32

de forma análoga a la anterior y vemos

play05:35

que en este caso sí que hay una suma de

play05:37

cuadrados totales hay variabilidad al

play05:40

analizar esta especie de varianza se

play05:43

observa que la variedad la variabilidad

play05:46

obtenida se debe se debe sólo al efecto

play05:49

de la variedad

play05:51

play05:56

en el siguiente caso en el tercero pues

play06:01

ya vemos que hay variaciones también en

play06:03

las variedades no sólo no solo en las

play06:06

variedades sino también en los

play06:08

rendimientos que dependen del abonado

play06:11

encontramos la variabilidad total de la

play06:15

misma manera vemos que hay una

play06:17

variabilidad y al analizar la misma se

play06:20

observa que esta variabilidad ya se debe

play06:23

tanto al efecto de la variedad como al

play06:26

efecto de la dosis de abonado

play06:31

es decir que el factor variedad y el

play06:35

factor dosis influyen sobre las medias

play06:38

del rendimiento y el efecto del abonado

play06:41

es lineal lo que significa que no hay

play06:44

interacción entre los dos factores

play06:47

veamos el siguiente caso que es un caso

play06:51

ya con más variabilidad todavía irreal

play06:55

pero con mayor variabilidad aquí así

play06:59

hacemos el análisis también de la

play07:01

variabilidad total obtenemos un valor y

play07:05

aquí ya observamos que además de los

play07:08

efectos de la variedad y del abonado es

play07:10

decir de los factores está presente

play07:13

también el efecto de la interacción de

play07:16

estos dos factores es decir que sobre la

play07:19

variedad sobre el rendimiento influye la

play07:24

variedad

play07:26

el abonado y la interacción de estos dos

play07:30

factores y veamos el único caso realista

play07:33

en que los rendimientos son

play07:35

completamente es aleatorio y a simple

play07:37

vista pues no podemos determinar ningún

play07:41

resultado

play07:42

encontramos el rendimiento medio

play07:44

encontramos la suma de cuadrados totales

play07:47

por la misma fórmula que hemos aplicado

play07:50

hasta ahora y vemos que en este caso la

play07:54

variabilidad se debe tanto al efecto de

play07:57

la variedad como al efecto de la dosis a

play08:01

su interacción pero también a otra serie

play08:05

de factores que no están controlados que

play08:07

no estamos midiendo la temperatura la

play08:12

humedad medioambiental etcétera etcétera

play08:14

etcétera es decir que en este caso

play08:19

influyen sobre la media los factores su

play08:23

interacción y tenemos también segregado

play08:26

es decir diferenciado una variabilidad

play08:28

debida a factores no

play08:31

no controlados sobre este ejemplo

play08:35

intuitivo que en la base de la nova

play08:38

hemos visto que el análisis de la

play08:41

variabilidad obtenida en un experimento

play08:44

puede descomponerse en factores que nos

play08:47

permitirán luego determinar si los

play08:52

rendimientos medios de la variable

play08:54

respuesta se deben a la influencia y en

play08:58

qué medida a la influencia de los

play08:59

diferentes factores y de otros factores

play09:02

que no se incluyen en el experimento

Rate This

5.0 / 5 (0 votes)

الوسوم ذات الصلة
ANOVACultivosTrigoVariedadAbonoExperimentaciónEstadísticaAgriculturaDesempeñoInvestigación
هل تحتاج إلى تلخيص باللغة الإنجليزية؟