Prueba t de dos muestras para diferencia de medias | Khan Academy en Español

KhanAcademyEspañol
15 Dec 201907:21

Summary

TLDRCarlos, un agricultor, cultiva tomates en dos campos y desea saber si las alturas de las plantas varían entre ellos. Para ello, realiza una muestra aleatoria de plantas en cada campo y mide sus alturas. Basándose en la hipótesis de que las condiciones de aleatoriedad, normalidad e independencia se cumplen, y utilizando un nivel de significancia del 5%, se lleva a cabo una prueba t de dos muestras. La hipótesis nula sugiere que no hay diferencia en el promedio de alturas entre los campos, mientras que la alternativa indica que las alturas sí difieren. El cálculo del estadístico t se realiza con los datos de las muestras, resultando en un valor de aproximadamente -2.44. Al buscar la probabilidad asociada a este valor en una distribución t, se encuentra que es menor que el nivel de significancia establecido. Esto conduce al rechazo de la hipótesis nula, lo que apoya la hipótesis alternativa y sugiere que efectivamente existen diferencias en las alturas de las plantas de tomate en los dos campos.

Takeaways

  • 🍅 Carlos cultiva tomates en dos campos y está interesado en saber si las alturas de las plantas varían entre ellos.
  • 📐 Se toma una muestra aleatoria de plantas de cada campo y se miden sus alturas para analizar la diferencia.
  • ❓ Se realiza una prueba t de dos muestras para verificar si las alturas de las plantas difieren significativamente entre los campos.
  • ⚖️ Se asume que las condiciones de aleatoriedad, normalidad e independencia están cumplidas para la inferencia estadística.
  • 🔢 Se establece un nivel de significancia del 0.05 para la prueba.
  • 🎯 La hipótesis nula sugiere que no hay diferencia en el promedio de las alturas de las plantas entre los campos A y B.
  • 🔄 La hipótesis alternativa indica que las alturas de las plantas en los campos A y B son diferentes.
  • 📉 Se calcula el estadístico t utilizando la diferencia de las medias entre las muestras y sus desviaciones estándar.
  • 📊 El estadístico t se calcula como -2.44, lo que indica una diferencia significativa entre las alturas promedio de las plantas.
  • 🧮 Se utiliza una calculadora estadística para encontrar la probabilidad asociada al valor t obtenido.
  • 📉 La probabilidad de obtener un valor t tan extremo como -2.44 es del orden de 0.024, lo que es menor al nivel de significancia.
  • ❌ Como el valor p (0.024) es menor que el nivel de significancia (0.05), se rechaza la hipótesis nula y se acepta la hipótesis alternativa.

Q & A

  • ¿Qué es lo que Carlos quiere saber sobre las plantas de tomate en sus dos campos?

    -Carlos quiere saber si las alturas de las plantas de tomate difieren entre los dos campos.

  • ¿Cuáles son las condiciones que se suponen se cumplen para realizar la prueba T de dos muestras?

    -Se suponen que se cumplen la condición de aleatoriedad, la condición de normalidad y la condición de independencia.

  • ¿Cuál es la hipótesis nula que se establece para la prueba T de dos muestras?

    -La hipótesis nula establece que no hay diferencia entre el promedio de las alturas de las plantas en los dos campos, es decir, la media del campo A es igual a la media del campo B.

  • ¿Cómo se construye la hipótesis alternativa para esta prueba?

    -La hipótesis alternativa se construye basándose en el interés de Carlos, que es saber si las alturas de las plantas difieren entre los dos campos, sin especificar una dirección (mayor o menor).

  • ¿Cómo se calcula el estadístico T para la prueba T de dos muestras?

    -El estadístico T se calcula como la diferencia entre las medias de las muestras dividida por la raíz cuadrada de la suma de las desviaciones estándar al cuadrado de las muestras, cada una dividida por su tamaño de muestra.

  • ¿Cuál fue el resultado del estadístico T calculado a partir de los datos proporcionados en el script?

    -El resultado del estadístico T calculado fue aproximadamente -2.44.

  • ¿Cómo se determina la probabilidad de obtener un valor T tan extremo como el calculado?

    -Se utiliza una distribución T y una calculadora estadística para encontrar la probabilidad de la cola que corresponde al valor T calculado, y luego se multiplica por 2 para incluir la probabilidad de la cola opuesta.

  • ¿Cuál es el nivel de significancia establecido para la prueba?

    -El nivel de significancia establecido para la prueba es de 0.05.

  • ¿Cómo se determina el número de grados de libertad para la distribución T?

    -Se utiliza un enfoque conservador que toma el tamaño de la muestra más pequeña menos uno, en este caso, 22 menos 1, dando un total de 21 grados de libertad.

  • ¿Qué conclusión se puede sacar con base en el valor p obtenido en la prueba T?

    -El valor p obtenido fue 0.024, que es menor que el nivel de significancia de 0.05, lo que indica que se puede rechazar la hipótesis nula y se acepta la hipótesis alternativa, sugiriendo que hay una diferencia en las alturas de las plantas de tomate en los dos campos.

  • ¿Qué implica rechazar la hipótesis nula en el contexto de esta prueba?

    -Rechazar la hipótesis nula implica que hay evidencia estadística para creer que las alturas medias de las plantas de tomate en los dos campos son diferentes.

  • ¿Cómo se interpreta el resultado de la prueba T en términos de la pregunta inicial de Carlos?

    -El resultado de la prueba T indica que hay una diferencia significativa en las alturas de las plantas de tomate en los dos campos, respondiendo así a la pregunta inicial de Carlos.

Outlines

00:00

🔍 Prueba T de Dos Muestras para Comparar Altura de Plantas

Carlos realiza cultivo de tomates en dos campos y desea saber si existe una diferencia en la altura de las plantas entre ellos. Para ello, toma muestras aleatorias de plantas de cada campo, midiendo sus alturas. Se realiza una prueba T de dos muestras bajo la suposición de cumplir con las condiciones de aleatoriedad, normalidad e independencia, con un nivel de significancia del 5%. La hipótesis nula sugiere que no hay diferencia en el promedio de las alturas entre los campos, mientras que la hipótesis alternativa indica que las alturas sí difieren. El cálculo del estadístico T se realiza usando la diferencia de las medias entre la desviación estándar de ambas muestras, ponderadas por el tamaño de la muestra. El resultado del estadístico T es aproximadamente -2.44, lo que se utiliza para determinar la probabilidad de obtener tal valor extremo bajo la distribución T.

05:01

📉 Análisis de la Probabilidad y Decisión Final

Para determinar la probabilidad de obtener un valor T tan extremo como el calculado (-2.44), se utiliza una calculadora estadística para encontrar la probabilidad en la cola de la distribución T. Se asume una aproximación de -∞ como límite inferior y -2.44 como límite superior, considerando 21 grados de libertad (mínimo de las muestras tomadas menos uno). El cálculo resulta en una probabilidad de 0.024, la cual se multiplica por 2 para cubrir ambas colas de la distribución. Al comparar este valor P con el nivel de significancia del 5%, se concluye que la probabilidad obtenida es menor al nivel de significancia, lo que lleva al rechazo de la hipótesis nula. Esto sugiere que hay evidencia suficiente para afirmar que las alturas de las plantas de tomate varían entre los dos campos cultivados por Carlos.

Mindmap

Keywords

💡Prueba t de dos muestras

La prueba t de dos muestras es una técnica estadística utilizada para determinar si hay una diferencia significativa entre dos medias de muestras. En el video, se utiliza para comparar las alturas de las plantas de tomate en dos campos diferentes. Se calcula el estadístico t, que es la diferencia entre las medias dividida por la desviación estándar de la distribución muestral de la diferencia de las medias.

💡Hipótesis nula

La hipótesis nula es una suposición que se hace para ser probada统计上. En este caso, la hipótesis nula establece que no hay diferencia entre el promedio de las alturas de las plantas en los dos campos (es decir, la media del campo A es igual a la del campo B). Se refuta o acepta en base a los resultados de la prueba estadística.

💡Hipótesis alternativa

La hipótesis alternativa es lo contrario de la hipótesis nula y representa lo que se espera probar. En el video, la hipótesis alternativa indica que las alturas de las plantas en los dos campos difieren, lo que significa que la media del campo A no es igual a la del campo B.

💡Nivel de significancia

El nivel de significancia, comúnmente representado como α, es el punto de corte para decidir si los resultados son estadísticamente significativos. En el video, se utiliza un nivel de significancia del 0.05, lo que significa que se rechazará la hipótesis nula si la probabilidad de un error tipo I (falso positivo) es menor o igual al 5%.

💡Desviación estándar

La desviación estándar es una medida de la dispersión de los datos en una muestra. Mide la cantidad de variabilidad o dispersión de los datos en torno a la media. En el video, se utiliza la desviación estándar de las muestras de los campos A y B para calcular el estadístico t.

💡Distribución t

La distribución t, o distribución de Student, es una distribución de probabilidad utilizada en la estadística para determinar la probabilidad de obtener un valor de estadístico t bajo la hipótesis nula. En el video, la distribución t se utiliza para encontrar la probabilidad de obtener un valor tan extremo como el estadístico t calculado.

💡Grados de libertad

Los grados de libertad son un concepto utilizado en estadística que se refiere a la cantidad de información independiente en una muestra de datos. En la prueba t de dos muestras, los grados de libertad se calculan como el tamaño de la muestra más pequeña menos uno, y en el video se utiliza para determinar la forma de la distribución t que se debe utilizar.

💡Probabilidad

La probabilidad es un concepto fundamental en la estadística que representa la chances de que un evento ocurra. En el video, se busca calcular la probabilidad de obtener un valor de estadístico t tan extremo como el observado, lo que nos dice si los datos son consistentes con la hipótesis nula o no.

💡Rechazo de la hipótesis nula

El rechazo de la hipótesis nula ocurre cuando los resultados de la prueba estadística sugieren que la hipótesis nula es muy improbable. En el video, si la probabilidad obtenida (p-valor) es menor al nivel de significancia, se rechaza la hipótesis nula, lo que indica que hay evidencia de que las alturas de las plantas en los dos campos son diferentes.

💡Evidencia estadística

La evidencia estadística se refiere a la información que se obtiene a través de pruebas estadísticas para apoyar o refutar una hipótesis. En el video, la evidencia estadística se utiliza para determinar si las alturas promedio de las plantas de tomate en los dos campos son significativamente diferentes.

💡Condiciones para la inferencia

Las condiciones para la inferencia son suposiciones o requisitos que deben cumplirse para que los resultados de una prueba estadística sean válidos. En el video, se asume que se cumplen las condiciones de aleatoriedad, normalidad e independencia, lo que permite llevar a cabo la prueba t de dos muestras.

Highlights

Carlos cultiva tomates en dos campos separados y está interesado en saber si las alturas de las plantas difieren entre ellos.

Se realiza una muestra aleatoria de plantas de cada campo y se miden sus alturas para analizar la diferencia.

Se asume que las condiciones para la inferencia estadística se cumplen: aleatoriedad, normalidad e independencia.

Se establece un nivel de significancia del 0.05 para la prueba estadística.

Se construye la hipótesis nula que no hay diferencia en el promedio de las alturas de las plantas entre los campos A y B.

La hipótesis alternativa sugiere que las alturas de las plantas en los campos A y B son diferentes.

Se calcula el estadístico t basado en la diferencia de las medias y la desviación estándar de las muestras.

El numerador para el cálculo del estadístico t es la diferencia entre las medias de las muestras (1.3 - 1.6).

El denominador es la raíz cuadrada de la varianza combinada de las muestras de los campos A y B.

El resultado del estadístico t es aproximadamente -2.44, lo que indica una diferencia significativa.

Se utiliza una distribución t para encontrar la probabilidad asociada al valor t calculado.

La probabilidad de obtener un valor t tan extremo es calculada como la suma de las áreas en las colas de la distribución t.

El uso de una calculadora estadística muestra que la probabilidad de un valor t absoluto mayor o igual que 2.44 es aproximadamente 0.024.

Dado que el valor p (0.024) es menor que el nivel de significancia (0.05), se rechaza la hipótesis nula.

La evidencia sugiere que las alturas de las plantas de tomate son significativamente diferentes entre los dos campos cultivados.

El tamaño de la muestra menor (22 plantas) menos uno se utiliza para determinar los grados de libertad en la distribución t.

Se concluye que hay una diferencia en las alturas de las plantas de tomate cultivadas en los campos A y B, lo que puede afectar la gestión de cultivos y la cosecha.

Transcripts

play00:00

carlos cultiva tomates en dos campos

play00:02

separados cuando los tomates están

play00:05

listos para ser cosechados le interesa

play00:08

saber si las alturas de las plantas

play00:10

difieren entre los dos campos toma una

play00:14

muestra aleatoria de plantas de cada

play00:16

campo y mide sus alturas este es el

play00:20

resumen de los resultados lo que quiero

play00:24

que hagas es que pausa el vídeo y

play00:26

realices una prueba te de dos muestras y

play00:30

vamos a suponer que todas las

play00:32

condiciones para la inferencia se

play00:34

cumplen la condición de aleatoriedad la

play00:37

condición de normalidad y la condición

play00:40

de independencia

play00:41

supongamos también que estamos

play00:43

trabajando con un nivel de significancia

play00:45

de 0.05 entonces pausa el vídeo y

play00:51

realiza la prueba te de dos muestras

play00:53

para verificar si hay evidencia de que

play00:56

las alturas de las plantas difieren

play00:59

entre los dos campos

play01:01

muy bien ahora hagámoslo juntos como

play01:05

siempre primero vamos a construir

play01:07

nuestra hipótesis nula que dice que no

play01:09

hay diferencia entre el promedio de las

play01:12

alturas entonces tendremos que la media

play01:16

de la altura del campo am es igual a la

play01:18

media de la altura del campo ven ahora

play01:21

que hay de nuestra hipótesis alternativa

play01:25

bueno le interesa saber si las alturas

play01:29

de las plantas difieren entre los dos

play01:31

campos es decir no requiere saber si la

play01:35

altura en el campo am es mayor que la

play01:38

altura en el campo b o viceversa

play01:41

entonces la hipótesis alternativa se

play01:44

construye con base en lo que a él le

play01:47

interesa es decir que la media del campo

play01:51

am no va a ser igual a la media del

play01:53

campo b es decir difieren

play01:57

ahora para hacer esta prueba te de dos

play02:00

muestras vamos a suponer la hipótesis

play02:03

nula y recuerda estamos suponiendo que

play02:06

se cumplen todas las condiciones para la

play02:08

inferencia y ahora queremos calcular el

play02:12

estadístico t con base en los datos que

play02:15

tenemos de la muestra nuestro

play02:17

estadístico t será igual a la diferencia

play02:21

de las medias de nuestra muestra entre

play02:25

la estimación de la desviación estándar

play02:27

para la distribución muestral de la

play02:30

diferencia de las medias esto es la raíz

play02:33

cuadrada de la desviación estándar de la

play02:37

muestra del campo am al cuadrado entre

play02:41

el tamaño de la muestra del campo am más

play02:44

la desviación estándar de la muestra del

play02:47

campo b al cuadrado entre el tamaño de

play02:50

la muestra del campo b ya tenemos todos

play02:53

los valores para hacer este cálculo este

play02:56

numerador es igual a

play02:58

1.3 menos 1.6 todo esto entre la raíz

play03:05

cuadrada de veamos la desviación

play03:08

estándar de la muestra del campo am es

play03:11

0.5 al elevarlo al cuadrado obtendremos

play03:15

0.25 entre el tamaño de la muestra del

play03:18

campo a que es 22 ya esto hay que

play03:22

sumarle 0.3 al cuadrado que nos da 0.09

play03:28

entre el tamaño de la muestra del campo

play03:30

vemos que es 24 el numerador es

play03:34

simplemente menos punto 3 entonces

play03:37

tenemos menos punto 3 dividido entre la

play03:42

raíz cuadrada de punto 25 entre 22 más

play03:47

punto 0 9 entre 24

play03:51

esto nos da aproximadamente menos 2.44

play03:57

vamos a notarlo aproximadamente menos

play04:01

2.44 y bueno si dibujamos una

play04:04

distribución t y usaremos nuestra

play04:07

calculadora para encontrar esta

play04:09

probabilidad entonces aquí tendremos la

play04:12

media supuesta de nuestra distribución t

play04:14

y obtuvimos un resultado para nuestro

play04:17

estadístico tm de menos 2.44 así que

play04:22

estaremos justo aquí este es menos 2.44

play04:27

entonces queremos saber para esta

play04:29

distribución t

play04:31

cuál es la probabilidad de obtener un

play04:33

valor tan extremo como éste es decir

play04:37

será esta área y también será esta área

play04:41

que corresponde a 2.44 por arriba de la

play04:44

media entonces lo que haremos es usar

play04:48

nuestra calculadora para encontrar esta

play04:51

probabilidad de aquí y después la

play04:53

multiplicaremos por 2 para incluirla de

play04:56

esta región

play04:58

entonces la probabilidad de obtener un

play05:00

valor tema

play05:01

supongo que podríamos decir el valor

play05:03

absoluto de t que sea mayor o igual que

play05:08

2.44 será aproximadamente igual a am

play05:13

e iremos a la segunda función luego a

play05:17

distribución después a la función de

play05:21

distribución acumulada t y cómo queremos

play05:24

calcular la probabilidad de la cola que

play05:27

tenemos aquí y después multiplicada por

play05:29

dos

play05:29

entonces el límite inferior será un

play05:32

número negativo muy muy muy grande así

play05:36

que podemos pensarlo como menos infinito

play05:39

mientras que el límite superior es menos

play05:41

2.44 y ahora cuántos grados de libertad

play05:46

tenemos bueno si nos basamos en un

play05:49

enfoque conservador será el tamaño de la

play05:52

menor de las dos muestras menos uno

play05:55

vemos que el menor tamaño de muestra es

play05:58

22 entonces es 22 menos 1 lo cual es 21

play06:02

ahora podemos pegar la función y

play06:05

obtenemos este número de aquí y si lo

play06:08

multiplicamos por 2 ya que este me da la

play06:10

probabilidad de obtener algo menor que

play06:13

esto pero también necesitamos la

play06:16

probabilidad de obtener algo

play06:18

o mayor a 2.44 por arriba de la media de

play06:22

nuestra distribución t entonces esto x 2

play06:25

será aproximadamente igual a cero punto

play06:29

cero 24 vamos a notarlo 0.0 24 y a

play06:37

continuación vemos que al compararlo con

play06:40

nuestro nivel de significancia podemos

play06:42

ver claramente que este de aquí que es

play06:45

nuestro valor p en esta situación es

play06:48

claramente menor que nuestro nivel de

play06:51

significancia y por esta razón podemos

play06:54

decir que al suponer cierta la hipótesis

play06:58

nula obtuvimos una probabilidad muy

play07:01

pequeña que está por debajo de nuestro

play07:04

umbral entonces podemos rechazar nuestra

play07:07

hipótesis nula lo que sugiere la

play07:10

hipótesis alternativa que nos dice que

play07:13

si hay una diferencia entre las alturas

play07:16

de las plantas de tomate en los dos

play07:19

campos

Rate This

5.0 / 5 (0 votes)

Related Tags
Prueba TEstadísticaCamposTomateDiferenciasHipótesisSignificanciaNormalidadIndependenciaAleatoriedadAgricultura
Do you need a summary in English?