Prueba de chi-cuadrado (χ²) con Excel

Helingeniero
11 Feb 202112:03

Summary

TLDREn este tutorial, se realiza una prueba de independencia conocida como 'Prueba Qui-Cuadrado' para determinar si el género de los consumidores está relacionado con su preferencia por tres marcas de refrescos. La agencia de publicidad busca saber si debe diseñar anuncios diferenciados para hombres y mujeres. Se plantean hipótesis nula e alternativa y se utiliza un nivel de significancia del 5%. Se calculan las frecuencias observadas y esperadas, y se utiliza la fórmula del Chi-Cuadrado para evaluar la asociación entre las variables. El resultado indica que no hay asociación entre el género y la preferencia de refrescos, lo que lleva a aceptar la hipótesis nula y sugerir un solo anuncio para todas las marcas y géneros.

Takeaways

  • 📚 El tutorial trata sobre realizar una prueba de independencia llamada 'Prueba Qui-Cuadrado'.
  • 👥 La agencia de publicidad quiere saber si el género es independiente de la preferencia por tres marcas de refrescos.
  • 📊 Se plantean hipótesis nula e alternativa para determinar si la marca de refresco consumida depende del sexo.
  • 🔢 Se entrevistaron a 47 hombres y 53 mujeres para obtener datos sobre su preferencia de refresco.
  • 📉 Se calculan las frecuencias observadas y esperadas para realizar la prueba.
  • 📊 Se utiliza la proporción de hombres y mujeres en el total de la muestra para calcular las frecuencias esperadas.
  • 🔢 Se realiza el cálculo del Chi-Cuadrado para cada celda del contenedor de datos.
  • 📉 El Chi-Cuadrado calculado es comparado con el Chi-Cuadrado crítico para determinar la asociación.
  • 📊 El grado de libertad se determina por la multiplicación del número de columnas menos 1 por el número de filas menos 1.
  • 📐 Se utiliza la función de prueba Chi-Cuadrado del programa para encontrar el Chi-Cuadrado crítico.
  • 🚫 El Chi-Cuadrado crítico (5.991) es mayor que el Chi-Cuadrado calculado (3.16), lo que indica que no hay asociación entre el género y la preferencia de refresco.
  • 🎯 Se acepta la hipótesis nula, lo que significa que la marca de refresco consumida es independiente del sexo.
  • 📣 La agencia de publicidad puede diseñar un solo anuncio para todas las marcas de refrescos y géneros debido a la independencia encontrada.

Q & A

  • ¿Qué prueba estadística se realiza en el tutorial?

    -Se realiza la prueba del chi cuadrado para determinar si hay independencia entre el género de los consumidores y su preferencia por tres marcas de refrescos.

  • ¿Cuál es el nivel de significancia utilizado en la prueba?

    -El nivel de significancia utilizado en la prueba es del 5%.

  • ¿Cuál es la hipótesis nula en el estudio sobre las preferencias de refrescos?

    -La hipótesis nula es que la marca de refresco que se consume es independiente del sexo de una persona, es decir, no hay asociación.

  • ¿Cuál es la hipótesis alternativa en el estudio sobre las preferencias de refrescos?

    -La hipótesis alternativa es que la marca de refresco que se consume depende del sexo de una persona, lo que implica una asociación.

  • ¿Cuántas personas se entrevistaron o observaron para obtener los datos del estudio?

    -Se entrevistaron o observaron a 47 hombres y 53 mujeres para obtener los datos del estudio.

  • ¿Cómo se calcula la proporción de hombres en el estudio?

    -La proporción de hombres se calcula dividiendo el número total de hombres (47) entre el total de personas entrevistadas.

  • ¿Cómo se determinan las frecuencias esperadas en la prueba chi cuadrado?

    -Las frecuencias esperadas se determinan multiplicando la proporción de cada grupo (hombres y mujeres) por el total de observaciones para cada una de las tres marcas de refrescos.

  • ¿Cuál es el valor del chi cuadrado calculado en el estudio?

    -El valor del chi cuadrado calculado en el estudio es de 3.16.

  • ¿Cuál es el grado de libertad utilizado para determinar el chi cuadrado crítico?

    -El grado de libertad utilizado es 2, que se calcula como (número de columnas - 1) * (número de filas - 1), siendo 2 columnas y 3 filas.

  • ¿Qué conclusión se toma en base al resultado del chi cuadrado en relación con la hipótesis nula?

    -Como el chi cuadrado crítico (5.991) es mayor que el chi cuadrado calculado (3.16), se acepta la hipótesis nula, lo que indica que no hay asociación entre el género y la preferencia de las marcas de refrescos.

  • ¿Qué recomendación se da a la agencia de publicidad basada en los resultados de la prueba?

    -La agencia de publicidad puede hacer un solo comercial para las tres marcas de refrescos y para cualquier género, debido a que no existe asociación entre el género y las preferencias de refrescos.

Outlines

00:00

📊 Prueba de la prueba chi-cuadrado para independencia

El primer párrafo presenta un tutorial sobre cómo realizar una prueba de chi-cuadrado para determinar si hay independencia entre el género de los consumidores y su preferencia por tres marcas de refrescos. Se plantean las hipótesis nula y alternativa y se describe el proceso de recolección de datos de 47 hombres y 53 mujeres. Seguidamente, se explica cómo calcular las frecuencias esperadas utilizando proporciones y seguidamente las frecuencias observadas, con el fin de establecer si hay una asociación o no entre las variables consideradas.

05:02

📐 Análisis de la diferencia entre frecuencias observadas y esperadas

En el segundo párrafo, se analiza la relación entre las frecuencias observadas y esperadas para determinar si existe una asociación entre el género y la preferencia de las marcas de refrescos. Se calcula el chi-cuadrado para cada celda del contenedor, que implica la diferencia entre las frecuencias observadas y esperadas elevada al cuadrado, dividida por las frecuencias esperadas. El resultado se suma para obtener el chi-cuadrado calculado. Luego, se determina el chi-cuadrado crítico a partir de la probabilidad de significancia y los grados de libertad, para compararlo con el chi-cuadrado calculado y así establecer si hay o no asociación.

10:04

🚫 Rechazo de la hipótesis alternativa y aceptación de la hipótesis nula

El tercer párrafo concluye el tutorial explicando que, al comparar el chi-cuadrado calculado con el chi-cuadrado crítico, se determina que no hay una relación significativa entre el género y la preferencia de las marcas de refrescos, ya que el chi-cuadrado calculado es menor que el crítico. Por lo tanto, se acepta la hipótesis nula, lo que indica que la marca de refresco consumida es independiente del sexo del consumidor. Esto sugiere que una agencia de publicidad puede diseñar un único anuncio para todas las marcas y géneros, basándose en la ausencia de asociación entre estas variables. El tutorial termina con una invitación a los espectadores a suscribirse y activar notificaciones para recibir futuras actualizaciones del canal.

Mindmap

Keywords

💡Prueba del Chi-cuadrado

La prueba del Chi-cuadrado es una técnica estadística utilizada para determinar si hay una asociación entre dos variables categóricas. En el video, se utiliza para evaluar si el género de los consumidores está asociado con su preferencia por tres marcas de refrescos. Se menciona que se realizará esta prueba con un nivel de significancia del 5%.

💡Independencia

En el contexto del video, la independencia se refiere a la ausencia de asociación entre dos variables. La hipótesis nula planteada indica que la elección de la marca de refresco es independiente del género del consumidor, lo cual se prueba mediante la prueba del Chi-cuadrado.

💡Hipótesis nula

La hipótesis nula es una suposición básica en un estudio estadístico que se asume verdadera hasta que se demuestre lo contrario. En el video, la hipótesis nula es que no hay asociación entre la marca de refresco consumida y el sexo de una persona.

💡Hipótesis alternativa

La hipótesis alternativa es la proposición opuesta a la hipótesis nula y representa lo que se espera probar. En el script, la hipótesis alternativa es que la marca de refresco consumida depende del sexo de una persona.

💡Nivel de significancia

El nivel de significancia, mencionado como del 5% en el video, es el umbral establecido para determinar si los resultados de una prueba estadística son estadísticamente significativos. Un nivel de significancia del 5% significa que hay un 5% de probabilidad de rechazar incorrectamente la hipótesis nula.

💡Frecuencia observada

La frecuencia observada se refiere a los datos recolectados a través de un estudio o experimento. En el video, se menciona que se han observado 47 hombres y 53 mujeres y se han registrado las frecuencias de preferencia de las marcas de refrescos.

💡Frecuencia esperada

La frecuencia esperada es el número de veces que se espera que ocurra un evento bajo la hipótesis nula. En el tutorial, se calculan las frecuencias esperadas para cada grupo (hombres y mujeres) y para cada marca de refresco, basándose en las proporciones totales.

💡Proporción

La proporción es una cantidad dividida por el total, expresada como una fracción o porcentaje. En el script, se calculan las proporciones de hombres y mujeres y se utilizan para determinar las frecuencias esperadas en cada grupo.

💡Grados de libertad

Los grados de libertad son un concepto en estadística que se refiere al número de observaciones independientes en un conjunto de datos. En el video, se calculan los grados de libertad como (número de columnas - 1) × (número de filas - 1), donde las columnas representan géneros y las filas representan marcas de refresco.

💡Chi-cuadrado crítico

El chi-cuadrado crítico es un valor tabulado que se utiliza para comparar con el chi-cuadrado calculado para decidir si se rechaza o no la hipótesis nula. En el script, se busca el chi-cuadrado crítico para un nivel de significancia del 5% y un grado de libertad de 2.

Highlights

Tutorial sobre la prueba del chi cuadrado para determinar la independencia entre género y preferencia de refrescos.

La agencia de publicidad quiere saber si el género influye en la preferencia de tres marcas de refrescos.

Se plantean las hipótesis nula y alternativa para la prueba de independencia.

La hipótesis nula sugiere que no hay asociación entre el género y la marca de refresco consumida.

La hipótesis alternativa indica que el género y la preferencia de refresco dependen el uno del otro.

Se realizó un estudio con 47 hombres y 53 mujeres observando su preferencia de refresco.

Se calculan las proporciones de hombres y mujeres en la muestra.

Se determinan las frecuencias esperadas basándose en las proporciones calculadas.

Se compara la frecuencia observada con la frecuencia esperada para evaluar la independencia.

Se calcula el chi cuadrado (CCI) para cada celda del contenedor de datos.

El chi cuadrado calculado se compara con el chi cuadrado crítico para determinar la asociación.

Se utiliza una tabla o una función de prueba para encontrar el chi cuadrado crítico.

El chi cuadrado crítico (5.991) es comparado con el chi cuadrado calculado (3.16).

El chi cuadrado calculado es menor que el crítico, lo que indica la independencia de variables.

Se acepta la hipótesis nula y se rechaza la alternativa, lo que significa que no hay relación de dependencia.

La agencia de publicidad puede diseñar un solo anuncio para todos los géneros basándose en los resultados.

Se presenta una gráfica de aceptación y rechazo de la hipótesis con un nivel de significancia del 5%.

Transcripts

play00:00

qué tal amigos sean todos bienvenidos

play00:01

una vez más a mi canal pues aquí estamos

play00:04

otra vez con otro tutorial

play00:06

en esta oportunidad vamos a llevar a

play00:08

cabo una prueba que se llama prueba si

play00:10

he cuadrado en esta en este caso lo

play00:13

vamos a utilizar como prueba de

play00:14

independencia ok vamos a empezar por

play00:17

este problema no dice que una agencia de

play00:19

publicidad desea saber si el género de

play00:23

los consumidores es independientes de su

play00:25

preferencia de tres marcas de refrescos

play00:27

el estudio determinará si se deben

play00:31

diseñar diferentes anuncios dirigido a

play00:33

los hombres y otros diferentes para las

play00:36

mujeres realice la prueba con un nivel

play00:38

de significancia del 5 por ciento

play00:42

para ello nos vamos a plantear estas

play00:44

hipótesis primero la hipótesis nula

play00:47

donde decimos que la marca de refresco

play00:50

que se consume es independiente del sexo

play00:53

de una persona es decir que no hay

play00:56

asociación y una hipótesis alternativa

play01:00

donde la marca de reflejo que se consume

play01:03

depende del sexo de una persona fíjense

play01:07

ustedes que tenemos aquí los datos que

play01:09

se recogió se entrevistaron o se

play01:12

observaron a 47 hombres y 53 mujeres

play01:17

y se obtuvo esta esta frecuencia

play01:21

observada que llamamos frecuencia

play01:23

observada entonces necesitamos

play01:25

determinar la frecuencia esperada ok

play01:29

entonces vamos vamos a hacer los

play01:32

cálculos primero vamos a buscar la

play01:34

proporción nos paramos aquí en esta

play01:36

celda vamos a la barra de fórmulas y

play01:39

tomamos el número total de hombres que

play01:41

son 47 y lo dividimos entre el total de

play01:45

personas vamos a fijar el 100% ok

play01:52

y le damos enter eso nos dio 0 47 y lo

play01:57

fijamos y para hacer esto

play01:59

ok obtener la otra proporción solamente

play02:02

arrastrando la celda ahora sí fíjense

play02:04

que estos dos valores también lo debemos

play02:06

sumar para ello ya yo tengo todas las

play02:08

tablas listas para hacer esto más rápido

play02:11

obviar cosas que son innecesarias y ser

play02:14

mã y que sea más didáctico el tutorial

play02:16

aquí le damos auto suma y unos 34

play02:20

fíjense sumamos estos 2

play02:22

también llenos de a 38 sumamos estas dos

play02:26

celdas

play02:28

y nos dan 28 fíjense que estos tres

play02:31

valores también deben dar 100 p ahora sí

play02:35

ahora vamos a determinar

play02:37

la frecuencia observar que para ello

play02:42

vamos a hacer lo siguiente nos vamos a

play02:44

parar aquí vamos a empezar por esta

play02:46

celda y nos vamos a la barra de fórmulas

play02:48

y decimos

play02:50

esta proporción

play02:52

x

play02:54

ok este valor que tenemos aquí esta

play02:57

celda 34 le damos gente y nos da 15 98

play03:02

hacemos lo mismo con esta celda sería

play03:05

este valor

play03:08

primero nos paramos aquí y vamos a la

play03:12

barra de fórmulas y tomamos la

play03:14

proporción

play03:16

y las multiplicamos ahora por cual por

play03:19

este señor que está aquí de valor 38 eso

play03:22

nos da 17 86

play03:27

en esta celda la marca ce con nombre nos

play03:31

vamos a la barra de fórmulas tomamos la

play03:34

proporción y la multiplicamos por este

play03:38

valor que está aquí

play03:41

eso nos da 13 16 fíjense ustedes que

play03:43

cuando sumamos estos tres valores nos

play03:47

tiene que dar 47 que este mismo valor

play03:50

ahora vamos a hacer lo mismo para la

play03:52

columna donde están las mujeres tomamos

play03:55

la proporción y las multiplicamos por

play03:57

cada uno de estos valores entonces

play04:00

empezamos por aquí nos vamos a la barra

play04:03

de fórmulas que vemos igual tomamos la

play04:06

proporción y la multiplicamos

play04:10

por este valor

play04:12

lo mismo sismos con todo lo demás ok

play04:15

vamos a esta celda escribimos igual

play04:17

tomamos la proporción y la multiplicamos

play04:20

por este valor ahora

play04:24

nos vamos a la otra celda escribimos

play04:28

igual tomamos la proporción y la

play04:31

multiplicamos ahora por este valor

play04:34

lo hice paso a paso para que vayan

play04:37

viendo cómo salen los cálculos ok si

play04:40

sumamos estos tres valores

play04:43

piense que nos da 53 el total de mujeres

play04:47

ahora vamos a sumar

play04:49

esta estos dos valores le damos autos o

play04:52

más fíjense que nos da 34 y lo mismo

play04:56

hacemos con los demás vamos a salvar

play04:57

ahora de una vez porque ya lo hicimos

play04:59

aquí paso por paso fíjense que ya

play05:02

tenemos la frecuencia esperada

play05:06

ok tenemos la observada y tenemos la

play05:09

frecuencia esperada aquí nosotros

play05:11

podemos ver

play05:13

qué pasa con la frecuencia observada y

play05:15

la frecuencia esperada si la diferencia

play05:18

es muy grande entre ella podemos decir

play05:21

que hay una asociación

play05:23

pero si es muy pequeña relativamente

play05:27

pequeña podemos ya decir que hay una

play05:29

independencia ok pero vamos a

play05:32

demostrarlo a través de la fórmula

play05:34

no estamos muy seguros

play05:36

sin embargo aquí se ve que es

play05:38

relativamente a la diferencia es pequeña

play05:40

de la frecuencia observada con las

play05:43

esperadas vamos entonces a calcular el

play05:45

cci cuadrado para cada una de las marcas

play05:48

de hombres y mujeres

play05:51

nos paramos aquí diferencia que vamos a

play05:54

determinar primero de esta fórmula ok en

play05:57

cada una de estas celdas vamos a

play05:59

calcular la frecuencia observada menos

play06:02

la frecuencia esperada se eleva al

play06:04

cuadrado y se divide entre las

play06:05

frecuencias esperadas para cada una de

play06:08

estas celdas luego las sumamos todas y

play06:10

eso va a ser nuestro chico cuadrado

play06:12

calculado estamos claro lo que íbamos a

play06:16

empezar entonces con esta celda y nos

play06:18

vamos a la barra de fórmulas y decimos

play06:20

es igual

play06:22

abrimos paréntesis

play06:24

frecuencia observada para esta celda

play06:27

aquí sería 12

play06:29

menos

play06:31

frecuencia esperada

play06:34

1598 cerramos paréntesis y eso lo vamos

play06:37

a elevar

play06:39

al cuadrado ahí lo tenemos y eso luego

play06:43

entre para empezar ok

play06:46

entre paréntesis porque lo vamos a

play06:49

dividir

play06:51

entre la frecuencia esperada ahí lo

play06:54

tienen

play06:54

llevamos enter

play06:56

y fíjense que nos da este valor

play06:59

ahora tomando esto calculamos los otros

play07:03

de la misma manera estamos claro de la

play07:06

misma manera y luego arre tramo hacia la

play07:09

derecha y ahí lo tenemos

play07:12

el chico ha grabado para cada una de las

play07:14

celdas estamos claro ahora si vamos a

play07:17

calcular el cci cuadrado que llamamos

play07:21

chis cuadrado calculado para ello nos

play07:23

vamos a la da de fórmula

play07:26

escribimos la función suma le damos

play07:28

doble clic y vamos a seleccionar todos

play07:31

estos valores

play07:33

lo vamos a sumar

play07:34

le damos enter y eso nos da 3 16 tan

play07:38

claro ahora qué pasa ya tengo el chico

play07:43

de grado calculado necesito determinar

play07:46

el chico a grado crítico y para ello

play07:49

necesito la probabilidad y los grados de

play07:51

libertad

play07:53

la probabilidad decimos entonces que es

play07:55

igual fíjense que nos da un 5% de grado

play07:59

de significancia entonces la

play08:01

probabilidad es 5

play08:05

entre 100

play08:07

claro

play08:08

y entonces la probabilidad es 0 05 y que

play08:13

es el grado de libertad el grado de

play08:15

libertad no es más que

play08:18

la multiplicación del número de columnas

play08:22

menos 1 por el número de filas menos 1 y

play08:26

lo vamos a hacer si es usted

play08:28

abrimos paréntesis cuántas columnas

play08:30

tenemos tenemos dos hombres y mujeres

play08:33

entonces serían dos menos uno cerramos

play08:37

el paréntesis por

play08:39

abrimos paréntesis el número de filas

play08:42

cuantas filas tenemos tres las tres

play08:45

marcas de refresco

play08:47

serían tres menos uno cerramos

play08:49

paréntesis y eso iguala cuanto a dos

play08:53

fíjense que muchos lo que no cuentan con

play08:56

conexión se van a una tabla y con la

play09:00

probabilidad y el grado de libertad

play09:01

determina el si cuadrado crítico pero

play09:05

excepto gracias a este maravilloso

play09:07

programa tiene una función que se llama

play09:10

prueba

play09:13

aquí la tenemos

play09:16

y donde me dan de alguna vez el cuadrado

play09:22

crítico

play09:23

pidiéndonos la probabilidad y el grado

play09:26

de libertad que la probabilidad aquí la

play09:29

tenemos 0.5 perdón 0 05

play09:33

y el grado de libertad en este caso 2

play09:40

la gente y fíjense que el chi cuadrado

play09:44

crítico nos dio 599 como pueden ver este

play09:50

cuadrado crítico es mayor que el chico a

play09:53

grado calculado

play09:55

eso quiere decir que no existe relación

play09:59

entre ambas variables no hay asociación

play10:03

si fuese lo contrario decimos que hay

play10:06

asociación y que el sexo o que es tiene

play10:12

relación con la preferencia de los

play10:14

refrescos o de las marcas de refresco

play10:16

pero en este caso no existe ninguna

play10:19

relación por lo tanto nosotros

play10:22

aceptamos la hipótesis nula que nos dice

play10:26

que la marca de refresco que se consume

play10:28

es independiente del sexo y rechazamos

play10:31

la hipótesis alternativa claro entonces

play10:35

tomamos este esta hipótesis como

play10:38

colocarla aquí y la ponemos así ok

play10:42

aceptamos la hipótesis nula

play10:45

por lo tanto la agencia de publicidad

play10:50

puede hacer un solo comercial

play10:53

ok para las tres marcas de refrescos y

play10:57

para cualquier género porque no existe

play11:00

asociación entre el género o el sexo y

play11:03

las marcas de refresco o preferencias

play11:06

hacia las marcas de refresco aquí

play11:08

tenemos la gráfica

play11:11

de aceptación y rechazo para este

play11:13

problema aquí la tenemos y vemos el área

play11:16

de aceptación y vemos el de rechazo con

play11:20

una probabilidad de 0,05 por ciento

play11:23

fíjense que la gráfica es asimétrica

play11:27

como todas las gráficas de este tipo

play11:29

para variables nominales ok bueno hasta

play11:32

aquí este vídeo este tutorial

play11:36

espero que les haya gustado

play11:39

que le haya servido para sus

play11:41

investigaciones para sus estudios y si

play11:44

es así por favor denle un like y sólo

play11:47

pueden compartir muchísimo mejor y si no

play11:50

estás suscrito a mi canal por favor

play11:52

suscriben sé que cada vez que yo suba un

play11:54

tutorial a youtube les llegará una

play11:57

notificación hasta aquí y hasta una

play11:59

nueva oportunidad

Rate This

5.0 / 5 (0 votes)

Related Tags
Prueba Chi-cuadradoAnálisis de datosIndependenciaPublicidadRefrescosGéneroPreferenciasTutorialEstadísticaHipótesis
Do you need a summary in English?