Varianza, Desviación Estándar y Coeficiente de Variación | Datos agrupados en intervalos
Summary
TLDREste video ofrece un curso práctico sobre cómo calcular medidas de dispersión como la varianza, la desviación estándar y el coeficiente de variación para datos agrupados en intervalos. Se utiliza una tabla de frecuencias con edades y frecuencias para ilustrar el proceso. El instructor explica paso a paso cómo encontrar la media, varianza y desviación estándar, distinguiendo entre la fórmula para datos de una población y una muestra. Además, se practica el cálculo del coeficiente de variación para determinar la homogeneidad de los datos. El video incluye un ejercicio para que los espectadores puedan aplicar lo aprendido con una tabla de pesos de 15 personas, enfocándose en la importancia de llenar correctamente las tablas y comprender los conceptos subyacentes para una correcta interpretación de los datos.
Takeaways
- 😀 El video es un curso sobre cómo calcular medidas de dispersión como la varianza, la desviación estándar y el coeficiente de variación para datos agrupados en intervalos.
- 📊 Se utiliza una tabla con intervalos de edades y frecuencias para ilustrar cómo calcular estas medidas estadísticas.
- 👥 La 'x' representa el valor medio de los límites de cada intervalo, y se calcula sumando los límites y dividiendo por 2.
- 📚 Se explica que hay dos fórmulas para calcular la varianza, una para cuando los datos son una población y otra para cuando son una muestra.
- 🧮 Para calcular la varianza de una población, se utiliza la fórmula que incluye la suma de (x - x̄)² * f, donde x es el valor medio del intervalo y f es la frecuencia.
- 🔢 Se resalta la importancia de conocer el promedio (x̄) antes de calcular la varianza, ya que es necesario para la fórmula.
- 📉 El promedio se calcula sumando todos los productos de x * f y dividiendo por el número total de datos (N).
- 📈 Se muestra cómo llenar una tabla para calcular el promedio, la varianza y la desviación estándar paso a paso.
- 📏 La desviación estándar se obtiene tomando la raíz cuadrada de la varianza.
- 📊 El coeficiente de variación se calcula dividiendo la desviación estándar entre el promedio y multiplicando por 100 para dar una porcentaje.
- 🔑 El coeficiente de variación ayuda a determinar si los datos son homogéneos o heterogéneos; valores por encima del 25% indican datos heterogéneos.
Q & A
¿Qué temas trata el curso de medidas de dispersión en el video?
-El curso trata sobre cómo encontrar la varianza, la desviación estándar y el coeficiente de variación para un grupo de datos agrupado en intervalos.
¿Qué es la 'x' en el contexto de la tabla de datos presentada en el video?
-La 'x' representa la marca de clase, que es el promedio de los límites de los intervalos en los que se agrupan los datos.
¿Cómo se calcula la marca de clase 'x' para un intervalo de datos?
-Para calcular la marca de clase 'x', se suman los límites del intervalo y se divide entre 2. Por ejemplo, para el intervalo de 10 a 15 años, sería (10 + 15) / 2 = 12.5.
¿Cuál es la fórmula para calcular la varianza cuando los datos se toman como una población?
-La fórmula para calcular la varianza de un grupo de datos tomado como población es Sigma(x - x_promedio)^2 * f, donde Sigma es la suma, x es la marca de clase, x_promedio es el promedio de las edades y f es la frecuencia.
¿Cómo se determina el promedio (x_promedio) de las edades en el video?
-Para encontrar el promedio, se realiza la suma de las marcas de clase multiplicadas por sus frecuencias (X * F) y se divide entre el número total de datos (N).
¿Qué significa la suma de las frecuencias (F) en el contexto de la tabla de datos?
-La suma de las frecuencias (F) representa el número total de datos en el conjunto, es decir, la cantidad total de personas consideradas en los intervalos de edad.
¿Cuál es la diferencia entre calcular la varianza para una población y para una muestra?
-La diferencia principal es en la división final: para una población se divide por el número total de datos (N), mientras que para una muestra se divide por el número de datos menos uno (N-1).
¿Cómo se calcula la desviación estándar a partir de la varianza?
-La desviación estándar se calcula tomando la raíz cuadrada de la varianza.
¿Qué es el coeficiente de variación y cómo se calcula?
-El coeficiente de variación es una medida de la dispersión de los datos en relación con su promedio. Se calcula dividiendo la desviación estándar entre el promedio y multiplicando por 100 para obtener un porcentaje.
¿Cómo se interpreta el coeficiente de variación en términos de dispersión de los datos?
-Un coeficiente de variación por encima del 25% indica que los datos son heterogéneos y tienen una alta dispersión, mientras que uno por debajo del 25% sugiere que los datos son homogéneos y menos dispersos.
¿Qué ejercicio práctico se sugiere al final del video para aplicar los conceptos aprendidos?
-Se sugiere trabajar con una tabla de pesos de 15 personas, calculando el promedio, la varianza (como si fuese una muestra), la desviación estándar y el coeficiente de variación para practicar llenar la tabla y aplicar las formulas aprendidas.
Outlines
📊 Introducción al análisis de datos agrupados
El primer párrafo presenta el tema del curso sobre medidas de dispersión, específicamente cómo calcular la varianza, la desviación estándar y el coeficiente de variación para datos agrupados en intervalos. Se menciona una tabla con edades y frecuencias de un grupo de personas como ejemplo. Además, se ofrece un enlace para aprender a hacer tablas de frecuencia si el espectador no está familiarizado con ellas. Se describe el proceso de calcular la marca de clase (x) como el promedio de los límites de los intervalos y se enfatiza la importancia de entender las fórmulas para calcular la varianza, ya sea para una población o una muestra.
🔢 Procedimiento para calcular la varianza y el promedio
En este párrafo, se explica con detalle el cálculo del promedio y la varianza para los datos agrupados. Se menciona que se necesita conocer el promedio, que se calcula como la suma de los productos de las marcas de clase (x) y las frecuencias (f) dividido por el número total de datos (n). Luego, se describe el proceso de calcular la varianza, que implica sumar el producto de cada marca de clase menos el promedio, elevado al cuadrado, y la frecuencia correspondiente. Se resalta la importancia de entender las fórmulas y los símbolos utilizados, y se proporciona un ejemplo práctico de cómo llenar una tabla para calcular estos valores.
📐 Cálculo de la desviación estándar y el coeficiente de variación
El tercer párrafo se enfoca en el cálculo de la desviación estándar y el coeficiente de variación. Se aclara que la desviación estándar es simplemente la raíz cuadrada de la varianza. Para el coeficiente de variación, se divide la desviación estándar entre el promedio y se multiplica por 100 para obtener un porcentaje que indica la dispersión relativa de los datos. Se menciona que un coeficiente de variación por encima del 25% sugiere datos heterogéneos, mientras que uno por debajo del 25% indica datos homogéneos. Se invita al espectador a practicar con un ejercicio proporcionado, relacionado con el peso de 15 personas, y se señala la diferencia en la fórmula de varianza cuando los datos son tratados como una muestra en lugar de una población.
📚 Conclusión y recursos adicionales
El último párrafo concluye la lección y ofrece recursos adicionales. Se menciona que el espectador puede encontrar el curso completo de medidas de dispersión en el canal del instructor o a través del enlace en la descripción del video. Se animan a los espectadores a suscribirse, comentar, compartir y dar 'like' al video. Además, se proporciona un ejemplo de cómo llenar una tabla para calcular el promedio, la varianza y el coeficiente de variación para un conjunto de datos que representan el peso de personas, destacando la importancia de la precisión en los cálculos y la interpretación de los resultados finales.
Mindmap
Keywords
💡Medidas de dispersión
💡Varianza
💡Desviación estándar
💡Coeficiente de variación
💡Intervalos
💡Frecuencias
💡Promedio
💡Clase
💡Población y muestra
💡Homogéneos y heterogéneos
Highlights
Bienvenidos al curso de medidas de dispersión para datos agrupados en intervalos.
Explicación de cómo encontrar la varianza, desviación estándar y coeficiente de variación.
Introducción de la tabla de datos de edades de personas con intervalos y frecuencias.
Cómo calcular la marca de clase y su promedio utilizando los límites.
Importancia de la diferenciación entre fórmulas para población y muestra en la varianza.
Proceso para encontrar el promedio utilizando la suma de X * F dividido por N.
Creación de una tabla para calcular la suma de X * F y su utilidad.
Paso a paso para calcular la varianza de un grupo de datos tomado como población.
Método para calcular la desviación estándar a partir de la varianza.
Cálculo del coeficiente de variación y su interpretación.
Diferencia entre la varianza de una población y una muestra en términos de fórmula.
Ejercicio práctico para calcular el promedio, varianza y desviación estándar.
Uso de la tabla de pesos de 15 personas para ejemplificar el proceso.
Cálculo del coeficiente de variación para interpretar la homogeneidad de los datos.
Invitación a suscribirse y seguir el canal para más contenido sobre medidas de dispersión.
Aclaración de cómo llenar las tablas y realizar los cálculos paso a paso.
Conclusión del video con una revisión de los conceptos aprendidos y desafío para la práctica.
Transcripts
[Música]
Qué tal amigos Espero que estén muy bien
bienvenidos al curso de medidas de
dispersión y ahora veremos Cómo
encontrar la varianza desviación
estándar y coeficiente de variación para
un grupo de datos agrupado en intervalos
y para este video trabajaremos con esta
tabla en la que tenemos los datos de las
edades de un conjunto de personas en
este caso pues aquí tenemos los
intervalos y las frecuencias en este
caso esto quiere decir que cinco
personas tienen Entre 10 y 15 años nueve
personas tienen entre 15 y 20 años y así
sucesivamente si ustedes no saben hacer
una tabla de frecuencia y la quieren
aprender a hacer aquí les dejo el link
en el que les enseño hacer tablas de
frecuencia Pero bueno empecemos eh
aclarando Porque pues Puede que no lo
sepan que la x es la marca de clase y la
x es el promedio de los los límites Cómo
se saca la x sumando los límites 10 + 15
25 di 2 que es 12,5 lo mismo se hace con
los demás por ejemplo aquí 20 men + 25
es 45 di 2 22,5 Así se sacan las marcas
de clase aquí están las frecuencias
bueno para hallar la varianza la
desviación estándar y el coeficiente de
variación primero tenemos que encontrar
la varianza en este caso est Esta
formulita es la varianza para cuando el
grupo de datos se toma como una
población acordémonos que la varianza se
puede o hay dos formulas diferentes una
es para cuando los datos se toman como
una población y la otra es para cuando
los datos se toman como una muestra como
les digo Aquí vamos a tomar los datos
como una población algunos libros o
profesores explican aquí o colocan aquí
x sub i f sub i x sub I por F sub I y
así en todo lo mismo aquí en la
formulita yo coloco la x y la f pero
pues ya se sabe lo importante es saber
que esto es la marca de clase que esto
es la frecuencia y y aquí en algunas
formulas en lugar de estar x media así
está un símbolo que se llama New que es
algo así Y en lugar de estar la n
minúscula está la n mayúscula Pero lo
importante es entender el concepto a mí
me gusta trabajarlo así porque el
símbolo más usado para el promedio es
este x con una Barrita arriba y pues la
n siempre va a ser el número de datos
Entonces primero vamos a encontrar la
varianza para la varianza necesitamos
hacer la suma de las x menos el promedio
eso elevarlo al cuadrado y multiplicarlo
por F obviamente ya lo vamos a explicar
acá primero que todo Pues como dice aquí
tenemos que conocer el promedio
acordémonos que el promedio se saca con
la suma de los X * F dividido en x
Entonces tenemos que acordarnos que la
tabla para qué me sirve si en algún
momento alguna fórmula dijera la suma de
los F por ejemplo Qué quiere decir la
suma de los F quiere decir hacer una
casilla que diga
F sumar todos esos datos de esa casilla
por ejemplo en este caso la suma de los
F sería 60 como en este caso dice la
suma de los X * F por eso es que ya
previamente hice una casilla en la que
dice X * F y cuando yo sume todos estos
valores esa suma que me de aquí va a ser
la suma de los X * F Entonces vamos a
encontrar el promedio aquí dice la suma
de los x * f div en N vamos a llenar la
casilla de X * F Cómo se llena pues
simplemente multiplicando como dice aquí
la x por la f o sea tenemos que
multiplicar la x para colocar el valor
de acá multiplicamos la x por la f 12,5
* 5 que eso es
62,5 Aquí vamos colocando esas
multiplicaciones para esta casilla Pues
multiplicamos esta x por esta F para
esta casilla multiplicamos esta x por
esta F y si llenamos toda esa casilla
entonces aquí ya hice todas las
operaciones por ejemplo 22,5 * 12 eso da
270 por ejemplo aquí 32,5 * 11 da
357,5 y así se hace en las demás
casillas luego sumamos todas estas
casillas 62,5 +
157,5 + 270 y más todas estas casillas
esa suma da
1560 ahora sí ya vamos vamos a
reemplazar aquí y vamos a encontrar el
promedio entonces aquí reemplazamos el
promedio es igual a la suma de esa
casilla x * F que es
1560 dividido en el número de datos
acordémonos que el número de datos es la
suma de todas las frecuencias o sea el
número de datos es 60 hacemos esa
división 1660 di 60 y eso me da
26 voy escribiendo el resumen por acá
Entonces el promedio nos dio 26 Qué
quiere decir que el promedio de las
edades de esas 60 personas es 26 años
ahora seguimos mirando qué más hacer
para la varianza Por qué hicimos el
promedio porque lo necesitamos para la
varianza como les decía aquí dice la
suma de los X - X media cuadrado por f o
sea que tenemos que hacer una casilla
que diga esto x - x Med cu * F por eso
la hice aquí mírenla x - x Med cu * F
este valor sí lo que voy a reemplazar
esto es por la suma de lo que me dé aquí
pero eso lo podríamos hacer de una vez
pero yo prefiero hacerlo por partes como
para no confundirnos primero voy a hacer
la suma primero voy a hacer esta
partecita X Men el promedio al cuadrado
aquí y luego ese resultado lo voy a
multiplicar por la frecuencia entonces
empezamos vamos a hacer esta primera
casilla qué Qué operación se hace para
esa casilla lo que dice aquí X Men el
promedio al cuadrado o sea para esta
casilla lo que tenemos que hacer es
colocar la x que en este caso es 12,5
voy a hacer el paréntesis 12,5 a esa x
le restamos el promedio que es 26 y lo
elevamos al cuadrado esto lo podemos
hacer en la calculadora 12,5 - 26 y
luego elevarlo al cuadrado y eso nos da
182 com 25 pilas que al hacer la
operación en la calculadora si ustedes
en la calculadora escriben sin el
paréntesis 12,5 - 26 cu les va a dar un
resultado erróneo ustedes tienen que
digámoslo así explicarle a la
calculadora que el cuadrado va para toda
la resta entonces hay dos formas o
colocamos el paréntesis o hacemos esta
operación de la resta escribimos igual y
luego elevamos al cuadrado entonces
Entonces esta operación me dio
182,25 coloco el valor
acá para esta casilla Qué tengo que
hacer lo mismo la x pero ya va a ser la
x de esta casilla que es
17,5 menos el promedio que para todas
Obviamente el promedio es 26 Y eso lo
elevamos al cuadrado esta operación me
da
72,25 Entonces ese valor es el que
coloco acá 7
2,25 Y así hacemos con las demás
casillas en este caso no hay necesidad
de hacer la suma de esta casilla porque
no dice o sea si tuviéramos que hacer
esta suma si la fórmula
fuera así nada más la suma de los X - X
Med cu ahí sí haríamos la suma pero como
nos dice completo Entonces tenemos que
hacer la suma de esta casilla Entonces
ahora sí como les decía vamos a llenar
la casilla que nos interesa entonces
aquí qué tenemos que hacer vamos aer la
operación de los X - X Med cu que es
este valor y ese lo vamos a multiplicar
por la frecuencia o sea este valor que
es x - X5 cu lo multiplico por la
frecuencia entonces
182,25 * 5 que eso da
91125 para la siguiente casilla
multiplicamos x - x med2 cu por la
frecuencia o sea 9 * 72 25 Y así hacemos
con las demás casillas aquí ya tengo
todos los resultados por ejemplo esta
casilla de qué daba de multiplicar 12,25
por la frecuencia por 12 esta daba de
multiplicar
42,25 por la frecuencia en este caso sí
tengo que hacer la suma o sea sumo
91125 +
650,555 + 147 y más estos otros tres
valores y esta suma me dio
326 5 Ahora sí podemos empezar a hallar
la varianza ya de aquí para adelante va
a ser muy sencillo porque ya tenemos
toda nuestra tabla completa entonces
escribo aquí la varianza que el símbolo
es Sigma al cuadrado es igual a la suma
de la casilla x - x Med cu por F que es
esto Esta o sea todo esto se reemplaza
por
3200
65 dividido en el número de datos Cuál
es el número de datos acord que es la
suma de las frecuencias o sea 60 esta
operación la hacemos en la calculadora y
nos da que la varianza es igual a
5441 años al cuadrado pilas que esta la
varianza siempre da en unidades al
cuadrado Cómo sabemos Cuál es la unidad
dependiendo de lo que nos están
preguntando en este caso lo que nos
están preguntando es la edad y esto es
de 10 a 15 años o de 15 a 20 años por
eso aquí es en años al cuadrado algo que
les quiero aclarar como les decía al
comienzo esta fórmula es para cuando nos
dicen ay la varianza para un grupo de
datos tomado como una población Qué
sucede si nos dicen hle la varianza para
un grupo de datos tómelos como si fuera
una muestra el único cambio Es que va a
ser todo igual vamos a llenar toda la
tabla igual el único cambio Es que si
nos dicen hágalo como una muestra la
fórmula no es n sino n - 1 o sea en
lugar de dividir por el número de datos
tenemos que dividir por el número de
datos -1 o sea en este caso si nos
dijeran con una muestra no dividirían
por 60 sino por 59 es el único cambio el
resto sería todo igual y bueno que
cuando es con una muestra Pues el
símbolo ya no es Sigma al cuadrado sino
s cuadrado más tardecito vamos a
practicar con eso ya encontramos la
varianza ahora vamos a encontrar
la desviación estándar la desviación
estándar ya es mucho más sencillo Porque
no es sino simplemente sacarle la raíz
cuadrada a la varianza O sea la
desviación estándar que el símbolo es
Sigma sin el cuadrado es igual a la raíz
cuadrada de la varianza entonces
colocamos la raíz cuadrada de esto 54
com 41 si quieren ustedes pueden
escribir años al cuadrado si no no hay
problema Entonces sacamos esta raíz y
nos da que la desviación estándar es 7
coma
37 aquí
como la varianza al hacer esta operación
me daba
5,416 Pues voy a agregarle otra cifra
decimal como para qué como para que nos
dé más exacto acordémonos que entre más
cifras decimales utilicemos más exacto
es el valor si ustedes quieren pueden
colocar 41 no hay problema igual les va
a dar un valor también muy acercado a la
realidad Entonces ya voy a colocar aquí
mi asumen que es la varianza es
54,41 y la desviación estándar
7,37 años ya hallamos la el promedio la
varianza la desviación estándar por
último vamos a hallar el coeficiente de
variación que se encuentra simplemente
haciendo esta operación el coeficiente
de variación es igual a la desviación
estándar dividido en el promedio esto es
esto sería nada más si uno lo quiere
escribir ese resultado o sea ese
coeficiente de variación en forma de
porcentaje que es como más fácil de
entender simplemente lo único que debe
hacer es a esa operación le multiplica
por 100 yo lo voy a hallar en forma de
porcentaje entonces de una vez reemplazo
el coeficiente de variación es igual a
la desviación estándar pilas que es la
desviación estándar No no es la varianza
es la desviación estándar o sea
7,37 dividido en el promedio el promedio
que nos había dado 2 6 y como yo lo
quiero hallar En porcentaje multiplico
por 100 hacemos esta operación 7,37 Divo
en 26 por 100 primero hacemos esta
operación y luego multiplicamos por 100
no y nos da que el coeficiente de
variación es igual al
28 por. esto Para qué nos sirve para
saber qué tanto varían los datos o más
bien para saber si los datos son
homogéneos o heterogéneos en este caso o
Generalmente se dice que si este valor
Es mayor que el
25% es porque esos datos son
heterogéneos o sea están muy dispersos
digámoslo así y si nos da menos del 25%
es porque esos datos serían homogéneos
Entonces en este caso es Las edades son
de un grupo de personas muy heterogéneo
como siempre por último les voy a dejar
un ejercicio para que ustedes practiquen
ya saben que ustedes pueden pausar el
video ustedes van a trabajar con esta
tabla que corresponde al peso de 15
personas les aclaro lo siguiente ustedes
nunca van a encontrar una tabla como
estas porque Generalmente no se hac tres
intervalos se hacen cinco seis o siete
lo que pasa es que yo quiero simplemente
que practiquen una cosita con esta tabla
pues van a ser poquitos Los datos que
ustedes van a llenar pero también van a
practicar Cómo se llena la tabla que eso
es lo importante Bueno entonces ustedes
van a hallar Obviamente el promedio la
varianza pero en este caso ustedes van a
hallar la varianza como les decía el
símbolo es s al cuadrado cuando los
datos son una muestra Entonces como van
a trabajar con una muestra la fórmula
como les decía es la misma solamente que
con n - 1 van a encontrar la varianza la
desviación estándar y el coeficiente de
variación y la respuesta va a aparecer
en 3 2 1 recuerden Cómo se llena la
tabla la primera casilla Bueno aquí
sería el promedio de estas dos 40 + 50
90 di en 2 45 Así se hace con todas aquí
se multiplica la x por la f por ejemplo
45 * 3 135 aquí se coge la x se le resta
el promedio y se lea al cuadrado o sea
en esta casilla sería por ejemplo 45
menos el promedio Y eso elevado al
cuadrado qua esto luego la última sería
esto que es x - X5 cu lo multiplicamos
por la frecuencia o sea por 3 y da
261 aquí el promedio es la suma de los X
* f o sea 8 25 dividido en el número de
datos que es la suma de las frecuencias
y me da
54,33 la varianza es la suma de las x *
F perdón de las x menos el promedio al
cuadrado por F que es
493,5 les aclaro una cosita yo cogí
solamente dos cifras decimales o sea dos
cifras después de la coma si ustedes
cogieron más cifras o menos cifras Lo
único es que les va a dar un poquitico
cambiados estos resultados pero por
ejemplo aquí debía haber dado
227,5 por ejemplo o com 69 y algo más
bueno aquí esa suma dividida en lo único
que cambia es esto no el número de datos
-1 o sea eran 15 datos como esto es una
muestra le restamos uno o sea 14 y ese
resultado nos da esa división nos da
35,23 kog al cuadrado por último la
desviación estándar que le sacamos la
raíz cuadrada a esto y da 5,9 y el
coeficiente de variación que es la
desviación estándar
5,93 dividido en el promedio Y eso lo
multiplicamos por 100 y en este caso me
dio 10,9 por. Qué quiere decir que en
este caso esos datos erá homogéneos
Bueno amigos Espero que les haya gustado
la clase Recuerden que pueden ver el
curso completo de medidas de dispersión
disponible en mi canal O en el link que
está en la descripción del video o en la
tarjeta que les dejo aquí en la parte
superior Los invito a que se suscriban
con Comenten compartan y le den like al
video y no siendo más bye bye
Weitere ähnliche Videos ansehen
Rango, varianza, desviación estándar, coeficiente de variación, desviación media: datos no agrupados
Varianza y desviación estándar | Introducción
Desviación Estándar para Datos Agrupados
Varianza, desviación estándar y coeficiente de variación en Excel
Qué es la Desviación Estándar - Típica
Variabilidad
5.0 / 5 (0 votes)