Desviación Estándar para Datos Agrupados

Profesor Sergio Llanos
26 Jul 201813:38

Summary

TLDREl script de este video ofrece una explicación detallada sobre la desviación estándar, una medida de dispersión en estadística que indica si los datos de una muestra están agrupados en torno a la media o están dispersos. Mediante un ejemplo práctico de lápices fabricados en una empresa, se muestra cómo calcular la desviación estándar a partir de los datos de longitud de los lápices. Seguidamente, se construye una tabla con las marcas de clase, las frecuencias absolutas y los cuadrados de las diferencias entre cada marca de clase y la media. Al aplicar la fórmula adecuada y realizar los cálculos, se obtiene una desviación estándar de 13.37 milímetros, lo que sugiere que la mayoría de los lápices miden alrededor de 192 milímetros, con una variación de hasta 13.37 milímetros en ambos lados de la media. Este análisis estadístico es crucial para entender la variabilidad en una muestra y predecir el rango en el que se agruparán los datos.

Takeaways

  • 📊 La desviación estándar es una medida de dispersión en estadística que indica si los datos se agrupan en torno a la media o están dispersos.
  • 📈 Un bajo valor de desviación estándar sugiere que los datos están cerca de la media, mientras que un alto valor indica una alta dispersión de los datos.
  • 🔢 La fórmula para calcular la desviación estándar para una muestra de datos es la raíz cuadrada de la varianza (suma de las diferencias al cuadrado entre cada dato y la media, dividida por el número de datos menos uno).
  • 📚 Se utiliza una tabla de frecuencias para organizar los datos en intervalos y calcular la desviación estándar, donde se incluyen marcas de clase, límites inferiores y superiores, y frecuencias absolutas.
  • 📉 Para cada intervalo, se calcula la diferencia entre la marca de clase y la media, se eleva al cuadrado y se multiplica por la frecuencia absoluta para contribuir a la varianza.
  • 🧮 Los cálculos se realizan para cada clase o intervalo de datos, y luego se suman para obtener la varianza, que es la base para la desviación estándar.
  • 📏 Se utiliza el promedio (x̄) de los datos para comparar con cada punto de datos individual dentro de la muestra para calcular las diferencias.
  • 📋 Se construye una tabla adicional que incluye las diferencias entre cada punto de datos y la media, sus cuadrados y el producto de estas diferencias y las frecuencias absolutas.
  • 🔧 La desviación estándar se obtiene al dividir la suma de los cuadrados de las diferencias por el número de datos menos uno, y luego se toma la raíz cuadrada del resultado.
  • 📊 El resultado de la desviación estándar indica el grado de dispersión de los datos en relación con la media.
  • 📈 Un ejemplo práctico se proporciona con una muestra de lápices, donde se calcula la desviación estándar de su longitud, lo que muestra cómo están agrupados los lápices en torno a la media.

Q & A

  • ¿Qué es la desviación estándar en estadística?

    -La desviación estándar es una medida de dispersión que indica si los datos de una muestra o población se agrupan en torno a la media o se encuentran dispersos.

  • ¿Cómo se calcula la desviación estándar para una serie de datos agrupados en intervalos?

    -Se calcula como la raíz cuadrada de la sumatoria de las frecuencias absolutas multiplicadas por el cuadrado de la diferencia entre la marca de clase y la media, dividido por el número de datos menos uno.

  • ¿Por qué es importante conocer la desviación estándar de un conjunto de datos?

    -Es importante porque permite entender qué tan agrupados o dispersos están los datos en relación a la media, lo que a su vez puede indicar la consistencia o variabilidad内在的 un proceso o fenómeno.

  • ¿Cómo se interpreta un valor bajo de desviación estándar?

    -Un valor bajo de desviación estándar indica que la mayoría de los datos están cercanos a la media, lo que sugiere poca dispersión y mayor consistencia en los datos.

  • ¿Qué implica un valor alto de desviación estándar?

    -Un valor alto de desviación estándar sugiere que los datos están más dispersos y se alejan más de la media, lo que puede indicar una mayor variabilidad.

  • ¿Cómo se relaciona la desviación estándar con la media de un conjunto de datos?

    -La desviación estándar se relaciona con la media porque se calcula a partir de la diferencia de cada dato con respecto a la media, lo que permite medir la dispersión de los datos en torno a este valor central.

  • ¿Cómo se puede utilizar la desviación estándar para establecer un intervalo de confianza?

    -Se puede utilizar la desviación estándar para establecer un intervalo de confianza alrededor de la media, donde se esperaría que la mayoría de los datos se encuentren con un cierto nivel de probabilidad.

  • ¿Por qué se utiliza la raíz cuadrada en la fórmula de la desviación estándar?

    -La raíz cuadrada se utiliza para devolver los valores a su escala original después de haberlos elevado al cuadrado, lo que permite obtener una medida de dispersión en las mismas unidades que los datos.

  • ¿Cuál es el ejemplo que se utiliza en el script para ilustrar la desviación estándar?

    -El ejemplo utilizado es de una muestra de 48 lápices, donde se calcula la desviación estándar a partir de la longitud de los lápices, obteniendo una media de 192 milímetros y una desviación estándar de 13.37 milímetros.

  • ¿Cómo se interpreta el resultado de la desviación estándar del ejemplo de lápices?

    -El resultado de 13.37 milímetros indica que los lápices miden en promedio 192 milímetros y varían en un rango de aproximadamente 177.63 a 204.37 milímetros, mostrando una cierta consistencia en la fabricación.

  • ¿Cómo se pueden representar gráficamente los datos y la desviación estándar?

    -Los datos y la desviación estándar se pueden representar gráficamente mediante histogramas, gráficos de polígono de frecuencias, diagramas de pastel y gráficos de puntos, lo que ayuda a visualizar la distribución y dispersión de los datos.

Outlines

00:00

📊 Introducción a la desviación estándar

El primer párrafo introduce la desviación estándar como una medida de dispersión en estadística. Se explica que esta métrica permite determinar si los datos de una muestra o población se agrupan en torno a la media o si están dispersos. La fórmula para calcular la desviación estándar de una serie de datos agrupados en intervalos se presenta, y se menciona un ejemplo de cómo se calcularía utilizando una muestra de lápices de una fábrica. Además, se habla de cómo la desviación estándar puede indicar si los datos están agrupados o dispersos en relación con la media.

05:02

📐 Cálculo de la desviación estándar con datos agrupados

Este párrafo describe el proceso para calcular la desviación estándar a partir de datos agrupados en intervalos. Se detalla cómo se llenan las columnas de una tabla con la marca de clase, la diferencia entre la marca de clase y la media, el cuadrado de esa diferencia y el producto de la frecuencia absoluta y el cuadrado de la diferencia. Se calculan los cuadrados de las diferencias y se multiplican por las frecuencias absolutas para obtener una suma que se utiliza en la fórmula de la desviación estándar. Finalmente, se calcula la desviación estándar como la raíz cuadrada de la suma obtenida, lo que resulta en un valor de 13.37 milímetros para los lápices de la muestra.

10:04

📈 Interpretación de la desviación estándar y diagrama de puntos

El tercer párrafo se enfoca en la interpretación de la desviación estándar y cómo se puede utilizar para entender la dispersión de los datos en relación con la media. Se presenta un diagrama de puntos que muestra la distribución de los lápices según su longitud y cómo se alinean con la media. Se calcula el rango en el que se agrupan los datos, tomando en cuenta la desviación estándar, y se establece un intervalo de confianza para las medidas de los lápices. El autor concluye con un mensaje de agradecimiento y un recordatorio sobre la importancia de la desviación estándar para entender la dispersión de los datos.

Mindmap

Keywords

💡Desviación estándar

La desviación estándar es una medida de dispersión en estadística que indica la variabilidad de una muestra de datos en torno a la media. En el video, se utiliza para determinar si los lápices fabricados por una compañía tienden a agruparse cerca de la longitud media o si están dispersos en un rango más amplio. Se calcula como la raíz cuadrada de la varianza y es un indicador de la concentración de los datos alrededor de la media.

💡Muestra

Una muestra es un subconjunto de elementos tomados de una población más grande para representarla en un estudio estadístico. En el contexto del video, la muestra se refiere a los 48 lápices que el operario ha seleccionado para analizar la longitud de los lápices fabricados por la compañía.

💡Promedio

El promedio, también conocido como la media, es el valor central de una distribución de datos y se calcula sumando todos los valores de la muestra y luego dividiendo por el número de elementos en la muestra. En el video, el promedio de la longitud de los lápices es de 192 milímetros, que sirve como referencia para calcular la desviación estándar.

💡Varianza

La varianza es una medida de cuánto se dispersan los valores en una muestra o población. Se calcula como la suma de las diferencias al cuadrado entre cada valor y la media, dividida por el número de observaciones. En el video, la varianza se utiliza para posteriormente calcular la desviación estándar, que es la raíz cuadrada de la varianza.

💡Frecuencias

Las frecuencias son los recuentos de cada evento o característica en una muestra. En el video, las frecuencias son utilizadas para construir una tabla de frecuencias y se relacionan con las marcas de clase y los intervalos para analizar la distribución de las longitudes de los lápices.

💡Marcas de clase

Las marcas de clase son los límites de los intervalos en una tabla de frecuencias. Estas marcas se utilizan para agrupar los datos en rangos específicos y son fundamentales para construir un histograma o diagrama de frecuencias. En el video, las marcas de clase se relacionan con los diferentes tamaños de lápices producidos.

💡Diagrama de puntos

Un diagrama de puntos, también conocido como gráfico de dispersión, es una representación gráfica que utiliza puntos para mostrar la relación entre dos conjuntos de datos. En el video, se utiliza para visualizar cómo los lápices se distribuyen en torno a la longitud media, mostrando la concentración de lápices en ciertas longitudes.

💡Intervalo de confianza

Un intervalo de confianza es un rango de valores que proporciona una estimación de la precisión de un valor desconocido. En estadística, se utiliza para indicar el nivel de incertidumbre asociado a una estimación. En el video, el intervalo de confianza se deduce de la desviación estándar y se utiliza para inferir que los lápices se agrupan en torno a la media dentro de un rango específico.

💡Histograma

Un histograma es una representación gráfica que muestra la distribución de una variable de forma que los datos se agrupan en intervalos o clases y la frecuencia de cada clase se representa mediante la altura de un rectángulo. En el video, el histograma se menciona como una herramienta para visualizar la distribución de las longitudes de los lápices.

💡Diagrama de torta

Un diagrama de torta, también conocido como gráfico circular, es una representación gráfica que divide una circunferencia en sectores para ilustrar la relación de partes a un todo. Aunque no se utiliza directamente en el cálculo de la desviación estándar, en el video se menciona como una forma de visualizar la proporción de lápices en cada clase o intervalo de longitud.

💡Promedio aritmético

El promedio aritmético, o simplemente el promedio, es una medida de tendencia central que se calcula sumando todos los valores en una muestra y luego dividiendo por el número de valores. Es fundamental para el cálculo de la desviación estándar, como se muestra en el video, donde se utiliza el promedio de las longitudes de los lápices para determinar cuán dispersos están los datos en torno a este valor central.

Highlights

La desviación estándar es una medida de dispersión en estadística que indica si los datos se agrupan en torno a la media o están dispersos.

Un bajo grado de dispersión indica que los datos están cerca de la media, mientras que una alta dispersión indica que los datos están más dispersos.

Se utiliza la fórmula de la desviación estándar para una serie de datos agrupados en intervalos para determinar esta medida.

La desviación estándar se representa con la letra 's' y se calcula como la raíz cuadrada de la varianza.

La varianza es la suma de las diferencias al cuadrado entre cada valor de datos y el promedio, dividida por el número de datos.

Se utiliza un ejemplo de lápices fabricados en una fábrica para ilustrar el cálculo de la desviación estándar.

Se describe cómo se determinó el promedio de la longitud de los lápices, que fue de 192 milímetros.

Se construyó una tabla de frecuencias para organizar los datos y facilitar el cálculo de la desviación estándar.

Se calculó la desviación estándar a partir de los intervalos, marcas de clase y frecuencias absolutas de los lápices.

Se creó una nueva tabla con tres columnas adicionales para el cálculo de la desviación estándar.

La primera columna de la nueva tabla muestra la diferencia entre la marca de clase y el promedio.

La segunda columna contiene los cuadrados de las diferencias de la primera columna.

La tercera columna muestra la multiplicación de la frecuencia absoluta por los cuadrados de la segunda columna.

El resultado de la suma de todos los valores de la tercera columna se utiliza para calcular la desviación estándar.

Se encontró que la desviación estándar de los lápices es de 13.37 milímetros.

La desviación estándar indica que los datos están agrupados a una distancia de 13.37 milímetros alrededor de la media.

Se utiliza un diagrama de puntos para visualizar cómo los datos de los lápices se distribuyen en torno a la media.

La desviación estándar se puede utilizar para establecer un intervalo de confianza para la medida de los lápices.

Transcripts

play00:00

o la desviación estándar la desviación

play00:03

estándar o desviación típica es una

play00:07

medida de dispersión en estadística qué

play00:11

significa eso que si yo tengo una serie

play00:14

de datos una muestra que he tomado de

play00:17

alguna población o tengo la población

play00:19

entera voy a determinar si esos datos se

play00:25

agrupan en torno a la media o al

play00:29

promedio o se alejan mucho o están muy

play00:32

dispersos si tengo la media

play00:39

todos los datos están muy cerca de ese

play00:41

de ese número entonces tengo una

play00:44

dispersión baja y si los datos están muy

play00:50

regados en toda la muestra entonces

play00:52

tengo una dispersión alta

play00:55

la fórmula para determinar la desviación

play00:59

estándar para una serie de datos que

play01:04

hemos agrupado en intervalos

play01:07

esta que te presento aquí donde vamos a

play01:11

representar la desviación estándar con

play01:14

la letra s

play01:16

y es igual a la raíz cuadrada de la

play01:20

sumatoria desde y igual a 1 hasta acá de

play01:26

los f sub y por x sub y menos x tras

play01:32

todo x con barrita que significa media o

play01:34

promedio y eso elevado al cuadrado

play01:38

/ / n 1 donde en es el número de datos

play01:43

que estamos trabajando en la muestra lo

play01:46

vamos a hacer con un ejemplo que venimos

play01:48

trabajando en vídeos anteriores de una

play01:52

serie de lápices que hemos sacado de

play01:55

muestra en una fábrica donde hemos

play01:58

formado su longitud su dimensión

play02:02

entonces la desviación estándar si tengo

play02:05

esta distribución entonces en esta línea

play02:10

azul me representa esta línea azul me

play02:13

representa la media x media o promedio y

play02:17

la zona que he puesto de color amarillo

play02:22

entonces me representa la zona en la que

play02:26

están agrupados los datos y están muy

play02:28

dispersos o si están muy agrupados esa s

play02:33

que aparece aquí abajo entonces me va a

play02:35

decir qué tan alejados están todos los

play02:37

datos del promedio o si están agrupados

play02:42

alrededor de él

play02:44

esa es la el sentido de la desviación

play02:46

estándar que vamos a calcular

play02:49

en el día de hoy

play02:51

voy a tomar como ejemplo

play02:54

que he trabajado durante estos vídeos

play02:56

que tengo un operario de una máquina en

play02:59

una empresa que fabrica lápices y ha

play03:01

sacado una muestra de 48 lápices

play03:06

y

play03:08

estos son los datos son los 48 datos

play03:11

donde en vídeos anteriores ya expliqué

play03:15

todos estos datos a que toda esta tabla

play03:17

de frecuencias determine que habían

play03:20

siete clases siete intervalos

play03:24

que estar aquí en donde tengo

play03:27

el límite inferior al límite superior la

play03:30

marca de clase la frecuencia absoluta la

play03:33

frecuencia absoluta acumulada determine

play03:37

también las frecuencias relativas y

play03:40

absolutas y acumuladas y porcentuales

play03:42

que puedes observar en este vídeo aquí

play03:46

poco el enlace donde aparece cómo

play03:50

construir el vídeo donde construir esta

play03:54

tabla de secuencias también están los

play03:57

gráficos tengo aquí en el gráfico de

play04:01

polígono de frecuencias tengo el

play04:03

histograma de frecuencias tengo el

play04:06

diagrama pastel o torta y la activa que

play04:08

también explique el otro vídeo que aquí

play04:10

habitan aquí el fin nos aparece creó el

play04:14

enlace bien y en este el programa

play04:18

presentó la media que sacamos también

play04:21

explique cómo sacar el promedio aquí

play04:23

dejo el enlace que nos dio de 191.000

play04:26

que esa muestra de 40 de estos lápices

play04:29

longitud desde un promedio de 192 metros

play04:33

bien aquí entonces tengo la fórmula que

play04:36

les dije ahora para terminar las días en

play04:38

estándar pero la raíz cuadrada de la

play04:40

varianza y tengo el promedio de 192

play04:44

milímetros y saqué parte de esa tabla de

play04:47

frecuencias la parte que necesito donde

play04:49

tengo mis intervalos y tengo la marca de

play04:52

clase y tengo las frecuencias absolutas

play04:57

que es lo que me va a hacer bien para

play04:59

poder determinar por qué porque mirarte

play05:01

es una fórmula aparece la frecuencia

play05:04

absoluta aparece la marca de clase x sub

play05:08

y y aparece x media o el promedio esos

play05:12

son los datos que necesitamos por lo

play05:14

tanto vamos a construir una nueva tabla

play05:16

y en esta nueva tabla aparecen tres

play05:19

columnas adicionales y vamos a ver cómo

play05:22

rellenamos esas columnas para poder

play05:24

determinar la medida de la desviación

play05:26

estándar la primera columna va a

play05:30

contener este dato de x su marca

play05:35

- el promedio entonces voy a tener x y

play05:39

menos x media en la siguiente columna

play05:43

voy a llevar al cuadrado x sub y menos x

play05:47

media porque lo necesito para la fórmula

play05:49

y luego voy a multiplicar la frecuencia

play05:54

absoluta en facebook y por el cuadrado

play05:57

que acabo de determinar

play05:59

ahora

play06:01

qué es ese x sub y que tengo aquí en

play06:04

esta columna pues es simplemente las

play06:07

marcas de clase

play06:09

y x con la barrita arriba que es el

play06:13

promedio x media la tengo

play06:16

efectivamente acá en ese dato

play06:20

como sería entonces esa primera casilla

play06:22

esa primera casilla entonces es la marca

play06:25

de clase correspondiente a la clase 1 a

play06:28

la clase de color azul que tengo allí y

play06:30

esa marca de clase sergio de 166

play06:36

y ese 166 le voy a restar el promedio la

play06:41

media de 191 entonces sería 166 191 y

play06:46

166 mil 291 veda menos 25

play06:50

la siguiente sería entonces la

play06:53

diferencia la resta en la clase 2 en la

play06:56

clase de color rojo sería la diferencia

play06:58

entre 174 y 191 974 291 edad menos 17

play07:07

de igual forma cálculo la clase 3 que me

play07:10

da menos 9 182 9 192 y el resto de de

play07:14

columna de casillas mira que tengo 190

play07:19

mil 291 que tendría menos 17 15 y 23

play07:23

años de minero rellenado

play07:25

ahora la siguiente columna recuerda que

play07:28

la siguiente columna son los cuadrados

play07:30

de la columna anterior entonces este

play07:33

primer dato es el cuadrado de menos 25

play07:36

en 1.095 al cuadrado

play07:39

- 25 al cuadrado 625 positivos porque

play07:43

menos por menos da más 25 por 25 625

play07:46

menos 17 4 289 de 2009 al cuadrado 81 y

play07:52

termino de rellenar menos suma al

play07:54

cuadrado a 1 y así sucesivamente 41 225

play07:57

que es el cuadrado de 15 y 529 que es el

play08:01

cuadrado de 23 ahora la siguiente

play08:04

columna

play08:06

la siguiente columna simplemente es

play08:08

multiplicar la frecuencia absoluta por

play08:12

la columna anterior que son los

play08:13

cuadrados entonces este primer dato es

play08:16

en 1875 es el producto de 3 por 625 que

play08:23

da 1875

play08:25

6

play08:27

es la frecuencia absoluta por 289 que es

play08:30

el cuadrado de la diferencia entre la

play08:32

marca de clase y el promedio de 1734 729

play08:38

es el producto de nueves por 81 8 por 1

play08:41

a 8 y término debe llenar la tabla 568

play08:44

1.350 bien

play08:47

ahora

play08:49

voy a determinar la sumatoria la suma de

play08:54

todos los ere psuv y por los cuadrados

play08:57

de esa diferencia y esa suma es sumar

play09:00

mil 875 mil 734 729 más 8 más 538 plata

play09:07

y me da 8 mil 418 mil 400 es esta suma

play09:14

ahora

play09:16

cambio le pongo la tabla encima

play09:19

y como la fórmula para la desviación

play09:22

estándar

play09:24

y

play09:26

esta suma entonces me dio 8 mil 400

play09:31

ahora

play09:32

este n es el número de datos que los

play09:36

tengo acá que es el total de datos que

play09:38

está en la tabla y sn son 48 reemplazo

play09:41

48 48 menos 1 ago la revista que me da

play09:45

47 y ahora voy a hacer la división de

play09:48

8.400 entre 47 que me da 178 puntos 72

play09:53

salvo la raíz cuadrada de 178 puntos 72

play09:57

y me da que la desviación estándar son

play09:59

13 puntos 37 milímetros

play10:03

es decir que los datos están agrupados

play10:07

alrededor de la media de 192 milímetros

play10:13

13.37 milímetros hacia atrás y 13 puntos

play10:17

37 milímetros adelante ahora

play10:20

que tengo acá tengo el diagrama de

play10:23

puntos que ya explique también en otro

play10:26

vídeo aquí desde gráficos

play10:29

donde digamos este punto rojo el punto 8

play10:34

es el punto 8 va a haber ese punto

play10:39

significa que de acuerdo con la tabla

play10:43

tengo la marca clase 190 milímetros es

play10:46

decir tengo 8 lápices de 190 milímetros

play10:54

este 6 tengo 6 lápices que están

play10:58

alrededor de 206 milímetros de acuerdo

play11:01

con la tabla en la clase 6

play11:03

entonces ese diagrama de puntos que lo

play11:07

tengo aquí ahora que voy a hacer

play11:09

simplemente si yo tengo tres puntos en

play11:15

tres la hice es con medidas alrededor de

play11:18

166 milímetros pues tengo estos tres

play11:21

tengo seis lápices alrededor de 170 y 49

play11:26

lápices alrededor de 182 así

play11:29

sucesivamente tengo todos los típicos y

play11:31

tengo la media

play11:32

el promedio son 192 milímetros entonces

play11:35

voy a determinar qué tan alejados o qué

play11:38

tan agrupados en torno a la media están

play11:40

todos los 48 datos

play11:44

y nos dio que la desviación estándar fue

play11:48

de 13.37 milímetros significa que a

play11:52

partir de la media le voy a restar 13 37

play11:55

y le voy a sumar 3 en 37

play11:58

entonces 191 13 37 y 191

play12:02

37 porque la media

play12:05

y me va a dar que los datos están

play12:08

agrupados en 377 puntos 63 ministros y

play12:12

204 puntos 37 milímetros aproximadamente

play12:15

es decir de menos 13 37 de 177 63 204 37

play12:24

está en esa región que he pintado de

play12:27

amarillo están agrupados alrededor de

play12:30

entonces en una distribución de esta

play12:34

forma donde los datos están en alrededor

play12:38

de la media nos dice que si la

play12:41

desviación estándar es de 13.37

play12:44

milímetros los datos están en esa región

play12:47

de color amarillo aproximadamente entre

play12:50

177 63 y 204 37 me puedo mover en un

play12:55

intervalo de confianza en que los

play12:57

lápices van a tener medidas

play13:01

y que se van a agrupar alrededor de la

play13:03

media en ese rango

play13:05

esa es entonces la estándar

play13:09

pero entonces que te haya podido servir

play13:12

para entender mejor la desviación

play13:14

estándar desviación típica suscríbete a

play13:17

mi canal profesor sergio ya nos comparte

play13:21

lo entre tus amigos

play13:22

escríbeme tus comentarios y que tengas

play13:25

un gran día

Rate This

5.0 / 5 (0 votes)

Related Tags
Desviación EstándarEstadísticaDispersión DatosMediaPromedioEjemplo LápicesAnálisis DatosFórmula VarianzaHistogramaDiagrama PastelTécnicas Estadísticas
Do you need a summary in English?