Regla de chebyshev y regla empírica

Albert Cubeles
20 Mar 201906:17

Summary

TLDREn este vídeo se explica cómo analizar la dispersión de datos alrededor de la media utilizando las reglas de Tchebychev y la regla empírica. Se menciona que con la regla de Tchebychev, al menos un 75% de los datos se encuentran a dos desviaciones estándar de la media, y al menos el 88% a tres desviaciones. La regla empírica, específica para distribuciones normales, afirma que aproximadamente el 68.3% de los datos se encuentra a una desviación estándar de la media, el 95.5% a dos y el 99.7% a tres. Se ilustra con un ejemplo de una aerolínea que estudia el número de pasajeros por vuelo, obteniendo una media de 130 con una desviación estándar de 15, para calcular porcentajes y valores específicos de pasajeros.

Takeaways

  • 📊 La unidad de vídeo explica cómo analizar la dispersión de datos alrededor de la media.
  • 📐 Se aplican las reglas de Chebyshev y la regla empírica para entender la distribución de datos.
  • 🔢 Conociendo la media y la desviación estándar, se pueden calcular porcentajes de datos en torno a la media.
  • 👉 La regla de Chebyshev indica que al menos un 75% de los datos se encuentran a dos desviaciones estándar de la media y al menos el 89% a tres desviaciones estándar.
  • 📉 La regla empírica, que solo se aplica a distribuciones normales, ofrece porcentajes más precisos: 68.3% a una desviación estándar, 95.5% a dos y 99.7% a tres.
  • 📋 Se puede representar gráficamente la distribución de datos usando estas reglas para obtener una visión más clara.
  • 🚀 Se da un ejemplo práctico: una aerolínea estudia el número de pasajeros por vuelo, obteniendo una media de 130 y una desviación estándar de 15.
  • 🔢 Se pide calcular el porcentaje de vuelos con entre 100 y 160 pasajeros usando las reglas mencionadas.
  • 📈 Al aplicar la regla de Chebyshev, se obtiene que al menos un 75% de los vuelos tienen entre 100 y 160 pasajeros.
  • 📊 Al usar la regla empírica, se encuentra que el 95.5% de los vuelos tienen entre 100 y 160 pasajeros, mostrando la precisión de la distribución normal.

Q & A

  • ¿Qué se analiza en esta unidad de vídeo?

    -Se analiza la dispersión de los datos alrededor de la media y se aplican las reglas de Tchebysheff y la regla empírica para entender esta dispersión.

  • ¿Qué son las reglas de Tchebysheff?

    -Las reglas de Tchebysheff son que para cualquier distribución de datos, a una distancia de dos desviaciones estándar de la media, siempre tendremos al menos un 75% de los valores y a tres veces la desviación estándar, al menos el 88-89% de los datos.

  • ¿Qué es la regla empírica?

    -La regla empírica es una regla que se aplica solo para distribuciones normales y nos dice que a una desviación estándar de la media, tendremos aproximadamente el 68.3% de los datos, a dos desviaciones estándar, el 95.5% y a tres desviaciones estándar, el 99.7%.

  • ¿Cómo se puede usar la regla de Tchebysheff para analizar datos de una aerolínea?

    -Se sustituyen los valores teóricos por los reales, como la media de 130 pasajeros y la desviación estándar de 15. Se calcula que al menos el 75% de los vuelos tendrán entre 100 y 160 pasajeros y al menos el 88% entre 85 y 175 pasajeros.

  • Si se conoce que la distribución de datos sigue una distribución normal, ¿qué se puede calcular con la regla empírica?

    -Con la regla empírica, se puede calcular que entre 100 y 160 pasajeros habrá aproximadamente el 95.5% de los vuelos, y se pueden hacer predicciones más precisas sobre el número de pasajeros por vuelo.

  • ¿Cómo se calcula el porcentaje de vuelos que tienen menos de 115 pasajeros?

    -Se conoce que entre 115 y 145 pasajeros hay aproximadamente el 68.3% de los vuelos. Al dividir este porcentaje entre los dos intervalos que lo limitan, se obtiene que aproximadamente el 15.75% de los vuelos tendrán menos de 115 pasajeros.

  • ¿Cuál es la diferencia entre las reglas de Tchebysheff y la regla empírica cuando se aplica a una distribución normal?

    -La regla de Tchebysheff proporciona porcentajes más generales que se aplican a todas las distribuciones, mientras que la regla empírica da porcentajes más precisos específicamente para distribuciones normales.

  • ¿Cómo se determina si los datos siguen una distribución normal para aplicar la regla empírica?

    -Se debe tener conocimiento previo o evidencia estadística que indique que los datos siguen una distribución normal para aplicar la regla empírica.

  • ¿Cuál es el porcentaje de vuelos que tendrán más de 160 pasajeros si los datos siguen una distribución normal?

    -Si los datos siguen una distribución normal, el 2.25% de los vuelos tendrán más de 160 pasajeros, basándose en la regla empírica.

  • ¿Qué implica que un porcentaje de datos esté por encima o por debajo de una desviación estándar en términos de dispersión de datos?

    -Esto indica cómo se dispersan los datos en relación a la media. Por ejemplo, si el 95.5% de los datos están entre una y dos desviaciones estándar de la media, significa que la mayoría de los datos se encuentran cerca de la media.

Outlines

00:00

📊 Análisis de Dispersión de Datos

En el primer párrafo, se explica cómo analizar la dispersión de datos alrededor de la media utilizando las reglas de Chebyshev y la regla empírica. Se menciona que con la media y la desviación estándar de un conjunto de datos, se pueden determinar porcentajes de valores. Se destaca que la regla de Chebyshev indica que al menos un 75% de los valores se encuentran a dos desviaciones estándar de la media y al menos el 88-89% a tres desviaciones estándar. La regla empírica, que solo se aplica a distribuciones normales, proporciona porcentajes más precisos: el 68.3% a una desviación estándar, el 95.5% a dos y el 99.7% a tres. Se ilustra con un ejemplo de una aerolínea que estudia el número de pasajeros por vuelo, obteniendo una media de 130 pasajeros y una desviación estándar de 15. Se pide calcular el porcentaje de vuelos con entre 100 y 160 pasajeros y, si la distribución es normal, el número de pasajeros por debajo de 115 y por debajo de 160.

05:00

🔢 Aplicación de las Reglas de Dispersión

En el segundo párrafo, se procede a aplicar las reglas mencionadas para responder a las preguntas planteadas en el ejemplo de la aerolínea. Se calcula que al menos el 75% de los vuelos tienen entre 100 y 160 pasajeros, y al menos el 88% tienen entre 85 y 175 pasajeros, según la regla de Chebyshev. La regla empírica, aplicable solo a distribuciones normales, proporciona un porcentaje más preciso: el 95.5% de los vuelos tienen entre 100 y 160 pasajeros. Se calcula también que el 15.75% de los vuelos tienen menos de 115 pasajeros y el 2.25% tienen más de 160 pasajeros. Estas aplicaciones muestran cómo las teorías estadísticas pueden ser utilizadas para obtener información detallada y importante sobre la distribución de datos.

Mindmap

Keywords

💡dispersión de datos

La dispersión de datos se refiere a cómo se distribuyen los valores de un conjunto de datos en torno a una media o promedio. En el vídeo, se utiliza para entender cómo se dispersan los datos alrededor de la media y cómo se pueden analizar estos datos para obtener porcentajes significativos. Por ejemplo, se menciona que al analizar la dispersión de datos de una aerolínea, se pueden obtener conclusiones sobre el número de pasajeros en sus vuelos.

💡reglas de Tchebysheff

Las reglas de Tchebysheff son un conjunto de principios estadísticos que dictaminan que para cualquier distribución de datos, al menos un cierto porcentaje de los datos se encuentra a una distancia de múltiples desviaciones estándar de la media. En el vídeo, estas reglas se aplican para determinar que al menos un 75% de los datos se encuentran a dos desviaciones estándar de la media y al menos el 89% a tres desviaciones estándar.

💡regla empírica

La regla empírica es una herramienta estadística que se aplica específicamente a distribuciones normales para proporcionar una estimación más precisa de la distribución de datos. En el vídeo, se utiliza para calcular que el 68.3% de los datos se encuentra a una desviación estándar de la media, el 95.5% a dos desviaciones y el 99.7% a tres desviaciones.

💡media

La media es el promedio de un conjunto de datos y se utiliza como punto de referencia para analizar la dispersión de los datos. En el vídeo, la media de 130 pasajeros por vuelo es el punto central en torno al cual se analizan los datos de la aerolínea.

💡desviación estándar

La desviación estándar es una medida de dispersión que indica cuánto se alejan los datos promedio de la media. En el vídeo, la desviación estándar de 15 pasajeros por vuelo se utiliza junto con la media para analizar la dispersión de los datos y para aplicar tanto las reglas de Tchebysheff como la regla empírica.

💡distribución normal

La distribución normal, también conocida como curva normal, es un patrón de distribución de datos que se asemeja a una campana y es simbólica en estadísticas. En el vídeo, se menciona que si los datos siguen una distribución normal, se pueden aplicar las reglas empíricas para obtener estimaciones más precisas de la distribución de los datos.

💡porcentajes

Los porcentajes se refieren a las proporciones de los datos en relación con el total y se utilizan en el vídeo para interpretar la dispersión de los datos. Por ejemplo, se calcula que al menos un 75% de los vuelos tienen entre 100 y 160 pasajeros, lo cual se deduce de la aplicación de las reglas estadísticas mencionadas.

💡ejemplo

El vídeo utiliza un ejemplo de una aerolínea para ilustrar cómo se aplican las reglas de Tchebysheff y la regla empírica. Este ejemplo conlleva calcular el porcentaje de vuelos que tienen un número específico de pasajeros, basándose en la media y la desviación estándar obtenidas.

💡análisis de datos

El análisis de datos es el proceso de examinar, limpieza, transformación y建模 de datos con el fin de extraer información útil. En el vídeo, el análisis de datos se lleva a cabo para entender la distribución de los pasajeros en los vuelos de la aerolínea y para responder a preguntas específicas basadas en esta distribución.

💡valores

Los valores en el contexto del vídeo son los datos individuales que componen el conjunto de datos que se está analizando. Estos valores se comparan con la media y la desviación estándar para determinar la dispersión y se utilizan para aplicar las reglas estadísticas mencionadas.

Highlights

Análisis de la dispersión de datos alrededor de la media.

Aplicación de las reglas de Tchebysheff y la regla empírica.

Importancia de conocer la media y la desviación estándar para analizar la distribución de datos.

Las reglas de Tchebysheff y la regla empírica proporcionan porcentajes de datos alrededor de la media.

La regla de Tchebysheff indica que al menos un 75% de los valores están a dos desviaciones estándar de la media.

A tres desviaciones estándar de la media, al menos el 88-89% de los datos se encuentran.

La regla empírica proporciona porcentajes más precisos para distribuciones normales.

En distribuciones normales, a una desviación estándar se encuentran el 68.3% de los datos.

A dos desviaciones estándar, el 95.5% de los datos están en la media.

A tres desviaciones estándar, el 99.7% de los datos están en la media.

La regla de Tchebysheff aplica a todas las distribuciones de datos.

La regla empírica solo se aplica a distribuciones normales.

Ejemplo práctico: Análisis del número de pasajeros en vuelos de una aerolínea.

Media de 130 pasajeros por vuelo y una desviación estándar de 15.

Aplicación de la regla de Tchebysheff para determinar el porcentaje de vuelos con 100 a 160 pasajeros.

Resultado de que al menos el 75% de los vuelos tienen entre 100 y 160 pasajeros.

Aplicación de la regla empírica para una distribución normal.

Entre 100 y 160 pasajeros, se espera que el 95.5% de los datos estén en la media.

Cálculo del porcentaje de vuelos con menos de 115 pasajeros.

Cálculo del porcentaje de vuelos con más de 160 pasajeros.

Transcripts

play00:00

en esta unidad de vídeo vamos a ver cómo

play00:03

se puede analizar la dispersión de los

play00:06

datos alrededor de la media

play00:10

para ello vamos a aplicar los reglas y

play00:12

vamos a explicar estos conceptos que son

play00:14

las reglas de tcheryshev y la regla

play00:16

empírica

play00:19

y dejemos por la teoría cuando ya

play00:22

conocemos la media y la desviación

play00:24

estándar de un conjunto de datos podemos

play00:27

analizar cómo se distribuyen estos

play00:30

valores alrededor de la media y podemos

play00:33

llegar a porcentajes de estos motores y

play00:37

como comentábamos antes tenemos dos

play00:39

formas de hacerlo la regla de ceviche y

play00:42

la regla empírica que nos dicen estas

play00:45

reglas pues si aplicase y empezamos por

play00:47

las de david chef nos dicen que para

play00:50

cualquier distribución de datos a una

play00:52

distancia de dos desviaciones de

play00:55

estándar de la media siempre tendremos

play00:57

al menos un 75% de los valores y a tres

play01:02

veces la desviación estándar alrededor

play01:06

de la media tendremos al menos el 88 89

play01:09

por ciento de los datos esto aplica para

play01:12

todas las distribuciones de edad

play01:15

en concreto si además sabemos que la

play01:19

distribución de datos sigue una

play01:21

distribución normal además pues podemos

play01:24

aplicar la regla notificada la regla

play01:26

empírica afina muchísimo más los

play01:29

porcentajes y tendríamos que a una

play01:32

desviación estándar de la media

play01:34

tendríamos el 68 3 por ciento de los

play01:37

datos a dos desviaciones estándar el 95

play01:41

53 el 99 7 si esto lo reflejamos

play01:46

gráficamente pues veremos que la regla

play01:50

de trichet que como os decía aplica

play01:52

todas las distribuciones de datos

play01:54

tendríamos aquí por ejemplo la media a

play01:57

una distancia de dos desviaciones

play01:59

estándar tendríamos el 75% y tres

play02:03

desviaciones estándar por cada lado de

play02:05

la media tendríamos el 88,9

play02:08

en la regla empírica que sólo sirve para

play02:12

distribuciones normales tendríamos como

play02:15

veis mucho más datos mucho más finos

play02:16

alrededor de una 68,3 alrededor de 290 y

play02:21

5.5 alrededor de 390 y 97

play02:25

para ver cómo podemos aplicar esto pues

play02:28

veremos un eje

play02:29

un ejemplo muy sencillo una aerolínea

play02:32

está estudiando el número de pasajeros

play02:34

de sus vuelos y obtiene una media de 130

play02:37

pasajeros por vuelo con una desviación

play02:39

estándar de 15

play02:41

entonces nos piden saber qué porcentaje

play02:43

de los pueblos está entre 100 y 160

play02:47

pasajeros esto sin tener más datos de la

play02:51

distribución de datos y además nos piden

play02:54

que si estos siguieron la distribución

play02:56

de datos normal tenemos que calcular el

play02:58

mismo valor y además también calcular el

play03:02

número de pasajeros por debajo de 115 y

play03:04

el número de pasajeros por debajo de 160

play03:08

bueno pues llevamos con la primera parte

play03:10

del problema y aplicamos the beaches

play03:13

utilizando el gráfico que teníamos en la

play03:15

teoría lo primero que haríamos es

play03:17

sustituir los símbolos que teníamos que

play03:20

estamos utilizando antes con los valores

play03:22

que nos han dado si sustituimos esto

play03:25

tenemos que la media 130 a dos veces la

play03:28

desviación estándar estaríamos con 100 y

play03:30

a 3 veces 85 vale entonces viendo

play03:33

simplemente este gráfico ya vemos que

play03:35

entre 100 y 170 y 160 tendríamos al

play03:38

menos 75% de los datos y entre 85 y 175

play03:44

tendríamos el 88

play03:46

esto es lo que nos dice la regla de

play03:47

trichet por tanto la respuesta al primer

play03:50

apartado el problema sería que al menos

play03:52

el 75% de los vuelos tienen entre 100 y

play03:56

160 veis de esta manera tan sencilla

play03:58

obtenemos información relativamente

play04:01

detallada y importante de los datos de

play04:05

la distribución de datos que tenemos

play04:07

sigamos de la segunda parte aplicamos la

play04:10

regla empírica sabiendo sólo podemos

play04:12

aplicar la regla empírica

play04:13

si la distribución es normal hacemos lo

play04:16

mismo que antes sostenemos los valores

play04:19

por la media desviación estándar y

play04:21

tendríamos la media 130 la media menos

play04:24

una vez la desviación estándar es 115 la

play04:27

media más una vez la desviación estándar

play04:30

145 y así con resto de valores y ya

play04:33

vemos que entre 100 115 y 145 tenemos

play04:37

nuestro 88 kome 3 y entre 100 y 160 que

play04:40

antes teníamos el 75% ahora como es

play04:43

mucho más precisa al ser la distribución

play04:45

normal tendremos el 95,5 por ciento de

play04:49

los datos con esto ya tendríamos la

play04:52

primera parte de la segunda parte del

play04:55

ejercicio en lo que nos pedía que

play04:57

cuantos vuelos habría entre 100 y 106

play05:00

sería 95.5 lo siguiente que nos pedía

play05:03

era cuántos vuelos hay por debajo de 115

play05:06

pasajeros o sea por debajo de este valor

play05:08

de aquí

play05:09

para ello conocemos un simple cálculo si

play05:12

entre 115 y 145 hay entre 80 y 83 por

play05:17

debajo de 115 y por encima de 145 habrá

play05:22

100 menos del 68,3 como tenemos dos

play05:27

fragmentos dividimos por dos y nos da

play05:29

que el 15 75 por ciento de los vuelos

play05:32

que tienen están por debajo de 115

play05:35

pasajeros lo siguiente que nos

play05:38

preguntaba era por encima de 160

play05:41

realizamos la misma operación

play05:44

entre 100 y 160 tenemos el 95 5 por

play05:49

tanto queremos un trocito aquí tenemos

play05:51

un trocito aquí y un trocito aquí

play05:54

dividimos hacemos 100 - 95.5 divididos

play05:57

por 2 y nos da que el 2 25% de los

play06:01

vuelos que estarán por encima de 160

play06:04

pasajeros

play06:05

bueno pues de esta manera puedes ver con

play06:07

un ejemplo muy sencillo pues la

play06:09

aplicación de la teoría de la regla de

play06:11

chevy chef y la regla empírica

Rate This

5.0 / 5 (0 votes)

Related Tags
Análisis de datosRegla de TchebysheffRegla empíricaDispersión datosMedia y desviación estándarDistribución normalAerolíneaPasajerosEjemplos prácticosTeoría estadística
Do you need a summary in English?