Estimación de medias por intervalos de confianza con Desviación Estándar poblacional conocida

Wilson Montenegro Velandia
30 Sept 202052:37

Summary

TLDREl guion trata sobre la teoría de la estimación en estadística, enfocándose en tres objetivos: identificar métodos clásicos de inferencia, estimar la media y desviación estándar poblacional, y modelar muestras para poblaciones infinitas y finitas. Se discute la importancia de la aleatoriedad y representatividad en la selección de muestras, y se explica cómo utilizar estadísticos como la media y desviación estándar para inferir características de la población. También se menciona el uso de intervalos de confianza para estimar parámetros poblacionales con un nivel de confianza específico.

Takeaways

  • 📊 La inferencia estadística es el proceso de hacer generalizaciones sobre una población a partir de una muestra representativa.
  • 🔍 Se divide en dos áreas principales: estimación y prueba de hipótesis, siendo el método de estimación el enfoque de este script.
  • 📚 El script destaca la importancia de la aleatoriedad en la selección de la muestra para garantizar su representatividad.
  • 🧐 Se menciona que los estadísticos calculados a partir de las muestras, como el promedio y la desviación estándar, son llamados estimadores y pueden ser sesgado o insesgado.
  • 📉 Para estimar el promedio poblacional, se pueden utilizar diferentes medidas como la media, mediana o moda, pero se enfatiza la importancia de su aproximación al parámetro poblacional.
  • 📝 Se describe el concepto de estimadores insesgados, donde el promedio del estimador es igual al parámetro poblacional, también conocido como esperanza matemática.
  • 🔢 El script explica el uso de intervalos de confianza para estimar parámetros poblacionales, como la media, a través de la selección de muestras y cálculo de márgenes de error.
  • ⚖️ Se introduce el teorema del límite central, que establece que el promedio de los promedios de las muestras seguirá una distribución normal con un error estándar de σ/√n.
  • 📐 Se discute cómo calcular el tamaño de la muestra necesaria para lograr un nivel de confianza y margen de error específicos en el estudio.
  • 🌐 Se hace referencia a estudios previos y cómo se pueden utilizar para conocer la desviación estándar poblacional, lo que es fundamental para estimaciones con muestras.
  • 📈 Se ilustra la aplicación de conceptos estadísticos en un ejemplo práctico, como el cálculo del intervalo de confianza para el kilometraje promedio de vehículos en una ciudad.

Q & A

  • ¿Qué es la teoría de la estimación y cómo se relaciona con la inferencia estadística?

    -La teoría de la estimación es una rama de la inferencia estadística que se enfoca en el proceso de hacer generalizaciones o sacar conclusiones sobre una población a partir de una muestra. Se utiliza para estimar parámetros poblacionales como la media o la desviación estándar a partir de datos de una muestra.

  • ¿Cuáles son los dos objetivos principales de la inferencia estadística según el guion?

    -Los dos objetivos principales de la inferencia estadística son la estimación y la prueba de hipótesis. La estimación se refiere a la inferencia del valor de un parámetro poblacional, mientras que la prueba de hipótesis implica la verificación de si una afirmación sobre un parámetro es verdadera o falsa.

  • ¿Qué es un estimador y cómo se define un estimador sesgado?

    -Un estimador es una estadística que se utiliza para estimar el valor de un parámetro desconocido de la población. Un estimador es considerado sesgado si el promedio del estimador no es igual al parámetro que se está estimando.

  • ¿Cómo se define la aleatoriedad en el contexto de la selección de muestras?

    -La aleatoriedad en la selección de muestras se refiere a que los individuos de la muestra deben ser elegidos de manera que cada elemento de la población tenga una oportunidad igual de ser seleccionado, evitando la selección sistemática o sesgada de individuos de ciertos sectores de la población.

  • ¿Qué es el teorema del límite central y cómo se aplica en la estimación de parámetros poblacionales?

    -El teorema del límite central establece que el promedio de los promedios de una serie de muestras aleatorias de una población tiende a tener una distribución normal, independientemente de la forma de la distribución poblacional. Esto se utiliza para calcular intervalos de confianza para el promedio poblacional.

  • ¿Cómo se calcula el tamaño de la muestra para un estudio estadístico?

    -El tamaño de la muestra se calcula considerando el nivel de confianza, el margen de error deseado y la desviación estándar poblacional. La fórmula para el tamaño de la muestra en una distribución normal es n = (Z * σ / E)^2, donde Z es el valor z para el nivel de confianza, σ es la desviación estándar y E es el margen de error.

  • ¿Qué es un intervalo de confianza y cómo se relaciona con el error muestral y el error estándar de la estimación?

    -Un intervalo de confianza es un rango que estima el valor de un parámetro poblacional con un cierto nivel de confianza. El error muestral es el margen de error entre el promedio de la muestra y el parámetro poblacional, mientras que el error estándar de la estimación es la variabilidad de los promedios de las muestras, y es dado por la desviación estándar poblacional dividida por la raíz del tamaño de la muestra.

  • ¿Cómo se determina si un estimador es in sesgado?

    -Un estimador es in sesgado si el promedio del estimador es igual al parámetro poblacional que se está estimando. Esto se verifica a través de la esperanza matemática del estimador, que debe ser igual al parámetro de la población.

  • ¿Por qué es importante que la muestra sea representativa de la población?

    -Es importante que la muestra sea representativa de la población para que las conclusiones y generalizaciones tomadas a partir de la muestra sean válidas y fiables para la población en su conjunto. Una muestra representativa permite que el comportamiento y las características de la muestra sean una aproximación precisa del comportamiento de la población.

  • ¿Cómo se utiliza la desviación estándar conocida para estimar el promedio de la población?

    -La desviación estándar conocida se utiliza en el cálculo del intervalo de confianza para el promedio de la población. Se asume una distribución normal y se utiliza el valor z para el nivel de confianza deseado, multiplicando por la desviación estándar sobre la raíz del tamaño de la muestra, y desplazando esta cantidad del promedio de la muestra para encontrar los límites inferior e inferior del intervalo.

Outlines

00:00

📊 Introducción a la Teoría de la Estimación

El primer párrafo introduce la teoría de la estimación y sus tres objetivos principales: identificar métodos de inferencia estadística clásica, estimar la media y desviación estándar poblacional tanto conocida como desconocida, y la identificación del modelo matemático para el cálculo de muestras en poblaciones infinitas y finitas. Se describe la inferencia estadística como un proceso para tomar decisiones basadas en una muestra representativa de una población, utilizando métodos aleatorios para garantizar que la muestra sea representativa. Además, se menciona la importancia de la inferencia estadística en áreas como educación, psicología y administración.

05:02

🔍 Estimadores y sus Propiedades

El segundo párrafo se enfoca en los estimadores, que son estadísticos calculados a partir de las muestras para hacer inferencias sobre la población. Se discuten las propiedades de los estimadores, especialmente si son sesgados o no sesgados, y cómo un estimador no sesgado tiene un promedio igual al parámetro poblacional. Se ejemplifica con la comparación entre la media, mediana y moda para estimar el parámetro poblacional, y cómo se puede determinar cuál es el más adecuado utilizando el promedio de estos estadísticos y comparando su aproximación al parámetro poblacional.

10:03

📉 Criterios de Selección de Estimadores

El tercer párrafo explora los criterios para elegir entre estimadores, destacando la importancia de la varianza como medida de la dispersión de los datos. Se compara la variabilidad de diferentes estimadores para determinar cuál tiene menor dispersión y, por lo tanto, es más confiable. Se introduce el concepto de intervalo de confianza, que es un rango dentro del cual se espera que se encuentre el parámetro poblacional con un cierto nivel de confianza, y se explica cómo se relaciona con el nivel de significancia (alfa).

15:05

🌐 Aplicación del Teorema del Límite Central

El cuarto párrafo aplica el Teorema del Límite Central para estimar el promedio de la población a partir de una muestra, asumiendo una distribución normal. Se describe cómo se calcula el intervalo de confianza utilizando el valor z correspondiente al nivel de confianza y la desviación estándar de la muestra. Se ilustra cómo se puede ajustar esta fórmula para estimar parámetros poblacionales cuando se conoce la desviación estándar poblacional.

20:06

📈 Estimación de Parámetros con Desviación Estándar Conocida

El quinto párrafo se centra en cómo estimar el promedio de la población cuando se conoce la desviación estándar, utilizando información de estudios previos. Se discute cómo se obtiene la desviación estándar a partir de investigaciones anteriores y se ejemplifica con un estudio científico sobre la infección de COVID-19, mostrando cómo se utiliza para estimar promedios y intervalos de confianza en diferentes países.

25:08

📉 Estimación de la Media y Error de Muestra

El sexto párrafo explica cómo se estima el promedio de la población y cómo se calcula el error de la muestra, que es la diferencia entre el promedio de la muestra y el promedio poblacional. Se ejemplifica con diferentes muestras y se muestra cómo el tamaño de la muestra y la confianza se relacionan con el error de la muestra, destacando que un mayor tamaño de muestra reduce el error.

30:09

🔢 Cálculo del Tamaño de la Muestra

El séptimo párrafo detalla cómo se calcula el tamaño de la muestra necesaria para lograr un margen de error y un nivel de confianza específicos. Se introduce la fórmula para el muestreo aleatorio simple y se muestra cómo se utiliza para determinar el número de individuos que se deben seleccionar de la población para obtener una estimación precisa.

35:11

🚗 Ejemplo de Intervalo de Confianza para Kilometraje de Vehículos

El octavo párrafo presenta un ejemplo práctico de cómo construir un intervalo de confianza para estimar el kilometraje promedio recorrido por los vehículos en Medellín. Se calcula el intervalo de confianza al 99% para el número de kilómetros recorridos por año, utilizando una muestra de 100 propietarios de automóviles.

40:18

🔧 Errores en Estimaciones y Cálculo del Tamaño de la Muestra para Poblaciones Finitas

El noveno y décimo párrafos discuten los errores asociados con las estimaciones, incluyendo el error muestral y el error estándar de la estimación puntual. Se explica cómo estos errores se relacionan con el tamaño de la muestra y cómo se ajusta el tamaño de la muestra para poblaciones finitas, utilizando el ejemplo de los vehículos en Medellín y considerando el tamaño de la población real.

Mindmap

Keywords

💡Inferencia Estadística

Inferencia Estadística es el proceso mediante el cual se hacen generalizaciones acerca de una población a partir de una muestra. Es fundamental para tomar decisiones basadas en datos en diversos campos, como la educación, la psicología y la administración. En el video, se discute cómo, dado el tamaño de una población, se puede tomar una muestra representativa para hacer inferencias sobre la población completa.

💡Estimación

La Estimación es una técnica de inferencia estadística que busca aproximar un parámetro poblacional como la media o la proporción. En el video, se enfatiza en identificar métodos clásicos para estimar la media poblacional, ya sea conociendo o no la desviación estándar de la población.

💡Prueba de Hipótesis

La Prueba de Hipótesis es otra área principal de la inferencia estadística que se menciona en el video. Se trata de contrastar si una hipótesis es verdadera o falsa basándose en la evidencia estadística, aunque en este video se centra principalmente en el método de estimación.

💡Muestra Representativa

Una Muestra Representativa es una parte de la población seleccionada de manera aleatoria para reflejar características de la población completa. En el video, se destaca la importancia de la aleatoriedad en la selección de la muestra para garantizar su representatividad.

💡Estadísticos

Los Estadísticos son medidas calculadas a partir de una muestra que se utilizan para hacer inferencias sobre la población. Ejemplos de estadísticos mencionados en el video incluyen el promedio, la proporción y la desviación estándar.

💡Estimatores Sesgado e Insesgado

Estimatores Sesgados e Insesgados son términos utilizados para describir la relación entre el valor promedio de un estimador y el parámetro poblacional que se busca estimar. Un estimador insesgado tiene un valor promedio igual al parámetro, mientras que un sesgado no. En el video, se discute cómo elegir estimadores que sean lo más insesgados posible.

💡Varianza

La Varianza es una medida de la dispersión o variabilidad de los datos en un conjunto estadístico. En el video, se utiliza para comparar la variabilidad entre diferentes estimadores y se elige aquel con menor varianza, indicando una mayor precisión en la estimación.

💡Intervalo de Confianza

Un Intervalo de Confianza es un rango que estima el valor de un parámetro poblacional, con un cierto nivel de confianza. El video explica cómo calcular este intervalo para la media poblacional, ya sea conociendo o no la desviación estándar de la población.

💡Nivel de Significancia

El Nivel de Significancia, representado por alfa, es la probabilidad de rechazar una hipótesis nula cuando es verdadera. En el contexto de los intervalos de confianza, se utiliza para determinar los límites superior e inferior del intervalo. El video menciona cómo se relaciona con el nivel de confianza.

💡Teorema del Límite Central

El Teorema del Límite Central afirma que el promedio de los promedios de muestras aleatorias y independientes converge en la distribución normal, independientemente de la distribución de la población. En el video, se utiliza este teorema para calcular el intervalo de confianza cuando la desviación estándar de la población es conocida.

💡Error de Muestreo

El Error de Muestreo es la diferencia entre el promedio de la muestra y el parámetro poblacional que se está estimando. El video discute cómo calcular el tamaño de la muestra para alcanzar un margen de error específico, lo cual es crucial para la precisión de la estimación.

💡Desviación Estándar Poblacional

La Desviación Estándar Poblacional es una medida de la variabilidad dentro de la población completa. En el video, se menciona cómo, en algunos casos, se puede conocer esta medida a priori a partir de investigaciones previas, lo cual facilita el cálculo del intervalo de confianza.

💡Muestreo Aleatorio Simple

El Muestreo Aleatorio Simple es una técnica de muestreo donde cada unidad de la población tiene la misma probabilidad de ser seleccionada. El video utiliza este concepto para explicar cómo determinar el tamaño de la muestra necesaria para un estudio estadístico.

Highlights

La teoría de la estimación se enfoca en identificar métodos clásicos de inferencia estadística para estimar la media y desviación estándar poblacional.

El objetivo es comprender el proceso de estimación para poblaciones infinitas y finitas, y reconocer el modelo matemático subyacente.

La inferencia estadística permite generalizar conclusiones sobre una población a partir de una muestra representativa.

La aleatoriedad en la selección de la muestra es crucial para garantizar su representatividad y confiabilidad.

Los estadísticos calculados a partir de muestras, como el promedio y la desviación estándar, son llamados estimadores y pueden ser sesgado o insesgado.

Un estimador insesgado tiene un promedio igual al parámetro poblacional, lo cual es un concepto clave en la estimación estadística.

La elección entre diferentes estadísticos para estimar un parámetro poblacional se basa en su capacidad de aproximarse al valor poblacional.

La varianza de un estimador, que indica su dispersión, es un factor importante al decidir qué estimador es más eficaz.

Los intervalos de confianza son utilizados para estimar el parámetro de una población, con un margen de error dentro de un nivel de confianza determinado.

El nivel de confianza y el nivel de significancia están directamente relacionados con el tamaño del intervalo de confianza.

El teorema del límite central es fundamental para entender el comportamiento de los promedios de muestras y su distribución normal.

Ejemplos de estudios empíricos, como el análisis de la infección de COVID-19 en diferentes países, muestran cómo se aplican los conceptos de estimación.

La desviación estándar poblacional, obtenida de estudios previos, es esencial para estimar el promedio de la población con una desviación conocida.

El tamaño de la muestra adecuada para un estudio se determina considerando el margen de error deseado y el nivel de confianza.

El muestreo aleatorio simple es una técnica utilizada para seleccionar una muestra representativa de una población.

El error muestral y el error estándar de la estimación son dos conceptos distintos que se relacionan con la precisión de la estimación estadística.

Ejemplo práctico: Calcular el intervalo de confianza para el kilometraje promedio de un automóvil en una muestra de propietarios.

La determinación del tamaño de la muestra para poblaciones finitas requiere un ajuste en la fórmula de muestreo aleatorio simple.

El ajuste en el tamaño de la muestra para poblaciones finitas considera el tamaño de la población total y ayuda a disminuir el error de estimación.

Transcripts

play00:01

1

play00:03

y

play00:06

bien vamos a hablar entonces de qué es

play00:08

la teoría de la estimación nuestros

play00:11

objetivos tres objetivos nos vamos a

play00:14

enfocar hoy primero identificar métodos

play00:18

clásicos de la inferencia estadística

play00:21

y reconocer el proceso para estimar la

play00:24

media poblacional tanto para la

play00:25

desviación estándar poblacional conocida

play00:28

como desconocida y el tercer objetivo

play00:31

identificación del modelo matemático

play00:33

para el cálculo de la muestra para

play00:35

poblaciones infinitas y para poblaciones

play00:38

finitas el primer concepto es el de

play00:41

inferencia estadística que es esto de la

play00:44

inferencia estadística pues la

play00:46

inferencia estadística consta de métodos

play00:48

mediante los cuales se hacen inferencias

play00:51

o generalizaciones acerca de una

play00:53

población entonces qué es la inferencia

play00:55

estadística es sacar conclusiones es

play00:59

hacer generalizaciones sobre una

play01:02

población la inferencia estadística se

play01:05

puede dividir en dos áreas principales

play01:07

una que es la estimación y la otra que

play01:11

es la prueba de hipótesis

play01:14

a partir de hoy vamos a empezar a

play01:16

trabajar la primera técnica el primer

play01:18

método de inferencia estadística que es

play01:21

el método de estimación y un capítulo

play01:24

posterior creo que ya nos vamos a

play01:26

dedicar un buen tiempo a la prueba de

play01:28

hipótesis entonces acá tenemos un

play01:33

ejemplo de lo que hace la inferencia

play01:35

estadística cuando nosotros queremos

play01:37

estudiar cualquier aspecto de una

play01:40

población a veces el recurso no alcanza

play01:43

o no alcanza la plata o no alcanza el

play01:46

tiempo porque tenemos que recoger

play01:48

información para para tomar decisiones

play01:51

pero el tiempo que tenemos es muy corto

play01:54

entonces no podemos analizar la

play01:57

población en su totalidad que se

play01:59

simboliza con la n mayúscula entonces lo

play02:02

que se acostumbra para reducir costos

play02:05

para para agilizar en el tiempo para

play02:09

facilitar el estudio lo que se hace es

play02:13

que se toma una parte de esa población a

play02:15

esa parte se simboliza con n minúscula

play02:18

esa parte pequeña es lo que le llamamos

play02:21

muestra

play02:22

ahora esa muestra que se selecciona

play02:25

estas personas que están dentro de este

play02:27

círculo no se seleccionan todas de un

play02:30

mismo sector es decir yo no lo voy a

play02:32

solamente de este sector de arriba

play02:34

o solamente del sector de la mitad o

play02:36

solamente del sector de abajo no cuando

play02:39

se selecciona la muestra algo que se

play02:41

tiene que garantizar es que haya

play02:45

aleatoriedad es decir lo que se hace

play02:48

entonces es que se puede tomar personas

play02:50

de acá abajo unas cuantas de por acá

play02:52

otras cuantas de esta región otras

play02:54

cuantas de esta región otras cuantas de

play02:56

esta región y se selecciona la muestra

play02:58

lo que buscamos es que la muestra sea

play03:02

representativa que la cantidad de

play03:05

personas que se seleccionen en realidad

play03:08

me den información que sea válida y

play03:11

confiable y que me ayude a comprender el

play03:15

comportamiento de la población

play03:17

yo ilustró esto de la siguiente manera

play03:19

cuando ustedes se van a hacer un examen

play03:22

de sangre entonces qué hace el médico y

play03:25

le saca por ahí dos centímetros de

play03:27

sangre a usted no le chupan toda la

play03:29

sangre

play03:29

para saber cómo está cierto ustedes

play03:32

sacan solamente dos centímetros de

play03:34

sangre esos dos centímetros de sangre es

play03:37

la muestra que hacen en los laboratorios

play03:40

pero dígame

play03:45

y si yo estoy grabando entonces les

play03:52

decía que al hacer ese al tomar esa

play03:55

muestra estos dos centímetros cúbicos es

play03:59

una representación del comportamiento de

play04:02

la población entonces él en el

play04:04

laboratorio dice miles y en estos dos

play04:06

centímetros cúbicos tiene este

play04:09

comportamiento entonces yo puedo inferir

play04:11

que la sangre de todo el cuerpo tiene

play04:14

tienen la misma característica es decir

play04:17

se hace una extrapolación se generaliza

play04:20

lo mismo pasa cuando nosotros hacemos

play04:23

cualquier otro tipo de investigación ya

play04:25

sea una investigación social en

play04:27

educación en psicología en

play04:30

administración pasa exactamente lo mismo

play04:33

tomamos una muestra y esperamos que el

play04:36

comportamiento y las características que

play04:38

yo esté evaluando esta muestra me sean

play04:41

una representación de la población

play04:44

entonces hay dos métodos estadísticos

play04:48

para hacer esto nos vamos a enfocar

play04:51

solamente en el método clásico entonces

play04:53

les decía que nosotros tomamos medidas a

play04:57

estas muestras esas medidas que les

play04:59

tomamos a las muestras reciben el nombre

play05:01

de estadísticos a estos estadísticos por

play05:06

ejemplo podemos calcular el promedio

play05:09

podemos calcular la proporción podemos

play05:12

calcular la desviación estándar y

play05:15

podemos calcular cualquier otra medidas

play05:17

ahora yo puedo predecir el promedio del

play05:19

promedio de la población sin haber

play05:23

tomado toda la población simplemente la

play05:25

muestra si la muestra tiene una

play05:27

característica similar a la población

play05:29

entonces yo espero que ese promedio de

play05:31

la muestra se aproxime no que sea igual

play05:34

no que sea igual sino que se aproxime de

play05:37

pronto con un margen de error pero muy

play05:38

pequeño cierto la diferencia puede ser

play05:41

muy pequeña pero que se aproxime a ese

play05:44

promedio de la muestra o sea perdón a

play05:48

ese promedio de la población a ese

play05:50

lo mismo la proporción de la de la

play05:54

muestra la proporción de la muestra

play05:56

puede ayudarme a inferir a generalizar a

play06:00

reconocer el la proporción general de

play06:04

toda la de toda la población y el

play06:06

estadístico de la desviación estándar

play06:09

también me puede ayudar para aproximar

play06:13

me a tomar a tener una idea de cuál

play06:16

sería la desviación estándar de toda la

play06:20

población

play06:22

ahora a esos a esos estadísticos a esas

play06:25

medidas de la de la muestra se les

play06:29

llaman estimadores ahora los estimadores

play06:33

pueden ser sesgados o in sesgados

play06:37

qué es un estimador in sesgado se dice

play06:41

que un estadístico es un estimador in

play06:44

sesgado del parámetro theta entonces el

play06:47

parámetro que es es la misma medida pero

play06:51

poblacional cuando el estimador es sin

play06:54

sesgado cuando el promedio del

play06:57

estadístico es igual al parámetro si el

play07:02

promedio del estadístico este símbolo

play07:04

que está aquí de teta y por qué

play07:09

resulta que al promedio también tiene

play07:11

otro nombre que es esperanza cierto ya

play07:13

creo que ustedes vieron ese ese concepto

play07:15

de esperanza matemática cuando

play07:17

calculamos la esperanza matemática

play07:19

estamos calculando un promedio por lo

play07:22

tanto acostumbran a escribirlo de esta

play07:25

forma la esperanza matemática o sea el

play07:28

promedio el estadístico va a ser igual

play07:30

al parámetro poblacional cuando ésta se

play07:33

presenta esta igualdad se dice que el

play07:36

estimador es sin sesgado entonces veamos

play07:38

si yo quiero identificar cuál es el

play07:42

comportamiento del promedio pobla

play07:44

cuál es el promedio de toda la población

play07:46

a partir de un estadístico yo tengo tres

play07:51

opciones

play07:53

qué opciones tendría yo o qué tipo de

play07:56

estadísticos me ayudarían a identificar

play07:59

el promedio yo puedo utilizar la media o

play08:02

también puede utilizar la mediana

play08:06

o también puede utilizar la moda de esos

play08:10

tres cuál de éstos

play08:13

cuál de esos tres es el que me ayuda a

play08:18

determinar a inferir a conocer de forma

play08:21

más precisa el parámetro poblacional

play08:24

cuál es el que me ayuda entonces

play08:28

el que me ayudaría sería el que cumple

play08:31

esta condición tendría que calcular el

play08:34

promedio de cada uno de ellos y

play08:36

verificar cuál de ellos se aproxima

play08:38

mejor ahora cuando nosotros estamos

play08:42

haciendo este tipo de estudios no se

play08:46

toma en realidad una sola muestra se

play08:49

toman muchas muestras entonces aquí yo

play08:52

puedo tener de acá puedo sacar un de

play08:55

esta población puedo sacar en forma

play08:57

aleatoria un grupito llamémoslo n uno

play09:00

pues después puedo sacar otro grupito

play09:02

llamémoslo n 2 puedo sacar muchas muchas

play09:05

muestras y de esas muestras a cada uno

play09:08

le calculo el promedio entonces por

play09:10

ejemplo

play09:11

yo puedo tener este tipo de

play09:14

comportamientos esta línea gris

play09:17

podríamos decir que es el comportamiento

play09:20

de la población entonces el theta sería

play09:24

el parámetro poblacional lo que yo

play09:26

quiero estimar cierto entonces cuando

play09:30

cálculo los promedios de esas muestras

play09:35

y entonces un promedio me puede dar por

play09:37

acá

play09:39

en realidad se aproxima mucho al

play09:41

parámetro de la población que sería esta

play09:43

línea se aproxima mucho pero no es

play09:45

cierto digamos acá para este ejemplo que

play09:47

me están dando de tajo rito 3 hay otro

play09:51

que es el tratado se aproxima mucho más

play09:54

el 2 podríamos decir que el 2 inclusive

play09:57

hasta pasaría exactamente por por el

play10:00

parámetro poblacional y me lo estaría

play10:02

estimando perfectamente el teta sub 2 y

play10:06

el teta sub uno es el que se parece

play10:08

absolutamente tanto en la curtósis o sea

play10:11

en el en el apuntamiento en la altura

play10:14

que tiene la curva como en como en la

play10:18

parte simétrica

play10:21

pero de los tres cuales cogeríamos el

play10:25

criterio es el que el promedio se

play10:28

aproxime al parámetro poblacional entre

play10:30

theta 130 2 / theta 3 beta 2 y theta 1

play10:34

los que más se aproximan serían tratados

play10:37

y theta 1 los dos se aproximan al

play10:39

parámetro poblacional los dos me

play10:42

estarían ayudando a describirlo ok a

play10:45

encontrarlo

play10:47

el z3 el promedio no estaría cumpliendo

play10:51

este criterio de que el promedio sea

play10:53

igual al de la población o sea que yo

play10:56

descartaría ya el z3 pero acá tengo dos

play10:59

estimadores el z1 y el test a dos de los

play11:03

dos con cuál me quedo entonces ya yo no

play11:05

utilizo el criterio del promedio sino

play11:08

que utilizamos el criterio de la

play11:10

varianza cuál es el que utilizamos vamos

play11:13

a escoger a que el estimador que tenga

play11:16

menor variabilidad entonces variabilidad

play11:20

sería como dispersión que están regados

play11:22

están los datos

play11:23

entonces notemos que por ejemplo si yo

play11:26

comparo el z3 esta línea de esta línea

play11:29

punteada el z3 la comparó con theta el

play11:32

z3 es este si comparo el 33 con el 30 2

play11:37

cuál de las curvas está más abierta si

play11:40

notamos el 30 2 es una curva que está

play11:43

mucho más abierta que el teta 3 lo cual

play11:45

quiere decir que los datos están más

play11:47

dispersos están más regados hay mayor

play11:49

variabilidad entre está 2

play11:52

a 30 y si yo comparo teta 3 contenta 1

play11:57

cuál de las dos está más abierta notemos

play12:01

que teta 3 está mucho más abierta la

play12:03

abertura de ésta es mayor que la de

play12:06

theta 1 entonces eso significa que teta

play12:10

uno es la que tiene menor variabilidad

play12:13

menor dispersión de los datos los datos

play12:16

no están tan regados por lo tanto

play12:18

podríamos decir que el estadístico que

play12:21

hayamos utilizado ese estadístico es el

play12:25

estadístico más eficaz

play12:28

cuando yo quiero estimar el parámetro de

play12:31

la de una población

play12:34

utilizamos una de las técnicas para

play12:37

hacer esa estimación y es el intervalo o

play12:41

link o llamados intervalos de

play12:43

confiabilidad

play12:44

y lo que hacemos es que

play12:48

esperamos que de todas las muestras que

play12:51

yo tome se mantenga el parámetro de la

play12:55

población ahora

play12:58

cada uno va a tener un promedio que no

play13:00

va a ser exactamente igual al de la

play13:03

población habrá un margen de error pero

play13:06

vamos a encontrar unos límites que de

play13:09

todas esas muestras que yo le calculo el

play13:12

promedio a los promedios ojo con esto si

play13:15

le calcula el promedio a los aa esos

play13:18

promedios

play13:19

yo voy a encontrar

play13:21

un valor mínimo y voy a encontrar un

play13:24

valor máximo entonces lo que esperamos

play13:27

es que el parámetro de la población esté

play13:32

dentro de esos dos límites y que la

play13:34

probabilidad de que el parámetro de la

play13:38

población se encuentra entre esos dos

play13:40

límites tenga un nivel de confianza o

play13:43

sea que el 1 - alfa se llama nivel de

play13:46

confianza entonces el intervalo de

play13:49

confianza cuales es el cual es esto que

play13:52

está aquí dentro de paréntesis límite

play13:54

inferior lower

play13:57

el parámetro poblacional el límite

play14:01

superior a p

play14:04

ahora el nivel de confianza es la

play14:07

probabilidad de que el parámetro

play14:10

poblacional se encuentra entre esos

play14:12

límites el nivel de confianza es esto

play14:15

1 - alfa cuál sería

play14:18

el intervalo de confianza el límite

play14:21

inferior y el límite superior que me

play14:23

generaría un link o un nivel de

play14:25

confianza que yo como investigador

play14:28

escojo sea soy yo el que lo escojo ese

play14:30

nivel de confianza pero ese nivel de

play14:33

confianza depende de un alfa a este alfa

play14:37

se conoce como nivel de significancia

play14:42

y que es el nivel de significancia el

play14:44

nivel de significancia es la

play14:47

probabilidad de que un dato esté por

play14:50

fuera del nivel de confianza vamos ahora

play14:53

a ver como ejemplo cómo se puede estimar

play14:58

la media o sea el parámetro de la

play15:00

población con una desviación estándar

play15:04

conocida este sigma noten que es un

play15:07

parámetro y ese parámetro que significa

play15:11

que es una medida de la población

play15:14

entonces significa que yo quiero estimar

play15:18

el promedio de la población que no lo

play15:20

conozco con la desviación estándar de la

play15:24

población algunos dirían pero es que si

play15:27

yo no conozco el promedio la población

play15:29

cómo voy a conocer entonces la

play15:31

desviación estándar de la población en

play15:33

realidad algunas personas dirían que no

play15:37

tiene sentido pero en sí lo tiene porque

play15:40

de dónde sale la información de de esto

play15:45

de estas desviaciones estándar estos

play15:47

datos conocidos

play15:50

miren cuando se hace una investigación

play15:53

no podemos pretender iniciar todo desde

play15:57

cero y ya hay muchas otras

play15:59

investigaciones que se han hecho previas

play16:01

en cualquier campo en el campo que

play16:03

ustedes quieran en el campo de la

play16:04

educación en el cambio la ingeniería no

play16:06

importa entonces frente a un estudio

play16:10

frente a una variable en particular yo

play16:13

puedo buscar estudios comprobatorios

play16:16

artículos que en estos momentos es muy

play16:19

fácil porque hay una cantidad de bases

play16:22

de datos las universidades tienen una

play16:24

disponibilidad de bases de datos de

play16:26

artículos científicos que muestran todos

play16:29

estos estos resultados datos

play16:31

estadísticos a partir de esos estudios

play16:34

entonces yo puedo ya tener un

play16:36

conocimiento de las variantes de las

play16:39

desviaciones estándar conocidas entonces

play16:41

lo que están diciendo es bueno vamos a

play16:43

estimar el promedio

play16:46

a partir de una desviación estándar

play16:48

conocida ahorita vamos a ver un ejemplo

play16:50

que les voy a mostrar entonces lo que se

play16:53

hace para estimar el promedio es

play16:55

calcular el intervalo de confianza y

play16:58

para eso asumimos una distribución

play17:00

normal

play17:02

y sabemos que el parámetro para calcular

play17:05

la distribución normal es z

play17:08

esta área sombreada es el nivel de

play17:10

confianza que es 1 - alfa

play17:14

y esto que está aquí afuera sería lo que

play17:18

llamamos nivel de significancia estás

play17:20

colitas está con la que está cayendo la

play17:23

que está acá es el nivel de

play17:24

significancia pero si yo digo que 1 -

play17:27

alfa o sea el nivel de confianza la zona

play17:29

gris es del 95%

play17:33

1 - alfa el del 95% cuánto tiene que

play17:37

valer alfa 5 y entonces el nivel de

play17:43

significancia es el 5% y en la

play17:46

probabilidad que esté aquí afuera pero

play17:49

resulta que ese 5% se divide en dos

play17:52

colas una cola hacia la izquierda y otra

play17:55

cola hacia la derecha o sea que si este

play17:57

5% el nivel de significancia del 5% yo

play18:00

lo divido en dos la mitad de 5 cuanto s

play18:04

los puntos 5.5 25 o sea que aquí a la

play18:09

izquierda quedaría alfa medios o sea 25

play18:13

por ciento y acá sería 25 por ciento

play18:16

ahora

play18:19

por el teorema del límite central

play18:21

reconocen cuál es el teorema del límite

play18:23

central por favor me podrían decir cuál

play18:26

es

play18:32

el teorema del límite central es este

play18:36

el teorema del límite central me dice

play18:41

si yo tengo una muestra o tengo varias

play18:45

muestras y yo saco el promedio de esas

play18:48

muestras es decir que a las muestras yo

play18:51

saco el primer promedio el segundo

play18:53

promedio el tercer promedio depende

play18:54

cuantas muestras tenga y después

play18:57

promedio todos esos promedios entonces

play19:00

es el promedio de los promedios de una

play19:02

muestra va a tener este comportamiento

play19:06

este comportamiento va a tener un

play19:09

comportamiento normal pero como el de

play19:12

una muestra hay un error estándar el

play19:15

error estándar o sea sería la desviación

play19:18

estándar de la muestra el error estándar

play19:21

o desviación estándar de la muestra está

play19:23

dada por sigma sobre raíz de n usted han

play19:28

visto esta fórmula antes entonces mira

play19:31

lo que vamos a hacer tomamos nuestro

play19:34

intervalo de confianza y vamos a

play19:36

reemplazar zz ya no vamos a colocar esto

play19:39

vamos a reemplazarlo por esto que

play19:41

obtenemos obtendríamos esto y lo que

play19:43

tengo que hacer aquí es despejar el

play19:46

parámetro poblacional que quiero hallar

play19:48

y notemos el límite central

play19:53

el parámetro poblacional es mío o sea

play19:56

que yo tengo que despejar a mí o si voy

play19:58

a despejar mi o que hago lo que está

play20:01

dividiendo pasa a multiplicar o sea que

play20:03

sin más sobre raíz de en está dividiendo

play20:05

pasa a multiplicar a la izquierda pero

play20:08

también debe pasar multiplicar a la

play20:09

derecha pasa a multiplicar a ambos lados

play20:11

ok y después de que pasa a multiplicar

play20:15

notemos que también debería quitar

play20:18

el estadístico x barra pero como el

play20:21

estadístico x barra está positivo

play20:23

entonces debería pasar negativo a la

play20:25

izquierda y negativo a la derecha

play20:28

entonces si yo quito estos dos que me

play20:31

quedaría un menos mío pero como lo que

play20:34

se busca es que el 'new quede positivo

play20:36

tendría que multiplicar todo por menos

play20:38

uno

play20:40

y al final cuando yo despejó este mío es

play20:43

un ejercicio que los dejo para que lo

play20:45

hagan es un ejercicio del manejo de

play20:48

ecuaciones cuando ustedes despejan este

play20:50

mío que obtiene esto que está aquí al

play20:53

lado izquierdo

play20:55

es lo que se llama

play20:58

límite unilateral de estimación el lado

play21:03

izquierdo es un límite inferior al

play21:05

límite unilateral de la estimación y

play21:08

este límite superior es el otro límite

play21:11

unilateral dentro de este rango el

play21:14

límite inferior y el límite superior

play21:18

esperamos que el promedio de la

play21:20

población se mantenga dentro de ese

play21:22

rango con una confianza de 1 - alfa

play21:26

vamos a ver un ejemplo como se los había

play21:28

prometido habíamos dicho que voy a

play21:31

estimar el promedio de la población a

play21:34

partir de una desviación estándar de la

play21:37

población pero decíamos bueno si yo voy

play21:40

a estimar la población y no la conozco

play21:42

entonces de dónde saben de dónde salió

play21:44

esta desviación estándar de la población

play21:46

entonces esos salen de estudios previos

play21:49

entonces quiero abrir un ejemplo un

play21:52

estudio científico sobre kobe 19

play21:56

esto es una de las revistas más

play21:58

prestigiosas que hay en investigación en

play22:02

este momento en términos de salud

play22:04

esto es déjenme demostrarle que revista

play22:07

es

play22:09

mira la revista 'nature' revista

play22:12

'nature'

play22:15

el break efecto de las políticas de

play22:19

contagio a gran escala a efecto de las

play22:22

políticas anti contagios a gran escala

play22:24

en la pandemia del hobbit 19 pero quiero

play22:28

que veamos esto noten esto

play22:32

estimación empírica

play22:36

de kobe 19 de infección de kobe 19 no no

play22:42

mitigado y aquí noten que me están dando

play22:45

promedios average de seis países me

play22:50

están dando

play22:51

un valor de punto 36 y en china me están

play22:56

dando además del promedio me están dando

play22:58

el intervalo de confianza noten el

play23:01

intervalo de confianza para este

play23:03

promedio tomar un promedio hay un límite

play23:05

inferior noten hay un límite superior de

play23:08

ver si yo puedo ampliar esto full size

play23:12

aquí se ve mejor entonces no te dan un

play23:16

promedio me dan un límite inferior me

play23:18

dan un límite superior para one china

play23:22

también me dan otro promedio o sea que

play23:24

tomaron dos muestras dos muestras hay

play23:27

una que está justo en el límite superior

play23:30

del intervalo de confianza en la segunda

play23:34

muestra el parámetro poblacional esta

play23:37

línea punteada se parece mucho al de la

play23:40

muestra note 3.36 con la aquí la

play23:45

confianza que se maneja es del 95%

play23:48

hay un 95% en este ejemplo hay un 95% de

play23:52

que este de que el parámetro poblacional

play23:56

se encuentre entre punto 30.40 y 1 y

play24:02

esto es lo que dio la muestra esta que

play24:04

está acá punto 36 así lo hicieron para

play24:06

corea para italia para irán para francia

play24:09

eeuu

play24:11

ahora efectos de políticas combinadas

play24:14

entonces cuando se pusieron a mirar la

play24:17

combinación de políticas en china semana

play24:19

12 miraron 5 semanas tomaron muestras

play24:23

por semana la primera semana miren como

play24:24

dio la segunda semana este es el

play24:27

parámetro poblacional y noten cómo

play24:29

quedaron los rangos quedaron muy por

play24:31

fuera cierto en su corea la muestra fue

play24:34

muy grande

play24:36

en italia en irán en francia bueno a

play24:39

partir de estos estudios que obtenemos

play24:42

nosotros vamos a mirar mira que el nivel

play24:45

de confianza el nivel el intervalo de

play24:48

confianza tiene una confianza del 95 por

play24:51

ciento y las desviaciones estándar son

play24:55

las que están las obtuvieron de estudios

play24:58

previos y ya este estudio es un estudio

play25:00

que me sirve como referencia entonces a

play25:03

partir de estos resultados es que

play25:05

obtienen esas desviaciones estándar ieee

play25:08

y se asume que las personas estos son

play25:11

muestra el note que las muestras son

play25:13

representativas no se enfocaron

play25:15

solamente en china también lo hicieron

play25:17

en otros países lo hicieron en korea lo

play25:20

hicieron en italia y en francia en los

play25:22

eeuu también en américa y noten que hay

play25:26

unos comportamientos más o menos

play25:28

parecidos en los promedios cierto aunque

play25:31

algunas muestras fueron más grandes que

play25:33

otras pero tienen unos comportamientos

play25:35

parecidos este estudio es un estudio de

play25:38

referencia que si lo leemos con cuidado

play25:40

podemos extraer

play25:42

esta desviación estándar entonces yo ya

play25:44

no me voy a preocupar de hoy cuál es la

play25:47

desviación estándar para este estudio

play25:48

que yo voy a hacer si yo voy a hacer un

play25:50

estudio sobre el efecto de las políticas

play25:53

que están haciendo en colombia para la

play25:56

prevención del contagio del cobi 19 yo

play25:59

ya no tengo que inventarme cuanto al

play26:01

estigma yo me voy para ese estudio que

play26:03

ya lo hicieron en muchos países a nivel

play26:05

mundial y yo voy a decir el sigma

play26:07

conocido es este bueno error de la

play26:10

muestra y el error estándar de la

play26:12

estimación ahora cuando yo estoy

play26:14

calculando la muestra mira esto es lo

play26:17

que hicimos tenemos entonces una primera

play26:20

muestra yo esta línea representa una

play26:22

muestra calculamos el límite inferior

play26:24

que el límite inferior sería el promedio

play26:26

de la muestra menos el zeta el límite de

play26:31

confianza

play26:33

el error estándar o sea desviación

play26:37

estándar sobre raíz de m esto me da el

play26:39

límite inferior y esto me da aquí el

play26:40

límite superior y éste sería el promedio

play26:43

de esta muestra ahora este promedio esta

play26:47

muestra al compararlo con el parámetro

play26:49

poblacional que sería esta línea y stem

play26:52

y entonces notemos que no necesariamente

play26:56

el promedio la muestra va a ser igual

play26:58

exacto al promedio de la población hay

play27:00

una diferencia a esa diferencia se llama

play27:03

error entonces en 'la para una muestra

play27:05

puede estar el promedio la muestra puede

play27:08

estar a la izquierda puede ser menor en

play27:10

algunas ocasiones puede estar a la

play27:11

derecha cierto y no tenemos de todas

play27:14

estas muestras de todas estas muestras

play27:18

todas contienen al parámetro de la

play27:21

población la segunda muestra contiene el

play27:24

parámetro de la población acá la tercera

play27:27

muestra contiene el parámetro de la

play27:29

población acá la cuarta muestra casi es

play27:32

igual al parámetro de la población

play27:35

solamente hay un error en esta esta es

play27:39

la primera segunda tercera cuarta quinta

play27:40

sexta la séptima muestra

play27:44

el para el el intervalo de confianza no

play27:47

contiene al parámetro de la población

play27:49

ese es el eje el riesgo que corremos

play27:52

cierto porque estamos diciendo que

play27:54

queremos una confianza del 95 por ciento

play27:56

o sea que el 95 por ciento de las

play28:00

muestras que yo tome que contenga al

play28:02

parámetro de la población que si hay un

play28:04

margen de error que sea muy pequeñito

play28:06

está que está acá estaría representando

play28:08

es de 5 por 7 es de 5 por ciento que

play28:11

está entonces en el nivel de

play28:13

significancia o sea en las colas ya que

play28:16

sea izquierda o derecha que se sale del

play28:18

intervalo de confianza

play28:20

ahora pero ese error ojo ese error es

play28:23

esta distancia la distancia la

play28:25

diferencia que hay entre el promedio de

play28:27

la muestra y el promedio poblacional y

play28:30

ese error no puede ser mayor a esto

play28:34

ese error no puede ser mayor a esta cola

play28:38

ya sea la cola de la derecha o la cola

play28:40

de la izquierda y esa cola como la

play28:42

determinamos de esa cola es el zeta más

play28:45

sigma sobre raíz de m note es el zeta

play28:50

sigma sobre raíz de n porque al promedio

play28:53

o sea este puntito le sumamos este dato

play28:56

este dato que está acá por lo tanto es

play28:58

lo que se llama el error de la muestra

play29:01

el error de la muestra es un dato que

play29:04

usted como investigador lo define cuando

play29:08

usted va a ser una investigación

play29:10

usted dice hombre voy a voy a recoger

play29:12

información sobre esta variable sobre

play29:15

efectos del contagio del joven 19

play29:19

en colombia a no efectos de las

play29:23

políticas contra el contagio del cobach

play29:25

19 en colombia ah bueno listo yo quiero

play29:29

una confianza de muestra del 90 por

play29:32

ciento entonces el error

play29:37

es un dato que usted escoge ustedes

play29:39

tiene cuál es la distancia que quiere

play29:42

entre el promedio de la muestra y el

play29:44

promedio de la población este entonces

play29:47

yo puedo hacer un muestreo para

play29:49

poblaciones infinitas con el sigma

play29:52

conocida es decir yo ya mire estudios

play29:54

previos y yo ya conocía el sigma ahora

play29:57

de acá calculemos cuál es el tamaño de

play29:59

la muestra cuál debería ser el tamaño de

play30:02

la muestra para tener una confianza

play30:04

determinada entonces de esta fórmula se

play30:07

puede despejar a raíz de n

play30:09

si usted define cuál es el margen de

play30:11

error usted define el nivel de confianza

play30:13

o sea z

play30:16

zg el que me da el límite de confianza y

play30:18

conoce la desviación estándar de la

play30:21

población por estudios previos

play30:23

entonces usted puede calcular cuál

play30:26

debería ser el tamaño de la muestra para

play30:27

una confianza determinada entonces noten

play30:30

el raíz de n está dividiendo pasaría a

play30:33

multiplicar a la raíz de enepasa a

play30:36

multiplicar a la e y la que está

play30:38

multiplicando pasaría a dividir pero

play30:41

como aquí el lado me quedaría raíz de n

play30:43

sacamos raíz cuadrada a ambos lados y

play30:45

obtendría esto esa es la fórmula de

play30:48

muestreo del muestreo aleatorio simple

play30:51

usted puede seleccionar a personas de la

play30:53

población desde diferentes lugares es

play30:56

cierto pero cuántas personas seleccionar

play30:58

este n me dice cuántas personas

play31:01

seleccionar que necesitamos necesitamos

play31:03

el límite de confianza sea si usted le

play31:07

dan el nivel de confianza tiene el

play31:09

límite de confianza necesita una

play31:11

desviación estándar poblacional conocida

play31:13

y usted define el margen de error que

play31:16

quiere es decir la diferencia que hay

play31:18

entre el plan el promedio entre el dato

play31:20

de la el estadístico y el parámetro

play31:23

mejor dicho y es el alto elevado al

play31:25

cuadrado ok

play31:27

esto es lo que se llama aquí arriba

play31:29

error de la muestra pero hay otra hay

play31:33

otro error que es llamado el error

play31:35

estándar de la estimación puntual noten

play31:38

ustedes acá tengo cuantas muestras 1 2 3

play31:42

4 5 6 7 8 9 10 y noten que cada una

play31:47

tiene un promedio diferentes y se dan

play31:49

cuenta cada muestra es ese puntito negro

play31:52

es el promedio de cada muestra está

play31:54

representando son diferentes

play31:56

si yo promedio todos estos si yo

play32:00

promedio los promedios se supone que

play32:03

tiene un comportamiento normal ese es el

play32:05

problema del límite central cierto pero

play32:08

también hay una dispersión una

play32:10

desviación estándar una varianza noten

play32:14

la variabilidad que tiene uno se mueven

play32:16

a la izquierda otros a la derecha hay

play32:18

una variabilidad la varianza de este

play32:21

promedio del promedio de promedios la

play32:23

varianza de esto es lo que se conoce

play32:26

como error estándar y el error estándar

play32:29

o sea la desviación estándar de x barra

play32:32

como sigma sobre raíz de n osea la

play32:37

desviación estándar poblacional sobre

play32:39

raíz de n si usted compara la desviación

play32:44

estándar o el error estándar perdón si

play32:46

compara el error estándar con el error

play32:48

de muestreo cuál es la relación que hay

play32:50

entre ellos dos o la uno estaba

play32:52

multiplicado sz es sobre la

play32:56

la distribución normal excelente claro

play33:00

el error de la muestra está

play33:03

multiplicando al error estándar por el

play33:06

límite de confianza en este caso el

play33:08

límite de confianza en una distribución

play33:10

normal z vamos entonces a mirar un

play33:13

ejemplo a ver un ejemplo

play33:17

alguien por favor podría leer el

play33:19

ejercicio por mí una muestra aleatoria

play33:22

de 100 propietarios como 10

play33:27

con dos en su automóvil en promedio diez

play33:30

mil 500 kilómetros por año

play33:32

con una desviación estándar de 900

play33:37

supongo que la distribución de las

play33:39

mediciones de esa próxima mejor mano a

play33:42

estrella un intervalo de confianza el

play33:45

grito ciento para el número por un

play33:50

propietario de un automóvil que ve que

play33:55

podemos afirmar con un 99 posee inter

play33:58

confianza hacer que el posible amaño del

play34:00

error si estimamos que los dos se

play34:10

determinen

play34:11

[Música]

play34:18

excelente entonces veamos cuál es la

play34:22

variable que estamos analizando de

play34:24

acuerdo a eso por favor vamos a empezar

play34:26

a interpretar cuál es el la variable a

play34:30

analizar en este caso

play34:35

excelente lo que se recorre en un año

play34:39

ok en este caso se tomaron a 100

play34:42

personas de medellín y a cada uno

play34:44

miraron el kilometraje recorrido por un

play34:47

año entonces en realidad si tome 100

play34:50

personas para medir el promedio de

play34:53

recorrido por año yo quiero saber ya no

play34:56

solamente para esas 100 personas sino

play34:58

para todas las personas que tengan un

play35:00

vehículo cuál es el promedio de

play35:04

recorrido por año en medellín en

play35:06

términos generales

play35:07

eso es inferencia cierto y vamos a

play35:10

estimar pero a partir de intervalos de

play35:13

confianza entonces me están diciendo que

play35:15

construya el intervalo de confianza el

play35:17

99 por ciento para estimar ese

play35:20

kilometraje para toda la medellín para

play35:23

toda la población entonces primer paso

play35:25

tomamos los datos la muestra n es 100

play35:30

el promedio de la muestra cuánto es diez

play35:33

mil quinientos ya me lo están dando diez

play35:35

mil quinientos kilómetros la desviación

play35:38

estándar con una desviación estándar de

play35:41

1900 ahora este 1900 mientras no me lo

play35:46

digan vamos a asumir que es el

play35:48

desviación estándar poblacional de

play35:51

acuerdo nos lo dieron ya

play35:54

nivel de confianza me está diciendo que

play35:57

el nivel de confianza es 99 por ciento o

play36:01

sea 0.99 si el nivel de confianza en

play36:05

noveno es del 99 por ciento cuál es el

play36:07

nivel de significancia cuál es el margen

play36:10

de rechazo de ésta desde 2001 0.01 el 1

play36:18

por ciento entonces listo me están

play36:21

pidiendo calcular el intervalo de

play36:24

confianza el promedio ya no desde los

play36:26

100 ya no el promedio de los 100 sino

play36:28

del promedio de conducción de todas

play36:30

medellín tengo que hallar el límite

play36:32

inferior y tengo que hallar el límite

play36:34

superior entonces el límite inferior

play36:36

cuánto es el promedio de la muestra que

play36:39

tenemos el promedio lo muestra veamos x

play36:41

promedio es 10 mil 500 tenemos el

play36:43

promedio la muestra

play36:45

necesitamos z pero z es el límite de

play36:48

confianza

play36:50

z es el límite de confianza tenemos que

play36:52

calcular es el límite de confianza pero

play36:54

el límite de confianza para que el nivel

play36:56

de confianza 99% multiplicado por la

play37:00

desviación estándar conocemos la

play37:02

desviación estándar 1900 sobre raíz de n

play37:05

o sea raíz de 100 vamos a ver cómo

play37:08

calcular ese límite de confianza

play37:12

entonces acá en esta página que tenemos

play37:16

la distribución normal y me están

play37:18

diciendo qué

play37:20

trabajé el 99 por ciento voy a escribir

play37:23

dos colas voy a marcar aquí para dos

play37:26

colas esta gráfica ya me está mostrando

play37:29

una confianza del 95 por ciento y me

play37:32

está dando el límite inferior y el

play37:33

límite superior pero nos están pidiendo

play37:36

no el 95 por ciento sino el 99 entonces

play37:39

algo doble clic y escribo 0.99 ok

play37:44

entonces en para el 99 por ciento me

play37:47

tengo un 1 por ciento del nivel de

play37:49

significancia cierto ese 1% el 1 / 2

play37:55

porque se divide en dos colas la cola

play37:57

izquierda y la cola derecho ese 1% sería

play38:00

la mitad para acá la mitad de uno es

play38:04

el punto cinco por ciento y punto cinco

play38:07

por ciento sería lo mismo que decir 0 0

play38:09

5

play38:10

esa es la probabilidad de que no se

play38:14

cumpla de que el dato del promedio no

play38:17

esté de que de que una muestra no tenga

play38:20

el parámetro de la población

play38:23

5 % punto 0 0 5 a la izquierda y punto 0

play38:27

0 5 a la derecha entonces cuál es el

play38:29

límite de confianza el límite de

play38:30

confianza en esta línea cita acá a este

play38:32

borde el borde el límite entre lo rojo y

play38:35

lo blanco este límite de confianza a la

play38:38

izquierda del -2 70 menos 2 576 y a la

play38:42

derecha es 2 576 estos son los valores

play38:46

de z pero ese valor de z se recuerden

play38:50

que se acostumbra a aproximar a dos

play38:52

decimales osea quedaría cuánto

play38:56

daría menos 258 la otra forma es

play39:00

calcularlo por la tabla de distribución

play39:03

normal como me están diciendo que es del

play39:05

99 por ciento y ese 97 por ciento

play39:08

noventa y nueve por ciento tiene un 1%

play39:10

ese nivel de significancia y este 001 lo

play39:14

divido entre dos entonces al lado

play39:16

izquierdo cuánto tendría 005 cierto ese

play39:20

005 es decir este 0.05 tiene un límite

play39:26

vamos a buscar cuál es el límite para

play39:28

una área a la izquierda de ese límite

play39:31

entonces cuánto valdría z este es una

play39:35

tabla distribución normal de cola

play39:37

izquierda que me imagino que ya la saben

play39:39

manejar verdad entonces voy a buscar la

play39:42

probabilidad de 0.05 y empiezo a bajar

play39:46

empiezo a bajar entonces aquí 0 0 09 01

play39:52

0 2

play39:54

04

play39:57

00 06 a ya llegué aquí y así continuó

play40:02

daría 0 08 te voy a llegar aquí 0 06 y

play40:06

empiezo ahora a moverme hacia la derecha

play40:09

0 62 0 060 00 50 y 80 puntos 0 50 y

play40:17

7 tenemos que llegar a 0.05 57 55 53 52

play40:26

aquí tengo cero 5000 49 cuál de los dos

play40:32

se aproxima más

play40:35

00 50 000 49 cuál de los dos se aproxima

play40:40

más a 0.05 si notamos este este está uno

play40:45

dos tres cuatro o cinco está ocho diez

play40:48

milésimas por encima de 0.05

play40:51

y esta esta cuanto por debajo

play40:56

610 milésimas por debajo cuál está más

play40:59

cerca del 0.05 este que está 810

play41:02

milésimas oeste que está por debajo 610

play41:06

milésimas cuál está más cerca a 0.05

play41:09

veamos aquí al lado derecho esto ya

play41:12

sabemos que se está vale 25 25 pero el

play41:17

segundo decimal lo buscamos aquí 258 que

play41:21

fue exactamente lo mismo que nos dio acá

play41:24

aproximando a los decimales 2.58 lo

play41:28

reemplazamos entonces

play41:30

el promedio x barra 10.500 menos el

play41:34

límite de confianza 258 por sigma la

play41:38

desviación estándar 1900 sobre raíz de n

play41:42

100

play41:43

menor que el promedio o menor igual que

play41:47

el promedio y ese promedio menor igual

play41:49

que lo mismo el promedio de la muestra

play41:52

100 mil 500 +2 58% sobre 100 hacemos la

play41:58

solución calculamos está el límite

play42:01

izquierdo me da 10 mil 910 mil 9

play42:06

kilómetros y el límite es superior daría

play42:09

10 mil 990 kilómetros con una confianza

play42:14

del 99 por ciento que hallamos que

play42:17

hallamos entonces me está diciendo que

play42:20

si la muestra de 100 de 100 vehículos

play42:25

tiene un promedio de recorrido de 10 mil

play42:28

500 kilómetros

play42:31

es de la población de todo medellín este

play42:35

promedio de recorrido está entre 10 mil

play42:38

y 10 1990 existe una probabilidad del 99

play42:43

por ciento me olvidó decir existe una

play42:45

probabilidad del 99 por ciento de que el

play42:48

promedio poblacional de la distancia

play42:50

recorrida de los vehículos en medellín

play42:53

esté entre 10.000 9 kilómetros y 10 mil

play42:57

990 kilómetros vámonos con la segunda

play43:00

pregunta que dice la segunda pregunta a

play43:03

la parte b

play43:06

que podemos afirmar con dos nuevos /

play43:10

confianza acerca del posible está mal el

play43:13

error y estimamos que los propietarios

play43:16

de automóviles conduce un promedio de

play43:19

diez mil quinientos kilómetros por año

play43:22

entonces ojos que me están hablando del

play43:24

posible tamaño de error y tenemos dos

play43:27

tipos de errores entonces como no me

play43:30

están especificando qué errores tengo

play43:32

que hablar de los dos errores el error

play43:34

muestral y el error estándar entonces el

play43:37

error muestral cuales haya simplemente

play43:40

el error está el error muestral sería el

play43:43

límite de confianza z por la desviación

play43:48

estándar poblacional sobre raíz de n

play43:50

o sea que el error de la muestra es

play43:54

490

play43:56

km o sea

play44:00

esta muestra tiene un promedio de 10 mil

play44:03

510 mil 500 pero con un error de 490 o

play44:08

sea que a este 10.500 yo le restó 490 y

play44:12

me da un límite inferior ya este 10.500

play44:14

le sumo 490 imedea el límite superior o

play44:18

sea este es el margen de error hasta así

play44:21

como lo está aquí en la gráfica al

play44:23

promedio de la muestra le restó el error

play44:25

y al promedio de la muestra le sumó el

play44:28

margen de error y que me queda los

play44:30

límites límite inferior límite superior

play44:32

entonces el error de la muestra es 490

play44:35

kilómetros y el error estándar pues es

play44:39

simplemente tomar el 190 sobre raíz de n

play44:43

ósea sobre raíz de 10 raíz de 100 y eso

play44:46

sería 190 kilómetros ese es el error o

play44:51

sea que entre estas muestras cuando

play44:53

calculamos la varianza

play44:57

perdón la desviación estándar cuando

play44:59

calculamos la desviación estándar de

play45:02

estos promedios la desviación estándar

play45:05

de los promedios de todas las muestras

play45:07

que tome es de 190 kilómetros en la

play45:10

variabilidad de todas estas muestras

play45:12

vámonos con la última pregunta cuántos

play45:17

automóviles tendrían que evaluar en

play45:20

medellín para poder determinar el tamaño

play45:24

de la muestra entonces que necesitamos

play45:27

para poder calcular el tamaño de la

play45:29

muestra n

play45:30

necesitamos el margen de error y es el

play45:34

1% de quién

play45:37

el 1% del promedio muestral

play45:42

el 1% del promedio muestral cuales el

play45:45

promedio muestral me está diciendo que

play45:47

el promedio de las de los 100 muestras

play45:49

anteriores el promedio cuánto fue diez

play45:52

mil quinientos cierto cuál es el 1% de

play45:55

10.500 chicos una calculadora y rápido

play45:58

150 ok entonces

play46:02

vamos a utilizar eso ahorita más

play46:04

adelante ya sabemos que esto es 150

play46:06

entonces pero me están diciendo que

play46:10

tiene que ser

play46:12

el tamaño la muestra pero una con una

play46:14

confianza del 95% o sea que si yo tengo

play46:17

un nivel de confianza del 95% cuánto

play46:21

valdría z

play46:23

este zeta entonces 95% tendría un nivel

play46:27

de significancia del 5%

play46:30

y el 5% se divide la mitad a la

play46:33

izquierda y la mitad a la derecha ese

play46:35

sería el nivel de significancia cuál es

play46:37

el límite de confianza o sea cuánto vale

play46:39

z dice que vale 1.96 el límite de

play46:44

confianza es 1.96 multiplicado por la

play46:48

desviación estándar la desviación

play46:49

estándar poblacional es la misma 1900

play46:53

pero falta calcular el p

play46:56

entonces él ya lo habíamos calculado que

play47:00

es igual a 105 entonces reemplazamos

play47:03

estos datos acá y me dice que en

play47:06

realidad yo debería tomar para un 95% y

play47:11

un margen de error del 1% o sea el error

play47:14

es tan pequeñito que entonces la muestra

play47:17

tendría que aumentar la ya no tendría

play47:20

que tomar 100 propietarios tendría que

play47:22

medir a cuántos propietarios a 1200

play47:26

57.88 hombre o sea que aproximando a

play47:29

enteros daría mil 258 vehículos

play47:33

pero venga resulta que aquí aquí aparece

play47:38

el cálculo del error lo hice fue al

play47:40

revés pero ok

play47:44

resulta que esta fórmula esta fórmula de

play47:48

muestreo

play47:49

estoy asumiendo que la población es

play47:53

infinita pero les pregunto aquí en

play47:56

medellín hay infinita cantidad de carros

play47:59

hay infinita cantidad de carro en

play48:01

medellín claro que no medellín hay una

play48:05

cantidad determinada hay una cantidad

play48:07

que se puede contar la cantidad de

play48:09

vehículos determinada por lo tanto a

play48:13

estas muestras esta muestra que tenemos

play48:15

aquí se dice que se puede aplicar para

play48:18

poblaciones infinitas pero qué pasa

play48:22

cuando la población es finita es decir

play48:25

hay un número determinado como se hace

play48:28

el muestreo para poblaciones finitas y

play48:32

con una desviación estándar conocida

play48:35

entonces tenemos que partir del muestreo

play48:38

con poblaciones infinitas y desviaciones

play48:41

estándar conocidas cuál es o sea que

play48:43

partimos de esta fórmula pero ya no le

play48:46

vamos a llamar n sino que le llamamos n

play48:48

sub 0 pero cuando conocemos la población

play48:53

n tenemos que hacer un ajuste a esta

play48:57

muestra tenemos que ajustarla cuando yo

play49:00

conozco el tamaño de la población y cómo

play49:03

se ajusta la nueva muestra ajustada al

play49:07

tamaño de la población está dada por n

play49:10

sub 0 sobre uno más en el sub 0 sobre n

play49:15

mayúscula que es l mayúscula el tamaño

play49:18

de la población menos 1

play49:20

entonces hagámoslo para medellín cuántos

play49:24

vehículos hay en medellín a partir de en

play49:27

la cantidad de vehículos en medellín que

play49:29

según la secretaria de movilidad son 836

play49:33

mil vehículos sin contar motocicletas

play49:36

solamente vehículos es decir automóviles

play49:40

pueden ser compactos pueden ser

play49:42

automóviles sedán pueden ser suburban

play49:45

pueden ser

play49:47

camioneta cierto hay 836.000 de esos

play49:52

vehículos sin contar buses camiones y

play49:54

motocicletas ahora determina el tamaño

play49:57

de la muestra para un error del 1%

play50:01

si con un nivel de confianza del 95

play50:04

entonces para el nivel de confianza del

play50:06

95

play50:09

aquí tendríamos que verificar que en el

play50:14

sub 0 en 1258

play50:18

en el sub zero en mil 2000 ln sub zero

play50:21

el n 0

play50:24

este en cero en 1258 dividido entre uno

play50:29

más en cero que en 1258 sobre n que es

play50:35

el tamaño de la población 836.000

play50:39

restándole este n al hacer esta división

play50:44

a 1.258 menos este dato daría 0 0 015 al

play50:50

sumar esto y hacer esta división daría

play50:53

mil 256 vehículos cuántos cuántos

play50:57

vehículos tendríamos que analizar ya no

play51:01

serían 1.258 5.256 al hacer el ajuste

play51:07

resulta que la diferencia solamente son

play51:09

dos carros de menos si lo notan son dos

play51:13

carros de menos por lo tanto no tiene

play51:16

sentido hacer un ajuste al a la muestra

play51:20

y trabajar con 1.256 anteriormente era

play51:24

1.258 ahora queda menos 156 porque no

play51:27

tiene sentido porque la variación es muy

play51:29

pequeña y porque es muy pequeña porque

play51:32

la población es muy grande cuando las

play51:34

poblaciones cuando el tamaño de n

play51:38

es cien mil o más de cien mil tomen

play51:41

notas sobre esto cuando las poblaciones

play51:43

tienen valores de 100.000 o mayores a

play51:46

100.000 entonces se dice que la

play51:51

población es infinita y cuando la

play51:54

población es infinita entonces es mejor

play51:55

trabajar con el cero

play52:05

[Música]

Rate This

5.0 / 5 (0 votes)

Étiquettes Connexes
Inferencia EstadísticaEstimaciónPoblacionalMuestraDesviación EstándarMediaConfianzaHipótesisInvestigaciónAnálisis de DatosMuestreo Aleatorio
Besoin d'un résumé en anglais ?