Distribución T de Student

Vinicio Martinez Monroy
27 Aug 201911:25

Summary

TLDREste video tutorial explica cómo utilizar la distribución t de Student para tomar decisiones estadísticas cuando se tienen menos de 30 datos. Se describen las condiciones para su uso, como una muestra pequeña y una población normal o casi normal. Se ilustra con un ejemplo de auditoría de facturas, donde se muestra cómo calcular un intervalo de confianza del 95% y determinar si una factura está inflada. Se detalla el proceso de cálculo de alfa, los grados de libertad y cómo aplicar la fórmula para determinar si la muestra es aceptable, concluyendo con cómo realizar estos cálculos en Excel.

Takeaways

  • 📚 La distribución t de Student es útil cuando no se tienen suficientes datos (menos de 30) para aplicar una distribución normal.
  • 🔍 Se utiliza la distribución t en tres casos: muestra pequeña, desviación estándar desconocida y población normal o casi normal.
  • 👀 Un ejemplo práctico es la auditoría de facturas para determinar si una factura fue inflada, tomando una muestra de 12 facturas.
  • 📉 La media y la desviación estándar de la muestra son clave para calcular el intervalo de confianza y determinar si una factura es atípica.
  • 📊 Se utiliza un intervalo de confianza del 95% para determinar un grado de error aceptable en el análisis de datos.
  • 🎯 El valor alfa (α) es el riesgo del experimento y se calcula como 1 - el intervalo de confianza, dividido entre 2.
  • 🔢 Los grados de libertad se calculan como la cantidad de datos (n) menos 1, y son importantes para la distribución t.
  • 📚 Se utiliza la tabla de la distribución t para encontrar el coeficiente t correspondiente a los grados de libertad y el alfa.
  • 🔧 Se despeja una fórmula para determinar el rango aceptable de la media de la muestra, comparándola con la media poblacional.
  • 📉 El análisis muestra que si la factura está dentro del rango calculado, es considerada aceptable con un 95% de confianza.
  • 💻 En Excel, se pueden utilizar fórmulas específicas para calcular el intervalo de confianza y el coeficiente t, facilitando el análisis.

Q & A

  • ¿Qué distribución se utiliza cuando no se puede obtener una muestra grande de datos?

    -Se utiliza la distribución t de Student cuando no se puede obtener una muestra grande de datos, es decir, cuando se tienen menos de 30 observaciones.

  • ¿Cuáles son las condiciones para aplicar la distribución t de Student?

    -Las condiciones para aplicar la distribución t de Student son: la muestra es pequeña, la división estándar de la población es desconocida y la población es normal o casi normal.

  • ¿Cómo se determina si una factura ha sido inflada según el ejemplo del script?

    -Se determina si una factura ha sido inflada tomando una muestra de facturas, calculando su media y desviación estándar, y utilizando un intervalo de confianza del 95% para comparar si el monto de la factura en cuestión está dentro del rango aceptable.

  • ¿Qué es alfa y cómo se calcula en el contexto del script?

    -Alfa es el riesgo del experimento y se calcula como 1 - el intervalo de confianza dividido por 2. Por ejemplo, para un intervalo de confianza del 95%, alfa sería 0.025.

  • ¿Qué son los grados de libertad y cómo se calculan en el ejemplo del script?

    -Los grados de libertad son un concepto utilizado en la estadística que, en el ejemplo, se calculan como el tamaño de la muestra (n) menos 1. En el caso de 12 facturas, los grados de libertad serían 11.

  • ¿Cómo se determina el coeficiente t para la distribución t de Student?

    -El coeficiente t se determina a partir de la tabla de la distribución t de Student, buscando el valor correspondiente a los grados de libertad y el alfa correspondiente.

  • ¿Cómo se utiliza la fórmula para determinar si la muestra es aceptable según la distribución t de Student?

    -La muestra es aceptable si la media de la muestra está dentro del rango formado por la media de la población más o menos el coeficiente t multiplicado por la desviación estándar dividido por la raíz cuadrada del tamaño de la muestra.

  • ¿Cómo se calcula el intervalo de confianza para una distribución t de Student en Excel?

    -En Excel, se utiliza la fórmula 'INTERVALO_DE_CONFIANZA.T' (o 'CONFIDENCE.T' en inglés), donde se especifica alfa, la desviación estándar y el tamaño de la muestra para obtener el coeficiente t.

  • ¿Qué significa que el valor de una factura de 1.150 está dentro del rango aceptado según el análisis del script?

    -Que el valor de la factura de 1.150 está dentro del rango aceptado indica que, con un intervalo de confianza del 95%, es probable que la factura no haya sido inflada y corresponde a los datos normales de la empresa.

  • ¿Cómo se puede aplicar este análisis en Excel para obtener una solución rápida?

    -Para aplicar este análisis en Excel, se definen los valores de alfa, la desviación estándar y el tamaño de la muestra, y luego se utiliza la fórmula 'INTERVALO_DE_CONFIANZA.T' para obtener el coeficiente t y determinar el rango aceptado para la muestra.

Outlines

00:00

📊 Análisis de Distribuciones de Probabilidad

El primer párrafo introduce la serie de videos sobre cálculos de distribuciones de probabilidad para tomar decisiones. Se centra en la distribución t de Student, útil cuando la muestra es pequeña (menos de 30 datos) y no se conoce el estándar de la población. Se presenta un ejemplo de auditores que analizan facturas para determinar si están infladas, utilizando una muestra de 12 facturas con una media de 1275 y una desviación estándar de 235. Se calcula un intervalo de confianza del 95% para determinar si la factura de 1150 es consistente con la muestra o no, utilizando el valor alfa correspondiente al riesgo del experimento.

05:02

🔍 Uso de la Distribución t en un Ejemplo

El segundo párrafo explica cómo aplicar la distribución t en el ejemplo de las facturas. Se detalla el proceso de encontrar el coeficiente t en una tabla de distribución t, utilizando los grados de libertad (n-1) y el valor de alfa determinado por el intervalo de confianza. Se calcula el rango aceptable para la media de las facturas, comparando el valor de la factura sospechosa de 1150 con este rango. El resultado muestra que la factura está dentro del intervalo aceptable, lo que sugiere que no está inflada y es coherente con los datos de la muestra.

10:04

🛠️ Aplicación de la Distribución t en Excel

El tercer párrafo describe cómo realizar el mismo análisis en Excel. Se menciona la fórmula 'intervalo confianza t' para calcular el coeficiente t, utilizando el valor alfa, la desviación estándar y el tamaño de la muestra. Se reitera el rango aceptable para la media de las facturas, confirmando que la factura de 1150 es aceptable dentro de un intervalo de confianza del 95%. El video tutorial concluye con una revisión de cómo se puede validar o descartar la validez de un dato utilizando la distribución t.

Mindmap

Keywords

💡Distribución t de Student

La distribución t de Student es una distribución de probabilidad continua utilizada en estadística cuando se tienen muestras pequeñas y no se conoce la desviación estándar de la población. En el video, se menciona que es útil cuando no se tienen más de 30 datos y se necesita tomar decisiones con información limitada, como en el caso de los auditores que analizaron las facturas.

💡Muestra pequeña

Una muestra pequeña se refiere a una cantidad limitada de datos que no es representativa de toda la población. En el contexto del video, los auditores solo tomaron una muestra de 12 facturas debido a la urgencia de la situación, lo que les llevó a utilizar la distribución t de Student para su análisis.

💡Desviación estándar desconocida

La desviación estándar desconocida hace referencia a que no se conoce la variabilidad típica de la población. En el video, esta es una de las premisas para utilizar la distribución t de Student, ya que los datos de la muestra de 12 facturas no pueden revelar la desviación estándar de la población completa.

💡Población normal o casi normal

Una población normal o casi normal es aquella cuyos datos se distribuyen de manera simétrica alrededor de la media, con la forma de una campana de Gauss. En el video, se asume que la población de datos de las facturas es normal o se comporta de manera relativamente normal, lo que justifica el uso de la distribución t de Student.

💡Intervalo de confianza

El intervalo de confianza es un rango de valores que, con un cierto nivel de seguridad, contiene el valor real de la población. En el video, se utiliza un intervalo de confianza del 95% para determinar si la factura de 1150 es inflada o no, basándose en la muestra de 12 facturas analizadas.

💡Alfa

El alfa, también conocido como nivel de significancia, es la probabilidad de rechazar la hipótesis nula cuando es verdadera. En el video, se calcula alfa como 0.05, lo que indica el riesgo de concluir incorrectamente que una factura está inflada cuando en realidad no lo está.

💡Grados de libertad

Los grados de libertad son un concepto utilizado en la estadística que indica el número de observaciones independientes en una muestra. En el video, se calcula como n - 1, siendo n el tamaño de la muestra, y en este caso es 11, lo que se utiliza para encontrar el valor del coeficiente t en la distribución t de Student.

💡Coeficiente t

El coeficiente t es un valor utilizado en la fórmula de la distribución t de Student para determinar el rango de valores aceptables para la media de una muestra. En el video, se encuentra el valor de 2.2010 para los grados de libertad y el alfa, que se utiliza para calcular el rango de la media de las facturas.

💡Excel

Excel es una hoja de cálculo electrónica que se utiliza para realizar cálculos y análisis estadísticos. En el video, se menciona el uso de Excel para calcular el intervalo de confianza y el coeficiente t, facilitando el proceso de análisis de datos y toma de decisiones.

💡Intervalo de confianza t

El intervalo de confianza t es una fórmula en Excel que permite calcular el intervalo de confianza para una muestra, utilizando la distribución t de Student. En el video, se utiliza esta fórmula para determinar si la factura de 1150 está dentro del rango aceptable basándose en la muestra de 12 facturas.

Highlights

Se presenta una serie de videos sobre cálculos de distribuciones de probabilidad para tomar decisiones.

La distribución t de Student es útil cuando no se tienen suficientes datos para una distribución normal.

Se aplica la distribución t de Student con muestras pequeñas y cuando la desviación estándar de la población es desconocida.

La distribución t se usa cuando la población es normal o casi normal.

Ejemplo práctico: auditores analizan si una factura fue inflada tomando una muestra de 12 facturas.

Se describe cómo calcular el intervalo de confianza del 95% para determinar si una factura es inflada.

El alfa se calcula como el riesgo del experimento y es usado para determinar el intervalo de confianza.

Se explica cómo calcular los grados de libertad usando la fórmula n-1.

Se utiliza la tabla de la distribución t para encontrar el coeficiente t correspondiente a los grados de libertad y alfa.

La fórmula para determinar si una muestra es aceptable se describe en detalle.

Se calcula el rango de facturas aceptables usando la fórmula de la distribución t.

Se determina que la factura de 1.150 está dentro del rango aceptable con un intervalo de confianza del 95%.

Se discute cómo trabajar con la distribución t en Excel para calcular el intervalo de confianza.

Se menciona la fórmula 'intervalo de confianza t' en Excel para calcular el coeficiente t.

Se resume cómo usar la media y el rango calculado en Excel para determinar la aceptabilidad de una factura.

El video finaliza con una revisión de cómo se puede medir y validar la validez de un dato usando la distribución t.

Transcripts

play00:00

saludos colegas en esta serie de vídeo

play00:03

todos reales

play00:04

veremos cómo realizar los cálculos para

play00:07

obtener información y toma decisiones a

play00:09

través de distribuciones de probabilidad

play00:11

como lo son la instrucción de estudio si

play00:14

cuadra génova comencemos con la

play00:16

distribución td student

play00:19

esta distribución es útil cuando en

play00:23

no podemos obtener una cantidad de datos

play00:27

no podemos tomar una muestra bastante

play00:29

grande por ejemplo tenemos menos de 30

play00:32

observación es decir no tenemos más de

play00:34

30 datos entonces no podemos aplicar una

play00:37

distribución normal porque es poco

play00:39

representativa esta cantidad de datos

play00:41

entonces para estos casos nosotros

play00:44

utilizamos la instrucción te des cuenta

play00:47

en qué momentos es cuando utilizamos

play00:49

esta distribución bajo tres premisas la

play00:52

muestra es pequeña la división de

play00:54

estándar de la población es desconocida

play00:57

y la población es normal o casi normal

play01:00

es decir los datos siempre se comportan

play01:02

de una manera normal o relativamente

play01:05

normal

play01:06

veamos un ejemplo

play01:08

tenemos un grupo de auditores que

play01:11

reciben las facturas y desea comprobar

play01:13

si esta factura fue inflada es decir por

play01:16

un monto mayor a los gastos normales la

play01:19

factura tiene un monto de 1150

play01:22

a los auditores les parece que ese monto

play01:25

no es el mundo común y que sobresale lo

play01:28

normalmente facturado entonces no tienen

play01:30

mucho tiempo para realizar una auditoría

play01:32

por lo que toman una muestra de 12

play01:34

facturas para poder analizar el caso

play01:39

en base a esas 12 facturas se obtiene

play01:42

una información de la muestra se obtiene

play01:44

una media de 1.275 y una desviación de

play01:48

estándar de 235 se utiliza con un

play01:51

intervalo de confianza del 95% y en base

play01:55

a este análisis previo queremos saber si

play01:58

la factura realmente fue inflada y no es

play02:02

un dato real o bien corresponde a los

play02:05

datos que si se pueden manejar dentro de

play02:08

la empresa

play02:09

entonces acá en este tipo de

play02:13

experimentos manejamos un intervalo de

play02:15

confianza para saber un cierto grado de

play02:18

error si estamos dispuestos a aceptar un

play02:21

grado de error y asumimos que la

play02:23

información es cierta o es falsa no

play02:27

sabemos exactamente si qué valor

play02:29

esperaríamos o que podríamos que

play02:32

patrones a futuro como en otras

play02:33

distribuciones entonces vamos a tener un

play02:37

alfa que va a ser el riesgo del

play02:40

experimento esta variable obviamente nos

play02:43

va a servir para el cálculo de la

play02:45

distribución nos va a servir para buscar

play02:47

un intervalo y como nosotros vamos a

play02:51

estar tomando en este caso

play02:54

y un rango de facturas aceptadas vamos a

play02:57

estar utilizando prácticamente de los

play03:00

dos lados de la distribución

play03:05

límite es el límite va a ser el alfa que

play03:08

nosotros vamos a estar manejando

play03:11

ok

play03:13

teníamos

play03:15

anteriormente que el intervalo de

play03:18

confianza iba a ser del 95% ese

play03:21

intervalo de confianza nos va a servir

play03:23

para calcular alfa entonces alfa partido

play03:27

2 va a ser igual a uno menos el

play03:31

intervalo de confianza que 0.95 partido

play03:35

2-1 menos 0.95 notas 0.05 2 y cuando lo

play03:40

vivimos centro de 2 nos da una alfa de

play03:42

0.0 25 porque lo dijimos dentro de 2

play03:45

porque vamos a estar utilizando un rango

play03:49

si se recuerda cuando hablamos de la

play03:51

distribución normal podríamos hacer

play03:53

distribuciones mayor que en la cual nos

play03:56

interesaba los datos a partir de el

play03:58

valor par en adelante

play04:01

menor que cuando buscamos los valores

play04:04

que eran menores y cuando era un rango

play04:07

básicamente lo que hacíamos era un

play04:09

sanguchito un extremo quitamos y otro

play04:11

que seamos quitamos y lo que nos queda

play04:13

en medio es el intervalo en este caso

play04:15

como nos interesa ver un rango

play04:17

intermedio de facturas también vamos a

play04:19

estar haciendo eso y por eso idiomas 2

play04:21

entonces nuestro primer valor alfa va a

play04:24

ser cero punto 025 repito tenemos que

play04:27

restar 1 - y el intervalo de confianza /

play04:30

2 y ese va a ser nuestro valor alto

play04:32

también necesitamos la información de

play04:35

los grados de libertad los grados de

play04:37

libertad va a estar dado por la fórmula

play04:39

n menos 1 siendo n la cantidad de datos

play04:43

en el ejemplo decía que se tomaba 12

play04:47

facturas entonces n que es el tamaño de

play04:50

la muestra va a ser 12 entonces la

play04:53

fórmula para grados de libertad es igual

play04:54

a enel -1 lo cual es 12 - 1 y la fórmula

play04:58

grado de libertad es 11

play05:01

con base a esos datos nosotros nos vamos

play05:04

a nuestra tablita de la información de

play05:07

la distribución de estudio vamos a

play05:10

ubicar primero dónde están los grados de

play05:13

libertad sabíamos que los grados de

play05:15

libertad o gl era 11 entonces vemos que

play05:18

nuestra respuesta o nuestro coeficiente

play05:21

para ayudarnos va a estar acá y luego

play05:24

sabíamos que nuestro alfa era de 0

play05:26

puntos 0 25

play05:29

entonces él

play05:30

valor que nos va a ayudar a calcular la

play05:33

información va a estar en el cruce entre

play05:35

los grados de libertad y el criterio

play05:38

alfa que es 2.20 10 ahora bien qué

play05:42

hacemos con eso tenemos una fórmula en

play05:46

la cual la muestra va a ser aceptable

play05:50

cuando la media sea igual a x de la

play05:54

población x de la muestra perdón más

play05:57

menos el valor del coeficiente t por la

play06:01

desviación estándar partido la real raíz

play06:04

cuadrada del tamaño de la muestra

play06:06

entonces empezamos a despejar valores x

play06:10

va a ser la media de la muestra sabíamos

play06:13

que la media de la muestra era 1.275

play06:16

porque regresamos otra vez a los datos

play06:19

media de 1.275 desviación estándar de

play06:23

235 12 facturas entonces simplemente

play06:27

nuestra fórmula vamos a venir y vamos a

play06:30

despejar eso

play06:32

es decir x se convierte en 1235 más o

play06:37

menos el coeficiente t si se recuerdan

play06:41

nos había quedado dos puntos 2010 pues

play06:43

utilizamos 2 punto 2010 por la

play06:48

desviación estándar dividido la raíz

play06:51

cuadrada del tamaño la muestra entonces

play06:53

cuando despejamos este lado derecho de

play06:57

la fórmula nos queda 149 puntos 31 más

play07:01

la media 1.275 como es más menos eso no

play07:05

significa así como cuando hablábamos de

play07:07

la dirección estándar que las facturas

play07:11

pueden variar desde 1935 más 149 31 o

play07:15

menos 141 a 31 entonces que se refiere a

play07:18

esto 1.275 más 149 31 mil 424 31

play07:27

1.275 -149 31 nos va a dar mil 125 punto

play07:32

69 entonces estos valores nos indican la

play07:37

media que esperaríamos de las facturas

play07:39

resulta que nosotros tenemos una factura

play07:42

volvamos a través de nuestro inciso de

play07:45

qué valor nos decía que la factura de

play07:48

1.150 entonces este valor de 1.150 se

play07:54

encuentra entre el rango de mil 125 69 a

play07:57

1.424 31 que significa que el valor es

play08:02

aceptable o sea si se excediera a esto o

play08:06

esto significa que realmente la factura

play08:08

fue alterada y no corresponde con la

play08:11

muestra entonces la respuesta que

play08:13

tenemos es

play08:15

el valor de la factura de 1.150 está en

play08:18

el rango aceptado con un intervalo de

play08:20

confianza el 95% entonces con esta

play08:23

desviación lo único que incluimos es ok

play08:26

el dato es posible entonces nosotros acá

play08:29

podemos calcular a bueno es la venta

play08:31

posible es el tiempo posible es la

play08:34

cantidad de algo que queremos medir

play08:36

posible y si o no únicamente es lo que

play08:40

podemos medir ahora bien como trabajamos

play08:43

esto en excel

play08:46

bueno ustedes pueden tener

play08:49

una una hojita de excel en la que

play08:53

realicen

play08:56

como vimos con los anteriores

play08:58

distribuciones las variables necesarias

play09:00

que les pueden ayudar entonces

play09:02

necesitamos definir un valor alfa en

play09:06

este caso es uno menos el intervalo de

play09:09

confianza porque no lo dividimos entre

play09:11

dos acá porque excel con la fórmula del

play09:14

intervalo de confianza para la

play09:17

distribución de the student y una vez

play09:19

hace ese cálculo intermedio es decir

play09:22

dejar como habíamos visto una gráfica un

play09:27

rango para acá y otro rango para acá y

play09:30

ya no es necesario que hagamos

play09:33

el cálculo divididos entonces nuestro

play09:36

alfa va a ser uno menos el intervalo de

play09:38

confianza si teníamos 95 de intervalo de

play09:41

confianza 1 - 0 puntos 95 la desviación

play09:44

estándar teníamos que era 235 el tamaño

play09:47

de la muestra era 12 entonces vamos a

play09:50

estar utilizando la fórmula intervalo

play09:53

punto confianza punto t

play09:55

si se excede estuviera en inglés la

play09:57

fórmula a ser confidence punto t

play10:01

entonces empezamos a hacer la fórmula

play10:04

intervalo confianza t probablemente para

play10:07

los que tienen versiones antiguas de

play10:09

excel y no les va a parecer simplemente

play10:10

la intervalo de confianza que es la

play10:12

misma en 3

play10:13

intervalo de confianza t nos pide como

play10:15

pri el parámetro alfa como segundo

play10:18

parámetro la desviación estándar y como

play10:21

tercer parámetro el tamaño de la muestra

play10:23

cerramos paréntesis y nos tira el valor

play10:27

del coeficiente t que era 149 31 así se

play10:32

fijan ya nos hizo todo este cálculo de

play10:35

este lado ahora bien se recuerdan que

play10:38

hicimos

play10:40

identificamos el rango en el que podía

play10:42

estar la factura aceptada tomamos en

play10:45

cuenta que la media es mil 275

play10:49

y con esto ya sabemos que la factura es

play10:52

aceptable en 325 puntos 69 y 1400 24.31

play10:58

mil 125 puntos 69 mil 424 puntos 31

play11:04

entonces de esa manera es como nosotros

play11:07

trabajamos en excel la distribución de

play11:09

esta distribución vuelvo a repetir sólo

play11:12

nos sirve para descartar o afirmar que

play11:15

un dato es válido y se puede darlo o no

play11:20

saludos colegas hasta aquí este vídeo

play11:23

tutorial

Rate This

5.0 / 5 (0 votes)

Related Tags
ProbabilidadDistribuciónStudentAuditoríaDecisiónConfianzaIntervaloEstadísticaAnálisisExcel
Do you need a summary in English?