Distribución T de Student
Summary
TLDREste video tutorial explica cómo utilizar la distribución t de Student para tomar decisiones estadísticas cuando se tienen menos de 30 datos. Se describen las condiciones para su uso, como una muestra pequeña y una población normal o casi normal. Se ilustra con un ejemplo de auditoría de facturas, donde se muestra cómo calcular un intervalo de confianza del 95% y determinar si una factura está inflada. Se detalla el proceso de cálculo de alfa, los grados de libertad y cómo aplicar la fórmula para determinar si la muestra es aceptable, concluyendo con cómo realizar estos cálculos en Excel.
Takeaways
- 📚 La distribución t de Student es útil cuando no se tienen suficientes datos (menos de 30) para aplicar una distribución normal.
- 🔍 Se utiliza la distribución t en tres casos: muestra pequeña, desviación estándar desconocida y población normal o casi normal.
- 👀 Un ejemplo práctico es la auditoría de facturas para determinar si una factura fue inflada, tomando una muestra de 12 facturas.
- 📉 La media y la desviación estándar de la muestra son clave para calcular el intervalo de confianza y determinar si una factura es atípica.
- 📊 Se utiliza un intervalo de confianza del 95% para determinar un grado de error aceptable en el análisis de datos.
- 🎯 El valor alfa (α) es el riesgo del experimento y se calcula como 1 - el intervalo de confianza, dividido entre 2.
- 🔢 Los grados de libertad se calculan como la cantidad de datos (n) menos 1, y son importantes para la distribución t.
- 📚 Se utiliza la tabla de la distribución t para encontrar el coeficiente t correspondiente a los grados de libertad y el alfa.
- 🔧 Se despeja una fórmula para determinar el rango aceptable de la media de la muestra, comparándola con la media poblacional.
- 📉 El análisis muestra que si la factura está dentro del rango calculado, es considerada aceptable con un 95% de confianza.
- 💻 En Excel, se pueden utilizar fórmulas específicas para calcular el intervalo de confianza y el coeficiente t, facilitando el análisis.
Q & A
¿Qué distribución se utiliza cuando no se puede obtener una muestra grande de datos?
-Se utiliza la distribución t de Student cuando no se puede obtener una muestra grande de datos, es decir, cuando se tienen menos de 30 observaciones.
¿Cuáles son las condiciones para aplicar la distribución t de Student?
-Las condiciones para aplicar la distribución t de Student son: la muestra es pequeña, la división estándar de la población es desconocida y la población es normal o casi normal.
¿Cómo se determina si una factura ha sido inflada según el ejemplo del script?
-Se determina si una factura ha sido inflada tomando una muestra de facturas, calculando su media y desviación estándar, y utilizando un intervalo de confianza del 95% para comparar si el monto de la factura en cuestión está dentro del rango aceptable.
¿Qué es alfa y cómo se calcula en el contexto del script?
-Alfa es el riesgo del experimento y se calcula como 1 - el intervalo de confianza dividido por 2. Por ejemplo, para un intervalo de confianza del 95%, alfa sería 0.025.
¿Qué son los grados de libertad y cómo se calculan en el ejemplo del script?
-Los grados de libertad son un concepto utilizado en la estadística que, en el ejemplo, se calculan como el tamaño de la muestra (n) menos 1. En el caso de 12 facturas, los grados de libertad serían 11.
¿Cómo se determina el coeficiente t para la distribución t de Student?
-El coeficiente t se determina a partir de la tabla de la distribución t de Student, buscando el valor correspondiente a los grados de libertad y el alfa correspondiente.
¿Cómo se utiliza la fórmula para determinar si la muestra es aceptable según la distribución t de Student?
-La muestra es aceptable si la media de la muestra está dentro del rango formado por la media de la población más o menos el coeficiente t multiplicado por la desviación estándar dividido por la raíz cuadrada del tamaño de la muestra.
¿Cómo se calcula el intervalo de confianza para una distribución t de Student en Excel?
-En Excel, se utiliza la fórmula 'INTERVALO_DE_CONFIANZA.T' (o 'CONFIDENCE.T' en inglés), donde se especifica alfa, la desviación estándar y el tamaño de la muestra para obtener el coeficiente t.
¿Qué significa que el valor de una factura de 1.150 está dentro del rango aceptado según el análisis del script?
-Que el valor de la factura de 1.150 está dentro del rango aceptado indica que, con un intervalo de confianza del 95%, es probable que la factura no haya sido inflada y corresponde a los datos normales de la empresa.
¿Cómo se puede aplicar este análisis en Excel para obtener una solución rápida?
-Para aplicar este análisis en Excel, se definen los valores de alfa, la desviación estándar y el tamaño de la muestra, y luego se utiliza la fórmula 'INTERVALO_DE_CONFIANZA.T' para obtener el coeficiente t y determinar el rango aceptado para la muestra.
Outlines
📊 Análisis de Distribuciones de Probabilidad
El primer párrafo introduce la serie de videos sobre cálculos de distribuciones de probabilidad para tomar decisiones. Se centra en la distribución t de Student, útil cuando la muestra es pequeña (menos de 30 datos) y no se conoce el estándar de la población. Se presenta un ejemplo de auditores que analizan facturas para determinar si están infladas, utilizando una muestra de 12 facturas con una media de 1275 y una desviación estándar de 235. Se calcula un intervalo de confianza del 95% para determinar si la factura de 1150 es consistente con la muestra o no, utilizando el valor alfa correspondiente al riesgo del experimento.
🔍 Uso de la Distribución t en un Ejemplo
El segundo párrafo explica cómo aplicar la distribución t en el ejemplo de las facturas. Se detalla el proceso de encontrar el coeficiente t en una tabla de distribución t, utilizando los grados de libertad (n-1) y el valor de alfa determinado por el intervalo de confianza. Se calcula el rango aceptable para la media de las facturas, comparando el valor de la factura sospechosa de 1150 con este rango. El resultado muestra que la factura está dentro del intervalo aceptable, lo que sugiere que no está inflada y es coherente con los datos de la muestra.
🛠️ Aplicación de la Distribución t en Excel
El tercer párrafo describe cómo realizar el mismo análisis en Excel. Se menciona la fórmula 'intervalo confianza t' para calcular el coeficiente t, utilizando el valor alfa, la desviación estándar y el tamaño de la muestra. Se reitera el rango aceptable para la media de las facturas, confirmando que la factura de 1150 es aceptable dentro de un intervalo de confianza del 95%. El video tutorial concluye con una revisión de cómo se puede validar o descartar la validez de un dato utilizando la distribución t.
Mindmap
Keywords
💡Distribución t de Student
💡Muestra pequeña
💡Desviación estándar desconocida
💡Población normal o casi normal
💡Intervalo de confianza
💡Alfa
💡Grados de libertad
💡Coeficiente t
💡Excel
💡Intervalo de confianza t
Highlights
Se presenta una serie de videos sobre cálculos de distribuciones de probabilidad para tomar decisiones.
La distribución t de Student es útil cuando no se tienen suficientes datos para una distribución normal.
Se aplica la distribución t de Student con muestras pequeñas y cuando la desviación estándar de la población es desconocida.
La distribución t se usa cuando la población es normal o casi normal.
Ejemplo práctico: auditores analizan si una factura fue inflada tomando una muestra de 12 facturas.
Se describe cómo calcular el intervalo de confianza del 95% para determinar si una factura es inflada.
El alfa se calcula como el riesgo del experimento y es usado para determinar el intervalo de confianza.
Se explica cómo calcular los grados de libertad usando la fórmula n-1.
Se utiliza la tabla de la distribución t para encontrar el coeficiente t correspondiente a los grados de libertad y alfa.
La fórmula para determinar si una muestra es aceptable se describe en detalle.
Se calcula el rango de facturas aceptables usando la fórmula de la distribución t.
Se determina que la factura de 1.150 está dentro del rango aceptable con un intervalo de confianza del 95%.
Se discute cómo trabajar con la distribución t en Excel para calcular el intervalo de confianza.
Se menciona la fórmula 'intervalo de confianza t' en Excel para calcular el coeficiente t.
Se resume cómo usar la media y el rango calculado en Excel para determinar la aceptabilidad de una factura.
El video finaliza con una revisión de cómo se puede medir y validar la validez de un dato usando la distribución t.
Transcripts
saludos colegas en esta serie de vídeo
todos reales
veremos cómo realizar los cálculos para
obtener información y toma decisiones a
través de distribuciones de probabilidad
como lo son la instrucción de estudio si
cuadra génova comencemos con la
distribución td student
esta distribución es útil cuando en
no podemos obtener una cantidad de datos
no podemos tomar una muestra bastante
grande por ejemplo tenemos menos de 30
observación es decir no tenemos más de
30 datos entonces no podemos aplicar una
distribución normal porque es poco
representativa esta cantidad de datos
entonces para estos casos nosotros
utilizamos la instrucción te des cuenta
en qué momentos es cuando utilizamos
esta distribución bajo tres premisas la
muestra es pequeña la división de
estándar de la población es desconocida
y la población es normal o casi normal
es decir los datos siempre se comportan
de una manera normal o relativamente
normal
veamos un ejemplo
tenemos un grupo de auditores que
reciben las facturas y desea comprobar
si esta factura fue inflada es decir por
un monto mayor a los gastos normales la
factura tiene un monto de 1150
a los auditores les parece que ese monto
no es el mundo común y que sobresale lo
normalmente facturado entonces no tienen
mucho tiempo para realizar una auditoría
por lo que toman una muestra de 12
facturas para poder analizar el caso
en base a esas 12 facturas se obtiene
una información de la muestra se obtiene
una media de 1.275 y una desviación de
estándar de 235 se utiliza con un
intervalo de confianza del 95% y en base
a este análisis previo queremos saber si
la factura realmente fue inflada y no es
un dato real o bien corresponde a los
datos que si se pueden manejar dentro de
la empresa
entonces acá en este tipo de
experimentos manejamos un intervalo de
confianza para saber un cierto grado de
error si estamos dispuestos a aceptar un
grado de error y asumimos que la
información es cierta o es falsa no
sabemos exactamente si qué valor
esperaríamos o que podríamos que
patrones a futuro como en otras
distribuciones entonces vamos a tener un
alfa que va a ser el riesgo del
experimento esta variable obviamente nos
va a servir para el cálculo de la
distribución nos va a servir para buscar
un intervalo y como nosotros vamos a
estar tomando en este caso
y un rango de facturas aceptadas vamos a
estar utilizando prácticamente de los
dos lados de la distribución
límite es el límite va a ser el alfa que
nosotros vamos a estar manejando
ok
teníamos
anteriormente que el intervalo de
confianza iba a ser del 95% ese
intervalo de confianza nos va a servir
para calcular alfa entonces alfa partido
2 va a ser igual a uno menos el
intervalo de confianza que 0.95 partido
2-1 menos 0.95 notas 0.05 2 y cuando lo
vivimos centro de 2 nos da una alfa de
0.0 25 porque lo dijimos dentro de 2
porque vamos a estar utilizando un rango
si se recuerda cuando hablamos de la
distribución normal podríamos hacer
distribuciones mayor que en la cual nos
interesaba los datos a partir de el
valor par en adelante
menor que cuando buscamos los valores
que eran menores y cuando era un rango
básicamente lo que hacíamos era un
sanguchito un extremo quitamos y otro
que seamos quitamos y lo que nos queda
en medio es el intervalo en este caso
como nos interesa ver un rango
intermedio de facturas también vamos a
estar haciendo eso y por eso idiomas 2
entonces nuestro primer valor alfa va a
ser cero punto 025 repito tenemos que
restar 1 - y el intervalo de confianza /
2 y ese va a ser nuestro valor alto
también necesitamos la información de
los grados de libertad los grados de
libertad va a estar dado por la fórmula
n menos 1 siendo n la cantidad de datos
en el ejemplo decía que se tomaba 12
facturas entonces n que es el tamaño de
la muestra va a ser 12 entonces la
fórmula para grados de libertad es igual
a enel -1 lo cual es 12 - 1 y la fórmula
grado de libertad es 11
con base a esos datos nosotros nos vamos
a nuestra tablita de la información de
la distribución de estudio vamos a
ubicar primero dónde están los grados de
libertad sabíamos que los grados de
libertad o gl era 11 entonces vemos que
nuestra respuesta o nuestro coeficiente
para ayudarnos va a estar acá y luego
sabíamos que nuestro alfa era de 0
puntos 0 25
entonces él
valor que nos va a ayudar a calcular la
información va a estar en el cruce entre
los grados de libertad y el criterio
alfa que es 2.20 10 ahora bien qué
hacemos con eso tenemos una fórmula en
la cual la muestra va a ser aceptable
cuando la media sea igual a x de la
población x de la muestra perdón más
menos el valor del coeficiente t por la
desviación estándar partido la real raíz
cuadrada del tamaño de la muestra
entonces empezamos a despejar valores x
va a ser la media de la muestra sabíamos
que la media de la muestra era 1.275
porque regresamos otra vez a los datos
media de 1.275 desviación estándar de
235 12 facturas entonces simplemente
nuestra fórmula vamos a venir y vamos a
despejar eso
es decir x se convierte en 1235 más o
menos el coeficiente t si se recuerdan
nos había quedado dos puntos 2010 pues
utilizamos 2 punto 2010 por la
desviación estándar dividido la raíz
cuadrada del tamaño la muestra entonces
cuando despejamos este lado derecho de
la fórmula nos queda 149 puntos 31 más
la media 1.275 como es más menos eso no
significa así como cuando hablábamos de
la dirección estándar que las facturas
pueden variar desde 1935 más 149 31 o
menos 141 a 31 entonces que se refiere a
esto 1.275 más 149 31 mil 424 31
1.275 -149 31 nos va a dar mil 125 punto
69 entonces estos valores nos indican la
media que esperaríamos de las facturas
resulta que nosotros tenemos una factura
volvamos a través de nuestro inciso de
qué valor nos decía que la factura de
1.150 entonces este valor de 1.150 se
encuentra entre el rango de mil 125 69 a
1.424 31 que significa que el valor es
aceptable o sea si se excediera a esto o
esto significa que realmente la factura
fue alterada y no corresponde con la
muestra entonces la respuesta que
tenemos es
el valor de la factura de 1.150 está en
el rango aceptado con un intervalo de
confianza el 95% entonces con esta
desviación lo único que incluimos es ok
el dato es posible entonces nosotros acá
podemos calcular a bueno es la venta
posible es el tiempo posible es la
cantidad de algo que queremos medir
posible y si o no únicamente es lo que
podemos medir ahora bien como trabajamos
esto en excel
bueno ustedes pueden tener
una una hojita de excel en la que
realicen
como vimos con los anteriores
distribuciones las variables necesarias
que les pueden ayudar entonces
necesitamos definir un valor alfa en
este caso es uno menos el intervalo de
confianza porque no lo dividimos entre
dos acá porque excel con la fórmula del
intervalo de confianza para la
distribución de the student y una vez
hace ese cálculo intermedio es decir
dejar como habíamos visto una gráfica un
rango para acá y otro rango para acá y
ya no es necesario que hagamos
el cálculo divididos entonces nuestro
alfa va a ser uno menos el intervalo de
confianza si teníamos 95 de intervalo de
confianza 1 - 0 puntos 95 la desviación
estándar teníamos que era 235 el tamaño
de la muestra era 12 entonces vamos a
estar utilizando la fórmula intervalo
punto confianza punto t
si se excede estuviera en inglés la
fórmula a ser confidence punto t
entonces empezamos a hacer la fórmula
intervalo confianza t probablemente para
los que tienen versiones antiguas de
excel y no les va a parecer simplemente
la intervalo de confianza que es la
misma en 3
intervalo de confianza t nos pide como
pri el parámetro alfa como segundo
parámetro la desviación estándar y como
tercer parámetro el tamaño de la muestra
cerramos paréntesis y nos tira el valor
del coeficiente t que era 149 31 así se
fijan ya nos hizo todo este cálculo de
este lado ahora bien se recuerdan que
hicimos
identificamos el rango en el que podía
estar la factura aceptada tomamos en
cuenta que la media es mil 275
y con esto ya sabemos que la factura es
aceptable en 325 puntos 69 y 1400 24.31
mil 125 puntos 69 mil 424 puntos 31
entonces de esa manera es como nosotros
trabajamos en excel la distribución de
esta distribución vuelvo a repetir sólo
nos sirve para descartar o afirmar que
un dato es válido y se puede darlo o no
saludos colegas hasta aquí este vídeo
tutorial
تصفح المزيد من مقاطع الفيديو ذات الصلة
5.0 / 5 (0 votes)