Regresión Lineal Simple (Parte 1)
Summary
TLDRLa clase aborda la regresión lineal simple, una técnica estadística para predecir una variable cuantitativa basada en otra. Se explica que la variable dependiente (y) es la que se predice y la independiente (x) es la que explica la variación. Se ejemplifica con el sueldo en función de la edad y el tiempo de construcción en función del número de trabajadores. Se grafica un diagrama de dispersión para visualizar la relación directa e inversa entre variables. Se introduce el concepto de 'mejor recta', que minimiza las distancias a los puntos de datos, y se describe cómo se obtiene a través del método de mínimos cuadrados. Finalmente, se definen el intercepto y la pendiente de la recta como coeficientes que caracterizan la línea estimada.
Takeaways
- 📊 La regresión lineal simple es una técnica estadística utilizada para predecir o estimar una variable cuantitativa en función de otra variable cuantitativa.
- 🔢 La variable que se desea predecir o estimar se conoce como la variable dependiente (Y), mientras que la variable que se utiliza para predecir se llama variable independiente (X).
- 📈 La relación entre X e Y puede ser directa (ambas variables aumentan o disminuyen juntos) o inversa (una variable aumenta mientras la otra disminuye).
- 👨🏫 Se utilizan ejemplos prácticos como el sueldo en función de la edad y el tiempo de construcción en función del número de trabajadores para ilustrar la relación entre variables.
- 📋 Se toma una muestra de datos para modelar la relación entre las variables, como el número de horas de estudio y las notas de los alumnos.
- 📊 El diagrama de dispersión es una herramienta utilizada para visualizar la relación entre la variable independiente (X) y la variable dependiente (Y).
- 📉 La línea de regresión es una recta que mejor ajusta los datos en el diagrama de dispersión, representando la tendencia central de la relación entre las variables.
- ➗ El método de mínimos cuadrados se utiliza para calcular los coeficientes de la línea de regresión, que son la pendiente (b1) y la intersección en el eje Y (b0).
- 📐 La pendiente (b1) de la línea de regresión indica la inclinación de la línea y representa el cambio promedio en Y por cada unidad de cambio en X.
- 📍 El intercepto (b0) es la proyección de la línea de regresión en el eje Y cuando X es cero, representando el valor promedio de Y cuando X no tiene efecto.
Q & A
¿Qué es la regresión lineal simple?
-La regresión lineal simple es una técnica estadística utilizada para predecir o estimar una variable cuantitativa en función de otra variable cuantitativa.
¿Cuál es la diferencia entre una variable dependiente y una variable independiente en la regresión lineal?
-La variable dependiente es la que se desea predecir o estimar, y depende de la variable independiente. La variable independiente, por otro lado, no depende de otras variables y se utiliza para explicar la variable dependiente.
¿Cómo se relacionan la edad y el sueldo en el ejemplo de regresión lineal proporcionado?
-En el ejemplo, se menciona que generalmente, a medida que aumenta la edad, también aumenta el sueldo debido a la acumulación de experiencia laboral, lo que indica una relación directa entre ambas variables.
¿Qué tipo de relación se tiene entre el tiempo de construcción de un condominio y el número de trabajadores contratados?
-Según el ejemplo, mientras más trabajadores se contratan, menos tiempo se demorará en construir el condominio, lo que sugiere una relación inversa entre el número de trabajadores y el tiempo de construcción.
¿Cómo se representa gráficamente la relación entre las variables en un diagrama de dispersión?
-En un diagrama de dispersión, se representan los puntos de datos donde el eje x corresponde a la variable independiente (horas de estudio) y el eje y a la variable dependiente (nota). Los puntos se grafican en función de los valores de x e y para cada observación.
¿Qué es la ecuación estimada en la regresión lineal?
-La ecuación estimada, representada por y^ = b0 + b1x, es la línea recta que mejor ajusta los datos en el diagrama de dispersión, y se obtiene mediante el método de mínimos cuadrados.
¿Qué significan los coeficientes b0 y b1 en la ecuación estimada?
-El coeficiente b0 se conoce como la interceptación y representa el punto donde la línea recta intersecta el eje y. El coeficiente b1 se llama pendiente y mide la inclinación de la línea, indicando el cambio en y por cada unidad de cambio en x.
¿Cómo se determina cuál es la mejor recta en un diagrama de dispersión?
-La mejor recta es aquella que minimiza las distancias cuadradas verticales entre los puntos de datos y la línea, lo que se logra mediante el método de los mínimos cuadrados.
¿Qué es la pendiente en una recta y cómo se relaciona con la relación entre las variables?
-La pendiente es la cantidad que la recta aumenta o disminuye horizontalmente, y es un indicador de la inclinación de la recta. Una pendiente positiva indica una relación directa entre las variables, mientras que una pendiente negativa indica una relación inversa.
¿Cómo se interpreta la interceptación en el contexto de la regresión lineal?
-La interceptación es el valor de la variable dependiente cuando la variable independiente es cero. Representa el punto en el que la línea de regresión intersecta el eje de la variable dependiente.
Outlines
📊 Introducción a la Regresión Lineal Simple
Este párrafo introduce la regresión lineal simple como una técnica estadística para predecir una variable cuantitativa basándose en otra variable cuantitativa. Se explica que la variable a predecir se denomina variable dependiente y la variable que se utiliza para predecir es la independiente. Se ilustra con ejemplos cómo la edad puede predecir el sueldo de un trabajador y cómo el número de trabajadores puede afectar el tiempo de construcción de un edificio. Además, se menciona que la relación entre las variables puede ser directa o inversa, dependiendo de si ambas variables aumentan o disminuyen en conjunto.
📈 Ejemplo de Regresión Lineal: Horas de Estudio y Calificaciones
Este párrafo presenta un ejemplo práctico de regresión lineal, donde se busca predecir las notas de un estudiante en función del tiempo de estudio. Se describe cómo se toma una muestra de seis estudiantes y se grafica un diagrama de dispersión para visualizar la relación entre las horas de estudio (variable independiente) y las notas (variable dependiente). Se observa una relación directa en el gráfico, lo que sugiere que cuanto más se estudia, más alta es la nota. Se discute la imposibilidad de una recta que pase exactamente por todos los puntos y se introduce la idea de la recta que mejor ajusta los datos, utilizando el método de mínimos cuadrados.
📐 La Recta de Regresión y sus Componentes
En este párrafo se profundiza en la idea de la recta de regresión, la cual es la que mejor ajusta los datos en el diagrama de dispersión. Se explica que hay múltiples rectas posibles, pero se busca la que minimice las distancias al cuadrado entre los puntos observados y la recta. Se introducen los conceptos de coeficientes (b0 y b1), donde b0 es la intercepción y b1 es la pendiente de la recta. Se describe la intercepción como el punto donde la recta intersecta el eje y, y la pendiente como la inclinación de la recta, que indica la relación entre el aumento en la variable independiente y el aumento en la variable dependiente.
Mindmap
Keywords
💡Regresión lineal
💡Variable dependiente
💡Variable independiente
💡Diagrama de dispersión
💡Relación directa
💡Relación inversa
💡Ecuación estimada
💡Mínimos cuadrados
💡Intercepto
💡Pendiente
Highlights
La regresión lineal es una técnica estadística utilizada para predecir una variable cuantitativa basándose en otra.
La variable que se desea predecir o estimar se llama variable dependiente.
La variable que se utiliza para predecir la variable dependiente se conoce como variable independiente.
La variable independiente (X) es la que explica la variable dependiente (Y).
La regresión lineal modela una ecuación de una recta que puede tener pendiente positiva o negativa.
Un ejemplo de regresión lineal es predecir el sueldo de un trabajador en función de su edad.
Cuando aumenta la edad, generalmente aumenta el sueldo, lo que indica una relación directa.
Otro ejemplo es predecir el tiempo de construcción de un condominio en función del número de trabajadores.
Cuando aumenta el número de trabajadores, disminuye el tiempo de construcción, lo que indica una relación inversa.
Para realizar regresión lineal, se toma una muestra de datos y se grafica un diagrama de dispersión.
El diagrama de dispersión muestra la relación entre la variable independiente (horas de estudio) y la dependiente (nota).
La técnica de regresión lineal busca modelar una línea recta que mejor ajuste a los puntos del diagrama de dispersión.
Existen múltiples rectas posibles que pueden ajustarse a los puntos, pero se busca la que minimice las distancias a los puntos.
La recta que mejor se ajusta a los puntos se llama ecuación estimada, representada por Y^ = b0 + b1X.
Los coeficientes b0 (intercepto) y b1 (pendiente) se calculan mediante el método de mínimos cuadrados.
El intercepto (b0) es el punto donde la recta intersecta el eje Y cuando X es cero.
La pendiente (b1) indica la inclinación de la recta con respecto al eje horizontal y refleja la relación entre X e Y.
La pendiente positiva indica que X e Y aumentan juntos, mientras que una pendiente negativa indica que uno disminuye mientras el otro aumenta.
Transcripts
bienvenidos a nuestra clase sobre
regresión lineal simple
la regresión lineal es una técnica
estadística utilizada para predecir o
estimar una variable cuantitativa en
función de otra variable cuantitativa
entonces esta variable cuantitativa es
la que queremos predecir o estimar la
vamos a llamar variable
y esta otra variable
se va a llamar variable x la variable ye
se llama variable dependiente porque
depende de x y la variable x es nuestra
variable independiente
porque no depende de otra variable pero
sí explica allí
entonces lo que tenemos que recordar es
que ya se llama variable dependiente
y es aquella que deseamos predecir o
estimar
y la variable x se llama independiente
y es nuestra variable explicativa es
decir que va a explicar ayer para
estimar o predecir allí
y la regresión lineal es una técnica que
consiste en modelar una ecuación de una
recta
vamos a crear entonces a modelar una
recta lineal una línea que puede ir
hacia arriba
a una línea que puede ir hacia abajo
ahora vamos a ver ejemplos para entender
esto de las variables xy
si deseamos predecir cuánto gana un
trabajador su sueldo en función a la
edad que tiene
entonces estamos hablando de una primera
variable de sueldo y como deseamos
predecir el sueldo esta variable en la
ley
y tenemos la segunda variable cuántica
que es la edad
y como nos dice que debemos predecir el
sueldo en función a la edad ósea que
queremos qué edad expliqué al sueldo
entonces la edad es nuestra variable
x
entonces de manera general a medida que
aumenta la edad va aumentando el sueldo
porque crece la experiencia de un
trabajador a persona físicamente que un
joven gana menos una persona que va
teniendo más experiencia gana más de
manera general no es una regla que
siempre se cumpla pero de manera general
esto sucede
por lo tanto cuando la x está aumentando
el sueldo también está aumentando y
cuando le da disminuye cuando una
persona nos joven su sueldo también
disminuye entonces cuando ambas
variables hacen lo mismo es decir
aumentan ambas o en su defecto
disminuyen ambas
decimos que xy ya tienen una relación
directa porque están haciendo lo mismo
están hacia la misma dirección aumentan
aumentan
y disminuyen disminuyen
vamos a ver otro ejemplo de variables si
deseamos predecir el tiempo que demora
una edificadora en construir un
condominio en función al número de
trabajadores que contrató para poder
realizar la obra
tenemos esta variable tiempo de
construcción que es la variable y porque
es la que deseamos predecir
y luego tenemos la variable número de
trabajadores que es la x
y mientras el número de trabajadores
aumenta
el tiempo de la construcción va a
disminuir porque porque mientras más
trabajadores que contratan lógicamente
que se va a demorar menos el tiempo de
la construcción porque hay más mano de
obra hay más recursos y el tiempo tiende
a disminuir
en su defecto si yo disminuyó los
trabajadores
tiempo se va a largar eso se va a
demorar más en construir la obra
por lo tanto ahora estas variables
están realizando lo inverso una está
aumentando la otra está disminuyendo y
si una disminuye la otra aumenta por lo
tanto decimos que aquí sigue tienen una
relación inversa
ahora sí vamos a ver un caso para
realizar nuestra técnica de regresión
lineal
se desea predecir las notas de un alumno
en función a la cantidad de horas a la
semana que estudió para un examen
y para ello se toma una muestra de seis
alumnos cuyos resultados en cuenta se
encuentran en el siguiente cuadro
tenemos nuestra variable x horas de
estudio y la variable que deseamos
predecir y es la nota
tenemos aquí en el cuadro a los a los
resultados de los seis alumnos por
ejemplo el 11 estudio tres horas y se
sacó ocho de nota
el alumno dos estudios seis horas y se
sacó 10 de nota y así sucesivamente y el
alumno 6 estudió seis horas y se sacó 12
de nota
vamos a graficar ahora un diagrama de
dispersión que nos va a permitir
ver la relación entre las variables xy
la variable x son las horas de estudio
porque es la variable explicativa va a
explicar la nota y la nota es la que
deseamos predecir entonces horas de
estudio va a ir en el eje x esta es mi
eje x
y la nota va a ir en el eje 10
entonces vamos a graficar el primer
alumno el primer alumno estudió tres
horas y sacó ocho entonces su x es 3
y se sacó 8 denota el punto del primer
alumno se encuentra aquí
el segundo alumno estudió seis horas x6
y es 10
punto está por aquí el tercer alumno
estudio 8 y se sacó 15 de notas un punto
está por acá
el cuarto alumno estudio dos y se sacó
ocho su punto está por aquí
en el quinto alumno estudio una hora y
sacó 5
y el sexto alumno estudió seis horas y
se sacó 12
por lo tanto tenemos aquí nuestro
diagrama de dispersión donde podemos
observar una relación directa
porque vemos que a medida que la x
aumenta
la nota también está aumentando a medida
que mientras el alumno estudia más la
nota va a aumentar y por eso los puntos
están yendo hacia arriba bueno esto lo
vamos a explicar con más detalle más
adelante
ahora podemos recordar que la técnica de
regresión lineal
consiste en modelar una línea recta
que una estos puntos
y como podemos observar en nuestro
diagrama de dispersión no hay una recta
que pase por los 6 puntos porque para
que exista una sola recta que pase por
los seis puntos los puntos deberían
estar alineados de esta manera y no
ocurrió así no están 100% alineados no
en una misma recta
por lo tanto nosotros podríamos dibujar
una recta de esta manera pero no va a
pasar pasará por dos puntos y se alejará
de cuatro puntos podemos dibujar esta
línea también de esta manera pero se
aleja de los demás puntos
o también podemos modelar estas líneas
amarilla y verde que acabamos de
ingresar a la gráfica
o también podríamos graficar de esta
manera
no como la línea naranja que pasa por
este punto pero se aleja de los demás
la conclusión es que existen infinitas
rectas posibles que pasen cerca de estos
seis puntos de nuestro diagrama de
dispersión
sin embargo hay una recta que es la
mejor de todas
y a esa recta la vamos a llamar ecuación
estimada cuyo símbolo va a ser ye
sombrero
entonces supongamos que la mejor recta
es esta verde que acabamos de graficar
es nuestra ecuación estimada y el
sombrero pasar igual a b 0 v 1 por equis
y ésta va a ser siempre la ecuación de
una línea recta de nuestra posición
estimada
pero cuál es la mejor recta la mejor
recta se define como aquella que logra
disminuir
a estas distancias entre los puntos
reales y la recta que estoy modelando
la que logre tener estas instancias
menores que el graficado aquí con
flechas negras es la mejor recta
y la cuestión estimada y el sombrero la
mejor recta se obtiene calculando los
coeficientes de 0 y b 1 con el método de
mínimos cuadrados
esto se puede hacer por medio de una
fórmula pero también en sps ese es una
herramienta que realiza la operación de
mínimos cuadrados para poder identificar
la b 0 y la b 1 de nuestra ecuación
estimada
entonces tenemos aquí la ecuación
estimada y ya hemos visto en que ye y x
son variables no es decir pueden adoptar
diferentes valores pero a diferencia de
xy ya la vez 0 y la b 1 son coeficientes
que quiere decir coeficientes que son
constantes es decir que no varía
o sea todo lo contrario a xy que adoptan
diferentes valores de serie b1
solo tienen un valor
y la ve 0 se llama interceptó y la b1 se
llama pendiente
vamos a explicar ahora el interceptó
vamos a enfocarnos entonces en este lado
de aquí
y el interceptó viene a ser aquel punto
donde
cuando alargó la recta hasta interceptar
con el eje
aparece un punto aquí un punto que
intercepta elegir este punto es el
interceptó de cero
y en este caso vean ustedes que este
punto el interceptó se encuentra en la
mitad de tres y cuatro es decir que
tiene el valor de 3,5
ahora vamos a explicar la pendiente la
pendiente nos indica la inclinación de
nuestra recta con respecto al eje
horizontal para explicar mejor esto
vamos a imaginar que tenemos una montaña
y una colina a la cual llamaremos a ive
y un ciclista tiene que subir ambas la
montaña y luego la colina en cuál de las
dos creen que se cansará más
lógicamente que no se va a cansar más en
ver y por qué ocurre esto porque hay más
inclinación que en b
por lo tanto ha decidido que tiene más
pendiente más inclinado que ve tiene
menos pendiente no es esta inclinación
respecto al eje horizontal esta
inclinación
cuando estemos subiendo
la pendiente va a ser positiva y si
estamos bajando la pendiente va a ser
negativa de igual manera que cuando
estemos subiendo la pendiente va a ser
positiva y cuando estemos bajando la
pendiente va a ser negativa
Посмотреть больше похожих видео
ADM008 s3 video metodos cuantitativos
FUNCIÓN, NOTACIÓN DE FUNCIONES
CORRELACIÓN y REGRESIÓN LINEAL con EJEMPLOS
¿QUÉ CONEXIÓN HAY ENTRE LA FUNCIÓN LINEAL Y LAS RELACIONES DE PROPORCIONALIDAD DIRECTA?
Regresión lineal por mínimos cuadrados en Matlab: Tutorial paso a paso
LA DERIVADA COMO RAZÓN de CAMBIO (EXPLICACIÓN y DEFINICIÓN) - #1
5.0 / 5 (0 votes)