Regresión Lineal Simple (Parte 1)

Rocio Salas Laines
9 Jun 201814:43

Summary

TLDRLa clase aborda la regresión lineal simple, una técnica estadística para predecir una variable cuantitativa basada en otra. Se explica que la variable dependiente (y) es la que se predice y la independiente (x) es la que explica la variación. Se ejemplifica con el sueldo en función de la edad y el tiempo de construcción en función del número de trabajadores. Se grafica un diagrama de dispersión para visualizar la relación directa e inversa entre variables. Se introduce el concepto de 'mejor recta', que minimiza las distancias a los puntos de datos, y se describe cómo se obtiene a través del método de mínimos cuadrados. Finalmente, se definen el intercepto y la pendiente de la recta como coeficientes que caracterizan la línea estimada.

Takeaways

  • 📊 La regresión lineal simple es una técnica estadística utilizada para predecir o estimar una variable cuantitativa en función de otra variable cuantitativa.
  • 🔢 La variable que se desea predecir o estimar se conoce como la variable dependiente (Y), mientras que la variable que se utiliza para predecir se llama variable independiente (X).
  • 📈 La relación entre X e Y puede ser directa (ambas variables aumentan o disminuyen juntos) o inversa (una variable aumenta mientras la otra disminuye).
  • 👨‍🏫 Se utilizan ejemplos prácticos como el sueldo en función de la edad y el tiempo de construcción en función del número de trabajadores para ilustrar la relación entre variables.
  • 📋 Se toma una muestra de datos para modelar la relación entre las variables, como el número de horas de estudio y las notas de los alumnos.
  • 📊 El diagrama de dispersión es una herramienta utilizada para visualizar la relación entre la variable independiente (X) y la variable dependiente (Y).
  • 📉 La línea de regresión es una recta que mejor ajusta los datos en el diagrama de dispersión, representando la tendencia central de la relación entre las variables.
  • ➗ El método de mínimos cuadrados se utiliza para calcular los coeficientes de la línea de regresión, que son la pendiente (b1) y la intersección en el eje Y (b0).
  • 📐 La pendiente (b1) de la línea de regresión indica la inclinación de la línea y representa el cambio promedio en Y por cada unidad de cambio en X.
  • 📍 El intercepto (b0) es la proyección de la línea de regresión en el eje Y cuando X es cero, representando el valor promedio de Y cuando X no tiene efecto.

Q & A

  • ¿Qué es la regresión lineal simple?

    -La regresión lineal simple es una técnica estadística utilizada para predecir o estimar una variable cuantitativa en función de otra variable cuantitativa.

  • ¿Cuál es la diferencia entre una variable dependiente y una variable independiente en la regresión lineal?

    -La variable dependiente es la que se desea predecir o estimar, y depende de la variable independiente. La variable independiente, por otro lado, no depende de otras variables y se utiliza para explicar la variable dependiente.

  • ¿Cómo se relacionan la edad y el sueldo en el ejemplo de regresión lineal proporcionado?

    -En el ejemplo, se menciona que generalmente, a medida que aumenta la edad, también aumenta el sueldo debido a la acumulación de experiencia laboral, lo que indica una relación directa entre ambas variables.

  • ¿Qué tipo de relación se tiene entre el tiempo de construcción de un condominio y el número de trabajadores contratados?

    -Según el ejemplo, mientras más trabajadores se contratan, menos tiempo se demorará en construir el condominio, lo que sugiere una relación inversa entre el número de trabajadores y el tiempo de construcción.

  • ¿Cómo se representa gráficamente la relación entre las variables en un diagrama de dispersión?

    -En un diagrama de dispersión, se representan los puntos de datos donde el eje x corresponde a la variable independiente (horas de estudio) y el eje y a la variable dependiente (nota). Los puntos se grafican en función de los valores de x e y para cada observación.

  • ¿Qué es la ecuación estimada en la regresión lineal?

    -La ecuación estimada, representada por y^ = b0 + b1x, es la línea recta que mejor ajusta los datos en el diagrama de dispersión, y se obtiene mediante el método de mínimos cuadrados.

  • ¿Qué significan los coeficientes b0 y b1 en la ecuación estimada?

    -El coeficiente b0 se conoce como la interceptación y representa el punto donde la línea recta intersecta el eje y. El coeficiente b1 se llama pendiente y mide la inclinación de la línea, indicando el cambio en y por cada unidad de cambio en x.

  • ¿Cómo se determina cuál es la mejor recta en un diagrama de dispersión?

    -La mejor recta es aquella que minimiza las distancias cuadradas verticales entre los puntos de datos y la línea, lo que se logra mediante el método de los mínimos cuadrados.

  • ¿Qué es la pendiente en una recta y cómo se relaciona con la relación entre las variables?

    -La pendiente es la cantidad que la recta aumenta o disminuye horizontalmente, y es un indicador de la inclinación de la recta. Una pendiente positiva indica una relación directa entre las variables, mientras que una pendiente negativa indica una relación inversa.

  • ¿Cómo se interpreta la interceptación en el contexto de la regresión lineal?

    -La interceptación es el valor de la variable dependiente cuando la variable independiente es cero. Representa el punto en el que la línea de regresión intersecta el eje de la variable dependiente.

Outlines

00:00

📊 Introducción a la Regresión Lineal Simple

Este párrafo introduce la regresión lineal simple como una técnica estadística para predecir una variable cuantitativa basándose en otra variable cuantitativa. Se explica que la variable a predecir se denomina variable dependiente y la variable que se utiliza para predecir es la independiente. Se ilustra con ejemplos cómo la edad puede predecir el sueldo de un trabajador y cómo el número de trabajadores puede afectar el tiempo de construcción de un edificio. Además, se menciona que la relación entre las variables puede ser directa o inversa, dependiendo de si ambas variables aumentan o disminuyen en conjunto.

05:00

📈 Ejemplo de Regresión Lineal: Horas de Estudio y Calificaciones

Este párrafo presenta un ejemplo práctico de regresión lineal, donde se busca predecir las notas de un estudiante en función del tiempo de estudio. Se describe cómo se toma una muestra de seis estudiantes y se grafica un diagrama de dispersión para visualizar la relación entre las horas de estudio (variable independiente) y las notas (variable dependiente). Se observa una relación directa en el gráfico, lo que sugiere que cuanto más se estudia, más alta es la nota. Se discute la imposibilidad de una recta que pase exactamente por todos los puntos y se introduce la idea de la recta que mejor ajusta los datos, utilizando el método de mínimos cuadrados.

10:00

📐 La Recta de Regresión y sus Componentes

En este párrafo se profundiza en la idea de la recta de regresión, la cual es la que mejor ajusta los datos en el diagrama de dispersión. Se explica que hay múltiples rectas posibles, pero se busca la que minimice las distancias al cuadrado entre los puntos observados y la recta. Se introducen los conceptos de coeficientes (b0 y b1), donde b0 es la intercepción y b1 es la pendiente de la recta. Se describe la intercepción como el punto donde la recta intersecta el eje y, y la pendiente como la inclinación de la recta, que indica la relación entre el aumento en la variable independiente y el aumento en la variable dependiente.

Mindmap

Keywords

💡Regresión lineal

La regresión lineal es una técnica estadística utilizada para predecir o estimar una variable cuantitativa basándose en otra variable cuantitativa. Es el tema central del video, donde se explica cómo se puede usar para modelar la relación entre variables como el sueldo en función de la edad o el tiempo de construcción en función del número de trabajadores. En el guion, se menciona que la regresión lineal consiste en crear una línea que puede ir hacia arriba o abajo para representar esta relación.

💡Variable dependiente

La variable dependiente es aquella que se desea predecir o estimar en una regresión lineal. En el video, se ilustra con ejemplos cómo esta variable varía en relación con la variable independiente, como el sueldo que varía con la edad. Es fundamental para entender el objetivo de la regresión lineal, que es predecir o estimar el valor de la variable dependiente.

💡Variable independiente

La variable independiente es la que se utiliza para explicar o predecir la variable dependiente. Según el guion, no depende de otras variables y es la base sobre la cual se construye el modelo de regresión. Por ejemplo, la edad es la variable independiente que se utiliza para predecir el sueldo, la variable dependiente.

💡Diagrama de dispersión

El diagrama de dispersión es una herramienta utilizada para visualizar la relación entre la variable independiente y la dependiente. En el video, se describe cómo se grafican los puntos de datos y cómo se observa una relación directa o inversa entre las variables, como se ve cuando se representa la relación entre horas de estudio y notas de un alumno.

💡Relación directa

Una relación directa entre variables significa que cuando una variable aumenta, la otra también aumenta. En el video, se da el ejemplo de cómo el sueldo generalmente aumenta con la edad, mostrando una relación directa, ya que ambas variables tienden a aumentar juntas.

💡Relación inversa

Una relación inversa ocurre cuando una variable aumenta mientras que la otra disminuye. En el guion, se menciona cómo el tiempo de construcción disminuye a medida que aumenta el número de trabajadores, ilustrando una relación inversa donde una variable aumenta mientras la otra disminuye.

💡Ecuación estimada

La ecuación estimada es la línea recta que mejor ajusta los datos en un diagrama de dispersión y se representa con la notación y^ = b0 + b1*x. Se obtiene mediante el método de mínimos cuadrados y es la 'mejor' línea en el sentido de minimizar la distancia vertical entre los puntos y la línea. En el video, se explica cómo se busca esta línea para representar la relación entre las variables.

💡Mínimos cuadrados

El método de mínimos cuadrados es una técnica utilizada para calcular los coeficientes de la ecuación estimada de manera que minimicen la suma de las distancias al cuadrado de los puntos de datos a la línea. El video menciona este método como una forma de encontrar la 'mejor' línea que ajuste los datos.

💡Intercepto

El intercepto (b0) es el punto donde la línea de regresión intersecta el eje y. En el video, se describe cómo se determina el valor del intercepto visualmente en el diagrama de dispersión, y se ilustra con el ejemplo de la relación entre horas de estudio y notas, donde el intercepto sería el punto en el que la línea toca el eje de las notas cuando las horas de estudio son cero.

💡Pendiente

La pendiente (b1) de la línea de regresión indica la tasa de cambio de la variable dependiente con respecto a la independiente. Es positiva cuando hay una relación directa y negativa cuando hay una relación inversa. En el video, se explica cómo la pendiente representa la inclinación de la línea y se relaciona con la idea de que una pendiente más alta (o más negativa) indica una mayor variación en la variable dependiente por unidad de cambio en la variable independiente.

Highlights

La regresión lineal es una técnica estadística utilizada para predecir una variable cuantitativa basándose en otra.

La variable que se desea predecir o estimar se llama variable dependiente.

La variable que se utiliza para predecir la variable dependiente se conoce como variable independiente.

La variable independiente (X) es la que explica la variable dependiente (Y).

La regresión lineal modela una ecuación de una recta que puede tener pendiente positiva o negativa.

Un ejemplo de regresión lineal es predecir el sueldo de un trabajador en función de su edad.

Cuando aumenta la edad, generalmente aumenta el sueldo, lo que indica una relación directa.

Otro ejemplo es predecir el tiempo de construcción de un condominio en función del número de trabajadores.

Cuando aumenta el número de trabajadores, disminuye el tiempo de construcción, lo que indica una relación inversa.

Para realizar regresión lineal, se toma una muestra de datos y se grafica un diagrama de dispersión.

El diagrama de dispersión muestra la relación entre la variable independiente (horas de estudio) y la dependiente (nota).

La técnica de regresión lineal busca modelar una línea recta que mejor ajuste a los puntos del diagrama de dispersión.

Existen múltiples rectas posibles que pueden ajustarse a los puntos, pero se busca la que minimice las distancias a los puntos.

La recta que mejor se ajusta a los puntos se llama ecuación estimada, representada por Y^ = b0 + b1X.

Los coeficientes b0 (intercepto) y b1 (pendiente) se calculan mediante el método de mínimos cuadrados.

El intercepto (b0) es el punto donde la recta intersecta el eje Y cuando X es cero.

La pendiente (b1) indica la inclinación de la recta con respecto al eje horizontal y refleja la relación entre X e Y.

La pendiente positiva indica que X e Y aumentan juntos, mientras que una pendiente negativa indica que uno disminuye mientras el otro aumenta.

Transcripts

play00:01

bienvenidos a nuestra clase sobre

play00:04

regresión lineal simple

play00:07

la regresión lineal es una técnica

play00:11

estadística utilizada para predecir o

play00:14

estimar una variable cuantitativa en

play00:18

función de otra variable cuantitativa

play00:22

entonces esta variable cuantitativa es

play00:26

la que queremos predecir o estimar la

play00:29

vamos a llamar variable

play00:32

y esta otra variable

play00:36

se va a llamar variable x la variable ye

play00:39

se llama variable dependiente porque

play00:43

depende de x y la variable x es nuestra

play00:48

variable independiente

play00:52

porque no depende de otra variable pero

play00:57

sí explica allí

play01:02

entonces lo que tenemos que recordar es

play01:05

que ya se llama variable dependiente

play01:10

y es aquella que deseamos predecir o

play01:13

estimar

play01:15

y la variable x se llama independiente

play01:19

y es nuestra variable explicativa es

play01:22

decir que va a explicar ayer para

play01:25

estimar o predecir allí

play01:31

y la regresión lineal es una técnica que

play01:36

consiste en modelar una ecuación de una

play01:40

recta

play01:42

vamos a crear entonces a modelar una

play01:46

recta lineal una línea que puede ir

play01:49

hacia arriba

play01:53

a una línea que puede ir hacia abajo

play01:59

ahora vamos a ver ejemplos para entender

play02:02

esto de las variables xy

play02:07

si deseamos predecir cuánto gana un

play02:10

trabajador su sueldo en función a la

play02:13

edad que tiene

play02:16

entonces estamos hablando de una primera

play02:18

variable de sueldo y como deseamos

play02:21

predecir el sueldo esta variable en la

play02:24

ley

play02:26

y tenemos la segunda variable cuántica

play02:29

que es la edad

play02:32

y como nos dice que debemos predecir el

play02:36

sueldo en función a la edad ósea que

play02:39

queremos qué edad expliqué al sueldo

play02:41

entonces la edad es nuestra variable

play02:45

x

play02:49

entonces de manera general a medida que

play02:52

aumenta la edad va aumentando el sueldo

play02:55

porque crece la experiencia de un

play02:58

trabajador a persona físicamente que un

play03:00

joven gana menos una persona que va

play03:03

teniendo más experiencia gana más de

play03:05

manera general no es una regla que

play03:08

siempre se cumpla pero de manera general

play03:10

esto sucede

play03:12

por lo tanto cuando la x está aumentando

play03:19

el sueldo también está aumentando y

play03:21

cuando le da disminuye cuando una

play03:24

persona nos joven su sueldo también

play03:27

disminuye entonces cuando ambas

play03:30

variables hacen lo mismo es decir

play03:32

aumentan ambas o en su defecto

play03:34

disminuyen ambas

play03:37

decimos que xy ya tienen una relación

play03:40

directa porque están haciendo lo mismo

play03:42

están hacia la misma dirección aumentan

play03:45

aumentan

play03:46

y disminuyen disminuyen

play03:49

vamos a ver otro ejemplo de variables si

play03:53

deseamos predecir el tiempo que demora

play03:55

una edificadora en construir un

play03:57

condominio en función al número de

play03:59

trabajadores que contrató para poder

play04:01

realizar la obra

play04:06

tenemos esta variable tiempo de

play04:08

construcción que es la variable y porque

play04:11

es la que deseamos predecir

play04:16

y luego tenemos la variable número de

play04:18

trabajadores que es la x

play04:23

y mientras el número de trabajadores

play04:26

aumenta

play04:29

el tiempo de la construcción va a

play04:32

disminuir porque porque mientras más

play04:35

trabajadores que contratan lógicamente

play04:39

que se va a demorar menos el tiempo de

play04:42

la construcción porque hay más mano de

play04:44

obra hay más recursos y el tiempo tiende

play04:48

a disminuir

play04:52

en su defecto si yo disminuyó los

play04:55

trabajadores

play04:57

tiempo se va a largar eso se va a

play05:00

demorar más en construir la obra

play05:03

por lo tanto ahora estas variables

play05:07

están realizando lo inverso una está

play05:11

aumentando la otra está disminuyendo y

play05:14

si una disminuye la otra aumenta por lo

play05:18

tanto decimos que aquí sigue tienen una

play05:21

relación inversa

play05:27

ahora sí vamos a ver un caso para

play05:29

realizar nuestra técnica de regresión

play05:32

lineal

play05:33

se desea predecir las notas de un alumno

play05:36

en función a la cantidad de horas a la

play05:37

semana que estudió para un examen

play05:41

y para ello se toma una muestra de seis

play05:43

alumnos cuyos resultados en cuenta se

play05:46

encuentran en el siguiente cuadro

play05:49

tenemos nuestra variable x horas de

play05:52

estudio y la variable que deseamos

play05:55

predecir y es la nota

play06:01

tenemos aquí en el cuadro a los a los

play06:04

resultados de los seis alumnos por

play06:06

ejemplo el 11 estudio tres horas y se

play06:10

sacó ocho de nota

play06:12

el alumno dos estudios seis horas y se

play06:16

sacó 10 de nota y así sucesivamente y el

play06:19

alumno 6 estudió seis horas y se sacó 12

play06:24

de nota

play06:28

vamos a graficar ahora un diagrama de

play06:31

dispersión que nos va a permitir

play06:35

ver la relación entre las variables xy

play06:42

la variable x son las horas de estudio

play06:45

porque es la variable explicativa va a

play06:48

explicar la nota y la nota es la que

play06:51

deseamos predecir entonces horas de

play06:54

estudio va a ir en el eje x esta es mi

play06:57

eje x

play06:59

y la nota va a ir en el eje 10

play07:05

entonces vamos a graficar el primer

play07:07

alumno el primer alumno estudió tres

play07:11

horas y sacó ocho entonces su x es 3

play07:15

y se sacó 8 denota el punto del primer

play07:19

alumno se encuentra aquí

play07:21

el segundo alumno estudió seis horas x6

play07:25

y es 10

play07:29

punto está por aquí el tercer alumno

play07:32

estudio 8 y se sacó 15 de notas un punto

play07:35

está por acá

play07:37

el cuarto alumno estudio dos y se sacó

play07:41

ocho su punto está por aquí

play07:44

en el quinto alumno estudio una hora y

play07:47

sacó 5

play07:49

y el sexto alumno estudió seis horas y

play07:53

se sacó 12

play07:57

por lo tanto tenemos aquí nuestro

play08:00

diagrama de dispersión donde podemos

play08:02

observar una relación directa

play08:06

porque vemos que a medida que la x

play08:09

aumenta

play08:11

la nota también está aumentando a medida

play08:14

que mientras el alumno estudia más la

play08:20

nota va a aumentar y por eso los puntos

play08:23

están yendo hacia arriba bueno esto lo

play08:25

vamos a explicar con más detalle más

play08:28

adelante

play08:32

ahora podemos recordar que la técnica de

play08:38

regresión lineal

play08:41

consiste en modelar una línea recta

play08:45

que una estos puntos

play08:49

y como podemos observar en nuestro

play08:51

diagrama de dispersión no hay una recta

play08:54

que pase por los 6 puntos porque para

play08:58

que exista una sola recta que pase por

play09:01

los seis puntos los puntos deberían

play09:03

estar alineados de esta manera y no

play09:05

ocurrió así no están 100% alineados no

play09:11

en una misma recta

play09:18

por lo tanto nosotros podríamos dibujar

play09:23

una recta de esta manera pero no va a

play09:26

pasar pasará por dos puntos y se alejará

play09:29

de cuatro puntos podemos dibujar esta

play09:35

línea también de esta manera pero se

play09:39

aleja de los demás puntos

play09:43

o también podemos modelar estas líneas

play09:47

amarilla y verde que acabamos de

play09:50

ingresar a la gráfica

play09:53

o también podríamos graficar de esta

play09:55

manera

play09:57

no como la línea naranja que pasa por

play10:00

este punto pero se aleja de los demás

play10:05

la conclusión es que existen infinitas

play10:08

rectas posibles que pasen cerca de estos

play10:12

seis puntos de nuestro diagrama de

play10:13

dispersión

play10:16

sin embargo hay una recta que es la

play10:18

mejor de todas

play10:21

y a esa recta la vamos a llamar ecuación

play10:24

estimada cuyo símbolo va a ser ye

play10:27

sombrero

play10:31

entonces supongamos que la mejor recta

play10:34

es esta verde que acabamos de graficar

play10:39

es nuestra ecuación estimada y el

play10:41

sombrero pasar igual a b 0 v 1 por equis

play10:46

y ésta va a ser siempre la ecuación de

play10:50

una línea recta de nuestra posición

play10:52

estimada

play10:55

pero cuál es la mejor recta la mejor

play10:57

recta se define como aquella que logra

play11:02

disminuir

play11:04

a estas distancias entre los puntos

play11:07

reales y la recta que estoy modelando

play11:12

la que logre tener estas instancias

play11:16

menores que el graficado aquí con

play11:19

flechas negras es la mejor recta

play11:23

y la cuestión estimada y el sombrero la

play11:25

mejor recta se obtiene calculando los

play11:27

coeficientes de 0 y b 1 con el método de

play11:31

mínimos cuadrados

play11:34

esto se puede hacer por medio de una

play11:36

fórmula pero también en sps ese es una

play11:39

herramienta que realiza la operación de

play11:42

mínimos cuadrados para poder identificar

play11:45

la b 0 y la b 1 de nuestra ecuación

play11:48

estimada

play11:51

entonces tenemos aquí la ecuación

play11:53

estimada y ya hemos visto en que ye y x

play11:58

son variables no es decir pueden adoptar

play12:00

diferentes valores pero a diferencia de

play12:05

xy ya la vez 0 y la b 1 son coeficientes

play12:08

que quiere decir coeficientes que son

play12:11

constantes es decir que no varía

play12:15

o sea todo lo contrario a xy que adoptan

play12:18

diferentes valores de serie b1

play12:22

solo tienen un valor

play12:26

y la ve 0 se llama interceptó y la b1 se

play12:32

llama pendiente

play12:35

vamos a explicar ahora el interceptó

play12:42

vamos a enfocarnos entonces en este lado

play12:45

de aquí

play12:47

y el interceptó viene a ser aquel punto

play12:51

donde

play12:53

cuando alargó la recta hasta interceptar

play13:00

con el eje

play13:02

aparece un punto aquí un punto que

play13:05

intercepta elegir este punto es el

play13:08

interceptó de cero

play13:12

y en este caso vean ustedes que este

play13:17

punto el interceptó se encuentra en la

play13:19

mitad de tres y cuatro es decir que

play13:21

tiene el valor de 3,5

play13:25

ahora vamos a explicar la pendiente la

play13:29

pendiente nos indica la inclinación de

play13:32

nuestra recta con respecto al eje

play13:34

horizontal para explicar mejor esto

play13:37

vamos a imaginar que tenemos una montaña

play13:40

y una colina a la cual llamaremos a ive

play13:45

y un ciclista tiene que subir ambas la

play13:50

montaña y luego la colina en cuál de las

play13:52

dos creen que se cansará más

play13:55

lógicamente que no se va a cansar más en

play13:58

ver y por qué ocurre esto porque hay más

play14:04

inclinación que en b

play14:08

por lo tanto ha decidido que tiene más

play14:12

pendiente más inclinado que ve tiene

play14:17

menos pendiente no es esta inclinación

play14:20

respecto al eje horizontal esta

play14:22

inclinación

play14:25

cuando estemos subiendo

play14:28

la pendiente va a ser positiva y si

play14:30

estamos bajando la pendiente va a ser

play14:32

negativa de igual manera que cuando

play14:35

estemos subiendo la pendiente va a ser

play14:36

positiva y cuando estemos bajando la

play14:39

pendiente va a ser negativa

Rate This

5.0 / 5 (0 votes)

相关标签
Regresión LinealEstadísticaPredicciónVariables CuantitativasAnálisis de DatosModeladoMínimos CuadradosDiagrama de DispersiónEducación EstadísticaTécnicas de Predicción
您是否需要英文摘要?