foto perfil

Regresión lineal simple: definición, fórmula y ejemplos

Publicado el 3 noviembre, 2020

Regresión lineal simple

Hannah es una científica que estudia la gestión del tiempo y las habilidades de estudio de los estudiantes universitarios. Realiza un experimento en una universidad local con 50 estudiantes. Ella le pide a cada estudiante que haga un seguimiento del tiempo que pasan en las redes sociales, el tiempo que pasan estudiando, el tiempo que pasan durmiendo y el tiempo que pasan trabajando en el transcurso de un semestre. También les pide a los estudiantes que registren su GPA final del semestre.

En esta lección, aprenderá acerca de la regresión lineal simple y cómo encontrar una línea de regresión usando una calculadora gráfica. Una línea de regresión es una línea recta que intenta predecir la relación entre dos puntos, también conocida como línea de tendencia o línea de mejor ajuste. La regresión lineal simple es una predicción cuando una variable ( y ) depende de una segunda variable ( x ) basada en la ecuación de regresión de un conjunto de datos dado. Veremos cómo Hannah usa la regresión lineal simple para ayudar a interpretar sus datos.

Gráficos de dispersión y regresión

Una vez que los 50 estudiantes entregan sus datos, Hannah crea un diagrama de dispersión , que es un gráfico de pares ordenados que muestra una relación entre dos conjuntos de datos. Para su primer diagrama de dispersión, Hannah usa dos variables: el tiempo que pasa en las redes sociales y la cantidad de sueño. Para simplificar su información, veremos el tiempo promedio por semana que cada estudiante pasó durmiendo y en las redes sociales. Eche un vistazo a la gráfica de dispersión:


Diagrama de dispersión, por ejemplo
diagrama de dispersión, por ejemplo

Dado que estamos utilizando dos variables, podemos llamar a estos datos bivariados. Los datos bivariados son dos conjuntos de variables que pueden cambiar y se comparan para encontrar relaciones. Los datos bivariados suelen mostrarse visualmente mediante un diagrama de dispersión.

Puede notar que estos datos tienen varios puntos que crean una especie de patrón. Muchos de los puntos aumentan en el valor x a medida que disminuyen en el valor y . Ésta es una relación entre los dos conjuntos de datos conocida como correlación . Una correlación es la relación entre dos conjuntos de variables que se utilizan para describir o predecir información.

Una línea de regresión es una forma de predecir esta información y encontrar una correlación en los datos. Hay dos formas de encontrar la línea de regresión de un conjunto de datos. La primera forma es encontrar la línea de regresión usando una regla, y la segunda forma es usar una calculadora gráfica. Hablemos brevemente sobre cómo encontrar una línea de regresión a mano antes de usar una calculadora.

Encontrar la línea de regresión a mano

Para encontrar una línea de regresión a mano, siga estos pasos:

  1. Dibuja una línea que esté más cerca de tantos puntos como sea posible.
  2. Elija dos puntos y calcule la pendiente.
  3. Escribe la ecuación de la recta.

Usemos el diagrama de dispersión anterior para practicar la búsqueda de la línea de regresión con una regla.

Primero, usa la regla para encontrar el lugar más cercano a tantos puntos como sea posible. A veces puedes encontrar dos puntos para usar.

En segundo lugar, elija dos puntos que crea que estarían en la línea de regresión. Puede usar puntos que están en la línea o puede inventar puntos nuevos. Utilice estos puntos y conéctelos a la siguiente ecuación:


Ecuación para encontrar pendiente
imagen de diagrama de dispersión con ecuación de pendiente

Si no está familiarizado con el uso de esta ecuación, consulte nuestras lecciones de álgebra.

En tercer lugar, ahora tienes la pendiente de tu línea. Puede crear una ecuación basada en esta información. Encuentre la intersección con el eje y extendiendo la línea hasta el eje y .

Usa la ecuación pendiente-intersección para crear la ecuación para tu línea como esta:

  • y = mx + b
    y = -1 x + 66

Usar una calculadora gráfica

Ahora que sabe cómo encontrar una línea de regresión a mano, hablemos de cómo encontrar una línea de regresión usando una calculadora. Cada calculadora es un poco diferente. Sin embargo, debería poder arreglárselas con casi cualquier calculadora gráfica siguiendo estos pasos:

  1. Configure la calculadora en el modo Estadísticas.
  2. Ingrese los datos (1er juego en L1, 2do juego en L2).
  3. Ajuste la configuración de una gráfica de dispersión y luego grafique los puntos.
  4. Configure la calculadora para la línea de regresión.

Usaremos los datos que Hannah recopiló sobre la cantidad de sueño y la cantidad de trabajo que hicieron los estudiantes durante el semestre:


Tabla de datos, por ejemplo
tabla de datos por ejemplo

Estos datos son un promedio semanal de cada estudiante. Para ahorrar tiempo, solo estoy usando 20 estudiantes, en lugar de los 50 originales. En este ejemplo, estoy usando una calculadora gráfica TI-83.

Primero, configure su calculadora para estadísticas presionando el botón Estadísticas. Esto lo llevará a una pantalla con las opciones de Editar, Calc y Pruebas. Seleccione la opción Editar presionando enter. L1 son las coordenadas x , y L2 son las coordenadas y . Ingrese cada una de las coordenadas usando el teclado numérico y presionando ‘Enter’ cuando haya terminado de ingresar cada coordenada. Después de presionar el botón Enter, la calculadora lo llevará a la siguiente línea para la segunda coordenada. También puede usar los botones de flecha para moverse entre L1 y L2.

A continuación, ajuste la configuración de su calculadora para mostrar un diagrama de dispersión. Para hacer esto, presione el segundo botón y luego presione Statplot. Debería ver esta pantalla:


Configuración ajustada para mostrar el diagrama de dispersión
pantalla en calculadora gráfica

Presione Enter para ir a la siguiente pantalla, que se ve así:


Configuraciones
configuración de la pantalla de diagrama de dispersión

Asegúrese de que su configuración coincida con la mía moviendo el cursor con los botones de flecha y seleccionando cada elemento con el botón Enter. Los elementos seleccionados tendrán un fondo negro y un texto claro.

También querrá asegurarse de poder ver todos sus puntos. Ajusté los valores en cada campo usando las teclas de flecha, el botón Enter y el teclado numérico. Presione la tecla Graph para ver los puntos trazados en el gráfico. Ahora está listo para encontrar la ecuación de su línea de regresión.

Primero, presione el botón STAT nuevamente. Esta vez, use las teclas de flecha para moverse a la opción CALC en la parte superior de la pantalla. Con las teclas de flecha, mueva el cursor hacia abajo hasta el elemento número cuatro etiquetado LinReg ( ax + b ). Presione el botón Enter.

La calculadora le mostrará el mismo LinReg ( ax + b ) en la parte superior de la pantalla. Presione ingresar por segunda vez para calcular la línea de regresión.

  • a = 1,3
  • b = 40,6

Por tanto, la ecuación de la recta de regresión es y = 1,3 x + 40,6. Mi gráfico se vería así:


Gráfico final por ejemplo
gráfico por ejemplo

Problemas de práctica

Ahora, Ana quiere comparar la cantidad de tiempo que un estudiante pasa estudiando con la cantidad de tiempo que pasa durmiendo. ¿Puedes encontrar la recta de regresión y su ecuación a partir de este conjunto de datos? Pausa el video aquí para trabajar en este problema.

Tiempo de sueño (horas) Tiempo de estudio (horas)
70 6
64 4
60 7
57 8
56 6
54 10
52 12
50 10
49 11
47 9
47 8
46 4
50 6
45 7
42 10
40 8
38 9
35 10
49 5
49 4

La ecuación para la línea de regresión en este gráfico es y = -0.0989 x + 12.643. Si redondeó los números aquí, está bien para este problema.

No olvide presionar ‘enter’ cuando vea LinReg ( ax + b ) en su calculadora. No te va a mostrar los valores de una y b si no pulsa ENTER, contando la calculadora para calcular estas variables.

De acuerdo, prueba esto. Hannah ahora quiere comparar el tiempo que un estudiante pasa estudiando con su GPA. ¿Puedes encontrar la recta de regresión y su ecuación a partir de este conjunto de datos? Siéntase libre de pausar el video aquí mientras trabaja.

Tiempo de estudio (horas) GPA (semestre)
6 2.6
4 2.2
7 2.9
8 3.4
3 3,5
10 4
12 4
10 3.8
11 3.6
9 4
8 3,7
4 4
6 2.4
7 3,5
10 3.2
8 3.3
9 3.9
10 3,7
5 2.6
4 2.3

La ecuación para la línea de regresión en este gráfico es y = .1683 x + 2.0343. Si redondeó los números aquí, está bien para este problema. Si no obtuvo la respuesta correcta aquí, no dude en volver al video y seguir los pasos nuevamente conmigo.

Resumen de la lección

En resumen, una línea de regresión , también conocida como línea de tendencia o línea de mejor ajuste, es una línea recta que intenta predecir la relación entre dos puntos. La regresión lineal simple es una predicción cuando una variable ( y ) depende de una segunda variable ( x ) basada en la ecuación de regresión de un conjunto de datos dado.

Cada calculadora es un poco diferente. Sin embargo, debería poder arreglárselas con casi cualquier calculadora gráfica siguiendo estos pasos:

  1. Configure la calculadora en el modo Estadísticas.
  2. Ingrese los datos (1er juego en L1, 2do juego en L2).
  3. Ajuste la configuración de una gráfica de dispersión y grafique los puntos.
  4. Configure la calculadora para la línea de regresión.

Finalmente, si obtiene algún error o la información no parece correcta, verifique dos veces los puntos que ingresó primero y luego revise la configuración en la calculadora.

Los resultados del aprendizaje

Mire esta lección en video, luego vea qué tan bien puede:

  • Proporcionar definiciones para ‘línea de regresión’ y ‘regresión lineal simple’
  • Crea una gráfica de dispersión
  • Presentar un método paso a paso para usar una calculadora gráfica.
  • Encuentre la línea de regresión de un conjunto de datos usando una regla y una calculadora gráfica

Articulos relacionados