¿Qué es una Regresión Lineal? ¿Para qué sirve? ¿Cómo se Calcula? ¿Cómo se interpreta?

El objetivo del presente artículo es dejar en claro el concepto de regresión lineal y también comprender la utilidad que ofrece para el cálculo estadístico.

¿Qué es una regresión lineal?

Una regresión lineal es un modelo matemático, de la rama estadística, que permite estimar el efecto de una variable sobre otra. A su vez, se encuentra asociado con el coficiente r de Pearson, fórmula que permite medir el grado de relación entre dos variables cuantitativas.
Es también una prueba estadística paramétrica (ver post sobre pruebas paramétricas).

¿Para qué sirve?

Permite probar si existen correlaciones y causales entre dos variables cuantitativas.
Este modelo matemático es utilizado en variedad de situaciones, desde el análisis de fenómenos sociales, ecónomicos, químicos y médicos.

¿Cómo se calcula?

Para inciar el planteo se debe partir como mínimo de dos variables, una debe ser dependiente y la otra independiente (artículo sobre variables y tipo de variables). También se debe tener un sustento teórico sólido.
Se puede utilizar como base el diagrama de dispersión, una gráfica donde se relacionan los resultados de una muestra sobre un eje X e Y.

Veamos un ejemplo:
Primeramente debemos ordenar los resultados cuantitativos con ambas variables a utilizar, en este caso se utilizaron mediciones de concentración de 10 soluciones.
Tengan en cuenta que, cuanto más resultados se coloquen en la muestra, más fiel será la regresión lineal obtenida.

C: Concentración molar de la solución, expresada en moles por litro.
D: Densidad de la solución, expresada en gramos por mililitro.
(Estos datos surgen de un informe de Laboratorio cedido por Facundo Agustín Paredes, UNS)

Luego se procede a realizar un gráfico de dispersión que muestre los resultados obtenidos para las dos variables a utilizar (densidad y concentración) y con ayuda de un software (puede utilizarse la herramienta Excel del paquete de Microsoft Office), se obtiene la ecuación de la recta que se ajusta a todos los puntos de la muestra y también el valor de R².

¿Cómo se interpreta?

Partiendo de la ecuación de la recta que obtuvimos, podemos entender el nivel de correlación entre las dos variables, pensándola como “y = bx + a”, donde “b” es el valor de la pendiente de la regresión lineal, por ende, por cada cambio unitario en el valor “x”, modificará el valor “y” en “b” unidades.
En el ejemplo anterior, “y” sería Densidad y “x” sería Concentración, por cada cambio unitario en la concentración, la densidad se modifica en 0,0377 unidades.

Entonces podemos concluir tres cosas:
1. Mientras más concentración tenga la solución, mayor será su densidad.
2. Las variables tienen una correlación positiva. (porque la pendiente es positiva)
3. Se precisa aumentar en gran cantidad la Concentración para aumentar la Densidad.

En el gráfico queda delineada la relación que existe entre los valores de las concentraciones de las soluciones y sus correspondientes densidades, viéndose que estas últimas crecen cuando crecen las primeras. Incluso se podrían obtener también los datos no medidos utilizando la línea de tendencia, teniendo en cuenta que cuanto más cercano a 1 sea nuestro valor R², más precisa será nuestra predicción, la del ejemplo anterior es un 96,8% precisa.

Referencias:

García Velázquez, M. del R. y Hernández Gracia, T. J. (2013) «Metodología de la investigación», Boletín Científico de las Ciencias Económico Administrativas del ICEA, 2(3)

Departamento de Sociología de la Universidad Complutense de Madrid. Análisis de regresión lineal : El procedimiento Regresión lineal. Guía para el análisis datos [Internet]. 2013;67. Disponible en: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/GuiaSPSS/18reglin.pdf

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *