Cuando la nube de puntos muestra una clara relación lineal entre las variables podemos describirla matemáticamente mediante una línea recta con una aproximación razonable y, posteriormente, utilizarla para predecir o estimar valores de y para los valores de x que interese.
El problema es obtener la recta que mejor ajuste a la nube, entendiendo que el mejor ajuste será aquel para el cual las estimaciones o predicciones que hagamos sean lo más certeras que sea posible: aquel que haga mínimo el conjunto de los errores de estimación.
Para un par de valores (xi, yi), el error de estimación, que llamamos residuo será la diferencia entre el valor observado de la variable dependiente yi y el valor teórico yi* que correspondería según la recta de regresión para el valor xi. Gráficamente, cada residuo será la distancia vertical de cada punto de la nube a la recta de regresión.
La recta que proporciona el mejor ajuste es la obtenida mediante el criterio de ajuste por mínimos cuadrados: aquella que hace mínima la suma de los cuadrados de los residuos.
|