¿Que son los mínimos cuadrados?
El criterio de mínimos cuadrados es un enfoque estadístico que se utiliza para proporcionar la estimación más precisa de las relaciones entre conjuntos de variables en datos de muestra. Se utiliza para definir líneas y planos de regresión que producen estimaciones de una variable dependiente, valores dados para una variable independiente.
El análisis de mínimos cuadrados es el enfoque más popular para el cálculo de líneas de regresión porque es relativamente simple y muy preciso. Particularmente en relaciones lineales, proporciona el mejor estimador lineal insesgado (AZUL) de datos de muestra. También proporciona el estimador de máxima verosimilitud (MLE), en regresiones donde los errores de la línea de regresión forman una distribución normal en forma de campana.
Para comprender cómo se realiza un análisis de mínimos cuadrados, es importante comprender primero las propiedades de un análisis de regresión. El análisis de regresión, descrito de manera simple, usa fórmulas algebraicas para estimar el valor de una variable dependiente aleatoria continua, usando otras variables independientes como indicadores. Estas fórmulas producen una estimación de la variable dependiente que es más correcta (o menos incorrecta), dado cualquier valor de una variable independiente.
El enfoque de mínimos cuadrados es casi 100 años más antiguo que el análisis de regresión. Fue desarrollado de forma independiente entre 1805 y 1809 por el matemático francés Adrien-Marie Legendre (1752-1833) y el matemático y astrónomo alemán Carl Friedrich Gauss (1777-1855). Estos matemáticos estaban trabajando en formas de estimar las trayectorias de los cometas.
Las observaciones astronómicas habían sugerido que estos cometas mantenían órbitas muy erráticas. De hecho, las desviaciones se debieron a errores de observación. Esto llevó a los descubridores a desarrollar un método, el menos
Figura 1criterio de cuadrados, que eliminaría estos errores y produciría una predicción correcta de la trayectoria de un cometa.
El trabajo de los matemáticos arrojó importantes conocimientos sobre la estimación de relaciones entre otros tipos de coordenadas gráficas, específicamente, cómo racionalizar las desviaciones de una línea teórica de mejor ajuste. Según la definición de tal línea estimada, hay tantas desviaciones negativas como positivas. Como resultado, todas las desviaciones deben expresarse como valores absolutos, una condición que se cumple mediante el cuadrado (el cuadrado de cualquier número, ya sea positivo o negativo, es positivo).
El criterio de mínimos cuadrados produce una línea en la que la suma de las desviaciones al cuadrado de cada valor Y de la línea es la más baja. La línea representa una estimación continua de los valores de Y para cada valor de X, según los datos de muestra (consulte la Figura 1).
Este sencillo ejemplo demuestra que es imposible trazar una línea recta o una regresión lineal que toque los cuatro puntos del gráfico. En cambio, usamos el criterio de mínimos cuadrados para determinar la ubicación de una línea recta (Q) que se acerca más a los puntos.
El cuadrado también coloca la línea de regresión precisamente donde las desviaciones de la línea son más bajas. Si las sumas de las desviaciones no se elevaron al cuadrado, la línea puede desplazarse hacia arriba o hacia abajo hasta que se encuentre con una coordenada. Una mayor desviación en un lado de la línea sería
Figura 2compuesto exactamente por disminuciones en el otro lado de la línea (ver Figura 2).
Cuando las desviaciones se elevan al cuadrado, se amplifica el grado de su desviación. La diferencia entre 2.5, 3.5, 4.5 y 5.5 es 1, pero la diferencia entre sus cuadrados (6.25, 12.25, 20.25, 30.25) aumenta gradualmente, 6, 8 y 10.
Como resultado, la fórmula de mínimos cuadrados indica una pendiente específica 13 y coloca esa pendiente en un punto de referencia específico a, la intersección con el Y.