¿Que es el análisis multivariado?
El análisis multivariado se ocupa de la aplicación matemática de la estadística a una función de regresión para determinar los efectos de los cambios en un grupo de variables sobre otras variables de la función. Como resultado, el análisis multivariado puede sugerir, con cierto grado de capacidad predictiva, lo que se puede esperar que suceda cuando cambien esas variables.
Si bien involucra muchos tipos de herramientas, el análisis multivariado es principalmente un enfoque matemático para la toma de decisiones. Tiene muchas aplicaciones, incluidos problemas en ingeniería, gestión del tráfico, biología, economía, marketing e incluso ética y psicología del comportamiento. Puede cuantificar cómo los cambios en una o más áreas de un problema complejo afectarán un resultado a lo largo del tiempo e indicar si esos cambios aliviarán o exacerbarán un problema.
Por ejemplo, una compañía aérea puede utilizar un análisis multivariado para determinar cómo los ingresos de una determinada ruta pueden verse afectados por diferentes precios de tarifas, factores de carga, presupuestos publicitarios , opciones de aviones, servicios, opciones de programación, precios de combustible y salarios de los empleados. Un ingeniero agrícola usaría análisis multivariante para medir el rendimiento de los cultivos en función de las diferentes calidades del suelo; opciones de semillas, fertilizantes, insecticidas y cronogramas de siembra; cantidades de luz solar y lluvia; y cambios de temperatura.
En estos ejemplos, los ingresos por ruta y el rendimiento de los cultivos son variables dependientes determinadas por conjuntos de variables independientes, como los precios de las tarifas y las opciones de semillas. Un cambio en cualquiera de las variables independientes producirá un cambio en la variable dependiente. Pero en algunos casos, las variables independientes pueden afectar a otras variables independientes.
Por ejemplo, las tarifas de avión más bajas pueden afectar los factores de carga y estos pueden afectar las opciones de los aviones. De manera similar, diferentes fertilizantes pueden afectar la elección de semillas y estos pueden afectar los programas de siembra. Los intentos de mejorar el resultado de la variable independiente pueden tener un impacto positivo a corto plazo, pero pueden resultar perjudiciales a largo plazo.
El análisis multivariado no es sinónimo de la metodología clásica de ecuaciones simultáneas, aunque esta forma de modelado es un componente esencial del análisis. El análisis multivariado incluye prescripciones para simplificar parámetros y establecer relaciones entre datos en diferentes períodos de tiempo.
La aplicación del poder de procesamiento por computadora avanzó enormemente la ciencia del análisis multivariante al liberar a los analistas de la tediosa tarea de la computación. Como resultado, los programas informáticos se han convertido en el instrumento básico necesario del análisis multivariado.
Uno de los mayores problemas que enfrentan los analistas de datos multivariados es la parametrización excesiva. Un analista demasiado entusiasta puede inclinarse a incluir muchos tipos de microfenómenos en el análisis que pueden tener poca o ninguna relación con el resultado.
Parte del arte del análisis multivariado es saber qué variables pueden excluirse. Si bien esto simplifica los cálculos involucrados, también puede crear una mayor variación en los datos observados, lo que dificulta la identificación de líneas de regresión confiables. La única forma de superar estos dilemas es probar repetidamente los modelos.
Una forma de parametrización excesiva tiene que ver específicamente con el análisis de series de tiempo. Esto se hace evidente en el análisis multivariado de los fenómenos biológicos y sociológicos; Las condiciones actuales pueden depender principalmente de los resultados de series de tiempo anteriores.
Por ejemplo, la tasa de reproducción de los árboles en un bosque no sólo depende de cuántos árboles hay, pero cuántos eran, y cuántos eran en serie de tiempo sucesivos antes de eso. Las condiciones climáticas de hace 10.000 años pueden ser responsables de los cambios climatológicos que afectan las tasas actuales de crecimiento. En algunos casos, el analista puede enfrentarse a una regresión prácticamente infinita. Cuando se enfrenta a estos problemas de la gallina y el huevo, el analista debe determinar dónde trazar la línea o limitar los parámetros del análisis, sin corromper la confiabilidad del análisis.