Análisis factorial

¿Que es el análisis factorial?

El análisis factorial es una técnica estadística que se utiliza para determinar hasta qué punto un grupo de medidas comparte una varianza común. El análisis factorial a veces se denomina técnica de “reducción de datos” porque el método se utiliza con frecuencia para extraer algunos componentes (o factores) subyacentes de un gran conjunto inicial de variables observadas. Se utiliza ampliamente en la investigación psicológica relacionada con la construcción de escalas destinadas a medir actitudes, percepciones, motivaciones, etc. Las aplicaciones relacionadas con el negocio son numerosas y los ejemplos incluyen el desarrollo de escalas utilizadas para medir la satisfacción del cliente con los productos y las actitudes laborales de los empleados. El análisis factorial, sin embargo, tiene aplicabilidad fuera del ámbito de la investigación psicológica. Puede ser utilizado acciones en las que los precios fluctúan de manera similar. Y el análisis de factores a menudo juega un papel crucial en establecer la validez de las pruebas de empleo y los métodos de evaluación del desempeño, ayudando así a una empresa a defenderse de los cargos por discriminación laboral.

Hay muchos métodos diferentes de análisis factorial y la teoría matemática subyacente es bastante compleja. Sin embargo, los elementos básicos del análisis factorial son relativamente sencillos de comprender. Un ejemplo del uso del análisis factorial podría involucrar una investigación diseñada para construir una escala de satisfacción laboral de los empleados. Inicialmente, un investigador o consultor puede reunir un gran conjunto de elementos del cuestionario que parecen estar relacionados con la satisfacción laboral. Estos elementos generalmente se presentarán a los sujetos junto con algún tipo de escala numérica o verbal.

El cuestionario de satisfacción laboral puede incluir varias docenas de preguntas de este tipo. Sin embargo, lo que realmente interesa son las opiniones de los empleados sobre las dimensiones subyacentes de la satisfacción laboral. Por lo general, solo hay unas pocas dimensiones de este tipo, que son estados psicológicos que no pueden medirse directamente. Estas dimensiones se denominan “factores” y el análisis factorial se utiliza para evaluarlas indirectamente.

En este caso, el modelo de análisis factorial básico asume que las respuestas de los empleados a cada uno de los ítems de satisfacción laboral en el cuestionario pueden condensarse en uno o más factores subyacentes. A veces, el investigador tendrá alguna expectativa en cuanto al número de factores, aunque tal suposición no es necesaria. Se supone que los factores están relacionados con la puntuación de cada ítem del cuestionario de forma lineal. Suponga que todas las respuestas a los ítems de satisfacción laboral derivan de dos factores subyacentes, más algún elemento aleatorio (quizás debido a un error de medición). Si es así, entonces la respuesta de un encuestado a un ítem en particular podría descomponerse en esos factores básicos de acuerdo con la siguiente ecuación: donde: puntajei = puntaje del sujeto en el ítem del cuestionario; 1i = coeficiente que relaciona el factor 1 con la puntuación ; factor = valor del primer factor para el sujeto; a 2i = coeficiente que relaciona el factor 2 con la puntuación ; factor = valor del segundo factor para el sujeto; aleatorio = error aleatorio.

Los factores subyacentes pueden considerarse como los verdaderos sentimientos del sujeto con respecto a su trabajo. El investigador, sin embargo, solo tiene las respuestas del sujeto a preguntas específicas sobre las características del trabajo del empleado. Dado que estos se miden con algún error, también hay un componente aleatorio en el valor observado. Se pueden escribir ecuaciones separadas para todos los elementos del cuestionario. Para cada ítem, los coeficientes (a 1i y a 2i ) probablemente será diferente. Estos coeficientes se denominan habitualmente “cargas factoriales”. Si bien los factores no se pueden medir directamente, es posible estimar cargas factoriales indirectamente. Las estimaciones de las cargas factoriales se derivan de la matriz que contiene las intercorrelaciones de todas las puntuaciones observadas para un gran número de sujetos. Cada sujeto de la muestra responde a todos los ítems del cuestionario y la matriz contiene todas las correlaciones posibles entre pares de estos ítems. Las matemáticas de este proceso están más allá del alcance de este artículo (aunque se discuten en las referencias incluidas al final). La mayoría de los programas estadísticos generales, como el paquete estadístico para los servicios sociales (SPSS), SYSDAT y SAS, realizan análisis factorial.

Los enfoques del análisis factorial se pueden agrupar en dos enfoques fundamentalmente diferentes. En el caso del “análisis factorial exploratorio”, el investigador puede tener sólo una vaga idea, en el mejor de los casos, de cuántos factores se incluyen en el conjunto de variables que se están estudiando. Además, es posible que no tenga expectativas sólidas en cuanto a qué variables observadas se asociarán con qué factores. Por lo tanto, el enfoque exploratorio se utiliza para comprender cómo pueden estar relacionadas las variables y descubrir la probable estructura de factores subyacente. Más recientemente, los investigadores han desarrollado un enfoque más sofisticado llamado “análisis factorial confirmatorio”. En el análisis factorial confirmatorio, el investigador tiene expectativas en cuanto al verdadero número de factores subyacentes y puede aplicar diferentes tipos de pruebas para determinar si la estructura hipotetizada es correcta. En la práctica, los investigadores a menudo mezclan técnicas exploratorias y confirmatorias.

En el “análisis factorial exploratorio”, el investigador se enfrenta primero al problema de determinar el número óptimo de factores a extraer de la matriz de correlaciones entre las variables observadas (como las respuestas a los ítems del cuestionario). Hay varios criterios disponibles, pero el más común se basa en el incremento en la varianza común explicado extrayendo un factor adicional. Los métodos exploratorios suelen definir factores como no correlacionados entre sí; el primer factor extraído por el método explicará la mayor cantidad de varianza común en el conjunto de elementos observados, el segundo factor será el factor no correlacionado (u “ortogonal”) que explica el siguiente componente más grande de varianza común, y así sucesivamente. La extracción de factores continúa hasta que se extrae lo que el investigador cree que es un número óptimo de factores. El número máximo de factores que se pueden extraer es igual al número de variables observadas, pero normalmente el número real es mucho menor. Un punto de parada ampliamente utilizado en la extracción de factores es el punto en el que el “valor propio” (un término matemático relacionado con los métodos de manipulación de matrices empleados para extraer factores) de un factor a extraer no es mayor que uno. Esto sugiere que el factor no explica más varianza entre las variables que la explicada por una sola variable. Dichos factores a menudo se asocian fuertemente con una sola variable observada y probablemente solo expliquen los errores de medición en las variables observadas. Sin embargo, entran en juego otras consideraciones, incluido el juicio profesional del investigador. A diferencia de muchas otras técnicas estadísticas, no existen pruebas sólidas de significación estadística que se puedan utilizar en el análisis factorial exploratorio. A menudo, los investigadores extraen diferentes números de factores y comparan los resultados, eligiendo el resultado que es más razonable en teoría.

Una vez determinado el número óptimo de factores, el investigador examina la tabla de cargas factoriales generada por el análisis para intentar interpretar el significado de los factores. Desafortunadamente, el conjunto de cargas factoriales producidas en el análisis factorial exploratorio no es determinante y es posible generar solo cargas factoriales “relativas”. Esto significa que las cargas factoriales pueden transformarse sistemáticamente en un número infinito de formas y aún así explicar la misma varianza común entre las variables observadas (es decir, el análisis factorial exploratorio determina la proporcionalidad entre las cargas, pero no sus valores exactos). Para resolver este problema, un segundo procedimiento, llamado “rotación de factores”, se utiliza normalmente después de que se ha generado el conjunto inicial de cargas factoriales. La rotación de factores implica una transformación sistemática del conjunto de cargas, de acuerdo con uno de los muchos criterios matemáticos posibles, para proporcionar una diferenciación óptima entre los factores. La rotación de factores ayuda al investigador a interpretar el significado de cada factor.

Los métodos de análisis factorial derivan cargas factoriales de tal manera que los grupos de variables que están altamente interrelacionados tienden a cargar en el mismo factor. Las cargas están en el rango de -1.0 a 1.0 y cuanto mayor es el valor absoluto de una carga, más estrechamente relacionado está un elemento observado con un factor.

El patrón observado de cargas factoriales se utiliza generalmente como una forma de interpretar los factores subyacentes. Este patrón dependerá de una serie de decisiones tomadas por el investigador, incluida la cantidad de factores extraídos y los métodos de extracción de factores especificados. Las cargas factoriales de más de .70 (o menos de —.70) a menudo se consideran indicativas de una asociación cercana entre un factor y un ítem observado. En el ejemplo hipotético, se destacan cargas factoriales relativamente fuertes. El factor 1 parece estar asociado principalmente con los aspectos económicos del trabajo, mientras que el factor 2 se asocia principalmente con las cualidades más intrínsecas del trabajo.

También es posible estimar la proporción de varianza en una variable observada que se explica por factores subyacentes. Esto se llama comunalidad de un artículo. Por supuesto, algunas variables pueden pasar desapercibidas. Este es el caso del “nivel de estrés”, que carga débilmente con ambos factores. La comunalidad de la variable estrés también será baja. El investigador podría concluir que el estrés representa una dimensión independiente y excluirlo del análisis.

El “análisis factorial confirmatorio” es un proceso muy diferente. Aquí, el investigador generalmente tiene una idea tanto del número de factores subyacentes como de la estructura de los factores. Esto significa que él o ella especifica cuáles de las variables observadas están asociadas con cuál de los factores hipotetizados. Los factores mismos pueden estar correlacionados. Si se cumplen ciertas condiciones matemáticas, entonces se pueden estimar los valores de todas las cargas factoriales identificadas; no se requiere una rotación posterior de las cargas factoriales. Los métodos de análisis factorial confirmatorio también permiten varias pruebas de significación estadística, tanto para el modelo en su conjunto como para parámetros individuales, como las cargas factoriales. análisis de regresión) y varios estadísticos de ajuste general diferentes se utilizan para evaluar la adecuación general del modelo.

Al utilizar el análisis factorial confirmatorio, el investigador debe postular uno o más modelos específicos, definiendo el número de factores y qué variables se hipotetizan para ser determinadas por (es decir, tener cargas con) qué factores. A diferencia del análisis factorial exploratorio, en el que se supone que todas las variables observadas se cargan en todos los factores, muchas o todas las variables observadas en el análisis factorial confirmatorio generalmente se planteará la hipótesis de que se cargan en menos factores que el número especificado de factores, a menudo solo en uno de factores (es decir, las cargas de los factores entre una variable observada y todos los demás factores se fijan, en efecto, a un valor de cero). Una vez que se especifica un modelo, se pueden estimar sus cargas factoriales y otros parámetros (por ejemplo, variaciones de error). Esto se logra mediante un proceso matemático en el que las cargas estimadas y otros parámetros se utilizan para calcular una matriz de correlación prevista para las variables observadas. Con una matriz de correlación predicha, los parámetros se actualizan sistemáticamente mediante un proceso iterativo hasta que la diferencia entre las matrices de correlación real y predicha se minimiza dada la estructura hipotética del modelo, en cuyo punto se dice que los resultados “convergen”.

Hay varios estadísticos de bondad de ajuste para el modelo general, y el estadístico básico sigue una “distribución de chi-cuadrado”. La prueba de chi-cuadrado se puede utilizar para determinar si el modelo en su conjunto reproduce razonablemente la matriz de correlación observada. Si es así, entonces el investigador concluiría que el análisis tiende a confirmar la validez del modelo hipotetizado (asumiendo que los valores de las cargas factoriales también son de los signos esperados). Sin embargo, dado que la prueba de chi-cuadrado es muy sensible al tamaño de la muestra, a menudo conduce al rechazo de los modelos. Por esta razón, a menudo se utilizan otros criterios, como el “índice de bondad de ajuste”, para evaluar estos modelos. Estos criterios alternativos no son sensibles al tamaño, pero tampoco tienen distribuciones muestrales que puedan usarse para realizar pruebas de significación estadística. Por lo tanto, tales pruebas son bastante críticas, aunque existe un acuerdo general en cuanto a los valores apropiados que deben alcanzar estos índices para confirmar un modelo.

También es posible utilizar el análisis factorial confirmatorio para comparar dos modelos diferentes con el fin de determinar cuál encaja mejor. Por ejemplo, un investigador puede desear determinar si un modelo de satisfacción laboral de un factor, en el que todos los indicadores de satisfacción observados se cargan en un solo factor, es inferior a un modelo de dos factores, en el que la satisfacción con los aspectos económicos del trabajo carga sólo en un factor y la satisfacción con los aspectos intrínsecos carga sólo en un segundo factor. Se estimarían ambos modelos y se preferiría el que tuviera mejores medidas de ajuste.

En la práctica, los análisis factoriales exploratorios y confirmatorios se utilizan a menudo de forma conjunta. El trabajo inicial con una escala podría involucrar un análisis factorial exploratorio, para discernir patrones probables en las interrelaciones entre las variables observadas. Una vez que se determinan, se puede usar el análisis factorial confirmatorio, generalmente con otra muestra de casos, para probar las relaciones esperadas. A veces, los investigadores comenzarán con un enfoque confirmatorio y descubrirán que su modelo anticipado no funciona. Esto puede dar lugar a un trabajo exploratorio adicional para determinar qué relaciones pueden existir entre los datos.

El análisis factorial sigue siendo una herramienta central para discernir la validez y confiabilidad de las escalas que podrían usarse en las decisiones comerciales. Una vez que se valida una escala en este asunto, los elementos se pueden sumar para formar una estimación de la escala. A veces, los investigadores extraerán ponderaciones, llamadas “coeficientes de puntuación de factores”, como un subproducto del análisis de factores; estos coeficientes ponderan la variable observada por su importancia relativa en un factor dado al calcular el valor estimado de ese factor. Los continuos refinamientos en las técnicas de análisis factorial confirmatorio deberían hacer que este tipo de análisis factorial sea especialmente importante como herramienta analítica en los próximos años.

5/5 - (5 votes)