INTRODUCCIÓN AL ANÁLISIS FACTORIAL

PDF

ÍNDICE

1. El análisis factorial

Desarrollo estadístico del Análisis Factorial. JM Santos Preciado

2. El análisis factorial en SPSS

-Inicio. Ventanas SPSS / Pestaña vista datos / Pestaña vista variables
-Menú analizar / reducción de dimensiones / factor
-Submenús: Variables / Descriptivos, Extracción, Rotación, Opciones
-Página de Resultados: Enunciados, Matriz de Correlaciones, Varianza de los factores, Factores
-Puntuaciones factoriales

3. Ejemplo de la aplicación del análisis factorial

-Caracterización de los desequilibrios socioeconómicos mundiales
-Definición de las variables
-Distribución mundial notaciones factoriales según países y modelos socioeconómicos
-Mapa del espacio mundo según modelos socioeconómicos
-Anexo. Matriz de datos de variables / Países, para el análisis factorial


1. EL ANÁLISIS FACTORIAL

El análisis factorial es un método estadístico que pretende sintetizar la información en un número de variables mínimo e imprescindible para el análisis del objeto de estudio.

El análisis factorial es un procedimiento estadístico complejo*, que precisa en su uso práctico de programas estadísticos. Si bien, existen varios programas estadísticos ofertados al público, tanto gratuitos como PSPP, y Javomi, y de pago, Minitab, SPSS y otros, SPSS, tiene incluido en el análisis factorial, el resultado final de la notaciones o puntuaciones aplicadas a cada caso de la Matriz de Datos (Casos / Variables), correspondientes a los factores extraídos para el análisis factorial.

* Desarrollo estadístico del Análisis Factorial. JM Santos Preciado


2. EL ANÁLISIS FACTORIAL EN SPSS

-Inicio. Ventanas SPSS / Pestaña vista datos / Pestaña vista variables

Cuando se abre SPSS se presentan dos ventanas. La primera es similar a uno hoja de cálculo dividida en celdas. La Segunda ventana es una hoja en blanco donde se obtienen los resultados del análisis factorial. La primera ventana tiene en la parte izquierda inferior dos pestañas, la primera pestaña sirve para pegar los datos y la segunda para definir las variables.

VENTANAS SPSS

DATOS INICIALES PARA EL ANÁLISIS FACTORIAL

En la pestaña Vista de Datos, se selecciona como celda activa, la celda superior izquierda, y se pegan los datos de la Matriz de Datos (Casos / Variables). En el presente ejemplo (170 casos / 14 variables). El resultado se puede ver en la siguiente imagen.

FORMATO DE LAS VARIABLES

La pestaña Vista de Variables sirve para dar el formato correspondiente a cada variable, para que se pueda realizar sin errores el análisis factorial.

En la columna Tipo, pulsando dos veces sobre la celda de cada variable se abre un Menú para asignar el formato correspondiente a cada variable. En el caso de la primera asignaremos el valor cadena por corresponder a un valor de texto. Las 14 variables con datos se les deberá asignar el formato: Coma, si son datos con decimales. Numérico, sin son datos sin decimales (Ver Imagen).

 

-Menú analizar / reducción de dimensiones / factor

Una vez cumplimentados los requisitos de la matriz de (Datos / Variables) se puede proceder al análisis factorial, para ello pulsaremos el MENÚ: Analizar y en el desplegable, la opción: Reducción de dimensiones-Factor. La Ventana que se abre nos muestra las variables en el cuadro de la izquierda.

-Submenús: Variables / Descriptivos, Extracción, Rotación, Opciones

VARIABLES

SUBMENÚS

SELECCIÓN DE LAS VARIABLES

Para poder realizar los cálculos seleccionaremos las variables a las que hemos asignado el formato, Coma (VAR00002 a VAR00014), y pulsaremos la flecha superior para pasarlas al cuadro de la derecha, tal y se muestra en la siguiente imagen.

A la derecha de la VENTANA se puede ver cuatro submenús: Descriptivos; Extracción; Rotación; Puntuaciones, y Opciones. Comenzando por el superior y en orden iremos abriendo cada uno de ellos.

DESCRIPTIVOS

Seleccionaremos los recuadros: Solución inicial; Coeficientes y Niveles de significación. Pulsamos: Continuar.

EXTRACCIÓN

Seleccionaremos: Matriz de Correlaciones y Número fijo de factores. Si el análisis factorial se corresponde con una alta concentración de las variables ponemos 2. Pulsamos: Continuar.

ROTACIÓN

Seleccionaremos: Ninguno, o la rotación Varimax, y Solución rotada. Pulsamos: Continuar.

PUNTUACIONES

Seleccionaremos: Regresión, y Mostrar matriz de coeficientes de las puntuaciones factoriales. Pulsamos: Continuar.

OPCIONES

Lo dejaremos como viene por defecto: Excluir casos según lista. Pulsamos: Continuar.


-Página de Resultados: Enunciados, Matriz de Correlaciones, Varianza de los factores, Factores

Los cálculos se irán colocando en la Página en blanco.

En primer lugar aparecerán los enunciados de los cálculos

ENUNCIADOS

Seguidamente se mostrará la Matriz de Correlaciones.

A continuación la Varianza de los Factores

Y por último los dos factores seleccionados, en este caso están extraídos sin rotación.

FACTORES

Puntuaciones factoriales

El aspecto más interesante en un análisis de múltiples casos que se corresponden con espacios geográficos, o de otro tipo, son las Notaciones o Puntuaciones factoriales de cada caso según el factor o los factores seleccionados. Las puntuaciones factoriales por caso, no aparecen en la hoja blanca sino en la Ventana de Vista de Datos a la derecha de las variables, tal y como se muestra en la siguiente imagen.


3. EJEMPLO DE LA APLICACIÓN DEL ANÁLISIS FACTORIAL

Caracterización de los desequilibrios socioeconómicos mundiales

Con el fin de tener una radiografía de los desequilibrios socioeconómicos a nivel mundial, se ha cuantificado la situación socioeconómica de 170 países a principios del siglo XXI. El procedimiento se ha basado en el análisis factorial. Se ha trabajado con 14 variables que definen las características socioeconómicas más importantes de 170 países basadas en datos de principios del siglo XXI (Ver Anexo Matriz de datos).

Estas variables se corresponden con tres campos que definen los desequilibrios socioeconómicos, que son: variables demográficas, económicas, y calidad de vida y se han tomado de una selección de variables más amplia por ser las que más grado de correlación tenían entre sí. (Cuadro 1)

Las variables demográficas, reflejan el crecimiento demográfico la estructura de la población, y la población urbana respecto del total de la población. Las variables económicas, la riqueza relativa del país respecto del total de la población y la composición de la población activa en los sectores agrario, industrial y servicios. Las variables de calidad de vida, las condiciones sanitarias, de alfabetización y la esperanza de vida. En estas 14 variables se ha resumido, pues, los posibles desequilibrios internos de cada país en relación con los 170 seleccionados.

 

Definición de las variables

Utilizando la técnica del análisis factorial se han relacionado las 14 variables de los 170 países (2.380 datos), habiendo obtenido una correlación elevada entre las mismas, explicando en un solo factor el 72,6% de la varianza. De esta manera la información de las 14 variables correlacionadas se sintetizan en una nueva y única variable denominada “Factor Socioeconómico” (Cuadro 1).

Cuadro 1

Ester “factor socioeconómico”, resume dos modelos de relacionarse las 14 variables entre sí: las variables del mismo signo se correlación directamente y las que tienen distinto signo inversamente. Los desequilibrios socioeconómicos en el mundo se pueden por lo tanto interpretar de la siguiente manera:

Por una parte, está el modelo expresado en las siete variables de correlación positiva y representa sociedades con fuerte dinamismo demográfico, un precario desarrollo económico y escasa calidad de vida. Ello está representado en: 1º las tasas de natalidad y 2º de fecundidad más altas, 3º en el crecimiento vegetativo más elevado, 4º el mayor grupo de edad de población menor de 15 años, 5º las mayores tasas de empleo agrícola,  6º la mayor tasa de analfabetismo y 7º la tasa de mortalidad infantil más alta.

En oposición, está otro modelo de sociedades, expresado en la correlación de las variables negativas que se caracterizan por: su poco dinamismo demográfico, excelente desarrollo económico y buena calidad de vida. Ello se expresa en: 1º el mayor porcentaje de viejos, 2º el más elevado PNB por habitante ($), 3º la población activa industrial y 4º de servicios más numerosa, 5º el mayor porcentaje de población urbana, 6º la mayor esperanza de vida al nacer y 7º el mayor número de médicos por mil habitantes (Cuadro 2).

Cuadro 2

Desde el punto de vista de los desequilibrios, en las sociedades con correlaciones positivas el desequilibrio interno se manifiesta, principalmente en el bajo PNB por habitante ($), la menor población activa industrial y de servicios, la menor esperanza de vida al nacer y el menor número de médicos por mil habitantes. En las sociedades con correlaciones negativas el desequilibrio interno se expresa principalmente por las bajas tasas de fecundidad y natalidad, el bajo crecimiento vegetativo y el menor grupo de edad menores de 15 años.

Estos desequilibrios se expresan cuantitativamente en un solo valor por país, o notación factorial del “factor socioeconómico”, valor que es la síntesis de la información correlacionada de las 14 variables. Según el resultado de las notaciones factoriales, se han agrupado los países conformando cuatro tipologías, dos para las notaciones negativas y dos para las positivas. Evidentemente, en las zonas intermedias de las clasificaciones, se encuentran una serie de países con notaciones que son difícilmente de tipificar pero convencionalmente se les ha asignados el grupo más afín. (Cuadro 3).

 

Cuadro 3

Distribución mundial notaciones factoriales según países y modelos socioeconómicos [1]

Elaboración propia.

[1] Se puede considerar que los desequilibrios reflejados en las notaciones del factor socioeconómico, son desequilibrios estructurales que ilustran relativamente el estado de los países de un periodo histórico que se puede estimar de comienzos del XXI.

Mapa del espacio mundo según modelos socioeconómicos

Elaboración propia.

El modelo 1 (notaciones –1,69 a -1), que comprende 39 países con desarrollo o moderado desarrollo socioeconómico y situación demográfica estancada, se localizan en Europa, Rusia, América del Norte, Australia - Nueva Zelanda y Japón, solamente Uruguay en América del Sur se sitúa en ese grupo.

El modelo 2 (notaciones –0,99 a 0), incluye 42 países con moderado desarrollo socioeconómico y situación demográfica de moderada a dinámica, se localizan en América Latina, Asia Oriental, y en África en Sudáfrica y Túnez.

El modelo 3 (notaciones 0,01 a 1), es el grupo más numeroso con 52 países de moderado desarrollo o subdesarrollo socioeconómico y situación demográfica dinámica, se localizan en América central, en la región del norte de los Andes; en el norte, oeste y sur de África; en Asia occidental y meridional, y en parte de Oceanía.

El modelo 4 (notaciones 1,01 a 1,71), comprende 37 países con subdesarrollo socioeconómico y situación demográfica muy dinámica, se localizan en los países de Asia de Laos, Afganistán, Yemen, Nepal y Bhután; el resto de países se localizan en el centro, este y oeste de África.

En el Cuadro 3 se puede apreciar como la situación que se ha llegado en el mundo, a principios del siglo XXI se correlaciona inversamente desde los países desarrollados a los países más pobres. En el Mapa 1, se puede observar, que el mundo, con la excepción de Australia y Nueva Zelanda, se divide entre el Norte, desarrollado económicamente, con demografía estancada, esperanza de vida alta, y el Sur, con subdesarrollado económico, demografía dinámica y esperanza de vida media o baja. Estos modelos contrastados entre ambos hemisferios están induciendo a movimientos de población que, sin duda, van a ser de gran fuerza en el siglo XXI.


ANEXO

Matriz de datos: variables / Países, para el análisis factorial

Fuente datos ONU. Elaboración propia

*

.