Diferencias entre el análisis factorial exploratorio y confirmatorio: una ilustración para un modelo de medición del rendimiento académico en lectura con datos de PISA 2009 (PRESENTACIÓN)

July 13, 2017 | Autor: A. Fernandez Arauz | Categoría: Confirmatory factor analysis, Confirmatory Factor-Analysis, An introduction to confirmatory factor analysis, Analisis Factorial Confirmatorio Amos

Share Embed

Laporkan tautan ini

Descripción

DIFERENCIAS ENTRE AL ANÁLISIS FACTORIAL EXPLORATORIO Y CONFIRMATORIO: UNA ILUSTRACIÓN PARA UN MODELO DE MEDICIÓN DEL RENDIMIENTO ACADÉMICO EN LECTURA CON DATOS DE PISA 2009 Andrés Fernández Junio 2015

Introducción • Datos observacionales: análisis de relación o correlacionales que no permiten realizar conclusiones causales (aunque algunos se aventuran a hacerlas). • Existe una técnica estadística que en lugar de explorar los datos, permite comprobar una hipótesis teórica sobre un modelo de medición: análisis factorial confirmatorio. • Este trabajo pretende presentar la técnica del análisis factorial confirmatorio, compararla con el análisis factorial exploratorio y evaluar mediante un ejemplo empírico el uso que se le puede dar a esta técnica estadística.

Análisis factorial • Técnica de reducción de datos que sirve para encontrar grupos homogéneos de variables a partir de un conjunto usualmente muy grande de variables. Esos grupos homogéneos se forman con las variables que correlacionan mucho entre sí.

• Determinar el número y la naturaleza de las variables latentes o factores que explican la variación y covariación entre un conjunto de medidas observadas, comúnmente conocidas como indicadores. • Un factor (también llamado variable latente o constructo) es una variable no observable que influye en más de una medida observada y que da cuenta de las correlaciones entre estas medidas observadas

Análisis factorial • Modelo de factor común: cada indicador en un conjunto de medidas observadas es una función lineal de uno o más factores comunes y un factor único. • Hay dos tipos principales de análisis basados en el modelo de factor común: el análisis factorial exploratorio (EFA) y el análisis factorial confirmatorio (CFA). • EFA: explorado por los datos; no se hacen especificaciones en relación con el número de factores latentes o al patrón de las relaciones entre los factores comunes y los indicadores. • CFA: especifica el número de factores y el patrón de relación entre el indicador y las cargas factoriales de antemano, así como otros parámetros.

Exploratorio vs Confirmatorio: Conocimiento previo • EFA es generalmente un procedimiento descriptivo o exploratorio donde todos los indicadores cargan libremente en todos los factores (no es necesario saber mucho). • CFA se debe especificar previamente todos los aspectos del modelo factorial (fuerte fundamentación empírica y conceptual para poder guiar la especificación y evaluación del modelo factorial).

Exploratorio vs Confirmatorio: Input de análisis • EFA matriz de correlaciones HISEI PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL

HISEI

PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL

1,0000 0,5405 0,5632 0,1929 0,1134 0,0268 0,0151 0,0285

1,0000 0,5051 0,1672 0,1027 0,0069 0,0309 0,0282

1,0000 0,2003 0,1238 0,0109 0,0836 0,0560

1,0000 0,3514 0,1003 0,0149 0,0586

1,0000 0,0984 0,0431 0,0553

1,0000 0,3337 0,1491

1,0000 0,1074 1,0000

• CFA matriz de varianzas y covarianzas HISEI

PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL

HISEI 338,501 PARED 42,165 17,976 HOMEPOS 12,370 2,557 METASUM 3,544 0,708 UNDREM 2,000 0,417 JOYREAD 0,395 0,023 DIVREAD 0,303 0,143 ATSCHL 0,541 0,123

1,425 0,239 0,142 0,010 0,109 0,069

0,998 0,336 0,080 0,016 0,060

0,919 0,075 0,045 0,055

0,638 0,290 0,123

1,185 0,121

1,067

Exploratorio vs Confirmatorio: Variables • EFA se estandarizan completamente todas las variables en el análisis (tanto observadas como latentes), para poder utilizar apropiadamente la matriz de correlaciones y producir soluciones completamente estandarizadas. • CFA la mayor parte del análisis no requiere la estandarización de las variables observadas ni de las latentes, por lo que no sólo se puede obtener una solución completamente estandarizada sino también una solución no estandarizada donde la estimación de los parámetros se expresa en la métrica original de los indicadores, así como una solución estandarizada o no completamente estandarizada (indicadores no estandarizadas pero variables latentes estandarizadas)

Exploratorio vs Confirmatorio: Cargas factoriales • EFA todos los indicadores cargan libremente en todos los factores latentes y la solución es rotada para maximizar la magnitud de las cargas primarias y minimizar la magnitud de las cargas cruzadas. • La rotación factorial no aplica en el CFA, debido a las restricciones identificadas previamente al fijar la mayor parte de las cargas cruzadas como iguales a cero (se obtiene una solución más parsimoniosa).

Exploratorio vs Confirmatorio: Cargas factoriales

Exploratorio vs Confirmatorio: Correlación de errores de medición • EFA los modelos factoriales deben ser especificados bajo el supuesto de que el error de medición es aleatorio (no correlacionan unos con otros). • CFA la correlación entre los errores de medición sí puede ser modelada (aunque dicha especificación de correlación debe ser justificada sustancialmente en la teoría y evidencia empírica, así como todas las estructuras de un modelo CFA).

Exploratorio vs Confirmatorio: Correlación de errores de medición

Exploratorio vs Confirmatorio: Relación con otros análisis • EFA requiere del cómputo de puntajes factoriales que sirvan como proxy de los factores latentes. Sin embargo, esta práctica es limitada por la indeterminación de los puntajes; esto es, que para un EFA dado existe un número infinito de sets de puntajes que podrían ser computados y que son igualmente consistentes con las cargas factoriales.

• CFA esta indeterminación no es un problema porque la base conceptual y el sustento analítico previo elimina la necesidad de computar puntajes factoriales, es decir, los factores latentes son utilizados ellos mismos (y no puntajes) en los análisis, como en el caso de los modelos de ecuaciones estructurales.

Exploratorio vs Confirmatorio: Relación con otros análisis

Estimación del Confirmatorio • Parámetros a estimar: cargas factoriales, varianzas y covarianzas de error, varianzas y covarianzas factoriales.

• Objetivo: reproducir la matriz de varianzas y covarianzas observada de los datos. • Las variables latentes en CFA pueden ser exógenas o endógenas: ▫ Exógena: no es causada por otras variables en la solución. ▫ Endógena: causada por uno o más variables en el modelo (otras variables en la solución ejercen efectos directos en la variable).

Estimación del Confirmatorio • Métrica de la variable latente: Variable latente (inobservable) debe tener escala. La forma más común de darle una escala es fijar la métrica de la variable latente para que sea la misma que uno de sus indicadores, que será llamado indicador de referencia (para la solución no estandarizada). • Identificación del modelo: ▫ Sub-identificado: número de parámetros desconocidos es mayor al número de elementos conocidos (gl 0; solución única).

Datos y metodología • Programa Internacional de Evaluación de Estudiantes 2009 (PISA) • Población: estudiantes con edades entre los 15 años y tres meses y 16 años y dos meses que asisten a las instituciones educativas oficiales y se encuentran cursando un grado equivalente al séptimo o superior.

Costa Rica: Estadísticas descriptivas de la muestra de PISA según categoría. 2009 (cifras en porcentajes) Categoría

Porcentaje

Género Mujeres Hombres

53,0 47,0

(0,6) (0,6)

Sector educativo al que asiste Público Privado

84,6 15,4

(1,4) (1,4)

Año de Colegio que cursa Séptimo Octavo Noveno Décimo Undécimo Duodécimo

8,5 16,0 34,1 40,9 0,4 0,0

(0,8) (1,0) (1,2) (1,8) (0,1) (0,0)

Datos y metodología • Se probará la validez de un modelo del rendimiento educativo de los estudiante en la prueba de lectura de la evaluación PISA 2009.

• PISA 2009 tuvo énfasis en la alfabetización lectora. • Únicamente el modelo de medición (CFA). • El ejemplo se ilustra sobre la base de la evidencia empírica en cuanto a la construcción de los constructos.

Factor Latente 1: Extracción socioeconómica • En diversos países ha sido ampliamente probada la hipótesis de que un mayor estatus socioeconómico del estudiante se asocia con un mejor rendimiento educativo. • PISA incluye una variable latente denominada Índice de Estatus Económico, Social y Cultural (puntuaciones factoriales) pero no será ingresada de esta forma en el modelo de medición. • Tres variables de medición: ▫ Índice posesiones del hogar (HOMEPOS) ▫ Índice de estatus ocupacional más alto de los padres (HISEI) ▫ Índice del nivel educativo más alto de los padres (PARED).

Factor Latente 2: Estrategias de lectura • Investigación previa (Fernández, 2013) “En especial, el índice de habilidad para resumir presenta el mayor efecto marginal, de un 76%, lo que significa que un incremento de una desviación estándar en la medida de este índice -para un estudiante desaventajadoproducirá un incremento en la razón de probabilidades de un 76%”. “El índice de habilidades para comprender y recordar se encuentra muy relacionada con las técnicas en donde se prioriza el resumir ideas y explicarlas en sus propias palabras, en lugar de copiar o recitar una oración textualmente”

• Dos variables de medición: ▫ Índice de habilidades para resumir (METASUM) ▫ Índice de habilidades para comprender y recordar (UNDREM)

Factor Latente 3: Actitud Personal hacia la lectura • Investigación previa (Fernández, 2013) “Como segunda y tercera variables con mayor impacto para propiciar la resiliencia, se encuentran el gusto del estudiante por la lectura y su actitud hacia el centro educativo. Ambas están relacionadas con las actitudes personales del alumno, la forma en que valora el proceso educativo, su colegio, la importancia del estudio y en general el gusto por la lectura”.

• Tres variables de medición: ▫ Índice de disfrute propio por la lectura (JOYREAD) ▫ Índice de diversidad de lecturas (DIVREAD) Una tercera que no está relacionada con este constructo: ▫ Actitud del estudiante hacia el centro educativo (ATSCHL).

Resultados: análisis exploratorio Cargas factoriales del análisis factorial exploratorio con datos de PISA FACTOR 1 FACTOR 2 FACTOR 3 FACTOR 4 HISEI PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL Autovalores iniciales % Varianza individual % Varianza acumulada

0,767 0,690 0,717 0,160 0,073 -0,006 0,049 0,027

-0,016 0,002 0,056 0,042 0,069 0,345 0,995 0,127

0,005 0,005 0,024 0,021 0,021 0,101 -0,018 0,988

0,115 0,092 0,125 0,633 0,532 0,134 -0,054 0,045

1,61 20,1 20,1

1,14 14,2 34,4

0,99 12,4 46,8

0,74 9,3 56,1

Fuente: cálculos propios con datos de PISA 2009 Rotación Varimax

Resultados: análisis confirmatorio Modelo sobreidentificado:

Parámetros total = 22 Parámetros fijos = 3 : λ_x31 = 1 para el Factor 1 λ_x42 = 1 para el Factor 2 λ_x63 = 1 para el Factor 3 Parámetros libres (a estimar) = 19 (22-3) Elementos observados: 36 Grados libertad=36-19=17

Resultados: análisis confirmatorio Solución no estandarizada

Resultados: Ajuste global del modelo Matriz de varianzas y covarianzas observada y estimada para el modelo de tres factores OBSERVADA HISEI

PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL

HISEI 338,501 PARED 42,165 17,976 HOMEPOS 12,370 2,557 METASUM 3,544 0,708 UNDREM 2,000 0,417 JOYREAD 0,395 0,023 DIVREAD 0,303 0,143 ATSCHL 0,541 0,123

1,425 0,239 0,142 0,010 0,109 0,069

0,998 0,336 0,080 0,016 0,060

0,919 0,075 0,045 0,055

0,638 0,290 0,123

1,185 0,121

1,067

ESTIMADA HISEI

PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL

HISEI 338,586 PARED 41,961 17,981 HOMEPOS 12,402 2,565 METASUM 3,539 0,732 UNDREM 2,309 0,478 JOYREAD 0,436 0,090 DIVREAD 0,356 0,074 ATSCHL 0,160 0,033

1,426 0,216 0,141 0,027 0,022 0,010

0,998 0,337 0,082 0,067 0,030

0,919 0,054 0,044 0,020

0,638 0,289 0,130

1,185 0,106

1,067

Error cuadrático medio de la aproximación. Menor a 0,05 es un muy buen ajuste: RMSEA = 0,0297 [0,0231 , 0,0366] al 95%

Ajuste Comparativo. Más cercano a 1 es mejor vs modelo nulo CFI = 0,9872

Resultados: Significancia de los parámetros estimados Prueba de Wald (T-value): Un valor mayor a 2 (1,96 estrictamente al 95%) en un parámetro específico muestra que el parámetro es realmente distinto del cero.

Resultados: Residuos estandarizados Matriz de residuos estandarizados para el modelo de tres factores HISEI PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL HISEI PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL

0,000 0,152 -0,057 0,018 -1,097 -0,180 -0,169 1,272

0,000 -0,087

-1,327 0,958 1,309

0,000 1,184 -1,080 4,313

0,000 0,000 -0,175 -3,402

0,000 2,085 0,065 2,382

0,000 0,093 -0,495

0,000 0,000

En la práctica, se considera que los residuos estandarizados que son iguales o mayores que 1,96 (en valor absoluto) son problemáticos. Un residuo estandarizado positivo sugiere que los parámetros del modelo subestiman la relación de orden cero entre dos indicadores en algún grado. Para residuos muy grandes, estos pueden indicar que se necesitan parámetros adicionales en el modelo para medir de una mejor manera la covarianza entre los indicadores

Resultados: análisis confirmatorio Solución estandarizada

Resultados: análisis confirmatorio • En la solución completamente estandarizada las cargas factoriales pueden ser interpretadas como coeficientes de regresión estandarizadas: un incremento de un punto estándar en el índice de posesiones del hogar (HOMEPOS) se asocia con un incremento de 0,73 puntos estándar en el factor de Extracción socioeconómica. • Cuando un modelo de medición no incluye dobles cargas de un mismo indicador (es decir, ninguna variable carga en más de un factor, como en este caso) las cargas factoriales de la solución completamente estandarizada también pueden interpretarse como correlaciones del indicador con el factor latente porque este factor es el único predictor del indicador. • De esta manera, el cuadrado de las cargas factoriales provee la proporción de la varianza en el indicador que es explicada por el factor latente.

Resultados: análisis confirmatorio Cargas factoriales de cada variable con su factor latente y proporción de varianza explicada por el factor latente Variable

Factor latente

Carga Factorial

Proporción Proporción de varianza Error

HISEI EXTRACT PARED HOMEPOS METASUM ESTRATEG UNDREM JOYREAD PERSONAL DIVREAD

0,77 0,69 0,73 0,72 0,49 0,74 0,45

0,60 0,48 0,53 0,52 0,24 0,55 0,20

0,40 0,52 0,47 0,48 0,76 0,45 0,80

ATSCHL

0,21

0,04

0,96

Resultados: Exploratorio vs Confirmatorio Diferencias entre las cargas factoriales para los modelos de análisis factorial exploratorio y confirmatorio con datos de PISA 2009 Variable HISEI PARED HOMEPOS METASUM UNDREM JOYREAD DIVREAD ATSCHL

Análisis Factorial Exploratorio

Análisis Factorial Confirmatorio

FACTOR 1

FACTOR 2

FACTOR 3

EXTRACT

0,77 0,69 0,72 0,16 0,07 -0,01 0,05 0,03

-0,02 0,00 0,06 0,04 0,07 0,34 0,99 0,13

0,00 0,01 0,02 0,02 0,02 0,10 -0,02 0,99

0,77 0,69 0,73

ESTRATEG

PERSONAL

0,72 0,49 0,47 0,45 0,21

Conclusiones • Los resultados muestran que las variables de nivel educativo máximo de los padres de familia, estatus ocupacional más alto de los padres de familia y de posesiones materiales en el hogar, son variables que en conjunto explican el constructo inobservable de extracción socioeconómica del estudiante. • Los índices de habilidades del estudiante para resumir un texto y de habilidades para comprender y recordar las partes esenciales de un texto dan buena cuenta del factor latente de Estrategias de lectura, aunque el índice de habilidades para comprender y recordar muestra una carga factorial más baja que el índice de habilidades para resumir, es decir, la proporción de la varianza que explica el factor latente sobre este indicador es más baja

Conclusiones • El disfrute propio del estudiante de la lectura por placer, la diversidad de materiales que lee el estudiante fuera del sistema educativo y la actitud personal del estudiante hacia el centro educativo son, en conjunto, indicadores aceptables para medir el constructo de actitud personal del estudiante hacia la lectura. • Sin embargo el tercer indicador muestra una carga factorial muy baja, que pueden evidenciar poca relación con este constructo o posibles correlaciones de error con otros indicadores; este índice de actitud personal del estudiante hacia el centro educativo muestra una carga factorial tan baja que la variable latente sólo explica el 4% de la varianza en este indicador, por lo que el 96% es varianza única

Conclusiones • A la luz de estos resultados, podría considerarse el variar algunas relaciones de trayectoria entre indicadores y variables latentes (analizando los índices de modificación de LISREL), así como definir efectos entre las mismas variables latentes para evaluar un modelo de ecuaciones estructurales sobre el rendimiento en lectura.

Gracias

Lihat lebih banyak...

Diferencias entre el análisis factorial exploratorio y confirmatorio: una ilustración para un modelo de medición del rendimiento académico en lectura con datos de PISA 2009 (PRESENTACIÓN)

Descripción

Comentarios