Análisis de Correspondencias Simples / AC0 El AFG (Análisis Factorial General) . 1 AF (Análisis Factorial) Objetivo: Dada una nube de puntos de Rp (filas de X), el AF da la mejor representación posible en un espacio de dimensión menor. Criterio de buena representación en un subespacio: Máxima separación (dispersión) entre las proyecciones. Utilizo como medida de calidad de una dirección la… Inercia recogida sobre esta dirección u (dispersión) : n Iu = d2 (0,proyu xi) = || Xu ||2 =utXtXu. i 1 Problema analítico: Soluciones / Iu= máx u=u1 Iu11 / Iu= máx u=u2 Iu22 paso 1 Busco u paso 2 Busco u ortogonal a u1 ... / Iu= máx u=up Iu p p paso p Busco u ortogonal a u1 , .. up-1 t v. y v. p. de X X. Solución: Direcciones: u1, u2, .. up vectores propios de XtX. Inercias: 1, 2, .. p valores propios de XtX. 1- La matriz a diagonalizar es XtX. En un ACP los datos se centran. XtX es la matriz de covarianzas muestrales. En un ACP Normado los datos se centran y escalan. XtX es m. corr. muestrales. 2- Cada dirección (factor principal) es una c.l. de las variables originales (con coeficientes dados por las componentes de u. 3- Los n valores del factor observado en los n individuos de la muestra se denominan “Factores calculados”: F= X u La dispersión de estos valores Fes la inercia recogida por el eje Iu =|| F||2 =|| Xu ||2 = utXt .Xu. Análisis de Correspondencias Simples / AC0 El AFG (Análisis Factorial General) . 2 AFG (Análisis Factorial General) Objetivo: Hace lo mismo que un AF, pero… con pesos pi (que forman la matriz diagonal N) y métrica M (para calcular distancias y proyectar) (El AFG con pesos iguales y métrica habitual N=M=I es un AF) Criterio de buena representación en un subespacio: El mismo. Máxima separación (dispersión) entre las proyecciones. Inercia recogida sobre una dirección u (dispersión) : n Iu = pi d2 (0,proy Mu xi) = || XMu ||2 N =utMXtNXMu. i 1 Problema analítico: paso 1 Busco u paso 2 Busco u M-ortogonal a u1 Soluciones / Iu= máx u=u1 Iu11 / Iu= máx u=u2 Iu22 ... paso p Busco u M-ortogonal a u1 , .. up-1 / Iu= máx u=up Iu p p t (v. y v. p. de X NXM.) Solución: Direcciones: u1, u2, .. up vectores propios de XtNXM. Inercias: 1, 2, .. p valores propios de XtNXM. Notas: 1- La matriz a diagonalizar es ahora XtNXM. 2- Cada dirección (factor principal) sigue siendo una c.l. (con coeficientes ude las variables originales. 3- Los n valores del factor observado en los n individuos de la muestra se denominan “Factores calculados”: F= XMu La dispersión, con pesos N, de estos valores Fes la inercia recogida por el eje Iu =|| F||2 N =|| XMu ||2N = utM XtNXMu.