Análisis de Componentes Principales

Técnica de síntesis de la información o reducción de la dimensión

Reducir a un menor números de datos perdiendo la menor cantidad de información posible.

Se emplea en:

Análisis Exploratorio de datos

Construcción de modelos predictivos

Ventaja

Reduce la dimensionalidad de un grupo de datos y retiene aquellas características del conjunto

Los componentes de bajo orden a veces contienen el aspecto "más importante"

Objetivos

Investigar si es posible representar los individuos mediante r variables con poca pérdida de información

r de ellas contengan toda la información

Las restantes p-r fuesen irrelevantes

Fundamento

Existe una base de vectores propios.

La transformación lineal es necesaria para reducir la dimensión de datos.

El ACP construye una transformación lineal que escoge un nuevo sistema de coordenadas para el conjunto de datos

Formas de aplicar ACP

Método basado en la matriz de correlación

Método basado en l matriz de covarianzas

Proceso general del ACP

X: Matriz de datos tipificados

R=X"X Matriz de correlaciones

Componentes principales

Matriz de datos

Criterios para la reducción de la dimensión

Criterio de varianza explicada

image

Criterio de valor propio

Gráfico de sedimentación o de "codo"

Sesión 4
Elaborado por: Diego Rivera