REDUCCIÓN DE DIMENSIONES

Definición de reducción dimensional

Selección de características vs extracción de características

Selección de características

Extracción de características

Se selecciona un subconjunto de las características originales

Se deriva información del conjunto característica para construir un nuevo sub-espacio de caractertísticas

La reducción de dimensionalidad es una técnica estadística que convierte un conjunto de datos de alta dimensión en otro de menor dimensión.

El objetivo es reducir el número de variables aleatorias consideradas, obteniendo un conjunto de variables principales.

Ventajas

Reducción de errores

Mejora el rendimiento

Mejora la interpretación

Mejora la visualización

Crea características nuevas a partir de funciones de las características originales

Devuelve un subconjunto de las características

La diferencia entre ambas es que mientras mantengamos las características originales cuando usamos algoritmos de selección de características, como la SBS, usamos extracción de características para transformar o proyectar la información en un nuevo espacio

Puede ser entendido como un acercamiento a la comprensión de los datos con el objetivo de mantener la mayor parte de información relevante.

No sólo se usa para mejorar el espacio de almacenamiento o la eficiencia computacional del algoritmo de aprendizaje, sino que puede también mejorar el rendimiento predictivo al reducir el curso de la dimensionalidad

Podemos usar diferentes técnicas para reducir el número de características en el conjunto de datos.