REDUCCIÓN DE DIMENSIONES
Definición de reducción dimensional
Selección de características vs extracción de características
Selección de características
Extracción de características
Se selecciona un subconjunto de las características originales
Se deriva información del conjunto característica para construir un nuevo sub-espacio de caractertísticas
La reducción de dimensionalidad es una técnica estadística que convierte un conjunto de datos de alta dimensión en otro de menor dimensión.
El objetivo es reducir el número de variables aleatorias consideradas, obteniendo un conjunto de variables principales.
Ventajas
Reducción de errores
Mejora el rendimiento
Mejora la interpretación
Mejora la visualización
Crea características nuevas a partir de funciones de las características originales
Devuelve un subconjunto de las características
La diferencia entre ambas es que mientras mantengamos las características originales cuando usamos algoritmos de selección de características, como la SBS, usamos extracción de características para transformar o proyectar la información en un nuevo espacio
Puede ser entendido como un acercamiento a la comprensión de los datos con el objetivo de mantener la mayor parte de información relevante.
No sólo se usa para mejorar el espacio de almacenamiento o la eficiencia computacional del algoritmo de aprendizaje, sino que puede también mejorar el rendimiento predictivo al reducir el curso de la dimensionalidad
Podemos usar diferentes técnicas para reducir el número de características en el conjunto de datos.