Please enable JavaScript.
Coggle requires JavaScript to display documents.
Aprendizaje Maninfold - Coggle Diagram
Aprendizaje Maninfold
Python
-
-
-
Isomap
from sklearn.manifold import Isomapmodel = Isomap(n_components=2)
proj = model.fit_transform(data)
- Para datasets grandes, usar submuestra
- data = mnist_data[::30] # 1/30 del total
Ventajas / Desventajas
-
-
¿Cuándo usar manifold?
Cuando se sospecha que los datos tienen estructura intrínsecamente no lineal y baja dimensionalidad. Especialmente útil para exploración visual y comprensión de datasets complejos.
Visualización exploratoria, Datos curvados y Alta dimensión
Aplicaciones
Reconocimiento de caras
Dataset de 2370 imágenes de 2914 píxeles. Isomap en 2D captura orientación (eje X) e iluminación (eje Y) como dimensiones fundamentales, sin necesitar etiquetas.
Dígitos MNIST
70,000 imágenes de 784 píxeles. El embedding de Isomap revela la variedad de estilos de escritura (orientación, serifas, bases) dentro de cada dígito.
-
Algoritmos
-
Incrustaciones
Lineales
consideran rotaciones, traslaciones y escalados de los datos. Fallan cuando la incrustación es no lineal.
No lineales
en lugar de preservar distancias globales, preservan solo las distancias entre puntos vecinos. Pueden imaginar desenrollar los datos en 2D manteniendo las longitudes de las líneas trazadas entre puntos vecinos.
Fundamentos
¿Qué es un Manifold?
Objetivo
Reducción dimensional, Preservar estructura y Visualización
Encontrar una representación de baja dimensión que preserve la estructura esencial de los datos, manteniendo las relaciones de vecindad o distancias entre puntos.
Un manifold es una variedad de dimensión baja que está incrustada (embebida) en un espacio de alta dimensión. La hipótesis del manifold asume que los datos reales de alta dimensión yacen —o están cerca— de una variedad de dimensión mucho menor.
Concepto clave
La base del aprendizaje manifold es la matriz de distancias por pares N×N, donde la entrada (i,j) contiene la distancia entre el punto i y el punto j.
Esta matriz codifica las relaciones fundamentales del conjunto de datos, siendo invariante a rotaciones y traslaciones.
La elección de la métrica de distancia (euclidiana, geodésica, etc.) determina qué relaciones se preservan en la incrustación resultante.
vs. PCA (lineal)
PCA busca proyecciones lineales de máxima varianza. El aprendizaje manifold va más allá: captura relaciones no lineales que PCA no puede descubrir.