Please enable JavaScript.
Coggle requires JavaScript to display documents.
Problemas del Aprendizaje Predictivo - Coggle Diagram
Problemas del Aprendizaje Predictivo
overfitting
modelo efectivo sobre los datos de entrenamiento pero no en caso real
causas
trainset no concuerda con datos reales
algoritmo demasiado optimizado
falta de evaluación rigurosa y sistemática
soluciones
garantizar traintest realista
protocolo de evaluación estable y consistente
validación cruzada
Desbalance clases
distribución desequilibrada de clases
soluciones
estratificacion
undersampling/inframuestreo
eliminar ejemplos de la clase mayoritaria
oversampling
multiplicar aleatoriamente los datos de la clase minoritaria
aprendizaje sensible al coste de error
cambiar métrica para dar más importancia a los ejemplares minoritarios
coste de error x10 a la clase mayoritaria
probar con diferentes costes para evitar falsos positivos
Clases Solapadas
solo en clasificación
noticia puede ser de economía, deportes y política a la vez
soluciones
binarizar el problema
ej: es economía si o no?
one hot enconding
políticas de ranking
Optimización de hiperparámetros
búsqueda exhaustiva
para cada hp se eligen valores posibles y se crea una malla de combinaciones posibles
búsqueda guiada
se elige una combinación de parámetros al azar y se evalua
si mejora se sigue buscando en esa dirección
si empeora se cambian
mejorable con gradiente
Costes de error asimétricos
No es lo mismo cometer un falso positivo que un falso negativo
ej. falso negativo en detección de cáncer
solución
aprendizaje sensible al coste
distintos valores de coste y penalización