Please enable JavaScript.
Coggle requires JavaScript to display documents.
Mapa Mental Data Leakage 0ffeb84e-c64d-447d-b3ca-a0babe673afd, Estuardo…
Mapa Mental Data Leakage
Definición
Situación en la que información no destinada al conjunto de entrenamiento influye en el proceso de aprendizaje del modelo.
Propósito de Identificar: Evitar sesgos y sobreajustes en el modelo, asegurando la validez y generalización de los resultados.
Aplicaciones de Prevención: En todos los proyectos de aprendizaje automático, especialmente en aquellos donde la exactitud y la fiabilidad del modelo son críticas.
Tipos de Data Leakage
Leakage de Datos de Entrenamiento: Información del conjunto de prueba se mezcla con el conjunto de entrenamiento.
Leakage de Características: Inclusión de características en el entrenamiento que no estarán disponibles en el momento de las predicciones reales.
Impacto
Sobreajuste: El modelo se ajusta demasiado bien a los datos de entrenamiento, pero falla en predecir correctamente en datos nuevos.
Rendimiento Engañoso: Métricas de rendimiento artificialmente altas durante la fase de entrenamiento.
Causas Comunes
Preprocesamiento Inadecuado: Aplicación de transformaciones a todo el dataset antes de la división en conjuntos de entrenamiento y prueba.
Errores en la Recopilación de Datos: Falta de separación clara entre los datos de entrenamiento y prueba desde la recopilación.
-
-
-
-