Please enable JavaScript.
Coggle requires JavaScript to display documents.
APRENDIZAJE SUPERVISADO - Coggle Diagram
APRENDIZAJE SUPERVISADO
Concepto general
El aprendizaje supervisado es un tipo de aprendizaje donde el modelo aprende usando ejemplos conocidos.
-
-
Si existe diferencia, ajusta sus parámetros para mejorar.
Se usa para que una máquina aprenda a clasificar, predecir o tomar decisiones a partir de ejemplos.
Esquema general
Datos de entrada
-
Pueden ser números, imágenes, textos, sonidos o características de un problema.
Salida esperada
-
También se conoce como etiqueta, objetivo o valor deseado.
Modelo
-
Puede ser un perceptrón, una red neuronal, un clasificador o un algoritmo de predicción.
-
-
-
Tipos principales
-
Aprendizaje por refuerzo
Concepto
-
-
Si la acción es buena, recibe una recompensa.
Si la acción es mala, recibe una penalización o castigo.
-
Aunque normalmente se estudia como un tipo independiente de aprendizaje automático, en esta actividad puede explicarse como una forma de aprendizaje guiada por señales de evaluación.
Qué incluye
Agente
-
Puede ser un robot, un programa, un sistema inteligente o un jugador automático.
-
-
-
-
-
-
-
Fórmulas principales
-
Función de valor acción
Q(s,a) = r + γ max Q(s',a')
Q(s,a) = valor de realizar una acción en un estado
-
-
-
-
-
Proceso
-
-
-
- Recibir recompensa o castigo
-
-
- Actualizar el conocimiento
-
-
-
-
-
-
Desventajas
-
-
-
Si la recompensa está mal definida, el agente aprende mal.
-
-
-
Ejemplo
-
Si avanza correctamente, recibe recompensa.
Si cae o choca, recibe castigo.
Con muchas pruebas, aprende qué movimientos son mejores.
Aprendizaje estocástico
Concepto
El aprendizaje estocástico es un método donde el modelo aprende usando muestras aleatorias de los datos.
En lugar de usar todo el conjunto de datos al mismo tiempo, selecciona ejemplos individuales o pequeños grupos.
-
-
-
-
Proceso
-
- Seleccionar una muestra aleatoria
-
-
-
-
-
-
-
-
-
Desventajas
-
-
-
Si la tasa es alta, puede no converger.
Si la tasa es baja, puede tardar demasiado.
-
-
-
Ejemplo
-
En lugar de usar los 1000 datos juntos, toma un dato aleatorio.
-
-
-
-
-
-
-
-
Conclusión
-
El aprendizaje por corrección de error corrige pesos usando la diferencia entre salida deseada y salida obtenida.
-
El aprendizaje estocástico aprende usando muestras aleatorias para actualizar el modelo de forma progresiva.
Los tres métodos ayudan a mejorar el comportamiento del modelo mediante entrenamiento, evaluación y ajuste.