Please enable JavaScript.

Coggle requires JavaScript to display documents.

TEMA 5: APRENDIZAJE Y ADAPTACIÓN EN INTELIGENCIA ARTIFICIAL - Coggle…

- - - - Capa de entrada: Recibe los datos
      - Capas ocultas: Procesamiento intermedio
      - Capa de salida: Genera la respuesta del modelo
- - - - Crossover: Intercambio de información entre individuos
      - Mutación: Alteración aleatoria de genes para explorar nuevas soluciones
- - - - Estados S
      - Acciones A
      - Recompensas R
      - Transiciones de estado P(s'|s,a)
  - - - Aprende una función Q(s,a) que estima la mejor acción en cada estado
      - Se basa en la ecuación de Bellman para actualizar valores
    - - Usa redes neuronales para aproximar la función Q
      - Aplicado en juegos como Atari y control de robots
    - - prenden directamente una política π(s) sin necesidad de una función Q
    - - Combina aprendizaje basado en valor y aprendizaje basado en políticas
  - - - ϵ-greedy: Explora con probabilidad ϵ, explota lo aprendido con 1-ϵ
      - Softmax: Selecciona acciones con probabilidad proporcional a su recompensa esperada