Please enable JavaScript.
Coggle requires JavaScript to display documents.
Deep Learning & Reinforcement Learning - Coggle Diagram
Deep Learning & Reinforcement Learning
¿Qué es el Reinforcement Learning?
Un diferenciador clave del aprendizaje reforzado del aprendizaje supervisado o no supervisado es la presencia de dos cosas:
Un entorno: podría ser algo así como un laberinto, un videojuego, la bolsa de valores, etc.
Un agente: esta es la IA que aprende a operar y tener éxito en un entorno determinado.
El objetivo del agente es maximizar su recompensa acumulativa esperada.
La forma en que el agente aprende a operar en el entorno es a través de un ciclo de retroalimentación iterativo. El agente primero realiza una acción y, como resultado, el estado cambiará según las recompensas ganadas o perdidas.
Al tomar acciones y recibir recompensas del entorno, el agente puede aprender qué acciones son favorables en un estado determinado.
¿Qué es deep learning?
Deep learning es un subconjunto de machine learning (que a su vez es parte de la inteligencia artificial) donde las redes neuronales, algoritmos inspirados en cómo funciona el cerebro humano, aprenden de grandes cantidades de datos.
Características de deep learning
Abierto y flexible
Cómputo de GPU elástico
Optimización de hiperparámetros
Neural Network Modeler (beta)
Asistente de experimentos
Beneficios de deep learning
Ahorre tiempo, y no solo dinero
Inteligencia bajo demanda
Infraestructura de nube confiable
Gráficos, no archivos de registro
Colaboración en equipo
Flujo de trabajo de reinforcement learning
Crear el entorno
En primer lugar, debe definir el entorno en el que opera el agente de reinforcement learning, incluida la interfaz entre el agente y el entorno.
Definir la recompensa
Dar forma a la recompensa puede ser complicado y requerir varias iteraciones hasta obtener el resultado correcto.
Crear el agente
Las diferentes formas de representación suelen depender de las categorías específicas de los algoritmos de entrenamiento.
Entrenar y validar el agente
Configure las opciones de entrenamiento y entrene al agente para ajustar la política. Asegúrese de validar la política entrenada cuando finalice el entrenamiento. Si es necesario, revise las opciones de diseño, tales como la señal de recompensa y la arquitectura de política, y vuelva a realizar el entrenamiento.
Desplegar la política
Despliegue la representación de la política entrenada utilizando, por ejemplo, código C/C+ o CUDA generado. En este punto, la política ya es un sistema de toma de decisiones independiente. El entrenamiento de un agente con reinforcement learning es un proceso iterativo.
¿Cómo se utiliza el deep learning?
Reconocimiento del habla
El mundo de los negocios y el académico han adoptado el aprendizaje a fondo para el reconocimiento del habla.
Procesamiento del lenguaje natural
Las redes neurales, componente central del deep learning, se han utilizado para procesar y analizar texto escrito por muchos años.
Sistemas de recomendación
El deep learning se puede utilizar para mejorar recomendaciones en entornos complejos como intereses musicales o preferencias de prendas de vestir en múltiples plataformas.