Reinforcement Learning (Gym), Markov Property, RL Overview, Q Learning,…