Training Deep Neural Nets (:star: 11.3 Faster Optimizers (11.3.1 Momentum…