Descripción: Apache Spark es un motor unificado para procesar datos a gran escala que integra módulos para SQL, streaming, aprendizaje automático y procesamiento de nodos. Spark se puede ejecutar de forma independiente o en Apache Hadoop, Apache Mesos, Kubernetes, la nube y distintas fuentes de datos. Apache Spark es un framework de computación en clúster open-source. Fue desarrollada originariamente en la Universidad de California, en el AMPLab de Berkeley. El código base del proyecto Spark fue donado más tarde a la Apache Software Fundation que se encarga de su mantenimiento desde entonces.