3. Preparación de los datos
Los mineros de datos dedican la mayor parte del tiempo a esta fase porque el software de minería de datos requiere datos de alta calidad. Los procesos empresariales recopilan y almacenan datos por razones distintas a la minería La preparación de los datos implica los siguientes procesos.
Limpiar los datos, Por ejemplo, gestionar los datos que faltan, los errores de datos, los valores predeterminados y las correcciones de datos.
Integrar los datos, Por ejemplo, combinar dos conjuntos de datos dispares para obtener el conjunto de datos objetivo final.
Dar formato a los datos, Por ejemplo, convertir los tipos de datos o configurar los datos para la tecnología de minería específica que se utiliza.