Con el nacimiento del internet y el crecimiento tecnológico, se ha provocado un aumento desmesurado del volumen de datos, adicionalmente ahora no sólo tenemos datos estructurados (fechas, claves, cantidades, tiempo, etc.), también tenemos datos no estructurados (blogs, comentarios en redes sociales, etiquetado en fotos, videos, etc.) lo que ha provocado una variedad de datos.
Entre más datos se tienen, una problemática que ha surgido es el poder determinar la veracidad de los datos, es decir, qué tan confiable pueden ser los datos