Please enable JavaScript.
Coggle requires JavaScript to display documents.
Ejemplos de datos sucios datos sucios, CBTIS 144, Nombre:Estrada Vazquez…
Ejemplos de datos sucios
¿Que son los datos sucios? :star:
Los datos son el nuevo petroleo. :red_flag:
No se tratan como tal.
Se tenian un almacen de datos planos.
Archivos planos y Excel.
No se soluciona creando mas infraestructuras de datos.
Las empresas no logran solucionar de manera correcta los problemas por no saber donde buscar.
Preguntas comunes :question:
¿Cómo se introdujo esa información?
¿Quién era el responsable?
Son preguntas sin respuestas. :fire:
Las empresas prefieren trabajar con datos erroneos ya que es mas facil qque arreglarlos desde la fuente.
¿Cuál de las dos informaciones es correcta?
Ejemplos mas comunes.
Las mas incorrectas suelen ser las mas basicas como nombre o sexo.
Los principales problemas de los especialistas es:limpiar los datos.
Las empresas quieren listas de primera.
Errores tipograficos.
Nombres en blanco, incorrectos,imcompletos
Datos de direccion imcompletos o no validos.
Los datos de referencia tambien tienen errore. :warning:
Los datos de referencian a referenciar otros.
Como una lista de paises y ciudades.
Crean su lista para tener problemas mas la rato por el mas minusculo de los errores. :red_flag:
¿Que medidas pueden tomar las empresas?
Navneet un enfoque para resolver estos problemas.
Identificar el alcanace:
Primero hay que identificar lo que hay que arreglar.
Implanta la gobernaza de datos:
Una vez identificados los problemas a corto y largo plazo puedes limpiar los datos historicos.
Con esto se soluciona tu problema y no queras que vuelva a pasar, y si vuelve a pasar ya se tendra un mecanismo para arreglarlo.
Construir el plan a largo plazo.
Hay dos formas de solucionarlo
Corto plazo:
Puedes ponerle un poco de de sellador para un tiempo.
Largo plazo:
Primero hay que buscar el problema. y asi comprender el problema
¿Como afecta la mala calidad?
La analitica y atrabajos de IA y ML se ven mas afectados.
Hay muchos casos donde los modelos se alimentan de datos basura.
CBTIS 144
Nombre:Estrada Vazquez Kevin Alexis
Docente: Somoza Marroquin Patricia Elizabeth
Fecha:20/10/25
3.-A Inteligencia Artificial
Mchine Learning
2do parcial
Mapa conceptual sobre los datos sucios