Please enable JavaScript.
Coggle requires JavaScript to display documents.
Relación entre la minería de datos y estudio de…
Relación entre la minería de datos y estudio de caso diabetes.csv
.
INTEGRANTES - DM C2 Grupo D
PILAMUNGA MUÑOZ BRITTANY LESSLY - Coordinadora de Proyecto.
MANTILLA LOZANO CRISTIAN DANILO - Data Manager.
GONZAGA ANDI BRYAN WILFRIDO - Esp. Modelos Predictivos.
SEGOVIA TAMAYO EDGAR FERNANDO - Analista Exploratorio.
GUADAMUD MENDOZA MARIA ELOISA - Esp. Clasificación y Recomendaciones.
SANTANA VERA JHON JAIRO - Documentador/Redactor.
¿Qué es?
Explorar grandes conjuntos de datos
Descubrir patrones y relaciones
Indicadores de riesgo conjunto
Análisis estadístico
Transformar datos en conocimiento útil
Objetivos Principales
Ejemplo: Estado de diabetes en pacientes
PREDICCIÓN
.
Ejemplo: Factores asociados a la diabetes
DESCRIPCIÓN
Procesos Clave
FASE I: Carga y Limpieza
Dataset Diabetes
Tratamiento de valores nulos (0)
FASE II: Análisis Exploratorio
Explorar relaciones entre variables
Factores de Riesgo y Outcome
Correlación entre Medidas antropométricas y biomédicas
antecedentes familiares y riesgos genéticos
Edad con otros factores
BMI y BloodPressure
FASE III: Modelado
Modelos predictivos / descriptivos
FASE IV: Evaluación
Validar precisión y utilidad clínica
Dataset "diabetes.csv"
768 registros
9 variables
1 categórica (Outcome: diabetes sí=1 / no=0)
8 numéricas (Glucosa, BMI, Edad, etc.)
Población: género femenino
Valores nulos representados como 0
Aplicación al Caso Diabetes
Predicción Temprana
Detección temprana de riesgo
Recomendaciones Preventivas
Salud personalizada y prevención
Estrategias
Estilo de vida saludable
Alimentación balanceada
Ejercicio regular
Control de factores de riesgo
Monitoreo de glucosa
Chequeos médicos regulares
Educación del paciente
Talleres informativos
Material didáctico
Análisis de Variables Clave
Glucosa, Edad, BMI, Antecedentes
atributos clínicos y demográficos
Variables
Total de embarazos
Concentración de glucosa
Presión arterial diastólica
Grosor de la piel
Niveles de insulina
Índice de masa corporal
Predisposición genética
Edad del encuestado
Diagnóstico médico (0 = ausencia, 1 = positivo)
Posibles tareas de minería de datos aplicables (clasificación, predicción, agrupamiento, etc.).
Asignar etiquetas a los individuos, por ejemplo, clasificar a las personas en grupos de riesgo (alto, medio, bajo) en función de sus valores de BMI y presión arterial.
Ejercicios
Clasificación (por ejemplo, riesgo de hipertensión),
Predicción (predicción de valores futuros o riesgo),
Agrupamiento (segmentación de perfiles de pacientes)
Reglas de asociación (descubrir relaciones entre BMI y presión arterial).
S3-TRABAJO PRÁCTICO EXPERIMENTAL_1
housing = pd.read_csv('diabetes.csv')