Please enable JavaScript.
Coggle requires JavaScript to display documents.
Experimentos Estadísticos y Pruebas Significativas para Ciencia de Datos…
Experimentos Estadísticos
y Pruebas Significativas
para Ciencia de Datos
Introducción a las Pruebas de Hipótesis y su Estructura:
Es un proceso estadístico diseñado para evaluar afirmaciones sobre una población utilizando datos de una muestra, permitiendo decidir con base en evidencia si una afirmación se sostiene o no.
Componentes Clave:
Hipótesis Nula: Es la hipótesis del "no cambio", la ausencia de efecto o la igualdad (ej. "el nuevo medicamento no hace diferencia"). Se asume verdadera hasta que se demuestre lo contrario.
Hipótesis Alternativa: Es la afirmación que el investigador desea probar o la sospecha de que existe un efecto real (ej. "el medicamento sí funciona").
Tipos de Error
Error Tipo I (alpha): Rechazar la hipótesis nula cuando en realidad era verdadera (falso positivo).
Error Tipo II (beta): No rechazar la hipótesis nula cuando en realidad era falsa (falso negativo).
Diseño de Experimentos y Pruebas A/B (A/B Testing)
Pruebas A/B:
Experimentos controlados con dos variantes (A y B) donde se mide una métrica de rendimiento específica para determinar cuál es más efectiva. Es ampliamente utilizado en optimización web y desarrollo de productos.
Elementos Esenciales del Diseño
Sujetos/Unidades: Las entidades que reciben los tratamientos (ej. usuarios, páginas web).
Controles y Tratamientos: El grupo de control recibe la versión existente (A) y el grupo de tratamiento recibe la nueva propuesta (B) para aislar el efecto del cambio.
Aleatorización: Asignación al azar de los sujetos a los grupos para evitar sesgos y asegurar que ambos grupos sean estadísticamente comparables antes del experimento.
El Proceso de Decisión: Valor-p y Alfa
Valor-p (p-value):
Es la métrica probabilística central que mide la "rareza" de los resultados. Indica la probabilidad de obtener un resultado tan extremo o más extremo que el observado, asumiendo que la hipótesis nula Ho es completamente cierta. Un valor-p bajo sugiere que los datos observados son incompatibles.
Nivel de Significancia (alpha): Es el umbral crítico de probabilidad (comúnmente fijado de manera arbitraria en 5% o 1%) que define el límite de lo que consideramos "azar".
Regla de Decisión: Si el valor-p < alpha, se rechaza la hipótesis nula Ho y se concluye que los resultados son estadísticamente significativos. Si el valor-p ge alpha, no hay evidencia suficiente para rechazar Ho.
Pruebas de Hipótesis Comunes y Aplicaciones
Prueba t de Student (t-test): Utilizada para comparar las medias de dos grupos y evaluar si su diferencia es estadísticamente significativa o producto del azar.
Prueba de Chi-Cuadrado (chi2: Aplicada para variables categóricas. Evalúa la independencia entre dos variables o la bondad de ajuste de una distribución.
Análisis de Varianza (ANOVA): Extensión de la prueba t que permite comparar simultáneamente las medias de tres o más grupos independientes para ver si al menos uno difiere de los demás.
Pruebas No Paramétricas: Alternativas avanzadas (como la prueba de Wilcoxon o Mann-Whitney) que se emplean cuando los datos no cumplen con los supuestos tradicionales de normalidad.