Please enable JavaScript.
Coggle requires JavaScript to display documents.
Estadística y análisis de datos (Modelos de distribución teórica (Formas…
Estadística y análisis de datos
Introducción
Estadística
El arte de realizar inferencias con datos con 'ruido'
Estadística en Ciencias de la Tierra
Métodos estadísticos
Analiza sistemas
Complejos
Con incetidumbres
Ejemplos
Recursos energéticos,
clima,
peligros geológicos
Toma de muestras
(observaciones)
Por medio de
Pruebas en campo
Experimentos
Monitoreo
Recolección e interpretación
de datos
Explorar, modelar y pronosticar
Conocer mejor el proceso
Inferencias adecuadas
Mezcla de ciencia y arte
Variedad de problemas, cada uno es diferente
Requiere conocer e investigar cada proceso
Desarrollo de métodos de investigación nuevos
Estadística básica
Se aplica en
Diseño de experimentos
Descripción y exploración de datos
Inferencia: predicciones y generalizaciones
Estadística descriptiva
Tipos de variables
Continuas
Numero infinito de valores
Escalas de medición
Discretas
Conjunto numerable de valores
Por conteo
Medidas de posición central
de sipersión y de forma
Tablas y gráficos
Inferencia estadística
Estimación
Puntual
Por intervalos
Contraste de hipótesis
Métodos paramétricos
T-Student,
ANOVA,
Fisher,
Pearson
Métodos no paramétricos
U-Mann,
Whitney,
K-W,
Tablas de contingencia
Clasificación de datos estadisticos
Numéricos
(cuantitativos)
Tipos
De radio
Cero indica ausencia de algo, es absoluto
Tiene un orden
De intervalo
Niveles de 'satisfacción'
Valores ordenados,
sin ceros
Categóricos (cualitativos)
Tipos
Nominal
Asigna etiquetas, sin orden obvio
Dicotómicos
Solo hay 2 categorías
Ordinal
Con un orden natural
(puede ser numerico)
Clasificación de datos de
acuerdo a su obtención
Primarios
Estudio particular, Muestreo de sitio
Secundarios
Información de apoyo, datos históricos
No necesariamente resuelven el problema principal
Obtenidos de agencias u otros etudios
Multivariados
Múltiples atributos
Provenientes de una misma estación
Análisis de frecuencias
Se realiza sobre los datos y
se lleva a cabo por pasos
Frecuencia relativa
hi
Proporción del total en la categoría
=fi/n
Frecuencia acumulada
Fi
Total acumulado de la categoría
Frecuencia absoluta
fi
Número de observaciones por categoría
Frecuencia relativa acumulada
Hi
Proporción del total que cae en la categoría
=Fi/n
Cuantifican la repetición
de un evento
Procedimiento para definir intervalos
de análisis de frecuencias
Regla de Sturges: determinar número de intervalos
k = 1 + 3.3 log_10(n)
,
n
el número tottal de datos
Determinar tamaño del intervalo,
w = R/k
Elaboración de una tabla de resultados
Calcular el rango,
R = Obs_máx - Obs_mín
Gráficos de distribuciones
de frecuencias
Ojiva
Gráfica de frecuencias acumulativas vs.
clases de valores de datos
Sirve para encontrar percentiles
Hojas y tallos
Separa el último dígito del
orden decimal superior
Grafica distribuciones de frecuencias de manera simultánea
Histograma
Gráfica de frecuencias vs.
clases de valores de datos
Da la forma de la muestra
Diagrama de Pareto
Ordenamiento de frecuencias
de mayor a menor
¿Qué tan rápido decrecen las frecuencias?
Muestreo y recolección de datos
Muestra
Subconjunto de la población
Seleccionado a través de una técnica muestral,
implica diseñar la técnica de muestreo
Elemento
Individuo representativo de la población
Selección por el muestreo
Sistemático
Aleatorio
Por grupos
Estratificado
Población
Es el universo de los datos de estudio
Diseño de muestras
Pasos del diseño
Universo: finito o infinito
Unidades del muestreo, tiempo y espacio
Origen (fuente) y tipo de población para el muestreo
¿De dónde se toma la muestra?
Tamaño de la muestra
¿Cuántos elementos son necesarios?
Parámetros a conocer de la muestra
¿Cuáles nos interesa conocer?
¿La variabilidad afecta?
Adecuación del diseño
Que sea representativo
Errores de muestreo y sistemáticos
pequeños y controlables
Coste óptimo y efectivo
rentable
Confianza de resultados, aplicables a la población
Tipo de diseños
En base a representabilidad
Probabilístico
Aleatorio, probabilidad equitativa, bajo regla de Bayes
No probabilístico
Reducción de varianzas entre elementos, etc.
Modelos de distribución teórica
Conecta observación y teoría,
visualización del comportamiento de los datos
Se basa en funciones de densidad
de probabilidad (y proba. acumulada)
Formas generales
Asimetría (sesgo)
Es positiva (a la derecha), usualmente, en ciencias de la Tierra y Ambientales
Probabilidad constante (uniforme)
Simetría (Gaussiana)
Puede asociarse a variables aleatorias:
discretas o continuas
Distribuciones comunes
Normal (Gaussiana)
LogNormal
x' = log(x). Se desea obtener
una distribución de tipo normal
Representación de distribuciones empíricas
Representación aritmética
Medidas de tendencia central
Mediana
Observación (promedio de valores) central
Afectada por rango y valores centrales
Moda
Valor que más se repite
No es afectada por outliers o rangos centrales
Media o esperanza
Promedio aritmético de datos
Sensible a outliers
Criterios
Sesgo
+, media > mediana > moda
-, media < mediana < moda
Simetría
Medidas de dispersión
o variabilidad
Rango intercuartil
Cuartiles: Datos en orden ascendente
IQR = Q3 - Q1
Dispersión del 50% de los datos
menos sensible a outliers
Desviación absoluta media
Para análisis de series de tiempo
Desviación estándar
raiz cuadrada positiva de la varianza
Coeficiente de variación
Sz = desv. estándar, Z^{barra] = media muestral
Varianza
Más sensible a outliers que la media
Medidas de forma
Coeficientes de asimetría
Asim = 0, distr. simétrica
Asim < 0 = sesgo negativo
Asim > 0 = sesgo positivo
Curtosis
Forma de la distribución con respecto a la media
k = 3, mesocúrtica
Leptocúrtica, k > 3, puntiaguda, distribución mas dispersa con resp. a la media
Planicúrtica, k < 3 (menos puntiagudo, distribución alrededor de la media)