Estadística Inferencial
Conceptos básicos de Estadística
Población
Muestra
Parámetros
Estadísticos Muestral
Inferencia
Conjunto de todas las posibles unidades de observación que son objeto del problema a considerar. Es el objeto real de interés del cual la muestra escogida constituye un subconjunto particular.
Ejemplo
Los niños de diez años en
Perú.
Parte o subconjunto de una población. Subconjunto de medidas u observaciones tomadas a partir de una población dada. Se utiliza una muestra por razones prácticas, económicas o de tiempo que no permiten considerar a toda la población.
Ejemplo
Un centenar de niños de diez años
Característica medible de una muestra. Coeficiente intelectual, estatura, peso,etc.
Se refieren a las características medibles de una población y a los valores verdaderos que las describen.
Ejemplo
Estatura promedio de la población de 15
años en Perú.
La propuesta de una característica en la población (parámetro) estimada según la evaluación de la característica en la muestra (estadístico).
Ejemplo
El número de piezas defectuosas obtenidas en un proceso de fabricación.
Tipos de Variables
Variables dependientes.
Variables independientes.
Variables dependientes.
Variables cuantitativas.
Variables moderadoras.
Variables cualitativas.
Tipos de Muestreo
Muestreo aleatorio simple.
Muestreo aleatorio estratificado.
Muestreo aleatorio de conglomerados.
Muestreo aleatorio sistemático.
Muestreo no aleatorio intencional, opinático o de convivencia.
Muestreo no aleatorio por conveniencia.
Muestreo no aleatorio consecutivo.
Muestreo no aleatorio por cuotas.
Semana 3
El teorema central del límite
En el resultado anterior, veíamos que la suma de variables aleatorias normales es otra variable aleatoria normal. Sin embargo, la normalidad de una suma de variables no se limita solo a las variables normales. El teorema central del límite es un resultado matemático que garantiza que, si sumamos variables cualesquiera (no necesariamente normales), la variable suma también seguirá una distribución normal (esto siempre que se cumplan algunas condiciones básicas).
Teorema del límite central
Si se seleccionan muestras aleatorias de n observaciones de una población con media y desviación estándar , entonces, cuando n es grande, la distribución muestral de medias tendrá aproximadamente una distribución normal con una media igual a y una desviación estándar de . La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.
Ejemplo
El error muestral de cada media
La media de los errores muestrales
La desviación estándar de los errores muestrales.
Distribución muestral de Proporciones
Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de que al extraer las muestras de la población se calcula el estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en lugar del estadísitico media.
Ejemplo
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Interpretación de resultados estadísticos
Intervalo de confianza
Corresponde a un rango de valores, cuya distribución es normal y en el cual se encuentra, con alta probabilidad, el valor real de una determinada variable. Esta «alta probabilidad» se ha establecido por consenso en 95%. Así, un intervalo de confianza de 95% nos indica que dentro del rango dado se encuentra el valor real de un parámetro con 95% de certeza.
Ejemplo
La importancia de entender el significado y alcance real de estos instrumentos es fundamental para el investigador, para los financiadores de las investigaciones y para los profesionales que precisan de una actualización permanente basada en buena evidencia y ayudas a la toma de decisiones. Se repasan diversos aspectos de los diseños, resultados y análisis estadísticos, intentando facilitar su entendimiento desde lo más elemental a aquello que es más común pero no por ello mejor comprendido y aportar una mirada constructiva y realista, sin ser exhaustiva.
Ejemplo
Distribución Muestral
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición.
Distribución muestral de medias
Distribución muestral de proporciones
Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución que llamaremos distribución muestral de medias.
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión de la población es grande la distribución binomial B(n,p) se aproxima a la normal .
Ejemplo
Ejemplo
La prueba de la hipótesis
El método de las pruebas de hipótesis consiste fundamentalmente en establecer la probabilidad de que sea consecuencia del azar la diferencia existente entre dos cantidades. Se pueden distinguir dos situaciones:
Diferencia entre un valor muestral y un valor poblacional, o valor teórico.
Diferencia entre dos o más valores muestrales.
El esquema a seguir
Plantear la hipótesis en términos estadísticos
Elegir un nivel de significación
Calcular el estadístico de prueba a base de los datos muestrales
Buscar en la tabla correspondiente
Comparar la probabilidad obtenida en la tabla con el nivel de significación elegido en el punto 2 y tomar una decisión respecto de las hipótesis planteadas
Elaborar una conclusión derivada de la decisión
Apoyar todo el proceso de análisis con un gráfico del problema
Tipos de Hipótesis
La hipótesis nula
La hipótesis alternativa
Es una afirmación de que no hay diferencia entre las variables: no están relacionadas. A menudo, esto puede considerarse el statu quo y, como resultado, si no se puede aceptar lo nulo, se requiere alguna acción.
Es una afirmación sobre la población que es contradictoria con H0 y lo que concluimos cuando rechazamos H0. Esto es normalmente lo que el investigador está tratando de probar.
Ejemplo
Ejemplo