Estimación de una proporción poblacional

Estimación puntual, intervalo de confianza y tamaño de la muestra

Intervalos de confianza de mejor desempeño

Estimación puntual

Intervalo de confianza

Determinación del tamaño de muestra

Desventaja del intervalo de confianza de Wald

Definición

Una estimación puntual es un valor único utilizado para estimar un parámetro poblacional.

La proporción muestral pˆ es la mejor estimación puntual de la proporción poblacional p.

Estimador no sesgado

Un estimador no sesgado es un estadístico que se dirige al valor del parámetro poblacional correspondiente, en el sentido de que la distribución muestral del estadístico tiene una media que es igual al parámetro poblacional correspondiente. El estadístico pˆ se dirige a la proporción poblacional p

Definición

Nivel de confianza

Es un rango (o un intervalo) de valores utilizados para estimar el valor real de un parámetro poblacional. En ocasiones, un intervalo de confianza se abrevia como IC.

También llamado ESTIMACIÓN DE INTERVALO

Es la probabilidad 1 2 a (por ejemplo 0.95, o 95%) de que el inter- valo de confianza realmente contenga el parámetro poblacional asumiendo que el pro- ceso de estimación se repite un gran número de veces.

También se denomina grado de confianza o coeficiente de confianza

Niveles comunes

95% o 0,95

99% o 0,99

90% o 0,90

a = 0.10

a = 0,05

a = 0,01

VALOR CRÍTICO Y MARGEN DE ERROR

Valor Crítico

Margen de error

Definición

Es el número en la frontera que separa los estadísticos muestrales que son significativamente altos o bajos de aquellas que no son significativos.

El número za/2 es un valor crítico que es una puntuación z con la propiedad de que está en el límite que separa un área de a/2 en la cola derecha de la distribución normal estándar

image

La diferencia entre la proporción muestral pˆ y la proporción poblacional p es un error

La cantidad máxima probable de ese error es el margen de error, expresado por E.

El margen de error E también se denomina error máximo de la estima- ción y se puede encontrar multiplicando el valor crítico por la desviación estándar esti- mada de las proporciones muestrales

image

Papel del tamaño N de la POBLACIÓN

Son notables porque muestran que el tamaño de la muestra no depende del tamaño (N) de la población

El tamaño de la muestra depende del nivel de confianza deseado, el margen de error deseado y, en ocasiones, de la estimación conocida pˆ.

ERRORES

No cometa el error de usar E 5 3 como el margen de error correspondiente a “tres puntos porcentuales”. Si el margen de error es de tres puntos porcentuales, use
E 5 0.03.

Asegúrese de sustituir la puntuación crítica z por za>2. Por ejemplo, al trabajar con una confianza del 95%, asegúrese de reemplazar za>2 por 1.96. No cometa el error de reemplazar za>2 por 0.95 o 0.05.

Asegúrese de redondear hasta el siguiente entero superior; no redondee usando las reglas habituales. Redondee 1067.11 a 1068.

Intervalos de confianza de mejor desempeño

image

Métodos

Método más cuatro

Puntuación de Wilson

Método Clopper-Pearson

La probabilidad de cobertura de un intervalo de confianza es la proporción real de tales intervalos de confianza que contienen la proporción poblacional real.

Error

La probabilidad de cobertura de un intervalo de confianza es la proporción real de tales intervalos de confianza que contienen la proporción poblacional real.

Ejemplo

Si seleccionamos un nivel de confianza del 95%, usualmente obtenemos un 95% o menos de intervalos de confianza que contienen la proporción de población p. (Esto a veces se considera “demasiado liberal.”)

El intervalo de confianza de Wald se usa raramente en aplicaciones y revistas profesionales.

El intervalo de confianza más cuatro se desempeña mejor que el in- tervalo de confianza de Wald en el sentido de que su probabilidad de cobertura está más cerca del nivel de confianza que se utiliza.

Procedimiento

Añada 2 al número de éxitos x

Añada 2 al número de fracasos (de modo que el número de ensayos n aumente en 4)

Busque el intervalo de confianza de Wald

El intervalo de confianza más cuatro es muy fácil de calcular y tiene probabilidades de cobertura similares a las del intervalo de confianza de la puntuación de Wilson

Se comporta mejor que el IC de Wald

La probabilidad de cobertura es más cercana al nivel de confianza. Con un nivel de confianza del 95%, el intervalo de confianza de la puntuación de Wilson nos acercaría a una probabilidad de 0.95 de contener el parámetro p

image

Tiene alta complejidad

Es un método “exacto”

Se basa en la distribución binomial exacta en lugar de en la aproximación de una distribución

Demasiado conservador

Seleccionamos un nivel de confianza específico, la probabilidad de cobertura suele ser mayor o igual al nivel de confianza seleccionado.

Alta complejidad

¿Cuál es el mejor método?

El intervalo de confianza de Wald funciona mejor como una herramienta de enseñanza para introducir a los estudiantes a los intervalos de confianza.

El intervalo de confianza más cuatro es casi tan fácil como el de Wald y se comporta mejor que éste por tener una probabilidad de cobertura más cercana al nivel de confianza seleccionado.