T3 3.1. INTRODUCCIÓN A LA ESTADÍSTICA
CONTENIDO
- Población VS muestra
- Métodos de selección de muestras
- Introducción a la estadística
LA INVESTIGACIÓN CUANTITATIVA
Las técnicas de obtención de información están estructuradas y son más rígidas que las cualitativas.
Utilizamos grandes muestras que sean representativas de la población para extrapolar los resultados a la población total.
Es una investigación sistemática y estructurada de los fenómenos observables utilizando técnicas estadísticas.
En algunos casos, es posible analizar la población total. Sin embargo, esto no es común. Normalmente, trabajamos con una muestra de la población.
¿QUÉ ES LA ESTADÍSTICA
La ciencia de la recogida, el análisis y el sacar conclusiones de los datos.
¿POR QUÉ HAY QUE ESTUDIAR ESTADÍSTICA?
Seguir los argumentos numéricos
Entender los conceptos básicos sobre cómo se deben recolectar, resumir y analizar los datos para sacar conclusiones estadísticas.
Extraer información de tablas, cuadros y gráficos
EL PROCESO DE ANÁLISIS DE DATOS
- Recopilar datos
- Resumir datos y realizar un análisis preliminar
- Decidir qué medir y cómo medirlo
- Realizar un análisis formal
- Entender la naturaleza del problema
- Interpretar los resultados
EJEMPLO I
Supongamos que queremos saber la media de años de formación de los gerentes de los hoteles en España. ¿Qué podemos hacer?
EJEMPLO I
Podríamos recopilar datos de todos los directores/as de hotel
¿Qué termino utilizamos a la hora de referirnos a "todos/as los directores de hotel"?
EJEMPLO II
POBLACIÓN/UNIVERSO La población/universo es la totalidad de individuos u objetos sobre los que queremos información
¿Cómo lo diríamos cuando se recogen datos sobre la población entera?
El censo se realiza para recopilar información sobre la totalidad de la población
Si no se ha realizado una censo, ¿qué podríamos hacer?
¿Por qué no utilizaríamos un censo aquí?
MUESTRA La muestra es un subconjunto de la población que se selecciona para el estudio mediante un procedimiento
EJEMPLO III
¿Cómo sería una muestra de gerentes de hoteles en todo el país?
Una vez recogidos los datos, ¿qué podríamos hacer con ellos?
ESTADÍSTICA DESCRIPTIVA La estadística descriptiva se refiere a los métodos de organización y resumen de los datos
Ejemplos: histogramas, diagramas de dispersión, moda, varianza, rango, ...
EJEMPLO IV
Podríamos calcular el promedio de años de formación de la muestra
ESTADÍSTICA INFERENCIAL La estadística inferencial se refiere al proceso de hacer generalizaciones a partir de una muestra a una población
EJEMPLO V
Si en nuestra muestra la media de años de formación de los gerentes de hotel es de 20 años, ¿qué generalización se podría hacer?
¿Alguien podría afirmar que el promedio de años de formación de los directores/as de hotel en Barcelona es de 20 años?
La media de años promedio de educación de los gerentes de hotel es de aproximadamente 20.
No. Las generalizaciones basadas en los resultados de una muestra sólo pueden hacerse a la población de la que viene la muestra
CENSO VS MUESTRA
¿Por qué podríamos preferir seleccionar una muestra en lugar de realizar un censo?
Recursos limitados
Cuando se requiere la destrucción del objeto de
estudio
Es difícil encontrar toda la población
INTRODUCCIÓN AL TAMAÑO DE MUESTRA
Para elegir el tamaño de la muestra, primero debemos establecer el nivel de confianza y el margen de error con el que queremos trabajar.
De hecho, el nivel de confianza y el margen de error determinarán el tamaño de la muestra. Sin embargo, ¿qué son el nivel de confianza y el margen de error?
Para hacer una inferencia estadística, primero debemos decidir el tamaño de la muestra.
MARGEN DE ERROR
NIVEL DE CONFIANZA
un porcentaje que indica cuánto se puede esperar que las respuestas de la población se desvíen de las respuestas de la muestra.
porcentaje que revela cuán de seguro puedes estar de que la población proporcionará una respuesta dentro de un cierto rango. Por ejemplo, un nivel de confianza del 95% significa que puedes estar 95% seguro de que los resultados se encuentran entre los números x e y.
Nivel de confianza típicamente utilizado: 95%
TÉCNICAS DE MUESTREO ALEATORIO
- Muestreo sistemático
- Muestreo aleatorio estratificado
- Muestreo aleatorio simple
- Muestreo aleatorio clúster /conglomerados
II
I
Supongamos que Cataluña tiene 2000 hoteles. Queremos estudiar 385 hoteles sobre la actual política de tasa turística. Una muestra de hoteles puede ser seleccionada poniendo el nombre de cada hotel en tiras individuales (pero idénticas) de papel y colocándolas en un recipiente grande. Después de mezclar bien, se seleccionan al azar 385nombres del recipiente, uno cada vez.
Una muestra de tamaño n se selecciona de la población de manera que asegura que cada posible muestra del
tamaño deseado tiene la misma probabilidad de ser seleccionada.
Una muestra aleatoria simple no garantiza que la muestra sea representativa de la población.
III
Otra forma de seleccionar una muestra aleatoria simple es crear una lista de todos los hoteles catalanes (llamado marco de muestreo).
Numere cada hotel con un número único del 1 al 2000. Use un generador de números aleatorios (software de computadora) para seleccionar los 385 hoteles de la muestra.
I
II
Supongamos que calculamos un coeficiente f = N / n, es decir, f = 2000/385 = 5. A continuación, seleccionamos al azar un número entre 1 y 5. Utilizando una lista alfabética de los hoteles catalanes, seleccionamos el hotel que está en este número en la lista. A continuación, vamos contando 5 y seleccionado los hoteles que estén en esta posición.
PROCESO
N= población
n=muestra
- Uno de los primeros individuos f se selecciona al azar.
- Entonces, cada 5o individuo en la secuencia se incluye en la
muestra.
- Un valor f especifica (f =N/n , f= 2000/385 = 5)
I
II
En lugar de una muestra aleatoria simple para nuestra encuesta sobre la política de la tasa turística, supongamos que tomamos cuatro muestras aleatorias simples de cada categoría (clase económica, categoría media, lujo y lujo superior). El tamaño de cada sub-muestra sería proporcional a la proporción de cada clase a la población total.
I
PROCESO
Este método funciona razonablemente bien, siempre que no haya patrones que se repiten en la lista de la población.
- La población se divide en subgrupos no superpuestos
llamados estratos
- Las muestras aleatorias simples se seleccionan de cada
estrato
A veces es más fácil de implementar y es más rentable que el muestreo aleatorio simple
A veces permite inferencias más precisas sobre una población que el muestreo aleatorio simple
Veamos otra forma de seleccionar una muestra de hoteles para responder a nuestra encuesta sobre la política de tasa turística. Una manera de hacerlo sería seleccionar al azar 5 ciudades catalanas y encuestar todos los hoteles de estas ciudades!
II
PROCESO
Los clusters suelen estar basados en la ubicación. Lo mejor es que los conglomerados sean subgrupos heterogéneos de la población.
- La población se divide en subgrupos no superpuestos
llamados conglomerados
- Se hace una selección aleatoria de grupos y después
todos los individuos de los grupos se incluyen en la muestra
El muestreo por conglomerados es a menudo más fácil de realizar y más rentable.