Capítulo 8: Selección de la muestra

¿Cómo se delimita una población?

¿En una investigación siempre tenemos una muestra?

Lo primero: ¿sobre qué o quiénes se recolectarán datos?

¿Cómo seleccionar la muestra?

Tamaño óptimo de una muestra

¿Cómo se lleva a cabo el procedimiento
de selección de la muestra?

Listados y otros marcos muestrales

¿Cómo y cuáles son las muestras no probabilísticas?

¿Cómo se selecciona una muestra probabilística?

Sólo cuando queremos efectuar un censo debemos incluir todos los casos (personas, animales, plantas, objetos) del universo o la población

Las muestras se utilizan por economía de tiempo y recursos

No siempre, pero en la mayoría de las situaciones sí realizamos el estudio en una muestra

Se les denomina también casos o elementos

Por tanto, para seleccionar una muestra, lo primero que hay que hacer es definir la unidad de muestreo/análisis (si se trata de individuos, organizaciones, periodos, comunidades, situaciones, piezas producidas, eventos, etc.

Aquí el interés se centra en “qué o quiénes”, es decir, en los participantes, objetos, sucesos o colectividades de estudio (las unidades de muestreo), lo cual depende del

Para el proceso cuantitativo, la muestra es un subgrupo de la población de interés sobre el cual se recolectarán datos, y que tiene que definirse y delimitarse de antemano con precisión, además de que debe ser representativo de la población

El investigador pretende que los resultados encontrados en la muestra se generalicen o extrapolen a la población (en el sentido de la validez externa que se comentó al hablar de experimentos)

El interés es que la muestra sea estadísticamente representativa

Así, una población es el conjunto de todos los casos que concuerdan con una serie de especificaciones (Lepkowski, 2008b)

Los criterios que cada investigador cumpla dependen de sus objetivos de estudio, y es importante establecerlos de manera muy específica

Una vez que se ha definido cuál será la unidad de muestreo/análisis, se procede a delimitar la población que va a ser estudiada y sobre la cual se pretende generalizar los resultados.

se debe definir cuál será la unidad de muestreo/análisis y cuáles son las características de la población

La muestra es, en esencia, un subgrupo de la población

Tipos de muestra

Las muestras no probabilísticas

Las muestras probabilística

Subgrupo de la población en el que todos los elementos tienen la misma posibilidad de ser elegido

Subgrupo de la población en la que la elección de los elementos no depende de la probabilidad, sino de las características de la investigación

Calcular un tamaño de muestra que sea representativo de la población

Seleccionar los elementos muestrales (casos) de manera que al inicio todos tengan la misma posibilidad de ser elegidos

Cálculo del tamaño de muestra

La respuesta consiste en encontrar una muestra que sea representativa del universo o población con cierta posibilidad de error (se pretende minimizar) y nivel de confianza (maximizar), así como probabilidad.

Calcular un tamaño de muestra que sea representativo de la población

Cuando se elabora una muestra probabilística, uno debe preguntarse: dado que una población
es de N tamaño

Consiste en seleccionar los elementos muestrales de manera que al inicio todos tengan la misma posibilidad de ser elegidos

Cómo y de dónde vamos a elegir los casos

Muestra probabilística estratificada

Muestreo en el que la población se divide en segmentos y se selecciona una muestra para cada segmento

Muestreo probabilístico por racimos

Muestreo en el que las unidades se encuentran encapsuladas en determinados lugares físicos

Las unidades de análisis o los elementos muestrales se eligen siempre aleatoriamente para asegurarnos de que cada elemento tenga la misma probabilidad de ser elegido.

Se utilizan básicamente tres procedimientos de selección, de los cuales a continuación se comentan dos y el tercero se expone en el centro de recursos en línea

Se determina el tamaño de la muestra n, pero ¿cómo seleccionar los elementos muestrales? (ya sean casos o racimos)

Tómbola

Cuando iniciamos nuestra exposición sobre la muestra probabilística, señalamos que los tipos de muestra dependen de dos características: el tamaño de la muestra y el procedimiento de selección

Documentos

Documento 1 “Cálculo de muestra

Material complementario

Después se hacen fichas o papeles, uno por cada elemento, se revuelven en una caja y se van sacando n número de fichas, según el tamaño de la muestra

Los números elegidos al azar conformarán la muestra

Muy simple pero muy rápido, consiste en numerar todos los elementos muestrales de la población, del uno al número N

Cuando nuestro muestreo es estratificado, se sigue el procedimiento anterior, pero por cada estrato

Números aleatorios (random numbers)

Éste es el procedimiento que se encuentra en el centro de recursos en línea: Documento 1 “Cálculo de muestra

STATS

Una excelente alternativa para generar números aleatorios se encuentra en el programa STATS®, que contiene un subprograma para ello (Random Number Generator) y evita el uso de la tabla de números aleatorios

El programa pide que le indiquemos cuántos números aleatorios requerimos

Selección sistemática de elementos muestrales

Así, tenemos que K = N/n, en donde K = un intervalo de selección sistemática, N = la población y n = la muestra

Este último (K ) es un intervalo que se determina por el
tamaño de la población y el tamaño de la muestra

Este procedimiento de selección es muy útil e implica elegir dentro de una población N un número n de elementos a partir de un intervalo K

Archivos

Marco muestral

Mapas

Las muestras probabilísticas requieren la determinación del tamaño de la muestra y de un proceso de selección aleatoria que asegure que todos los elementos de la población tengan la misma probabilidad

Es un marco de referencia que nos permite identificar físicamente los elementos de la población, así como la posibilidad de enumerarlos y seleccionar las unidades muestrales

Un gerente de reclutamiento y selección de una empresa quiere precisar si ciertos datos que se presentan en una solicitud de trabajo están correlacionados con el absentismo del empleado.

Es decir, si a partir de información como edad, género, estado civil, nivel educativo y duración en otros trabajos es factible predecir la conducta de absentismo

Para establecer correlaciones se considerará como
población a todas las personas contratadas durante los últimos 10 años

Se relacionan los datos en las solicitudes de empleo con los registros de faltas

Como no hay una lista elaborada de estos individuos, el investigador decide acudir a los archivos de las solicitudes de empleo

Tales archivos constituyen su marco muestral a partir del cual se obtendrá la muestra

Determina el tamaño de la población, obtiene el tamaño de la muestra y selecciona sistemáticamente cada elemento 1/K (solicitud que será analizada)

Obviamente, en el archivo habrá solicitudes de gente que no fue contratada y, por tanto, no debe considerarse en el estudio

En la actualidad hay mapas de todo tipo: mercadológicos, socioculturales, étnicos, marítimos, entre otros

El Global Positioning System (GPS) o sistema de posicionamiento global puede ser muy útil para esta clase de muestreo

El mapa le permite ver la población y su localización geográfica, de manera que elige zonas donde coexistan diferentes tiendas competidora, para asegurarse de que el consumidor de la zona tenga todas las posibles alternativa

Los mapas son muy útiles como marco de referencia en muestras de racimos

Debemos recordar que en el caso de los experimentos, la muestra representa el balance entre un mayor número de casos y el número que podamos manejar

Recordemos que la mayoría de
las pruebas estadísticas exigen 15 casos como mínimo por grupo de comparación (HernándezSampieri et al., 2013 y Mertens, 2010

El tamaño de una muestra depende también del número de subgrupos que nos interesan en una población.

Además, resulta obvio que en ciertos fenómenos el tamaño de la muestra varía en función de qué tan homogéneo o heterogéneo es el universo considerado

La selección aleatoria de los elementos muestrales

Recordemos que lo óptimo de una muestra depende de cuánto se aproxima su distribución a la distribución de las características de la población

La determinación del tamaño de la muestra

Esta aproximación mejora al incrementarse el tamaño de la muestra

Cuando las muestras están constituidas por 100 o más elementos tienden a presentar distribuciones normales y esto sirve para el propósito de hacer estadística inferencial
(generalizar de la muestra al universo)

A lo anterior se le llama teorema central del
límite (Kish, 1995): señala que una muestra de más de cien casos será una muestra con una distribución normal en sus características, lo cual sirve para el propósito de hacer estadística inferencial

Se utilizan en diversas investigaciones cuantitativas y cualitativa

La ventaja de una muestra no probabilística —desde la visión cuantitativa— es su utilidad para determinados diseños de estudio que requieren no tanto una “representatividad” de elementos de una población, sino una cuidadosa y controlada elección de casos con ciertas características especificadas previamente en el planteamiento del problema

También llamadas muestras dirigidas, suponen un procedimiento de selección orientado por las características de la investigación, más que por un criterio estadístico de generalización

Para el enfoque cualitativo, al no interesar tanto la posibilidad de generalizar los resultados, las muestras no probabilísticas o dirigidas son de gran valor, pues logran obtener los casos (personas, objetos, contextos, situaciones) que interesan al investigador y que llegan a ofrecer una gran riqueza para la recolección y el análisis de los datos

click to edit

Muestreo al azar por marcado telefónico (Random Digit Dialing)

Involucra identificar áreas geográficas —para ser muestreadas al azar— y sus correspondientes códigos telefónicos e intercambios (los primeros dígitos del número telefónico que las identifican

Luego, los demás dígitos del número que se va a marcar pueden ser generados al azar de acuerdo con los casos que requerimos para la muestra (n)

Ésta es una técnica que los investigadores utilizan para seleccionar muestras telefónicas

Es posible reconocer qué intercambios son usados de forma primaria para teléfonos residenciales y enfocar el muestreo en ese subgrupo (Kreuter, 2013)

Asimismo, es muy útil para incluir en muestras a teléfonos celulares o móviles y aparatos con GPS (Hernández-Sampieri et al., 2013)

Una máxima del muestreo y el alcance del estudio

La mayor parte de las veces, las investigaciones experimentales utilizan muestras dirigidas, porque como se comentó, es difícil manejar grupos grandes o múltiples casos (debido a ello se ha insistido que, en los experimentos, la validez externa se consolida mediante la repetición o reproducción del estudio)

Las investigaciones no experimentales descriptivas o correlacionales-causales deben emplear muestras probabilísticas si quieren que sus resultados sean generalizados a la población

Los estudios exploratorios regularmente emplean muestras dirigidas, aunque podrían usarse muestras probabilísticas

Asimismo, en ocasiones la muestra puede ser en varias etapas (polietápica)

Ya sea que se trate de un tipo de muestreo u otro, lo importante es elegir a los casos adecuados, de acuerdo con el planteamiento del problema y lograr el acceso a ellos