Please enable JavaScript.
Coggle requires JavaScript to display documents.
Análisis de datos univariado y bivariado, 1, 2, 3, 4, 5, 7, 1, 2, 3, 4, 5 …
Análisis de datos univariado y bivariado
Tópicos de estadística descriptiva e inferencial
Aplicaciones de software
SPSS
Excel
Proceso de campo y de recopilación de datos
Supervisión de los trabajadores de campo
Control de los fraudes
Control del muestreo
Control de calidad y edición
Control por parte de la oficina central
Capacitación de los trabajadores de campo
La capacitación asegura que todos los entrevistadores apliquen el cuestionario de la misma forma para que haya uniformidad en los datos obtenidos
Puede hacerse de manera personal o por correo o
Internet
Validación de los trabajadores de campo
Validar el trabajo de campo significa corroborar que los trabajadores de campo realizan entrevistas auténticas.
Evaluación de los trabajadores de campo
Es importante evaluar a los trabajadores de campo para darles retroalimentación sobre su desempeño, así como para identificar a los mejores y consolidar una fuerza de trabajo de campo de mayor calidad.
Criterios de evaluación
Cantidad
Costo y tiempo
Tasas de respuestas
Calidad
Calidad de los datos
Calidad de las entrevistas
Selección de los trabajadores de campo
reclutar a los individuos adecuados
determinar qué características deben tener los trabajadores de campo
Hacer las especificaciones de trabajo para el proyecto, tomando en cuenta la forma de recopilación de información
Preparación de los datos
Codificación
Codificar significa asignar un código, por lo general un número, a cada respuesta posible de cada pregunta.
Codificación de preguntas no estructuradas
En el cuestionario se registran las respuestas literales, y luego se desarrollan y asignan los códigos para estas respuestas al analizar los datos de algunos encuestados
Codificación de preguntas estructuradas
El investigador asigna un código a cada respuesta de cada pregunta, y especifica el registro y la columna adecuados en que deben aparecer los códigos de la respuesta
El código incluye una indicación de la posición en la columna (campo) y el registro que ocupara el dato.
Transcripción
La trascripción implica transferir los datos codificados de los cuestionarios o de las hojas de codificación a discos o directamente a la computadora por medio del teclado y creando un archivo de datos.
Edición
La edición es la revisión de los cuestionarios con la finalidad de incrementar su exactitud y precisión.
Consiste en examinar los cuestionarios para identificar respuestas ilegibles, incompletas, incongruentes o ambiguas.
Tratamiento de las respuestas insatisfactorias
Devolución al campo
Asignación de valores faltantes
Sustituir por un valor neutro
Un valor neutro, por lo regular la respuesta promedio a la variable, sustituye las respuestas faltantes.
Eliminación por casos
En la eliminación por casos se descartan del análisis los casos o los encuestados con alguna respuesta faltante.
Eliminación por casos
en vez de descartar todos los elementos con algún valor faltante, el investigador solo considera los casos o encuestados con respuestas completas para cada calculo
El tamaño de la muestra es grande,
no hay mucha relación entre las variables
las respuestas faltantes son pocas
Descartar a encuestados que dieron respuestas insatisfactorias
Depuración de los datos
Revisión del cuestionario
La preparación de los datos debe iniciar en cuanto se reciba el primer lote de cuestionarios completados, mientras el trabajo de campo sigue en proceso.
si se detecta algún problema, es posible tomar medidas correctivas modificando el trabajo de campo
Ajuste estadístico de los datos
La redefinición de las variables implica transformar los datos para crear variables nuevas o modificar las existentes
Otro procedimiento común de redefinición de
las variables es la estandarización.
na vez que los datos están codificados, transcritos y depurados, tal vez sea necesario redefinir las categorías de una variable categórica como el ingreso.
Recodificación una vez que los datos están codificados, transcritos y depurados, tal vez sea necesario redefinir las categorías de una variable categórica como el ingreso.
Plan preliminar del análisis de datos
Especificar los procedimientos de medición y escalamiento
Definir la información que se necesita
Construir y hacer la prueba piloto de un cuestionario (forma de entrevista) o una
forma apropiada para la recolección de datos
Diseñar las fases exploratoria, descriptiva y/o causal de la investigación
Especificar el proceso de muestreo y el tamaño de la muestra
Elección de una estrategia de análisis de los datos
La elección de la estrategia para el análisis de los datos debe basarse en las primeras etapas del proceso: definición del problema , desarrollo del enfoque y diseño de la investigación
Ética en la investigación de mercados
El investigador y los trabajadores de campo tienen la responsabilidad ética de respetar la privacidad, los sentimientos y la dignidad de los participantes
Introducción al análisis estadístico univariado
SPSS tiene la capacidad de trabajar con un gran número de variables (33.000 aprox), es recomendable utilizar siempre la opción correspondiente a distintas variables, ya que de esta manera podemos conservar los datos originales
Es necesario resaltar que SPSS permite agrupar la información, pero NO permite desagruparla
Calcular los estadísticos descriptivos medidas de localización y variabilidad
Calcular la fecuencia y el porcentaje para cada valor de la variable
Calcular el porcentaje y el porcentaje acumulado de cada variable, efectuando los ajustes necesarios para cualquier valor faltante
Graficar histograma de frecuencias
Medidas de localización
son medidas de tendencia central porque tienden a describir el centro de la distribución
Media
Sirve para estimar el promedio cuando los datos se recopilaron utilizando una escala de intervalo o de razón
Moda
es el valor que ocurre con mayor frecuencia y representa el pico más alto de la distribución
Mediana
es el valor intermedio cuando los datos están acomodados en orden ascendente o descendente
Varianza o desviación estándar
La varianza es la desviación promedio al cuadrado a partir de la media, es decir, el promedio del cuadrado de las desviaciones a partir de la media de todos los valores.
La varianza nunca puede ser negativa.
Cuando los datos se agrupan alrededor de la media, la varianza es pequeña. Cuando los datos están dispersos, la varianza es grande.
La varianza ayuda a entender qué tan similares o diferentes son los datos.
Si los datos son similares, la varianza será pequeña y su distribución se agrupará de forma estrecha alrededor de la media.
Si los datos tienen valores muy diferentes, la varianza será grande y su distribución se dispersará más alrededor de la media.
Si todos los datos se multiplican por una constante, la varianza se multiplica por el cuadrado de la constante.
Introducción al análisis estadístico bivavariado
Técnica estadística que describe dos o más variables de manera simultánea, y que produce tablas que reflejan la distribución conjunta de dos o más variables con un número limitado de categorías o valores distintivos.
CHI CUADRADO DE PEARSON(𝑿𝟐).
Este estadístico de medida permite saber el grado de asociación entre variables para tal efecto se considera dos hipótesis: H0 = Existe independencia entre variables, para ello se considera un valor de (X2) >0,05. HA = Existe dependencia entre variables, para ello se considera un valor de (X2) <0,05.
Coeficiente de correlación rho de
Spearman (R)
es el coeficiente de
correlación de Pearson, pero aplicado después de transformar las puntuaciones originales en rangos. Toma valores entre 1 y 1, y se interpreta exactamente igual que el coeficiente de correlación de Pearson.
Pruebas bilaterales o de dos colas
Una prueba de dos colas se asocia a una hipótesis alternativa para la cual se desconoce el signo de la potencial diferencia. Por ejemplo, supongamos que deseamos comparar las medias de dos muestras A y B.
Pruebas unilaterales o de una cola :
•Una prueba de una cola normalmente está asociada a una hipótesis alternativa para la cual se conoce el signo de la potencial diferencia antes de ejecutar el experimento y la prueba.