Please enable JavaScript.
Coggle requires JavaScript to display documents.
CONFIABILIDAD - Coggle Diagram
CONFIABILIDAD
- Se asume que la prueba mide una característica relativamente estable.
- La falta de confiabilidad es resultado de errores de medición producidos por estados internos temporales como:
- La baja motivación
- Falta de disposición
- Condiciones externas (ambiente de prueba incómodo o con distracciones).
CORRELACIÓN Y PREDICCIÓN
Los coeficientes de correlación, errores estándar y formulas de predicción son elementos fundamentales.
- Distribución Bivariada (Diagrama de dispersión): relación entre dos variables
- Coeficiente de correlación (r): proporciona un resumen numérico de la relación representada en una distribución bivariada.
- Todos los coeficientes de correlación pueden interpretarse del mismo modo que el coeficiente de Pearson.
El valor de r puede variar entre -1.00 y +1.00
- Relación lineal positiva entre dos variables: r de +1.00
- Relación linear negativa perfecta: r de -1.00
- Una de r de .00 representa una ausencia de relación entre las dos variables.
Linea de regresión
Y'= bX + a
Y': ( ' ) indicar que esta es un Y predicha y no una Y conocida
b= pendiente de la linea de regresión
a= intercepción con el eje y
Cuando mayor sea r, menor será la dispersión. Mientras menor sea r, mayor será la dispersión.
Error estándar de estimación:
DEy= desviación estándar de la prueba que se esta pronosticando
rxy= correlación entre la prueba que se pronosticará
-
PRINCIPALES FUENTES DE INESTABILIDAD
Nada que genere una variación no sistemática en las puntuaciones de las pruebas es una fuente de inestabilidad
- se identifican 4 categorias
1. Calificación de la prueba:
- una de las mas fáciles de entender
- La variaciones en los criterios de calificación pueden influir en los reactivos de pruebas simples.
- La falta de acuerdo entre los calificadores puede generar una variación no sistemática en las puntuaciones de las pruebas de las personas.
- Las maquinas que califican reactivos "de opción" suelen eliminar las variaciones, aunque estas no estén libres de error.
- Cuando mas juicio exija la calificación, mas preocupante será la fuente de inestabilidad o falta de confiabilidad.
2. Contenido de la prueba:
Las variaciones en el muestreo de los reactivos de una prueba pueden generar un error no sistemático en las puntuaciones de la misma.
3. Aplicación de la prueba:
- Una prueba debe contar con procedimiento estandarizados para su aplicación.
- Factores como: instrucciones, limites de tiempo y las disposiciones físicas para la aplicación.
- los detalles de la aplicación pueden ejercer cierta influencia en las puntuaciones de la prueba. (ruido en el corredor, condiciones de iluminación poco adecuadas)
- Las variaciones en la aplicación de la prueba pueden constituir fuentes de varianza en las puntuaciones de la prueba.
4. Condiciones personales:
- Las condiciones temporales de los examinados pueden ejercer influencias no sistemáticas en sus puntuaciones en las pruebas.
- Las variaciones en los factores no generan automáticamente inestabilidad o falta de confiabilidad
- El grado de influencia que estos factores ejercen en las puntuaciones de las pruebas es una cuestión empírica.
MARCO CONCEPTUAL: TEORÍA DE LA PUNTUACIÓN VERDADERA
La confiabilidad de la prueba puede formularse en 3 marcos conceptuales
- Teoría clásica de la prueba (TCP)
- Teoría de respuesta al item (TRI)
- Teoría de la generalizabilidad (TG).
Teoría clásica de la prueba (TCP)
- Empieza con un marco conceptual útil e interesante
Terminos claves:
- Puntuación observada (O):* Puntuación real de una persona en una prueba, la puntuación natural de la persona
- Puntuación verdadera (V): puntuación que obtendría si se eliminaran o suprimieran todas las fuentes de inestabilidad.
- puntuación obtenida de varias aplicaciones de la prueba en distintos momentos y con condiciones distintas.
- Puntuación de error (E): diferencia entre la puntuación verdadera y la observada.
- puede ser positiva o negativa
- es la suma de todas las influencias no sistemáticas en la puntuación verdadera de una persona
Puntuación de error (E) expresa la relación entre las puntuaciones observadas, verdadera y de error.
V= O + I - E
METODOS PARA DETERMINAR LA CONFIABILIDAD
- Confiabilidad de Test- Retest
- Confiabilidad entre calificadores
- Confiabilidad de la forma alterna
- Confiabilidad de consistencia interna
Confiabilidad de Test- Retest:
- Se obtiene aplicando la misma prueba a los mismos individuos en dos ocasiones diferentes.
- El margen temporal entre las dos ocasiones suele ser desde un dia hasta un mes.
- El coeficiente de confiabilidad es la correlación entre las puntuaciones en la primera y segunda evaluaciones.
- Ayuda a evaluar la influencia que los cambios ejercen en las condiciones personales.
- No aborda la influencia de los cambios en el contenido de la prueba, ya que se emplea el mismo instrumento.
- La confiabilidad test-retest puede o no abordar las variaciones debidas a la aplicación de la prueba.
Tiene tres inconvenientes:
- No explica el error no sistemático debido a las variaciones en el contenido de la prueba.
- Es un fastidio sacar la confiabilidad tesr-retest de cualquier pruebas, excepto las mas sencillas y breves.
- El intervalo debe ser lo suficientemente largo para que la primera prueba ejerza una influencia mínima en la segunda.
Confiabilidad entre calificadores
- Se evalúa la variación no sistemática debida solo a quienes califican la prueba, implica a dos personas.
- En ocasiones se denomina confiabilidad entre observadores o entre jueces.
- El coeficiente de confiabilidad entre calificadores es la correlación entre las puntuaciones que asigna primeo y el segundo calificadores.
- Es importante que los dos o mas calificadores o jueces trabajen en forma independiente, ninguno de los dos deben influir en el otro.
- Coeficiente de correlación intraclase (CCI):
- Se calcula a partir de los cuadrados medios (CM) elaborados en un análisis de varianza (ANOVA)
- Se interpreta como el coeficiente de correlación de Pearson (r)
Confiabilidad de la forma alterna (Confiabilidad de forma paralela o de forma equitativa)
- Exige que haya dos formas de la prueba, deben ser iguales o muy similares en terminos de la cantidad de reactivos, limites de tiempo, especificaciones de contenido, etc.
- Consiste en aplicar ambas formas de la prueba a los mismos examinados
- La confiabilidad de la forma alterna es la correlación entre las puntuaciones obtenidas de las dos formas
- Pueden aplicarse en sucesión inmediata si son relativamente breves y pocos exigentes.
- En el caso mas sencillo cuando las dos formas se aplican en sucesión inmediata, el método mide:
- la inestabilidad o falta de confiabilidad debida al muestreo de contenido.
- En las pruebas mas largas, suelen aplicarse con un intervalo entre pruebas de unos cuentos días a unas cuantas semanas. Mide:
- Inestabilidad debida al muestreo de contenido
- Cambios en las condiciones personales
- Variaciones en las condiciones de la aplicación.
Confiabilidad de consistencia interna
- Método de división por mitades de Spearman
- Las fórmulas de Kuder-Richardson
- Coeficiente alfa de Cronbach
Método de división por mitades de Spearman:
- Una sola prueba se considera compuesta por dos partes (formas paralelas) que miden la misma cosa.
- Puede aplicarse una prueba y asignar calificaciones separadas a sus dos mitades seleccionadas de manera arbitraria.
- La segunda prueba incluye reactivos mas difíciles, los examinados pueden estar mas cansados.
- Confiabilidad non-par: resultado de dividir la prueba en reactivos de numero par y non
- La correlación entre las dos mitades no da la confiabilidad de la prueba completa. Solo da la confiabilidad de una
-
-
Coeficiente alfa (alfa de Cronbach)
- Los reactivos pueden contar con cualquier calificación continua
- k= cantidad de reactivos de la prueba
- Sx (o DEx)= desviación estándar de las puntuaciones de la prueba
- Si (o DEi)= Desviación estándar de las puntuaciones de los reactivos
- Todos los procedimientos de consistencia interna no son apropiadas para las pruebas de velocidad
CONFIABILIDAD EN LA TEORIA DE RESPUESTA AL ITEM
- La confiabilidad es un problema en las pruebas elaboradas
- El análisis de confiabilidad de la TRI depende del funcionamiento de los reactivos dentro de la prueba.
- Los reactivos operan de forma independiente
-
TEORIA DE LA GENERALIZABILIDAD (TG)
- Constituye un esfuerzo por evaluar simultáneamente muchas fuentes de inestabilidad o falta de confiabilidad.
- Cada persona tiene una puntuación verdadera (puntuación universal o puntuación de dominio)
- Puntuación verdadera es la puntuación promedio a lo largo de todas las ocasiones, formas y calificadores.
- Permite que el investigador especifique y estime varios componentes de varianza de la puntuación verdadera, varianza de error y varianza de puntuaciones observadas.
Análisis de varianza ( ANOVA):
- Proporciona el marco de base para un estudio de generalizabilidad
- Permite estudiar de manera simultanea el efecto de diversas variables independientes en una variable dependiente.
- Permite estudiar las interacciones, el efecto único que genera la combinación de dos o mas variables independientes.
-