Please enable JavaScript.
Coggle requires JavaScript to display documents.
Confiabilidad (parte 2) (Confiabilidad de consistencia alterna…
Confiabilidad (parte 2)
Teoría de la puntuación verdadera
Confiabilidad
Teoría de la respuesta al reactivo (TRR)
Teoría de la generalizabilidad (TG)
Teoría clásica de las pruebas (TCP)
Puntuación observada (O)
Puntuación real de una persona en una prueba o puntuación natural
Puede ser afectada en + o - por varias fuentes que afectan a la confiabilidad, + por: "buena suerte al responder preguntas de las que no se conoce la respuesta correcta" o - por: "el examinado estuvo demasiado cansado durante la aplicación"
Es la suma de la varianza de la puntuación verdadera y la varianza de la puntuación de error. Recordemos que la "varianza" es sólo la desviación estándar elevada al cuadrado
Puntuación de error (E)
Es la diferencia entre la puntuación verdadera y la puntuación observada
Es la sumatoria de todas las influencias no sistemáticas en la puntuación real de una persona que atenta contra la confiabilidad
El error (E) puede ser positivo o negativo
Puntuación verdadera (V)
La persona la obtendría si todas las fuentes que afectaran a la confiabilidad pudieran ser eliminadas o canceladas
Puntuación promedio obtenida de la prueba en distintos momentos y en condiciones ligeramente diferentes
Cuando todas puntuaciones reales observadas se promedia, la media podría ser igual a la puntuación verdadera
Métodos para determinar la confiabilidad
Confiabilidad interjueces
Evalúa la variación no sistemática debida simplemente a quien (2 personas o máquinas) califica la prueba
Se le conoce con otros nombres como: confiabilidad de jueces, confiabilidad de observadores y confiabilidad de evaluadores
Para obtenerla se aplica una prueba a un grupo y se califica dos veces. Es la correlación entre la calificación del primer juez con la del segundo (ello trabajan de manera independiente)
El coeficiente de correlación intraclase, también es conocido como r, p, o CCI. El CCI se calcula a partir de las medidas cuadráticas (MC) desarrolladas en el análisis de varianza (ANOVA)
Confiabilidad de formas alternas
Se le conoce también como confiabilidad de formas paralelas o equivalentes
Requiere la existencia de dos pruebas, éstas deben de ser iguales o muy similares en términos de números de reactivos, límites de tiempo, especificaciones del contenido
Consiste en aplicar ambas formas de la prueba a los mismos examinados
La correlación de este tipo de confiabilidad, casi siempre es la de Pearson, entre las puntuaciones obtenidas en las dos formas de la prueba
Las pruebas pueden aplicarse de manera inmediata, una después de la otra si son breves y poco demandantes
Esta forma no se usa con mucha frecuencia porque la mayoría de las pruebas no tiene formas alternas, ya que es bastante difícil crearlas
Confiabilidad de test-retest
Es un coeficiente de confiabilidad que se obtiene aplicando la misma prueba a los mismos individuos en dos ocasiones diferentes (tiempo entre días, hasta un mes)
Consiste en la correlación entre las puntuaciones de la primera aplicación y de la segunda
Conocido también como coeficiente de estabilidad temporal
Puede o no, indicar variaciones interjueces, dependiendo si la prueba es calificada por la misma persona o siguiendo el mismo procedimiento en ambas ocasiones
Confiabilidad de consistencia alterna
Es el método que más se usa, produciendo un coeficiente de confiabilidad
División por mitades
Aplicación de una sola prueba, calificada por mitades como si cada una fuera una forma alterna de la prueba, para después correlacionar las puntuaciones de las dos mitades de la prueba
La correlación entre las dos mitades de la prueba no indica la confiabilidad de la prueba entera, sino de la mitad de la prueba en que estamos interesados
División de la prueba en reactivos pares y reactivos nones = confiabilidad de pares y nones
La correlación de Spearman-Brown permite determinar el efecto estimado sobre la confiabilidad de consistencia interna de cualquier cambio en la extensión de la prueba
Kuder-Richardson
KR-20
Produce la correlación promedio entre todas las posibles mitades de la prueba
KR-21
Permite estimar la confiabilidad sólo cuando M y DEx están disponibles y no se puede obtener ninguna otra estimación
Coeficiente alpha
Conocido también como alpha de Cronbach
Depende de la correlación promedio entre los reactivos
Indica el grado en que los reactivos miden el mismo constructo o rasgo
Se relaciona con el muestreo de contenido
No mide la falta de confiabilidad debida a cambios en la aplicación de la prueba, condiciones personales o calificación
3 conclusiones importantes
La confiabilidad se maximiza cuando se acerca a .50 el porcentaje de examinados que responde de manera correcta una prueba de capacidades cognitivas o que responde en cierto sentido en una prueba no cognitiva
La correlación entre los reactivos es importante,. Para obtener una buena confiabilidad de consistencia interna, debemos usar reactivos que midan un rasgo bien definido
La extensión de la prueba es importante y se debe aumentar, para aumentar la confiabilidad; el número de reactivos siempre forma parte de las fórmulas
Temas especiales relacionados con la confiabilidad
Confiabilidad de los perfiles
Los perfiles de las puntuaciones a menudo son la base para interpretar las pruebas
Confiabilidad de las pruebas con referencia a un criterio
Confiabilidad de subpuntuaciones y reactivos individuales
Debe proporcionarse la información de confiabilidad de la "puntuación" que se está interpretando
Aspectos estadísticos para la interpretación de la confiabilidad
Intervalos de confianza
Conocido también como banda de confianza
Error estándar de la diferencia
Puntuación única
Error estándar de medición
Proporciona información valiosa sobre una prueba
Es la desviación estándar de un número hipotéticamente infinito de puntuaciones obtenidas al rededor de la puntuación verdadera de una persona
3 tipos de errores estándar
Error estándar de la media
Índice de error debido al muestreo aleatorio
Error estándar de estimación
Índice de error en la predicción de Y a partir de X
Error estándar de medición
Índice del error debido a la falta de confiabilidad