Please enable JavaScript.
Coggle requires JavaScript to display documents.
Validez: Es el grado en que la prueba mide lo que pretende medir, Las…
Validez: Es el grado
en que la prueba mide lo que pretende medir
La validez es una cuestión de grado, La mayoría de las puntuaciones que se usan tienen cierto grado de validez, que puede ser leve, moderado o considerable. Nuestro interés determinara el grado de la validez.
Debemos distinguir entre validez y exactitud de las normas de una prueba. Es muy posible tener una prueba con una buena validez, pero también con normas bastante inexactas
Subrepresentación del constructo y varianza irrelevante para el constructo
Constructo: característica a medir. la superposición entre constructo y prueba representa la validez: medir lo que queremos medir
Subrepresentación del constructo: La parte del
constructo que no está cubierta por la prueba
La prueba, además de medir una parte del constructo de interés, puede medir algunas características diferentes de las que queremos medir; esta "otra" medición se llama varianza irrelevante para el constructo
Clasificaciones tradicionales y nuevas de los tipos de evidencia de la validez
De contenido
: se ocupa de la relación entre el contenido de una prueba y algún dominio bien definido de conocimiento o conducta
Para que una prueba tenga
validez de contenido, debe haber una buena correspondencia entre el contenido de la
prueba y el contenido del dominio pertinente.
La obtención de la validez de contenido a menudo implica la noción de muestreo, es decir, el contenido de la prueba cubre una muestra representativa de todos los posibles contenidos del dominio. La validez de contenido tiene dos
aplicaciones primarias
Aplicación en las pruebas de aprovechamiento: El propósito habitual de estas pruebas es
determinar el grado de conocimiento sobre algún material. Ejemplo: Conceptos matemáticos de 1 a 3 grado
Aplicación en las pruebas de reclutamiento: En las pruebas de reclutamiento, el dominio de contenido
consiste en los conocimientos y habilidades requeridos para un trabajo específico. Los factores como motivación y características de personalidad no suelen incluirse
Análisis de puesto: El proceso de desarrollar una lista de conocimientos y habilidades necesarios para un trabajo
Validez instruccional
: pregunta si el contenido ha sido, en verdad, enseñado.
De criterio- Relaciones con otras variables:
Su característica esencial es establecer la relacion entre el desempeño en la prueba y algún otro criterio que se consideran un indicador importante del constructo de interés.
Los dos contextos generales de la validez de criterio son la validez predictiva y la
validez concurrente
validez concurrente, verificamos la concordancia entre el desempeño en la prueba y el
estatus actual en alguna otra variable
validez predictiva, la prueba busca predecir el estatus en algún criterio que será alcanzado en el futuro
En algunos contextos queremos usar varias pruebas para predecir el estatus de un criterio. El método usual para tratar con esta situación es la
correlación múltiple
técnica para expresar la relación ente una variable (el criterio) y la combinación óptima de dos o más variables (en este caso, varias pruebas)
Concurrente- convergente y discriminante
La validez convergente se refiere a una correlación relativamente entre la prueba y algún criterio pensado para medir el mismo constructo de la prueba.
La validez discriminante, es la que muestra que una prueba tiene una correlación relativamente con constructos diferentes al que se pretende medir con ella.
Los conceptos de validez convergente y discriminante se usan mucho en el campo de
la medición de la personalidad
Una aplicación especial de los conceptos de validez convergente y discriminante es la
matriz
multirrasgo-multimétodo
El propósito esencial del análisis multirrasgo-multimétodo es demostrar que las correlaciones dentro o de un rasgo utilizando distintos métodos son más altas que las correlaciones dentro de un método con distintos rasgos y, desde luego, que
las correlaciones que combinan distintos rasgos y métodos
Predictiva- Relaciones con pruebas-criterios
De constructo- Procesos de respuesta
Un concepto que incluye la validez de contenido y la validez de criterio. La correspondencia del contenido que está implicada en la validez de contenido y la correlación entre prueba y criterio son sólo casos –relativamente claros– que demuestran el grado en que la prueba mide el constructo
Hay ciertos tipos de evidencia que se presentan en las discusiones sobre la validez de constructo.
El
análisis factorial
es una familia de técnicas estadísticas que ayudan a identificar las
dimensiones comunes que subyacen en el desempeño en muchas medidas diferentes. ; tienen un papel destacado en los inventarios de personalidad y en las pruebas de inteligencia
Procesos de respuesta
: El estudio de la manera en que los examinados emprenden la tarea de responder una prueba. puede proporcionar evidencia relacionada con la validez de la prueba
Efecto de las variables experimentales
: Puede ayudar a demostrar la validez de una
prueba. los grupos que tratamos al hablar de la validez de constructo se crean
específicamente para estudiar la validez
Cambios mediacionales o en el desarrollo
: Mostrar que una capacidad mental refleja
esta evolución ayuda a establecer la validez de la prueba. Uno de los principales métodos que usó
Binet para defender la validez de los reactivos de su prueba fue demostrar cambios en las
puntuaciones promedio de niños de distintas edades.
-Estructura interna
Un nivel alto
de consistencia interna, por ejemplo, una KR-20 o un coeficiente alpha altos, indica que
la prueba mide algo de una manera consistente
Quizá lo mejor es pensar en la consistencia interna como un prerrequisito de la
validez más que como evidencia de validez por sí misma.
Una consistencia interna alta
indica que un constructo se está midiendo, pero se requiere otra evidencia que sugiera de
qué constructo podría tratarse.
-Consecuencias, Validez consecuencial
Relaciona la prueba con las consecuencias de su uso e interpretación. El concepto incluye las consecuencias que se buscaban y las que no.
Esta noción abarca las consecuencias buscadas y las imprevistas
La validez consecuencial es una recién llegada a la discusión sobre la validez y despierta opiniones opuestas acerca de cómo tratarla con exactitud.
Validez aparente: se refiere a si la prueba tiene la apariencia de medir el constructo meta. Ésta nunca puede ser un sustituto de la validez empírica
Relación entre confiabilidad y validez
La validez de una prueba depende en parte de su confiabilidad y, en parte, de la
confiabilidad del criterio. Así, una confiabilidad limitada, sea de la prueba o del criterio,
limitará la validez de criterio
Validación cruzada y encogimiento de la validez
La validación cruzada se refiere a determinar la ecuación (y R) en una muestra, y luego aplicar la ecuación en una nueva muestra para ver que R emerge.
La pérdida de validez (es decir, reducción de R) de la primera a la segunda muestra se conoce por el curioso nombre de encogimiento de la validez.
Predicción estadística frente a predicción clínica
En general, las predicciones estadísticas son iguales o, muchas veces, mejores que las
predicciones clínicas.
Meehl (1954) fue el primero en documentar la superioridad de las predicciones estadísticas sobre las clínicas en varios estudios
Teoría de la decisión
: La teoría de la decisión es un cuerpo de conceptos, términos y procedimientos para analizar los efectos cuantitativos de nuestras decisiones
Aplicada a la evaluación, la
decisión implica usar pruebas, sobre todo en el contexto de la validez de criterio para
propósitos como selección, certificación y diagnóstico
Al aplicar la teoría, por lo general
queremos optimizar los resultados de nuestras decisiones de acuerdo con ciertos criterios,los cuales pueden implicar ahorros en costos o tiempo.
Aciertos, positivos falsos y negativos falsos
Un
acierto
es un caso que tiene el mismo estatus respecto de la prueba y el criterio; es
decir, los aciertos incluyen casos que excedieron el punto de corte del criterio y de la
prueba (acierto positivo), así como casos que estuvieron por debajo del punto de corte
del criterio y de la prueba (acierto negativo)
Los
positivos falsos
son
casos que superan el punto de corte pero no se ajustan al criterio
Los
negativos falsos
son aquellos en que la puntuación de la prueba esta debajo del punto de corte, pero tienen éxito en el criterio.
Dos factores afectan los porcentajes de aciertos, positivos falsos y negativos falsos
El primer factor es el grado de correlación entre la prueba y el criterio. Los casos extremos
son los de correlación perfecta o de correlación cero.
En el caso de una correlación
perfecta, no habrá positivos falsos ni negativos falsos, pues todos serán aciertos. En el de una correlación cero, la suma de positivos falsos y negativos falsos será igual al numero de aciertos.
El segundo factor es la ubicación de la puntuación de corte en la prueba. Los cambios
en esta puntuación afectan el porcentaje relativo de positivos falsos y negativos falsos
Índice base
El índice base es
el porcentaje de individuos de la población que tienen alguna característica
Por ejemplo, el índice base de la esquizofrenia en la población general es de casi 1%, el de
hombres solteros entre 25 y 29 años de edad es de 45% % y el de adultos con grado de
licenciatura es de casi 21%.
Cuando el índice base es extremo, muy alto o muy bajo, es difícil mostrar que una prueba tiene una nueva validez al identificar individuos del grupo meta.
Sensibilidad y especificidad
: Aplicamos estos términos cuando una prueba se usa para clasificar individuos en dos grupos, como alcohólicos y no alcohólicos o con riesgo suicida y sin riesgo suicida
La sensibilidad de una prueba es
el grado en que identifica de manera correcta al grupo criterio, mientras que la especificidad es el grado en que la prueba no identifica o evita identificar al grupo de contraste.
Integración de la evidencia
análisis final, el usuario profesional de pruebas debe sopesar toda la evidencia (
generalización de la validez
) disponible y hacer juicios acerca de la probable validez de una prueba utilizada en ciertas
circunstancias.
El metaanálisis es una técnica para resumir la información real estadística de muchos estudios diferentes sobre un solo tema.
Análisis final
: En el análisis final, cuando llegamos a ese juicio, el usuario trata de responder a la pregunta: ¿es mejor que use esta prueba como fuente de información o no?
No hay una respuesta para la pregunta cual es el mínimo de validez que debe haber, pero se debe ver cual es tiene mas validez y esa se usa
Las tres aplicaciones comunes de la validez de criterio implican
Criterio externo y factible
: un criterio externo proporciona una definición factible del constructo de interés. El criterio externo es aquello sobre lo que nos gustaría
tener información
Ejemplo: Prueba: Prueba de admisión a la
universidad. Criterio: GPA al término del primer año en la universidad
Correlaciones con otras pruebas
: Mostrar la correlación entre la prueba que se desea validar y alguna otra que se sabe p se supone que es una medida valida del constructo pertinente
Grupos contrastados
: el criterio es la pertenencia a un grupo. Queremos demostrar que la prueba diferencia un grupo de otro. Por lo general, mientras mejor es la diferenciación entre grupos, más válida es la prueba
CLAUDIA CARREÑO