Please enable JavaScript.
Coggle requires JavaScript to display documents.
АПРОБАЦИЯ ТЕСТА - Coggle Diagram
АПРОБАЦИЯ ТЕСТА
ЭТАПЫ АПРОБАЦИИ
Формирование выборки тестируемых.
Проведение измерений по единой технологии.
Формирование исходной матрицы результатов тестирования.
Компьютерная обработка результатов тестирования.
Экспертная оценка качества теста.
Уточнение (улучшение) теста
ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ТЕСТА
статистическую трудность заданий;
дифференцирующую способность заданий;
сложность теста (статическое распределение баллов);
надежность теста от угадывания;
надежность – ретестовую, по внутренней согласованности
Дифференцирующая способность
Дифференцирующая способность (дискриминативность) – это способность тестового задания отделять испытуемых с высоким общим баллом по тесту от тех, кто получил низкий балл.
Типичными недостатками низкодискриминативных заданий могут быть
излишняя сложность, запутанность формулировок;
неоднозначность условия;
очевидность решения;
абсурдность вариантов ответов;
низкая содержательная валидность задания (проверяется непройденный материал, проверяется память учащихся, а не их знания и умения);
наличие двух или более правильных ответов, не оговоренное в инструкции.
ВАЛИДНОСТЬ ТЕСТА
Валидность определяется путем экспертных оценок (не измеряется).
Валидность выражается степенью (высокая, средняя, низкая).
Валидность специфична для каждого конкретного использования.
Существует много способов определения валидности.
очевидная;
содержательная;
конструктная (концептуальная);
критериальная;
конкурентная (сравнительная).
СЛОЖНОСТЬ ТЕСТА
Мода – наиболее часто встречающееся значение среди результатов выполнения теста.
метод повторного тестирования (Retestmethod);
метод параллельного тестирования (с помощью параллельной формы теста);
метод расщепления теста (Split-Half-Method).
НАДЕЖНОСТЬ ПО ВНУТРЕННЕЙ СОГЛАСОВАННОСТИ
Внутренняя согласованность – это характеристика теста, указывающая на степень однородности состава заданий с точки зрения измеряемого качества (все задания теста должны определять тестируемое качество).
ИСТОЧНИКИ НЕУДОВЛЕТВОРИТЕЛЬНОЙ НАДЕЖНОСТИ
Величина теста.
Неоднозначность понимания вопроса (двусмысленность задания).
Угадывание правильных ответов.
Качество инструкций.
Субъективное оценивание.
Причины, связанные с испытуемыми.
Формирование выборки тестируемых
ВЫБОРКА
ОБЪЕМ
ФАКТОРЫ ВЛИЯЮЩИЕ НА ОБЪЕМ ВЫБОРКИ
Задачи и условия проведения исследования.
Степень однородности генеральной совокупности.
Вероятность, с которой гарантируется достоверность результатов. Наиболее часто используемая вероятность – 95% (0,95).
Точность результатов, определяемая предельной ошибкой репрезентативности. Задается обычно в пределах (0,01–0,1) с наиболее частым употреблением 5% (0,5).
Объем выборки вычисляется
по изменению дисперсии;
по таблицам достаточно больших чисел;
эмпирически по процентному выражению среднего квадратичного отклонения от величины измеряемого параметра;
по формулам математической статистики.
РЕПРЕЗЕНТАТИВНОСТЬ
СООТВЕТСТВИЕ ХАРАКТЕРИСТИК ВЫБОРКИ ХАРАКТЕРИСТИКАМ ПОПУЛЯЦИИ ИЛИ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ В ЦЕЛОМ.
Общие правила формирования периодической выборки
выборка должна быть стратифицирована, т.е. в выборке должны быть представлены различные категории, реально существующие в генеральной совокупности, желательно в той пропорции, которая имеет место в генеральной совокупности;
в каждой подгруппе должно быть достаточное количество испытуемых, чтобы сформировать адекватную выборку.