Валидность теста. виды валидности - содержательный, логический, эмпирический и концептуальную

Вся электронная библиотека      Поиск по сайту

 

ПСИХОЛОГИЯ

 

СПОРТИВНАЯ ПСИХОДИАГНОСТИКА

Валидность теста

 

Валидность теста показывает, в какой мере он измеряет то Психическое качество (свойство, способность, характеристику и т. п.), для оценки которого предназначен. Инвалидные, т. е. не o6ладающие валидностью, тесты непригодны для практического использования.

 

Валидность и надежность — связанные понятия. Их соотношеиие аналогично соотношению центральности и кучности в пулевой! стрельбе. При этом валидность соответствует центральности, а нaдежность — кучности. Из приведенной аналогии становится очевидным, что валидкость теста не может быть выше его надежно?! сти, а надежность — ниже валидности. Надежность является верх- ней границей валидности, т. е. необходимым условием валидност измерения.

 

В современной психодиагностике выделяют три основных вида валидности: содержательную (логическую), эмпирическую и концептуальную.

 

Содержательная валидность. Ее часто называют логической валидностью или валидностью по определению. Она означает*^ что тест является валидным по отношению к мнению специалистов. Содержательную валидность следует отличать от очевидно^ валидности — валидности с точки зрения испытуемых, которая означает то впечатление о предмете измерения, которое формируй ется у испытуемого при знакомстве с инструкцией и материалов теста. Очевидная валидность играет важную роль в процес- се тестирования, поскольку именно она в первую очередь опреде- ляет отношение испытуемого к обследованию. Например, спорт  смены нередко отказываются от выполнения обшепсихологическид! тестов, мотивируя это тем, что в них ничего не спрашивается o спорте. Специальные тесты в которых используется спортивная! терминология, кажутся «своими» и вызывают больше доверий Именно поэтому очевидную валидность иногда называют довери-^ тельной.

 

Очевидная валидность может находиться в разных отношение ях с содержательной валидностью. В одних случаях они совпадав ют, в других—очевидная валидность используется для маскиров- ки содержательной валидности. С этой целью содержанию зада-d ний и инструкции придается специальная форма, маскирующая истинную цель исследования, и тем самым предупреждается уста-i неточное поведение при тестировании.

 

В отличие от очевидной содержательная валидность всегда} связана с оценкой отношения содержания тестового материала 13 истинной, а не мнимой цели измерения. Для определения содержа* тельной валидности используются экспертные методы. Как вф всякой экспертизе, при этом необходимо решить следующие во-d просы: отобрать компетентных экспертов, сформировать эксперту ную группу, организовать процедуру экспертизы и т. п. Специфнчэ ным является объект экспертизы — содержание теста.

 

Эксперт должны оценить содержание заданий теста по их соответствии^ психическому свойству, объявленному в качестве содержания ва^ лидизируемого теста. С этой целью экспертам предъявляется cneg иификация к тесту и список заданий. Если конкретное задание^ полностью соответствует спецификации, то эксперт обозначаете его как соответствующее содержанию теста. В противном случае он бракует задание и письменно обосновывает свою оценку. Если несколько экспертов бракуют одни и те же задания, они признаются не соответствующими спецификации к тесту. Если эксперты расходятся в оценке заданий, их анонимно знакомят с письменными объяснениями экспертов, забраковавших задания, после чего экспертиза, повторяется. Конечно, следует предусмотреть возможность контроля компетентности и добросовестности экспертов.

 

Одним из простых способов такого контроля является введение заданий, не соответствующих спецификации к тесту.

 

С целью получения итоговой количественной оценки содержательной валидности теста производится агрегация экспертных оценок, обобщающая суждения отдельных экспертов по всем заданиям. В простейшем случае это может быть процент заданий, признанных группой экспертов соответствующими спецификации к тесту.

 

Эмпирическая валидность. Эмпирическая валндность означает, что тест может служить индикатором или предсказателем строго определенной психической особенности или формы поведения человека. Для измерения эмпирической валидности теста вычисляется коэффициент корреляции тестового результата с внешним критерием. В качестве такого критерия может выступать любой показатель, независимо и бесспорно измеряющий ту же психологическую характеристику, что и валидизируемый тест. Вопрос о выборе критерия является основным, так как от него зависит качественная и количественная оценка валидности. Условно можно выделить три группы критериев: 1) экспертные, 2) экспериментальные и 3) «жизненные».

Экспертные критерии предполагают использование экспертных оценок для независимого измерения свойств психики спортсмена.

 

При валидизации тестов, предназначенных для спорта, роль экспертов обычно выполняют тренеры. Однако, как показали специальные исследования, экспертные оценки тренеров имеют низкую валидность и надежность. Немногие тренеры могут выступить в качестве надежных экспертов; это связано с тем, что их оценки в значительной степени подвержены субъективным искажениям (симпатиям и антипатиям, переносу отношений с родителей на ученика, с упешности деятельности на качества личности и т. п.). Другой причиной ошибок является недостаточное понимание содержания оцениваемого качества.

 

Предложить тренеру оценить такую-то особенность психики спортсмена — значит поставить перед неспециалистом задачи, затруднительные даже для большинства психологов. Вначале следует объяснить тренеру содержание психического свойства, для измерения которого предназначен валидизируемый тест, ознакомить со спецификацией и составом заданий и только после этого просить выставить экспертные оценки. В связи с низкой надежностью и трудностями организации экспертиз экспертные критерии валидности используются редко, преимущественно в тех случаях, когда невозможно или чрезвычайно трудно использовать в каче-, стве внешнего критерия валидности обычные количественные методы измерения.

 

Экспериментальные критерии распространены знаЛ} чительно больше. В качестве такого критерия валидности исполь-> зуются результаты одновременного и независимого тестированиях испытуемых другим тестом, предположительно измеряющим то ж1 свойство личности, что и валидизируемый тест. Коэффициент кор40 реляции между результатами двух измерений называется эмпириЛ[ ческой взаимной валидиостью. Его величина зависит как от сте-ll пени совпадения содержания измерения, так и от надежности теС1 стов. Поэтому максимальные коэффициенты эмпирической взаим-Л ной валидности имеются у параллельных тестов.

 

Это вытекает из определения параллельных тестов как тесто^ измеряющих одно и то же свойство с одинаковой ошибкой. Если» бы параллельные тесты были абсолютно надежны, их взаимная, валидность была бы равна единице, так .как по психологическому, содержанию они идентичны. Эмпирическая валидность теста —1 это всегда валидность по отношению к конкретному критерию,-! Именно поэтому процесс конструирования теста часто сопровожу дается поиском подходящего критерия. Если к моменту проверки^ еаущдности такого экспериментачьного критерия не оказывается,! используются жизненные критерии — характеристики pe^l ального поведения, которые на основе существующих психологи-Л ческих теорий предполагаются связанными с измеряемым свойст^1 вом.

 

Например, в качестве жизненных критериев для тестов интеллекта используются показатели успешности обучения, для психомоторных способностей — успешность, спортивной деятельности!? для психической устойчивости — поведение на соревнованиях т. п. Однако успешность обучения, поведения и деятельности ред^1 ко зависит только от одного-единственного свойства психики. РеЯ альное поведение человека множественно детерминировано, т. е£ зависит не от одного, а от целого комплекса психических свойств! Поэтому использование жизненных критериев для валидизации* тестов имеет смысл только в отношении многомерных тестов, изд меряющих одновременно несколько свойств и представляющих^ по существу, многопрофильные батареи тестов. Для оценки ваэ лидности батареи тестов или многомерного теста используются* методы множественного регрессионного анализа.        

 

Регрессионный анализ предназначен для изучения влияния не-э! зависимых переменных на одну или несколько зависимых пере-э менных. В общем случае использование регрессионного анализа измерения валидности является, по существу, построением мате? матической модели поведения, представляющей значение жизнен-^ ного критерия в виде специальной комбинации оценок по шка-Т лам валидизируемой батареи тестов. Поэтому валидность тесгЩ по отношению к жизненному критерию называется также пракги4 ческой валидностью. Наиболее распространенные , спортивной} практике многомерные тесты и батареи тестов обладают высокой) практической валидностью.

 

Концептуальная валидность. Она устанавливается путем доказательства правильности теоретических концепций, положенных в основу валидизируемого теста. Обращение к концептуальной ва- лидности необходимо в тех случаях, когда результаты тестовых измерений используются не просто для предсказания поведения, а как основа для выводов о том. в какой степени испытуемые обладают некоторой определенной психологической характеристикой. Причем эта характеристика не может быть отождествлена с какой-либо наблюдаемой особенностью поведения, а представляет собой теоретическую концепцию (например, интеллект, черты личности, мотивы, психическая устойчивость и т. п.). Концептуальная валидность имеет значение также при разработке принципиально новых тестов, для которых не определены внешние критерии ва- лидности.

 

По существу, проверка концептуальной валидности теста проходит три основных этапа:

1)        определение некоторой теоретической концепции, которая (предположительно) объясняет выполнение валидизируемого теста;

2)        выведение из теоретической концепции одной или нескольких гипотез, связанных с валили шруемым тестом;

3)        эмпирическая проверка выдвинутых гипотез.

 

Если эмпирические данные подтверждают гипотезу, то тем самым подтверждается психологическая концепция, положенная в основу теста, и способность теста служить инструментом измерения концепции. Чем убедительнее эмпирическое подтверждение, тем определеннее можно говорить о валидности теста по отношению к психологической концепции. Если эмпирические данные не подтверждают выдвинутых гипотез, то ошибка могла возникнуть из-за:

а)         неправильности теоретической концепции, положенной в основу теста;

б)        отсутствия соответствия между тестом и теоретической концепцией;

в)         ошибок при выдвижении гипотез, относящихся к валидизи- руемому тесту.

 

В отличие от эмпирической валидности, которая обычно имеет дело с единственным внешним критерием, при оценке концептуальной валидности проверке подвергаются по возможности все гипотезы, вытекающие из теоретической концепции, лежащей в основе валидизируемого теста. Концептуальная валндность считается удовлетворительной, если почти все гипотезы подтверждаются экспериментально.

 

 



 

 

 Смотрите также:

 

Методы оценки надежности теста. Коэффициент...

До включения в тест задача должна быть оценена с точки зрения объективности, надёжности, валидности, трудности и дискриминативности.

 

Валидность и надежность. Надёжность - это устойчивость...

валидность < надёжность. Это означает, что валидность теста не может превышать надёжности теста.

 

Методы тестирования. Тест — это метод изучения глубинных...

Валидность теста может быть проверена посредством сравнительной оценки результатов, полученных другими методами...