20.02.2004 Время чтения: 4 минуты

Оценка эффективности теста "Большая пятерка" и пример его практического использования

Содержание

1. Проверка валидности
2. Проверка надежности
3. Проверка репрезентативности
4. Проверка достоверности

Пользуясь многочисленными психодиагностическими методиками, мы редко задумываемся о качестве этих рабочих инструментов. И напрасно. Ведь любому практикующему психологу известно, что ни одно психологическое обследование невозможно без хорошего диагностического инструментария.

При этом популярные сборники психологических тестов, широко публикуемые в последнее время, к сожалению, не могут удовлетворить требованиям настоящего профессионала, который должен быть уверен в диагностических возможностях того инструмента, который он использует в своей работе. Поэтому, проблема поиска грамотно разработанной и надежной диагностической методики остается актуальной.

Основной задачей HR-Лаборатории Human Technologies является разработка качественной продукции. Одним из условий создания такой продукции являются периодические проверки тестовых методик на предмет их соответствия ряду психометрических требований (валидности, надежности, репрезентативности, достоверности). Для этого, после набора достаточного количества протоколов проводится статистический анализ тестовых методик.

Рассмотрим психометрический анализ теста "Большая пятерка" (общая выборка которого составила 660 человек).

Данный тест, разработанный в 90-е гг., предназначен для экспресс-диагностики уровня выраженности пяти так называемых "больших" факторов темперамента и характера и используется для исследования личности взрослых людей с целью профотбора, профконсультации, определения направлений психологической помощи, комплектования групп, самопознания и т.п.

Основой универсальности "Большой пятерки факторов" является их кросс-ситуационность: факторы глобальной функционально-деятельностной оценки человека приложимы практически к любой ситуации социального поведения и предметной деятельности, в которых обнаруживаются устойчивые различия между людьми.

Опросник включает 75 пунктов по три варианта ответа в каждом.

ШКАЛЫ теста представляют собой точное воспроизведение факторов "Большой Пятерки" в их международном варианте (за исключением пятого фактора, который в ряде западных версий B5 обозначается как "открытость новому опыту - ограниченный практицизм"):

экстраверсия - интроверсия
согласие - независимость
организованность - импульсивность
эмоциональная стабильность - тревожность
обучаемость - инертность

1. Проверка валидности

При проверке существующих шкал традиционным способом - путем расчета корреляций между ответами на вопросы и суммарным баллом по шкале - мы выяснили, что практически все пункты значимо коррелируют со "своими" шкалами со средним коэффициентом корреляции равным 0,35.

При проверке содержательной валидности теста были проанализированы формулировки заданий теста, содержательно отражающие соответствующую предметную область (область поведения) и имеющие значимую (положительную или отрицательную) корреляцию с суммарным баллом:

Шкала	Пример заданий теста	Коэффициент корреляции
ЭКСТРАВЕРСИЯ	Для меня важно высказать свое мнение окружающим	(0,31)
	Я люблю участвовать во всевозможных конкурсах, соревнованиях и т.п.	(0,41)
	Мне нравится ходить в гости и знакомиться с новыми людьми	(0,5)
СОГЛАСИЕ	Большинству людей нельзя доверять	(-0,23)
	Мои интересы для меня превыше всего	(-0,22)
	"Кто людям помогает, тот тратит время зря, хорошими делами прославиться нельзя"	(-0,3)
	"Каждый - сам за себя" - вот принцип, который не подведет	(-0,4)
САМОКОНТРОЛЬ	Когда я ложусь спать, то уже наверняка знаю, что буду делать завтра	(0,37)
	Взяв книгу, я всегда ставлю ее на место	(0,35)
	Перед ответственными делами я всегда составляю план их выполнения	(0,37)
СТАБИЛЬНОСТЬ	Я легко краснею	(-0,28)
	Если я уловил(а) возникновение нежелательной ситуации на работе, то это всегда вызывает у меня тягостное сомнение до тех пор, пока ситуация не прояснится	(-0,3)
	В конце дня я обычно устаю настолько, что любая мелочь начинает выводить из себя	(-0,32)
	Испортить мне настроение совсем просто	(-0,42)

Анализ приведенных формулировок говорит о достаточно высокой содержательной валидности теста.

2. Проверка надежности

Надежность теста как средства измерения определяется низкой вероятностью ошибок измерения тестовых баллов и тем, в какой мере результаты измерений воспроизводятся при многократном использовании теста по отношению к данной группе испытуемых. Чтобы оценить вклад различных источников в ошибку измерения, необходимо использовать разные способы оценки надежности. Особый интерес представляет оценка внутренней согласованности теста, она обуславливает ту часть ошибки, которая связана с отбором заданий.

Оценка внутренней согласованности теста производилась посредством расчета альфа-коэффициента Кронбаха. Данный коэффициент представляет собой оценку надежности, базирующуюся на гомогенности шкалы или сумме корреляций между ответами испытуемых на вопросы внутри одной и той же тестовой формы.

В нашем случае рассчитанный для каждой шкалы альфа-коэффициент надежности Кронбаха показал в целом вполне приличный уровень внутренней согласованности, традиционный для личностных экспресс-опросников, в которых субшкалы содержат ограниченное число пунктов (менее 20):

экстраверсия	0,67
согласие	0,56
организованность	0,67
эмоциональная стабильность	0,63
обучаемость	0,53

Напомним, что строгим психометрическим требованиям, предъявляемым к эффективно работающему личностному тесту, соответствует значение альфа-коэффициентов выше 0,8.

В нашем же случае относительно низкий уровень значения коэффициентов надежности Кронбаха можно объяснить содержательной объемностью данных шкал: на каждую шкалу приходится по 15 разноплановых вопросов, что позволяет расширить область охвата исследуемых факторов, жертвуя вместе с тем высоким уровнем внутренней согласованности.

Особенно остро это сказалось на факторных шкалах "СОГЛАСИЕ" и "ОБУЧАЕМОСТЬ", по которой альфа-коэффициент оказался ниже 0,6.

3. Проверка репрезентативности

При переходе от выборки стандартизации (рис.1 - 300 человек) к выборке популяции (рис.2 - 660 человек) проявляется устойчивость конфигурации распределения тестовых баллов, что говорит о репрезентативности тестовой методики:

#IMAGE_0#

Рис.1. Выборка стандартизации (300 человек)

#IMAGE_1#

Рис.2. Выборка популяции (660 человек)

Помимо визуальной схожести этих распределений, использованный нами статистический хи-квадрат критерий Пирсона показал следующую степень сходства распределений:

экстраверсия	5.614
согласие	7.858
организованность	8.094
эмоциональная стабильность	9.676
обучаемость	8.123

Данные значения хи-квадрата попадают в промежуток неопределенности: когда нельзя однозначно принять или однозначно отвергнуть гипотезу о согласованности распределений.

Такой результат может быть обусловлен основным свойством экспресс-теста, а именно - малым количеством вопросов, работающих на каждую шкалу. Учитывая этот факт, результаты проверки репрезентативности можно признать удовлетворительными.

4. Проверка достоверности

Так как испытуемые, проходившие тестирование на сайте, находились в ситуации клиента (были заинтересованы в достоверных результатах), то с высокой вероятностью полученные результаты можно считать достоверными.

Однако в ситуации экспертизы (когда в результатах тестирования заинтересовано третье лицо), данные могут искажаться от вмешательства сознательных фальсификаций (лжи, неискренности испытуемого) или бессознательных мотивационных факторов. Чтобы избежать этого в версию, предназначенную для подобных случаев (B5splus), была добавлена шкала лжи (в данный момент эта версия проходит апробацию на нашем сайте) .

Полученные результаты являются свидетельством высокого качества и эффективности методики, что немаловажно, ведь профессиональный уровень специалиста, зачастую, определяется тем инструментом, которым он пользуется.

Однако, следует помнить, что даже мощный современный инструмент не гарантирует полного отсутствия ошибок. Для того чтобы избежать их, мало иметь компьютер и тестовую программу к нему. Обязательно нужен еще и опытный психолог, контролирующий выполнение теста. Так что наличие тестов, прошедших серьезную психометрическую адаптацию, вовсе не отменяет профессионализма и опыта психолога, призванного проверять правдоподобность тестовых результатов с использованием параллельных источников информации (включая собственное наблюдение, беседу и т.п.)

#Большая пятерка #Разработка тестов

0 комментариев

Написание комментария требует предварительной регистрации на сайте

Комментариев пока нет, будьте первым

Похожие статьи

11.03.2014

Инфографика: Обновление норм методик в 2013г.

В 2013 г. коллективом научно-методического отдела Лаборатории "Гуманитарные Технологии" была проведена масштабная работа по обновлению тестовых норм методик, наиболее активно используемых нашими клиентами в практике оценки персонала (17 из 22). С помощью инфографики представляем Вам результаты этой работы.

05.05.2015 06:38:37

Увольняющийся герой нашего времени — кто он?

Результаты исследования данных текучести персонала и их связи с результатами психометрических текстов.

24.01.2013 04:29:57

Портрет «идеального» покупателя

Качество рекламы и её «попадание» в целевую аудиторию - всегда под сомнением. Компании стремятся развеять свои колебания, проводя массовые опросы, анкетирования или фокус-группы, однако вряд ли у многих из них есть комплексное и непротиворечивое представление о личности собственного «идеального» покупателя. Вряд ли они обладают его законченным портретом в единстве всех психологических штрихов и нюансов. Создание подобных произведений исследовательского искусства с опорой на современные стандартизированные диагностические методики – вполне посильная и одновременно интересная задача, за решение которой мы взялись. При этом совершенно очевидны «реальные» коммерческие выгоды от нахождения указанных «идеальных» типов: любое рекламное послание отныне может быть направлено по верному адресу (а не «на деревню дедушке»), с гарантией доставки и минимальными издержками.

29.02.2012 13:32:00

Что хотел сказать автор?..

Первоначально этот текст появился как комментарий к заметке, которую мы решили переопубликовать на сайте HT.RU, но оказалось, что комментарий превышает саму заметку по размеру и мы решили опубликовать его отдельно, ограничившись лишь ссылкой на саму заметку. Законы журналистики приучают нас к тому, что заголовок должен быть громким. Применительно к Интернет-формату, можно даже уточнить: настолько громким, чтобы на него «кликнули». Один из таких заголовков предварял заметку о том, что проведенное в США исследование показало, что изучение страницы кандидата в социальной сети оказывается более действенным инструментом, чем личностные опросники.

29.08.2011 10:47:24

Приоткрывая занавес: как создавался тест 11ЛФ

Несмотря на то, что в аннотации к каждому тесту Лаборатории есть информация об истории создания методики и ее психометрических параметрах, за кулисами нашей психометрической сцены от глаз зрителя часто остаются скрытыми споры, идеи, предложения, отринутые гипотезы и радость подтвержденных догадок. В данной статье мы решили поподробнее рассказать об одной из недавних наших разработок – личностном тесте 11ЛФ. О том, почему он появился, как он изменялся в процессе апробации, а также о выявленной при работе с его результатами связи между характером человека и его удовлетворенностью своей жизнью.

12.07.2010 10:44:46

Диагностика факторов Большой Пятерки методом ипсативного опросника

В своей работе мы поставили задачу найти и воплотить в практических решениях такую технологию оценки факторов «Большой пятерки», которая была бы защищена от эффекта социальной желательности в процессе самой процедуры тестирования, а не только на этапе интерпретации результатов. Такое методическое решение в настоящее время многими разработчиками видится в так называемой «ипсативной» технологии тестирования.

07.10.2009 17:20:50

Анализ ситуационных различий в тестовых нормах (на примере тест-опросника "Большая пятерка")

В настоящем сообщении приводятся статистические результаты сравнительного эмпирического исследования с использованием тест-опросника "Большая пятерка" в двух диагностических ситуациях: "клиента" и "экспертизы". Для четырех факторных шкал из пяти получены значимые различия (по критерию Стьюдента) для средних значений.

07.10.2009 16:51:47

Тест юмористических фраз: результаты психометрического исследования с использованием оценочной версии (ТЮФО)

Как известно, разные люди смеются над разными вещами. В данном исследовании была предпринята попытка подтвердить или опровергнуть данный тезис. Для этого необходимо выяснить, существуют ли значимые различия в предпочтениях юмора. И, во-вторых, являются ли эти различия столь устойчивыми и значимыми в статистическом смысле, что на них можно построить косвенную психодиагностическую методику.

10.01.2004 15:57:00

Оценка внутренней валидности теста СТМ (структура трудовой мотивации)

Редакция Ht.ru, Валерия Одинцова, HR-Лаборатория Human Technologies 10 января, 2004 За годы эксплуатации тестовой методики многое может измениться: социальная ситуация в стране, общественные взгляды и индивидуальные установки. Случается, что интересные по замыслу диагностические инструменты оказываются слишком чувствительными к подобным факторам. То, что было важным и работало вчера, сегодня может стать неактуальным. Именно поэтому, даже при создании очень удачной, эффективно работающей...

Хотите подобрать тест для оценки?

В нашем арсенале более 30 тестов оценки личностных, мотивационных особенностей, IQ, управленческого потенциала, рискованного поведения, самопознания и др.

Оставьте заявку на бесплатную консультацию специалиста!

Перейти в каталог тестов