Глава 3. Создание надежных тестов II: личностные опросники.



Разработка заданий

 

Личностные опросники - широко используемые методики изме-

рения личностных качеств, поскольку они могут разрабатываться

так, что им будут присущи многие атрибуты эффективных тестов:

надежность, дискриминативность и стандартизованность. Однако, в

силу природы личностных переменных, труднее всего бывает устано-

вить валидность именно этих методик.

 

Проблемы конструирования личностных опросников

 

Как и в случае тестов способностей, качество отдельных заданий

(вопросов, утверждений) является определяющим для всего опрос-

ника, и поэтому в данной главе будут рассматриваться трудности,

возникающие при формулировании заданий, а также преимущества

различных типов заданий.

При разработке заданий для личностных опросников необходимо

учитывать следующие проблемы, которые, если их не обойти, неиз-

бежно приведут к низкой валидности тестов.

(1) Установка на согласие (response set of acquiescence). Это

тенденция испытуемого соглашаться с утверждениями или отвечать

на вопросы «да» независимо от их содержания. Чаще всего проявля-

ется, согласно Guilford (1959), когда утверждения (вопросы) неодно-

значны и неопределенны.

(2) Установка на социально одобряемые ответы (response set of

social desirabiliiy). Это тенденция испытуемых отвечать на вопросы

теста так, чтобы выглядеть «социально положительным»: если воз-

можен «социально желательный» ответ, то весьма вероятно, что

испытуемые будут его давать. Эта установка, как показал Edwards

(1957), оказывает, в частности, влияние на результаты теста ММР1

(Minnesota Multiphasic Personality Inventory).

(3) Установка на неопределенные или средние ответы (response

set of using the uncertain or middle category). Если в опроснике пред-

ставлена средняя категория ответов, отражающая нерешительность

или неуверенность в ответе (напр., «не уверен», «не знаю», или

«затрудняюсь ответить»), то многие испытуемые склонны к ней при-

бегать, как к безопасному компромиссу. Это приводит к снижению

валидности заданий, поскольку большинство методов анализа вопро-

сов основывается на крайних значениях показателей.

(4) Установка на «крайние? (расположенные по краям шкалы)

ответы (response set of using the extreme response). Эта установка

может проявляться при использовании многоэлементной рейтинго-

 

91

 

вой шкалы. Некоторые испытуемые, независимо от содержания воп-

росов предпочитают выбирать крайние ответы (Vernon, 1964).

(5) Очевидная валидность (face validity) вопросов (утвержде-

ний). Несомненно, в тестах личности необходима уверенность в том,

что ответы на вопросы могут рассматриваться как правдивые. Catfell

и Kline (1977) рассматривают данные опросника как данные Q и Qi.

Данные из первого множества рассматриваются так, как если бы они

отражали поведение испытуемого, данные из второго - как ответ на

отдельный вопрос, ответ, который либо нагружен некоторым факто-

ром, либо нет, независимо от того, отражает ли он поведение испы-

туемого.

(6) Выборка из генеральной совокупности вопросов. В тестах

интеллекта и специальных способностей, обсуждавшихся в предыду-

щей главе, относительно легко убедиться в том, что задания принад-

лежат или с высокой степенью вероятности выглядят принадлежа-

щими к подразумеваемой для них генеральной совокупности. Линг-

вистические задания нелегко перепутать с математическими или

какими-либо другими. Однако, в области особенностей личности и

темперамента все гораздо сложнее.

В самом деле, иногда даже опытные и искусные разработчики

вопросов (например, Cattell, 1957) бывают удивлены тем, что вопро-

сы нагружены не теми факторами, для выявления которых они были

созданы, а также тем, что вопросы вообще не нагружены ни одним из

факторов. Эта проблема с точки зрения классической теории тестов

состоит в трудности определения конкретной выборочной совокупно-

сти вопросов. В результате возникает проблема подбора адекватной

выборки из выборочной совокупности вопросов или утверждений для

теста, а без этого тест не может быть валидным.

(7) Выборка из генеральной совокупности испытуемых. Как ука-

зано выше, в личностных тестах труднее обеспечить адекватность

выборки из выборочной совокупности, чем в тестах способностей.

При использовании тестов способностей обычно известна вполне оп-

ределенная категория лиц (популяция), для которой данный тест

предназначен, и таким образом, по крайней мере в принципе, можно

эффективно подбирать выборки. Однако, в личностных тестах, в

отличие от тестов, разрабатывающихся для испытуемых с той или

иной патологией, в идеале нужны выборки из общей популяции (т.е.

всего населения страны), в которой встречаются все возможные по-

казатели. Такие выборки, как показано, должны быть большими, и

их обычно трудно получить.

(8) Проблемы в установлении адекватного критерия валидное

ти. Существует, как уже подробно обсуждалось в разделе о валид-

 

92

 

ности, значительная трудность в нахождении адекватного критерия.

Например, если мы пытаемся измерить авторитаризм, то будем вы-

нуждены полагаться на рейтинги, поскольку нет никаких других

внешних мерил (в отличие от, например, школьных экзаменов в

случае диагностики способностей). Рейтинги - это неадекватный

инструмент (см. гл. 1), а если бы они подходили, тест был бы не

нужен. Аналогично, если существуют высокоэффективные тесты ав-

торитаризма, которые могут быть использованы в качестве критерия

валидности, вероятно, в новом тесте нет необходимости.

Таким образом, мы вынуждены ограничиваться исследованиями

конструктной валидности, обычно основывающимися на мультива-

риативном анализе разрабатываемого теста по сравнению с другими

переменными, а также исследованиями специальных групп, имею-

щих по предположению контрольные показатели по рассматривае-

мой переменной.

Таковы основные сложности, возникающие при конструировании

личностных опросников, и следует отчетливо их себе представлять,

прежде чем вы приступите к формулированию вопросов или утверж-

дений. Две последние проблемы, хотя они и являются определяющи-

ми, выходят на первый план уже после того, как подобраны задания

теста.

 

Формулирование вопросов (утверждений ) для личностных

опросников

 

Практически нет необходимости особо говорить о том, что для

тестов личности имеет большое значение то, чтобы ответы на вопро-

сы могли быть объективно и с высокой надежностью оценены. Следо-

вательно, мы должны сделать это возможным путем разработки фор-

мы вопросов. Ниже приведены формы вопросов, используемых в

наиболее известных опросниках - тех, которые оказались наиболее

эффективными на практике.

(1) Вопросы с ответом типа «да-нет». Такие вопросы исполь-

зовались автором этой книги в разработанных им тестах личности,

Ai3Q (Kline, 1971), OOQ и OPQ (Kline and Storey, 1978). Их легко

формулировать, они понятны испытуемым и ответы на них даются

быстро. Такова форма вопросов личностных тестов Айзенка. Типич-

ный дихотомический вопрос: «Любите ли вы загорать на пляже?»

(2) Вопросы с ответа.ш типа «да-?-нет», «да - затрудняюсь

ответить - нет». Это вариант вопросов типа «да-нет», описан-

ных выше, с добавлением категории неопределенности, потому что

некоторые испытуемые становятся раздражительными и несговорчи-

 

93

 

выми, если их заставляютотвечатьлибо «да», либо «нет» на вопросы,

в ответах на которые они не очень уверены.

Трудность с такими вопросами состоит в том, что эта «средняя»

категория очень привлекательна для испытуемых и редко бывает

информативной. Bendig (1959) показал ото на примере теста МР1

(Maudsley Personality Inventory - ранней версии EPI, Eysenck Perso-

natoy Inventory), в котором не делалось различие между дихотоми-

ческой и трихотомической формой вопросов, и сделал заключение о

том, что дихотомические вопросы более предпочтительны, посколь-

ку они заставляют преодолевать нежелание делать выбор. С моей

точки зрения между вопросами типа «да-нет» и «да-?-нет» раз-

личие столь невелико, что вопрос о том, какую форму выберет раз-

работчик теста, становится не более, чем делом личного предпочте-

ния. Cattell и его коллеги используют трихотомическую форму для

некоторых из вопросов в своих факторных тестах личности.

(3) Альтернативные задания (сответами типа «правда-ложь»;.

Эти задания состоят из утверждений (часто от первого лица), кото-

рые испытуемые должны отметить как верные или неверные для них.

Примером альтернативного задания является: «Я ненавижу втиски-

ваться в переполненный автобус». Это форма утверждений, исполь-

зуемая з ММР1. По существу, она ненамного отличается от дихото-

мических вопросов, хотя формулирование их как альтернативных

утверждений, а не как дихотомических вопросов, может до некото-

рой степени повлиять на языковую представленность задания.

(4) Задания с ответами типа «нравится-не нравится» (одно

слово или фраза). Это весьма оригинальная форма задания, которая

в настоящее время используется у Grygier (1961) в динамическом

тесте личности (DPI - Dynamic Personality Inventory), тесте, осно-

ванном на шкале личностных предпочтений Кроута (Krout Personal

PreferenceScale) (KroutandTabin, 1954). Примерамитакихзаданий

могут быть: (1) «фонарщики»; (2) «воротники из бобрового меха»;

(3) «бас-барабан». Испытуемые должны указать, нравится им пред-

ложенное или не нравится. Grygier и Grygier в своем руководстве по

DPI утверждают, что эти задания являются сугубо проективными по

своей природе, a DPI - это в сущности проективный опросник. Од-

нако, так это или нет, такие задания не обязательно должны быть

проективными, и может оказаться, что это чрезвычайно полезная,

хотя и необычная, форма заданий.

(5) Задания с рейтинговыми шкалами. Эти задания состоят из

предложений, к которым прилагаются рейтинговые шкалы. Cornrey

(1970)- наиболее видный исследователь, использовавший эти зада-

ния - отдавал им предпочтение потому, что в них преодолеваются

 

94

 

трудности, связанные с коррелирующими дихотомическими зада-

ниями (см. обсуждение далее, в гл. 6), а также потому, что исптуй-

мым они кажутся более разумными, нежели дихотомические зада-

ния, хотя и может проявиться установка на крайние ответы (см.

выше). Сошгеу использует две семибалльные шкалы, крайними зна-

чениями которых являются: «всегда-никогда» и «определенно да -

определенно нет», в зависимости от формулировки задания. Типич-

ным примером может быть: «Мне нравится бывать с друзьями в кафе:

всегда, очень часто, часто, от случая к случаю, редко, очень редко,

никогда». Очевидной проблемой для этой шкалы является различная

интерпретация индивидуумами терминов частоты.

(6) Разнообразные трихотомические задания. В действительно-

сти это варианты трихотомической формы вопроса типа «да-кет»

(тип 1 в данном списке). Cattell, например, в тесте 16PF использует

эти задания, потому что они более подходят по смыслу в отношении

некоторых утверждений, чем «да - затрудняюсь ответить - нет».

Примерами трихотомий являются: «обычно - иногда - никогда»,

«верно - не знаю - неверно», «согласен - не уверен- не согласек».

Эти варианты предоставляют большую гибкость при формулирова-

нии заданий, чем жесткие формы типа «да-нет» (дихотомическая)

или альтернативные.

(7) Трихотомические задания с выбором. Это варианты типа (6),

позволяющие вложить в лаконичную форму задания почти любую

мысль. В них используются три завершающих предложение фразы,

одну из которых испытуемый должен выбрать. Вот типичный пример:

«Когда мне нечего делать, я могу: (а) позвонить другу, чтобы побол-

тать; (б) заняться разгадыванием трудного кроссворда; (в) пойти на

джазовый концерт». Некоторые разработчики тестов использовали

такие задания (например, Myers-Briggs, 1962) сдвумя, тремя и более

вариантами выбора. Они могут быть упомянуты как отдельная кате-

гория заданий.

(8) Задания с вынужденным выбором. В таких заданиях, как уже

говорилось выше, испытуемые принуждаются к выбору того, какое

из (обычно двух) утверждений более точно применимо к ним или

более верно для них, хотя может быть и больше вариантов выбора.

Однако, задания с вынужденным выбором включены в данный список

как отдельная категория не потому, что они концептуально отлича-

ются от трихотомических заданий с выбором, а потому, что Edwards

(1959) разработал довольно много заданий с вынужденным выбором,

которые были специально сконструированы в парк, уравновешенные

по тенденции к социально одобряемым ответам, чем пытался устра-

нить влияние этой установки.

 

95

 

(9) Другие формы. Основные типы заданий, описанные в пунктах

(1) - (8), - это те, которые в основном используются в наиболее

известных личностных опросниках. Все они, с точки зрения формы

(в отличие от содержания), довольно легко формулируются, для них

существует несколько правил, которые буду обсуждены ниже, они

лаконичны, наконец, просты в работе, а также для подсчетов.

Очевидно, возможны и другие типы заданий, и в Myers-Briggs

Type Indicator (МВТЗ) , например, находим тип заданий, которые

более напоминают проективный тест, хотя они оцениваются объек-

тивно. Испытуемые должны указать, какое из пары слов более при-

влекательно для них. Вероятно, их лучше рассматривать как вариант

заданий «нравится-не нравится» (тип 3 в данном списке).

CaUeii и др. (1970) используют аналогичные задания в тесте MAT

(Motivational Analysis Test - тест анализа мотивов), хотя можно

было бы возразить, что это задания объективного теста, а не теста

личности; разработка объективных тестов описана в главе 4.

Все рассматривавшиеся до сих пор виды заданий требуют от испы-

туемых самостоятельной работы. Испытуемые должны отвечать на-

столько правдиво, насколько возможно, хотя, как я уже указывал,

есть такие методы конструирования тестов, в которых предполагает-

ся, что это не обязательно. Некоторые задания в них, хотя по форме

и являются такими же, как в приведенных восьми пунктах, отлича-

ются посопровождающим ихинструкциям. Так, вличностномопрос-

нике Эдвардса (Edwards, 1967) испытуемые должны отвечать на

вопросы заданий так, как будто они смотрят на себя со стороны (как

они полагают, другие видят их). Это, как можно надеяться, устраня-

ет, по крайней мере частично, тенденцию к социально положитель-

ным ответам.

Хотя есть и другие типы заданий, используемых в личностных

опросниках, нет никакого сомнения, что среди приведенных восьми

типов можно найти задания, хорошо апробированные в практике

тестирования личности. Более того, фактически нет такого содержа-

ния, которое не могло бы быть эффективно сформулировано в виде

задания одного из этих типов.

 

Правила для формулирования заданий

 

Итак, у нас есть перечень типов заданий, приведенных выше, и

теперь следует обсудить некоторые приемы, принятые разработчика-

ми тестов с целью преодолеть описанные выше проблемы.

 

Распространенный за рубежом тест личности на основе типологии К. Г. Юнга

(1924) (Прим.перев.)

 

96

 

Большинство из того, что будет сказано, очевидно и исходит из

здравого смысла. Несмотря на это, изучение многих опубликованных

тестов, а также тестов, используемых для внутреннего подбора кад-

ров в крупных организациях, убедило автора в том, что все это

должно быть сказано. Слишком часто разработчики тестов, ослеп-

ленные блестящей методикой анализа заданий, забывают о том оп-

ределяющем факте, что тест не может быть лучше (но может быть

хуже), чем его задания. Guilford (1959), личностные опросники ко-

торого были среди первых, разрабатывавшихся при помощи факто-

рного анализа (правда, на шкалах, уже хорошо изученных за сорок

лет исследований), делает несколько предположений, полезных для

разработчиков заданий в тестах личности. По нашему опыту, эти

правила показали себя как весьма эффективные.

(1) Устраняйте возможность проникновения испытуемых в

суть того, что изучается при помощи данных заданий. Это делает-

ся не ради того, чтобы ввести их в заблуждение, а потому, что если

испытуемые догадаются, что некоторое задание предназначено для

измерения черты X, то ответы будут отражать их точку зрения по

выраженности у себя этой черты, а не реальное положение дел. Пред-

ставления же некоторых испытуемых о своей личности могут быть

значительно искаженными. Как утверждает Guilford (1959), идеаль-

ным было бы оценивать испытуемого по чертам, о которых он не

знает, задавая ему вопросы о том, что он знает хорошо.

(2) Формулируйте понятные, недвусмысленные вопросы (ут-

верждения). Это важно для того, чтобы уменьшить погрешность,

возникающую из-за неверного понимания вопросов. Высокая надеж-

ность зависит, в известной степени, от этого качества теста.

(3) Задания должны отражать конкретные, а не общие аспекты

изучаемой области поведения. Так, задание вида: «Нравится ли вам

спорт?» - является слишком общим: термин «спорт» - неопреде-

ленный, как и термин «нравится». Необходимо задать более конкрет-

ный вопрос: «Вы играете регулярно в какую-либо спортивную игру?»

или «Вы регулярно следите за игрой вашей любимой спортивной

команды?», «Следите ли вы за результатами скачек?» На эти вопро-

сы, ответы на которые вряд ли будут фальсифицировать или относи-

тельно которых реальное поведение вряд ли изменится, испытуемые

будут отвечать одинаково, когда бы вы их ни тестировали.

(4) В каждом задании следует задавать только один вопрос или

делать только одно утверждение. Рассмотрим пример: «Думаю,

следует заставить черных и представителей других рас эмигриро-

вать». Если это задание предназначено для измерения расизма, то

оно будет плохим. Есть расисты (такие, как южно-африканские),

 

4-196

 

97

 

которые проводят резкие различия между черными и людьми других

рас. Другие считают всех, кто не являются англо-саксами, не относя-

щимися к людям. Следовательно, некоторые расисты могут положи-

тельно ответить на этот вопрос, тогда как другие - нет (только

черных следует принуждать к эмиграции). Более злостные расисты

могут быть готовы оставить черных и представителей других рас, но

видеть их исключительно в качестве рабов. А, например, немцы,

проживающие в Англии, опять-таки ответят «нет», исходя из своей

интерпретации понятия «другие расы» (см. п. 2 выше). Это задание

явно бесполезно: у него слишком неопределенная формулировка и

одновременно задаются два вопроса. Следовало бы дать утверждение

более точно: «Думаю, следует заставить негров эмигрировать». Сей-

час оно более понятно (выражение «черные и представители других

рас» заменено на более точное), и в нем остался только один вопрос.

(5) Избегайте, насколько это возможно, слов, определяющих

частоту действий. Они обычно настолько субъективны, что вносят

большую неопределенность. Это положение прояснят примеры.

Пример А. «Часто ли вам снятся сны?» Здесь все зависит от зна-

чения слова «часто». Некоторые испытуемые могут испытывать та-

кое чувство, что видеть сон раз в месяц - это часто, и ответят на

вопрос утвердительно. Другие могут возразить, что один сон за ночь

- это не часто, потому что исследования показали, что людям снятся

три-четыре сна за ночь, и ответят «нет». Вопрос, таким образом,

становится бессмысленным. Ответы указывают противоположное то-

му, что происходит на самом деле. Улучшенный вопрос будет зву-

чать: «Снятся ли вам сны дважды в неделю или чаще?»

Пример Б. « Испытываете ли вы иногда беспричинное беспокойст-

во?» Очевидно, что этот вопрос порождает ту же проблему, что и

предыдущий. Однако, он еще хуже, поскольку «иногда» буквально

означает «чаще, чем однажды». Следовательно, практически все

испытуемые вынуждены, если они отвечают искренне, ответить на

этот вопрос положительно. Однако, этот вопрос мог бы быть очень

полезным, поскольку всем известно, что люди действительно разли-

чаются по частоте беспричинного беспокойства. Дело не в содержа-

нии, а в форме вопроса, которая не выдерживает критики. Как же

можно более точно сформулировать вопрос, в котором частота столь

существенна? В улучшенном виде это может выглядеть: «Испытыва-

ли ли вы беспокойство без особых причин в последние две (четыре)

недели?»

(6) Насколько возможно, избегайте терминов, выражающих

чувства. Вместо этого, попытайтесь представить задание в контексте

поведения. Это правило было проиллюстрировано в пункте (3) выше,

 

98

 

в котором задание было сформулировано более конкретно с целью

повышения надежности при тестировании по истечении некоторого

времени. Для этого слово «нравится» было заменено на «играете».

Важным для нас здесь является то, что испытуемый без колебаний

отвечает, играет он или нет, а со словом «нравится» возникает целая

проблема. Сообразительные, высокообразованные, точно выражаю-

щие свои мысли испытуемые могут долго колебаться в выборе значе-

ния этого слова: «Да, им нравится это, но, вероятно, «наслаждаться»

будет чуточку точнее; «находить удовольствие» - да, но...»,- и т.д.

Конечно, и для такого задания, как в вышестоящем пункте (5), в

котором исследуется чувство беспокойства, эта проблема также су-

ществует. Однако, выражать это задание в поведенческой форме,

например: « Бьется ли ваше сердце быстро и пересыхает ли во рту безо

всяких причин?», кажется слишком искусственным. Особенность со-

стоит в следующем. Если только задание может быть сформулирова-

ио так, чтобы неопределенные слова о чувствах могли быть заменены

на описание поведения, это должно быть сделано. Когда это невоз-

можно, конечно же, стоит попытаться составить задания, в которых

описываются чувства. Их пригодность или непригодность будет вы-

явлена на этапе анализа заданий.

(7) При помощи инструкций обеспечьте, чтобы испытуемые

давали первые приходящие на ум ответы. Не позволяйте испытуе-

мым долго размышлять над значением заданий. Эффективное зада-

ние личностного теста, которое действительно имеет отношение к

поведению испытуемого, должно вызвать немедленную и точную

реакцию. В противном случае вероятно, что задание не выявляет ту

область поведения, которая имеет существенное отношение к изме-

рению личностных качеств. Некоторые примеры прояснят этот мо-

мент.

Пример А. «Нравится ли вам наблюдать за щеглами?» Этот вопрос

у испытуемых, за исключением орнитологов, не вызовет, вероятно,

ничего, кроме смеха над его очевидной эксцентричностью. Большин-

ство людей это просто не интересует.

Пример Б. «Любите ли вы хлеб с маслом?» Это явно не эксцент-

ричный вопрос. Многие испытуемые, по крайней мере на Западе, где

нет недостатка в основных продуктах питания, не будут испытывать

по этому поводу сколь-нибудь сильных чувств, воспринимая это как

данность.

Пример В (взят из пробных заданий для разработанного автором

TCCTaAiSQ; Kline, 1971). «Позволяетеливывашейсобакелизатьвам

лицо?» Это задание было предназначено для выявления чистоплот-

ности, и ключевым ответом для него является «нет». Очевидно те

 

люди, у которых нет собаки, ответят «нет», но можно возразить, что

часто чистоплотность не является причиной отсутствия домашних

животных. К моему удивлению, этот вопрос вызвал исключительно

значимые ответы. Некоторые индивидуумы, дойдя до этого вопроса,

отказывались вовсе отвечать на вопросы теста, говоря, что все это

вообще отвратительно; один испытуемый даже говорил мне, что он

никогда не был так оскорблен, и никогда бы не допустил подобной

мерзости, и тому подобное в том же духе.

Нет никакого сомнения, что этот вопрос затрагивает нечто скры-

тое и подавляемое. Уместность вышеупомянутой инструкции к тесту

теперь понятна. Именно первый ответ, по всей вероятности, является

индикатором определенного личностного качества. Как только испы-

туемые начинают раздумывать над вопросами, включаются не толь-

ко защитные процессы, но и сознательные искажения, такие как

желание произвести впечатление, угодить экспериментатору,- все

это отрицательно влияет на результаты теста.

И вот что еще более важно : многие задания не могут выдержать

критической оценки в основном из-за вполне оправданного желания

исследователей вложить слишком много информации в краткую фор-

му задания. Вот почему особое значение при создании заданий тестов

придается понятности и конкретности.

Можно было бы поразмышлять над приведенным выше примером

В, и тогда не было бы никаких проблем. Некто либо позволяет, либо

не позволяет собаке лизать его лицо. Нет никаких сложностей в

решении того, что: (а) собака есть собака; (б) что она именно лижет;

(в) и что именно она лижет - лицо или что-нибудь другое. Однако,

большинство тестов личности не являются такими однозначными.

Между прочим, стоит отметить, что этот вопрос оказался неудачным

и его пришлось удалить.

Пример Г. «Бывают ли у вас яркие сны?» Этот пример хорошо

иллюстрирует наше указание. Большинство испытуемых, вероятно,

смогут дать немедленный ответ - либо «да «, либо « нет». Однако, при

внимательном рассмотрении этот вопрос оказывается неприемле-

мым. «В конце концов, насколько яркими могут быть сны? Мои сны

кажутся мне яркими, но это мое субъективное мнение. Я действи-

тельно вижу яркие сны, но я также иногда вижу несколько однооб-

разные и серые сны,»- подобные мысли затрудняют ответы.

Пример Д. «У вас много друзей?» Как и в первом примере, на этот

вопрос, по размышлении, чрезвычайно трудно дать точный ответ.

Проблема опять заключается в значении определенных слов, в дан-

ном случае «много» и «друзей». С этими трудностями столкнутся

внимательные, вдумчивые и добросовестные испытуемые. Они могут

 

100

 

рассуждать так: «Думаю, у меня много друзей, но что значит «мно-

го»? Сколько на самом деле в среднем друзей имеют люди? Без этой

информации, а также без знания о разбросе вокруг среднего значе-

ния, невозможно ответить, много их у меня, или нет.»

Хотя все эти мысли несомненно правильны, на практике этот

вопрос у многих испытуемых вызывает автоматический ответ. Слово

«друзья» тоже может породить проблемы. Испытуемые могут рас-

суждать: «Что такое друг, чем он отличается от знакомого, есть ли

вообще какие-либо различия? Возьмем А, является ли он мне другом?

Некоторым образом, нам нравится бывать вместе, но если бы он мне

был нужен, он был бы практически бесполезен. Теперь Б . . .»,- и

так далее.

Из этих примеров понятно, что в инструкциях необходимо про-

сить испытуемых выполнять задания настолько быстро, насколько

это возможно. Конечно, нельзя избежать того, что таким инструкци-

ям не всегда следуют, и в исследовании навязчивости, выполненном

автором книги, один из вопросов, касающийся того, быстро ли испы-

туемый решается на что-либо и придерживается этого решения, ясно

показал возможность многих различных ответов, хотя на него и от-

вечали утвердительно «да».

Это последнее наблюдение подводит нас к той критике, которая

направлена против личностных опросников, что мы сейчас и обсу-

дим.

 

Возражение: задания личностных опросников по существу

бессмысленны

 

Это становится очевидным из приведенных выше примеров Г и Д.

Рассчитывать на то, что испытуемые-интеллектуалы будут отвечать

быстро, - это не только оскорбительно для испытуемых (так утвер-

ждает Alice Heim в связи с обсуждением некоторых тестов интересов;

Heim and Watts, 1966), но болеетого, у таких испытуемых появляют-

ся серьезные сомнения в том, что такие задания могут вообще что-

либо измерять.

На эти критические замечания получен эмпирический ответ: ана-

лиз заданий любого рода показывает, что наше множество заданий

измеряет однородный фактор, в то время как исследования валиднос-

ти демонстрируют, что же это за фактор. Тот факт, что задания

имеют сомнительное значение, становится несущественным, если

ответы на эти задания фактически являются эффективно дискрими-

нативными или коррелируют с внешним критерием. Вышеприведен-

ная критика, хотя и может показаться серьезной, не имеет, таким

образом, большого значения.

 

101

 

Таковы правила формулирования заданий, описанные Guilford

(1959), и они способствуют обеспечению того, что подготовленные

вопросы будут обеспечивать решение тех задач, которые стоят перед

ними. Автору этой книги при конструировании собственных заданий

для личностных тестов всегда удавалось создать надежные и, как я

полагаю, валидные методики, когда он следовал этим правилам. Уда-

лось ли бы ему это без уже известной нам методологии, неизвестно.

 

Устранение влияния установок на ответ

 

Кроме того, что при разработке заданий следует всегда помнить о

вышеперечисленных правилах, необходимо, конечно, ослабить, на-

сколько это возможно, влияние наиболее существенных установок на

ответ. Ниже описано, как это следует делать.

 

Установка на согласие (acquiescence)

 

Установки на ответы (response sets) были определены Кронбахом

(Cronbach, 1946) как стилистическая последовательность, стимули-

руемая формой ответов на задания личностного опросника. Как ука-

зывалось ранее, одной из наиболее существенных является установка

на согласие (см. Messick, 1962), то есть тенденция соглашаться с

утверждением независимо от его содержания.

 

СБАЛАНСИРОВАННЫЕ ШКАЛЫ

Messick (1962) утверждает, что сбалансированная шкала - это

один из способов минимизации влияния установки на согласие. Сба-

лансированной называется такая шкала, для которой равное или

примерно равное количество заданий имеют ключевые ответы «да»

или «нет», «верно» или «неверно».

Однако, здесь заслуживают внимания два момента. Во-первых,

сбалансированная шкала не устраняет полностью тенденцию : уста-

новка на согласие все же может проявиться, но, как указывает Know-

les (1963), такая шкала не позволит спутать «соглашающегося» ис-

пытуемого с тем, у кого реально высокие показатели, а это важно.

Конечно, можно возразить, что «соглашающийся» испытуемый с

потенциально высокими показателями не будет выявлен при сбалан-

сированной шкале. Если это происходит чаще, чем в нескольких

отдельных случаях, то последующее исследование валидности теста

будет обречено на неудачу.

Во-вторых, искажающего влияния этой установки на показатели

по тесту можно избежать только в том случае, если будут сформули-

рованы в равной степени содержательные, недвусмысленные и по-

буждающие к определенному ответу задания, имеющие как поло-

 

102

 

жительные, так и отрицательные ключевые ответы. Если вы сможете

сформулировать лишь очень небольшое количество заданий с клю-

чевым ответом «нет», то эти задания будут способствовать низкой

валидности шкалы. Несколько примеров пояснят это.

Пример 1. Рассмотрим вопрос на экстравертированность: «Вам

нравятся вечеринки?» Обратной формой этого вопроса будет: «Вам

не нравятся вечеринки?» В этих заданиях стилистические обороты

языка удовлетворительны, потому что принято говорить, что вече-

ринки нравятся или не нравятся. Они также удовлетворительны,

потому что, как это и случается, испытуемому с высоким показате-

лем по параметру экстраверсии нравятся вечеринки, а испытуемому

с низким показателем - не нравятся. Таким образом, полярность

этих заданий эффективна. Однако, часто попытка получить обрат-

ную форму вопроса становится источником ошибок.

Пример 2. Следующее задание было создано, чтобы выявить удов-

летворение, получаемое от статистики - как утверждают, оно отно-

сится к чертам навязчивости: «Являетесь ли вы одним из тех людей,

кто находит статистические данные и таблицы совершенно скучны-

ми?» Это обратная форма вопроса с ключевым ответом «нет». Одна-

ко, очевидно, (прежде чем первое испытание теста показало, что этот

вопрос не работает), можно не считать статистику скучной, но и не

восхищаться ею. Таким образом, обращение вопросов, когда они

относятся к некоторым крайним проявлениям в поведении, вероят-

нее всего не даст результата в силу континуальности, лежащей в

основе многих ответов на задания. Обращение вопросов обычно пред-

полагает дихотомичность ответа. Другими словами, если ответ на

вопрос является дихотомическим, то обращение вопроса для сбалан-

сированной шкалы возможно; если же используются крайние (гра-

ничные) значения из континуума, обращение не будет удачным.

Пример 3. Аналогично, можем рассмотреть вопрос отом, нравится

ли испытуемым отдавать распоряжения. Обратная форма вопроса,

такая как: «Вы не испытываете удовольствия, когда вам вменяется в

обязанность отдавать распоряжения?» - не может быть удачной,

потому что возможны случаи, когда отрицание неприязни к распоря-

жениям, приказам вовсе не означает получение удовольствия от

 

Данный пример показывает, как в результате непосредственного перевода вопрос

стал звучать крайне неудачно - испытуемые будут в затруднении, как следует

отвечать: «Да, не нравятся» или «Нет, не нравятся». В англ. варианте таких

трудностей не возникало (Вопросы звучали так: Do you enjoy parties? и Do you

dislike parties?). На этом примере видно, что при адаптации зарубежных тестов

важно не только выполнить все процедуры валидизации и стандартизации, но

также при переводе необходимо уделить внимание тщательной формулировке

адекватных заданий (Прим.перев.)

 

103

 

этого. В основе этого ответа лежит континуум, а не дихотомия. Этот

вопрос не может быть обращен.

Пример 4. В данном задании рассматривается аккуратность: «В

школах сильно преувеличивают значение аккуратности». Можно

утверждать, что навязчиво аккуратный индивидуум будет считать,

что значение этой особенности поведения невозможно преувеличить.

Следовательно, данное задание было написано так, чтобы отрица-

тельный ответ действительно выявлял исследуемую черту. Таким

образом, с точки зрения разработки заданий, это жизнеспособное

«негативное» задание.

В этих примерах проиллюстрированы два наиболее важных мо-

мента в формулировании заданий с отрицательными ключевыми

ответами: они могут быть сформулированы, во-первых, если отрица-

тельный ответ соответствует реальному поведению, и во-вторых,

если в основе ответов лежит дихотомия, а не континуум, как в при-

веденном выше примере 1.

 

ПОНЯТНЫЕ, НЕДВУСМЫСЛЕННЫЕ УТВЕРЖДЕНИЯ

Имеющий значение в контексте нашей работы вопрос был поднят

Guilford (1959) при попытке устранить установку на согласие из

личностных опросников. Он утверждает, что согласие наименее ве-

роятно тогда, когда задания понятны, недвумысленны и относятся к

конкретному поведению. Поскольку эти качества уже были указаны

среди тех, которые, по моему предположению, должны быть присущи

разрабатываемым заданиям, я не буду более говорить о них, а лишь

проиллюстрирую это положение несколькими примерами.

Так, вопрос: «Играете ли вы на каком-либо музыкальном инстру-

менте?»,- является настолько конкретным, что индивидуумдолжен

был бы иметь предельно выраженную установку на согласие, чтобы

утвердительно ответить на этот вопрос, если это не соответствует

истине. С другой стороны, вопрос: «Нравится ли вам музыка?»-

настолько неопределенный (в том, где же критерий того, что музыка

нравится?), что согласие вероятно будет фактором, влияющим на

положительные ответы в этом вопросе. В последнем примере есть две

особенности. Прежде всего, обратите внимание, что данный вопрос

НЕ сравним с вопросом: «Нравятся ли вам вечеринки?» В этом воп-

росе критерий того, нравятся ли вечеринки, известен каждому: час-

тые посещения с желанием и энтузиазмом. Следовательно, этот воп-

рос - практически сокращенная форма вопроса: «Посещаете ли вы

много вечеринок?» Таким образом, для него вероятность подверг-

нуться влиянию установки на согласие меньше, чем для вопроса:

«Любите ли вы музыку?»

 

104

 

К этой особенности относится и неопределенное утверждение

«нравится музыка». Это выражение бесполезно в задании. Так, слово

«нравится» может соответствовать разнообразным чувствам: от тех,

которые испытывают великие композиторы и исполнители, когда

слушают, пишут или исполняют музыку, до чувств человека, кото-

рыйлюбит слушать популярные песенки, совершая субботние покуп-

ки. Подобно этому, термин «музыка» означает огромное разнообра-

зие различных направлений: например, джаз, поп, народная музыка,

рок, барокко, доклассическая, классика, романтизм, модерн, нео-

классицизм, - а, кроме того, может иметь отношение к слушанию и

исполнению, так что идентичные ответы на вопрос могут отражать

совершенно различное поведение. Например, «да» для испытуемого

1 может отражать наслаждение от пения контр-тенора в ранней пол-

ифонической венецианской церковной музыке. А для испытуемого 2

это может отражать удовольствие прослушивания мотивчика типа

«Танцуй со мной», когда он сидит за рулем своей машины. Любое

задание, в результате оценки которого оказывается, что столь разные

области поведения будут отнесены к одному и тому же классу, с

очевидностью является бесполезным.

 

ПРОВЕРКА ВЛИЯНИЯ УСТАНОВКИ НА СОГЛАСИЕ

До сих пор все наши усилия были направлены - при помощи

сбалансированных шкал и формулирования предельно ясных и кон-

кретных заданий - на уменьшение влияния установки на согласие

или на то, чтобы сделать менее вероятным получение за счет тенден-

ции к согласию высоких показателей по переменной, для измерения

которой предназначен тест. Однако, как уже говорилось, действие

этой установки возможно даже при сбалансированных шкалах, и

далеко не всегда можно создать настолько понятные вопросы, чтобы

быть уверенным, что влияние установки устранено. Поэтому разра-

ботаны методики, предназначенные для проверки того, была ли ус-

тановка на согласие фактором, влияющим на ответы. Эти методики

будут описаны в главе 6.

 

Социально одобряемые ответы

 

Edwards (1957) показал на материале с заданиями ММР1, что

наблюдается высокая положительная корреляция между степенью

социальной желательности утверждений, оценивавшейся эксперта-

ми, и количеством реальных социально одобряемых ответов на них

испытуемыми. Поэтому он утверждает, что данная установка должна

детерминировать ответы на задания и, следовательно, является ос-

новным источником невалидности тестов. Хотя, очевидно, невоз-

 

105

 

можно полностью устранить влияние установки на социально одоб-

ряемые ответы, есть разнообразные приемы, полезные для уменьше-

ния ее влияния. Эти приемы описаны ниже.

 

ЗАДАНИЯ С ВЫНУЖДЕННЫМ ВЫБОРОМ, ПОДОБРАННЫЕ

ПО ИХ СОЦИАЛЬНОЙ ЖЕЛАТЕЛЬНОСТИ

В списке личностных предпочтений (Personal Preference Schedu-

le) Эдвардса (EPSS) (Edwards, 1959), как мы уже отмечали в обсуж-

дении типов заданий (см. п. 8 на стр.95), задания состоят из двух

утверждений, подобранных по социальной желательности, одно из

которых испытуемый должен выбрать. Это радикальное решение

для устранения влияния установки на социально одобряемые ответы.

Однако, этот метод не получил поддержки по следующим причинам.

 

(1) Крайне трудно получить согласованные утверждения, реле-

вантные также в терминах содержания, которое мы хотим измерить

(Edwards, 1957). Действительно, серьезное возражение против EPPS

- это то, что данный тест является немногим более, чем упражнени-

ем по конструированию тестов, и мало свидетельств того, что он

измеряет переменные с какой-либо эффективностью (см. Kline,

1979).

(2) Любые незначительные различия в социальной желательнос-

ти между частями заданий имеют тенденцию увеличиваться, когда

они предъявляются вместе, как это предусмотрено в форме вынуж-

денного выбора, что сводит на нет большинство из усилий по подбору

утверждений (СогаЬидр., 1958; Edwards, Wright и Lunneborg, 1959).

(3) Экспертное оценивание социальной желательности - значи-

тельное упрощение данного явления. Это становится ясно из того, как

получается средняя экспертная оценка социальной желательности

для каждого задания. Для этого предполагается, что социальная же-

лательность одномерна (хотя a priori это не так). В действительности

было бы нужно многомерное шкалирование влияния социальной же-

лательности по всем заданиям, и затем подсчет показателей по от-

дельным измерениям - процедура, которая могла бы быть, несом-

ненно, рекомендована в свете приведенного выше пункта (2)! Кроме

того, как указывает Messick (1960), социальная желательность сама

по себе допускает значительные индивидуальные различия : то, что

социально желательно для члена парламента, почти наверное не

является таковым для лондонского докера.

 

Примером пар заданий могут служить следующие:

1 ) А. Мне нравится говорить о себе с другими. .

Б. Я люблю работать, заранее поставив себе какую-то цель.

2) А. Я чувствую себя подавленным, когда мне что-то не удается.

Б, Я нервничаю при разговоре с группой людей (Прим.ред.)

 

106

 

Исходя из этих трех причин, не рекомендуется прибегать к такому

радикальному и, по-видимому, недостаточно эффективному шагу,

как конструирование спаренных заданий, подобранных по их соци-

альной желательности.

 

ИЗБЕГАЙТЕ ЯВНО СОЦИАЛЬНО ЖЕЛАТЕЛЬНЫХ / НЕЖЕ-

ЛАТЕЛЬНЫХ ЗАДАНИЙ

Существует ряд характеристик и качеств, с которыми мало кто

захочет согласиться, по крайней мере в среде образованных европей-

цев. Они настолько очевидны, что когда мы проиллюстрируем их

ниже несколькими примерами утверждений, то они покажутся явно

абсурдными. Вот несколько примеров утверждений, которые явля-

ются явно социально желательными или нежелательными:

 

(1)Яс трудом переношу неудачи: (да, нет).

(2) Я не понимаю юмор: (да, нет).

(3) Я постоянно лгу: (да, нет).

(4) Я мало сексуален: (да, нет).

(5) Я сексуальный психопат: (да, нет).

(6) Я не могу контролировать свои эмоции: (да, нет).

(7) Я завистливый и ревнивый человек: (да, нет).

(8) Я скупой: (да, нет).

(9) Когда возможно, я отлыниваю от работы: (да, нет).

(10) Я лгу, чтобы избавиться от хлопот: (да, нет).

(11)Я ненавижу негров: (да, нет).

( 12) Я в основе своей антисемит: (да, нет).

 

По нашему опыту разработки тестов, мы были бы сильно удивле-

ны, если бы любой из двенадцати приведенных примеров оказался

приемлемым даже для исследовательского теста. Например, для тес-

тов личности, используемых в профотборе, они будут совершенно

бесполезными. Представьте себе утверждение (11) в тесте, предназ-

наченном для работников социального обеспечения, или утвержде-

ние (12) в тесте, предложенном человеку, надеющемуся получить

работу в фирме, владельцем которой является еврей.

 

ИЗМЕРЕНИЕ СОЦИАЛЬНО ЖЕЛАТЕЛЬНЫХ ИЛИ НЕЖЕЛА-

ТЕЛЬНЫХ ЧЕРТ

Если измерению подлежат социально желательные или нежела-

тельные черты, при разработке заданий следует избегать прямоли-

нейного подхода; в перечисленных утверждениях. Два.

примера пояснят сказанное.

 

Приведенные в данном пункте примеры явно показывают, насколько задания:

могут быть зависимы от культуры страны, для которой разрабатывался тест.

 

107

 

Пример 1. Задание для измерения скупости. Поскольку (см. ут-

верждение 8 выше) прямой подход не годится, я утверждал при раз-

работке теста Ai3Q, что скупой человек вполне мог бы думать, что

содержащиеся в народной мудрости высказывания о бережливости

очень разумны, тоа как на менее скупого они не произвели бы

впечатления. Следовательно, я попытался сформулировать задание

следующим образом: «Каждый ребенок должен знать, что бережли-

вость лучше богатства.»Похоже, что в этом задании ответы как «да»,

так и «нет», не имеют отношения к социальной желательности (не

являются социально одобряемыми). Действительно, этот вопрос ока-

зался удачным по всем результатам анализа заданий.

Пример 2. Задание для выявления мстительности. Мало кто под-

твердит утверждение: «Я мстителен.» Однако, как уже говорилось,

мстительные индивидуумы обычно проецируют свою мстительность

на других, т.е. действуют механизмы защиты. Таким образом, я

сконструировал утверждение: «Поступками большинства революци-

онеров руководит мстительная жестокость.» Я подумал, что мало

кого из испытуемых можно было бы действительно причислить к

революционерам, так что мнения обследуемых будут отражать их

собственные защитные реакции и стремления. Это задание оказалось

удачным, и я полагаю, что проекция - это механизм, действие кото-

рого может быть использовано в формулировании вопросов, которые

слишком социально нежелательны, чтобы задавать их прямо.

Пример 3. Задание для выявления лености. Если опираться на

механизм проекции, то можно сформулировать утверждение так:

«Промышленность сегодня находится в плачевном состоянии, пото-

му что рабочие в основном ленивы.» Следует заметить, что если это

утверждение рассматривается некоторыми испытуемыми как факт,

то есть не «включает» проективный механизм, то анализ заданий

полностью выявит это: вопрос не будет работать.

 

: ИСПОЛЬЗОВАНИЕ ШКАЛЫ ЛЖИ

Некоторые авторы (например, Айзенк в тестах ЕР1 и EPQ) вводят

особую группу заданий для выявления тех лиц, которые склонны

давать социально одобряемые ответы. Они состоят из вопросов, каса-

ющихся незначительных проступков, которые, увы, иногда соверша-

ются большинством людей. Набравший наибольшее количество бал-

лов по такой шкале рассматривается как дающий социально одобря-

емые ответы, а поэтому его показатели по тесту могут быть проигно-

рированы. Хотя Eysenck и Eysenck (1976), исходя из факторного

анализа заданий теста EPQ утверждают, что шкала лжи измеряет

определенную личностную переменную, для практического тестиро-

 

108

 

вания со значительным потоком испытуемых этот прием для обнару-

жения установки на социально одобряемые ответы весьма полезен.

Вот некоторые типичные утверждения шкалы лжи: «Я никогда не

лгу»; «Я всегда прихожу вовремя на встречи и свидания»; «Я всегда

плачу за проезд на транспорте».

 

АДЕКВАТНЫЙ АНАЛИЗ ЗАДАНИЙ И ВАЛИДИЗАЦИЯ ТЕС-

ТА

Несмотря на все сказанное, я по-прежнему утверждал бы, что при

соответствующем анализе и отборе заданий во время разработки

теста, при тщательной валидизации теста, как и в случае с установ-

кой на согласие, влиянием тенденции к социально одобряемым отве-

там можно пренебречь.

(1) Анализ заданий. По определению, наличие в тесте задания,

провоцирующего социально одобряемые реакции, должно приводить

к тому, что распределение ответов на него будет смещено, то есть не

будет соответствовать нормальному распределению Таким образом,

устранением из теста заданий с распределением ответов, отличным

от нормального, мы избавимся от действия установки на социально

одобряемые ответы. Более того, если большинство заданий дают нор-

мальное распределение ответов и они нагружены некоторым общим

фактором, тогда установка на социально одобряемые ответы не мо-

жет оказывать сильное влияние и на другие задания, относящиеся к

тому же фактору. Подобные аргументы приводятся при анализе за-

даний с использованием бисериальной корреляции результатов вы-

полнения каждого задания с общим показателем по тесту. Таким

образом, при адекватном анализе те задания, результат выполнения

которых подвержен влиянию установки на социально одобряемые

ответы, должны быть устранены, если только, по нелепой случайно-

сти, все задания, выбранные нами для теста, не оказались измеряю-

щими эту черту. Возможность возникновения этой ситуации должна

проверяться при валидизации теста.

(2) Валидизация теста. Более важной процедурой, нежели про-

верка на тенденцию к социально одобряемым ответам, является ва-

лидизация теста. Если мы покажем, что тест валиден, то тогда не

имеет значения, влияет ли на его выполнение установка на социаль-

но одобряемые ответы, или нет. Один из путей доказательства того,

что тест свободен от действия установки на социально одобряемые

ответы, - показать при исследовании валидности, что он не связан

со шкалой социальной желательности Кроуна-Марлоу (Crowne-Mar-

lowe Social Desirability Scale; Crowne и Marlowe, 1964), шкалой, co-

 

109

 

стоящей из явно социально желательных (нежелательных) утверж-

дений.

 

ВЫВОДЫ ОТНОСИТЕЛЬНО УСТАНОВКИ НА СОЦИАЛЬНО

ОДОБРЯЕМЫЕ ОТВЕТЫ

Нет сомнения, что установка на социально одобряемые ответы

может влиять на результаты выполнения заданий, и, следовательно,

на показатели тестов личности. Несмотря на это, ее влияние может

быть минимизировано. Вот некоторые выводы:

(1) Следует всячески избегать заданий с явно социально жела-

тельной или нежелательной окраской.

(2) Процедура анализа заданий позволит устранить те задания,

ответы на которые явно смещены в одном направлении («да» или

«нет»).

(3) Должна быть всегда продемонстрирована валидность теста,

что позволит окончательно устранить все задания, в ответах на кото-

рые сказывается установка на социальную желательность.

(4) Нет необходимости предпринимать столь тщательно разраба-

тываемые меры предосторожности против установки на социальную

желательность, как это делал Edwards (1957).

 

Другие установки на ответы

 

ТЕНДЕНЦИЯ ПОДТВЕРЖДАТЬ КРАЙНИЕ ОТВЕТЫ

Это тенденция, сказывающаяся в рейтинговых шкалах и таких

тестах, как, например, тест личностных шкал Комрея (Cornrey Per-

sonality Scales; Cornrey, 1970), то есть тех, в форму заданий которых

входят рейтинговые шкалы. С моей точки зрения, преимущества

рейтинговых шкал (в плане чувства удовлетворения у тех испытуе-

мых, которые полагают, что на вопросы лучше отвечать в такой

форме) сводятся на нет проблемами, возникающими с теми испыту-

емыми, которые склонны подтверждать крайние ответы. Для того,

чтобы не спутать их с лицами, имеющими высокие показатели по

тесту, сбалансированная шкала уже не поможет, потому что при

такой установке каждый из крайних пунктов шкалы одинаково при-

влекателен. Единственный способ избежать этой проблемы - не

использовать задания данного типа. Если же мы по каким-либо ири-

чинам вынуждены использовать такие шкалы, то тщательный анализ

заданий и валидизация переменных теста, вероятно, смогут устра-

нить те вопросы (утверждения), которые особенно побуждают испы-

туемых проявлять эту установку.

Как утверждает Guilford (1959), наиболее благоприятной почвой

для проявления любых установок на ответы являются те задания,

 

110

 

которые неопределенны, неоднозначны и неконкретны. Значение

этого утверждения невозможно преувеличить. Формулирование за-

даний путем следования указанным выше правилам позволит мини-

мизировать влияние установок. Более того, тщательная валидизация

теста продемонстрирует, что влияние этих искажающих факторов

незначительно. Однако, это влияние не будет столь несуществен-

ным, если не будут приняты меры предосторожности. Применитель-

но к установкам на крайние ответы можем рекомендовать избегать

использовать задания типа рейтинговых.

 

ТЕНДЕНЦИЯ К ПОДТВЕРЖДЕНИЮ СРЕДНИХ ЗНАЧЕНИЙ

Несомненно, лучший способ избежать проявления этой установки

- это использовать дихотомические задания. Однако, у некоторых

испытуемых возникают сложности при работе с дихотомическими

заданиями. Они считают, что на них невозможно отвечать, а поэтому

(для этих испытуемых) желательно введение некоторой средней ка-

тегории ответов. Исследования (Bendig, 1959) показали столь высо-

кую корреляцию между дихотомическими и трихотомическими за-

даниями, что риск проявления побочных явлений, подобных обсуж-

даемому, не оправдывает использования последних (см.стр.91).

Хорошо сформулированные задания могут быть написаны так,

что выбор средней категории не будет притягательным для испытуе-

мых. Эта категория ответов особенно привлекательна тогда, когда

оба крайних значения в равной степени не затрагивают, безразличны

для испытуемых. Например: «Что бы вы предпочли: (а) осмотреть

консервный завод; (б) пойти в местный музей; (в) не знаю?» Как

могут быть выявлены такие вопросы при проверке теста в том случае,

когда мы используем дихотомические задания? Автор данной книги

использовал такой прием: во время проверки теста он снабдил его

специальной инструкцией, в которой указывалось, что все задания,

при выполнении которых испытуемым потребовалась средняя кате-

гория ответов, должны быть помечены крестиком. От тех заданий,

которые часто отмечаются таким образом, лучше отказаться, если

только они не оказались особенно эффективными в ходе анализа

заданий.

Задания, для которых необходима средняя категория ответов, не

смогут пройти процедуру анализа и будут автоматически устранены,

а исследование валидности может показать, что установка на средние

ответы не является существенным источником ошибок.

Довольно об установках на ответы. Если будут использоваться те

приемы, о которых речь шла выше, то мы склонны полагать, что

 

III

 

влияние установок на ответы будет минимальным. Дальнейшая ва-

лидизация тестов покажет, действительно ли это так.

 

Содержание вопросов (утверждений)

 

До сих пор при обсуждении принципов конструирования заданий

основное внимание уделялось их форме. При этом мы предполагали,

что знаем, какие черты (особенности) пытаемся тестировать. Тем не

менее, справедливо было бы спросить, каким же именно образом мы

принимаем решения о содержании заданий. Трудно делать общие

заключения об этом, поскольку многое зависит от особенностей кон-

кретной области поведения, для диагностики которой мы хотим раз-

рабатывать тест личности. Чтобы проиллюстрировать, как прини-

мать решения о содержании тестов, я приведу несколько примеров.

 

Теоретический пример

 

Kline (1968) выполнил экспериментальное исследование особен-

ностей анального характера (Freud, 1908), в ходе которого для кон-

струируемого теста было поставлено большое количество эмпиричес-

ких задач. Существует ли анальный характер? Если да, то измеряет-

ся ли он другими личностными опросниками? Имеет ли он отношение

к научению ребенка справлять большую нужду? Изменяется ли он от

культуры к культуре, как следовало бы ожидать, исходя из психо-

аналитической теории? Чтобы ответить на эти вопросы, было необ-

ходимо сконструировать и валидизировать инструмент для измере-

ния анального характера. Чтобы сделать это, я должен был решить,

какие черты должны войти в тест.

Далее следует краткое описание того, как содержание вопросов

(утверждений) было отшлифовано, прежде чем они превратились в

задания теста. Получившийся в результате этого тест (Ai3Q), похо-

же, выдержал подробные критически проверки (см. Kline, 1978).

Были подробно изучены психоаналитические описания анального

характера (напр., Abraham, 1921; Jones, 1923; Menninger, 1943), и

составлен список всех черт и специфических примеров поведения.

Примеры из публикации Jones (1923) перечислены ниже.

 

( 1 ) Промедление в удовлетворении потребностей, доводимое до их

интенсивной концентрации, монотонная настойчивость, своеволь-

ная независимость - уверенность, что никто не может сделать что-

либо так хорошо, как он сам.

(2) Неспособность перепоручать работу.

(3) Мелочное внимание к подробностям.

(4) Нежность к детям.

(5) Склонность к доминированию.

112

 

Подобным образом был собран длинный подробный список черт и

особенностей поведения. Затем они были преобразованы в задания

теста с использованием всех тех правил и приемов, которые обсуж-

дались в данной главе.

 

Практический пример

 

Нет сомнений в том, что полезно иметь инструмент для измерения

агрессивности, например, в центре по перевоспитанию правонару-

шителей или для малолетних заключенных. Основным подходом в

этом случае было бы составление списка всех проявлений агрессив-

ности, которые только можно вообразить, преобразование их в зада-

ния и апробация на соответствующей выборке. Следует отметить, что

при таком подходе не стоит вопрос о том, что есть агрессия как

личностное измерение. Для этого необходимо специальное исследо-

вание. Так, факторный анализ заданий продемонстрировал бы, есть

ли только одно измерение, ряд коррелирующих между собой измере-

ний, несколько некоррелирующих измерений или ни одного реаль-

ного синдрома поведения, которые могли бы быть значимо описаны

как агрессивность.

 

Получение содержания задания

 

Возвращаясь к нашему примеру, отметим, что есть набор призна-

ков агрессивного поведения, которые бы могли быть использованы в

заданиях: постоянно дерется (не в шутку); когда раздражен, вступает

в драку по любому поводу; использует в драке разбитые бутылки;

носит с собой бритвы, кастеты, велосипедные цепи, складные ножи,

ремни с металлическими бляхами, имеет тяжелые ботинки; бьет

упавших противников ногами; избивал кого-либо до потери созна-

ния; страдал от несправедливости и оскорблений; кричит, если раз-

дражен; разбрасывает вещи по комнате; лжет, чтобы раздразнить

конкурентов; придумывает страшные истории. Затем подобный спи-

сок при помощи приемов, описанных в данной главе, может быть

преобразован в задания теста.

 

Заключение

 

При тех сложных и неизбежно неточных инструкциях для конст-

руирования заданий тестов личности, приведенных в данной главе,

наиболее ценным может оказаться краткое пошаговое описание ин-

тересующей нас процедуры. Оно и приводится ниже. Полное обосно-

вание всех этих положений содержится в тексте главы.

(1) Перечислите черть; и особенности поведения из описаний в

психологической литературе.

113

 

(2) Преобразуйте описание каждой черты или особенности пове-

дения в задание. Это лучше всего сделать при помощи обычных форм

заданий опросников: (а) дихотомических заданий (типа «да-нет»);

(б) трихотомических заданий (типа «да-?-нет»); (в) альтернатив-

ных заданий; (г) заданий типа «нравится-не нравится»; (д) заданий

с вынужденным выбором; (е) заданий с рейтинговыми шкалами.

Выбор формы задания зависит от особенностей используемого мате-

риала и оценки преимуществ и недостатков каждого типа заданий.

(3) Независимо от используемого типа заданий старайтесь, чтобы

назначение каждого задания не было слишком очевидным.

(4) Формулируйте каждое задание понятно и недвусмысленно.

(5) Насколько возможно, обеспечьте, чтобы каждое задание отно-

силось к какой-либо конкретной области поведения.

(6) В каждом задании должен содержаться только один вопрос или

одно утверждение.

(7) Избегайте использовать термины частоты и другие субъектив-

ные выражения.

(8) Когда это возможно, задания должны касаться поведения, а не

чувств и отношений.

(9) Обеспечьте, чтобы ответы на задания давались быстро.

(10) Избегайте влияния основных установок на ответы, таких как

установка на согласие и установка на социально одобряемые ответы.

(II) Вероятность проявления установки на согласие лучше всего

уменьшается формулированием понятных заданий и использовани-

ем сбалансированных шкал.

(12) Проверьте при помощи процедур анализа заданий то, что

тенденция к согласию - несущественный фактор.

(13) Установки на социально одобряемые ответы легче всего из-

бежать путем тщательного формулирования заданий.

(14) Проверьте при помощи техники анализа заданий, что уста-

новка на социально одобряемые ответы - несущественный фактор.

(15) Избегайте с помощью адекватной формы заданий влияния

установок на выбор крайних или средних категорий ответов.

( 16) Проверьте при помощи процедуры валидизации, что влияние

установок на ответы не является существенным. Если тесты валидны,

то установки на ответы не могут оказывать влияние на их показатели.

 

S14

 


Дата добавления: 2018-02-18; просмотров: 518; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!