Анна Анастази - Дифференциальная психология. Индивидуальные и групповые различия в поведении
Предположим, что по результатам вербального теста на сообразительность, показатель у женщин в среднем на 8 пунктов выше, чем показатель у мужчин. Чтобы оценить, насколько существенна эта разница, мы вычисляем уровень статистической значимости. Анализируя специальную таблицу, мы сможем увидеть, может ли быть случайной вероятность того, что результирующие значения одной группы превышают результирующие значения другой группы на 8 пунктов и более. Предположим, мы обнаружили, что эта вероятность, обозначаемая буквой р, составляет 1 из 100 (р = 0,01). Это означает, что если бы вербальная сообразительность не зависела от половой принадлежности и если бы мы должны были взять из популяции наугад 100 случайных мужчин и женщин, то только в одном случае мы бы имели несовпадение с полученным результатом. Поэтому можно сказать, что по половой принадлежности отличие существенно на уровне 0,01. Такое утверждение выражает уровень статистической значимости вывода. Таким образом, если исследователь сделал вывод о том, что полученные им результаты свидетельствуют о различии по половому признаку, вероятность, что он ошибается, составляет 1 из 100. И наоборот, вероятность, что он прав, составит, естественно, 99 из 100. Еще одним уровнем статистической значимости, часто фигурирующим в сообщениях, является р = 0,05. Это означает, что ошибка возможна в 5 случаях из 100, а статистически значимым сообщение будет в 95 случаях из 100.
Другой проблемой, для решения которой нам требуется соотношение со значением р, является анализ действенности некоего экспериментального условия, например эффективности назначения витаминных препаратов. Действительно ли успехи группы, члены которой принимали витамины, существенно выше, чем у группы, членам которой давали плацебо, или контрольные таблетки? Достигает ли разница между показателями у двух групп степени достоверности 0,01? Может ли эта разница быть результатом случайных отклонений чаще, чем в одном случае из ста?
Это относится и к двукратному тестированию тех же самых людей — до и после эксперимента, такого, например, как специальная программа подготовки. В этом случае мы также должны знать, насколько достигнутые результаты превышают ожидаемые случайные отклонения.
Необходимо добавить, что величина уровня статистической значимости не обязательно должна строго соответствовать — и на самом деле редко соответствует — точным значениям, таким как 0,05; 0,01, или 0,001. Если, например, исследователь хочет обозначить уровень статистической значимости 0,01, то это означает, что согласно сделанному им выводу вероятность случайного отклонения составляет один случай из ста или меньше этого. Поэтому когда сообщают величину р, то делают это в следующей форме: р меньше 0,05 или р меньше 0,01. Это означает, что вероятность ошибочности некоего вывода составляет меньше 5 случаев из 100, или соответственно меньше 1 случая из 100.
Корреляция. Другое статистическое понятие, которое должен знать студент, изучающий дифференциальную психологию, называется корреляцией. Оно выражает степень зависимости, или соответствия, между двумя сериями измерений. Например, мы можем захотеть узнать, насколько взаимосвязаны между собой результаты, полученные в двух разных тестах, таких как тест на способность считать и тест на механическую сообразительность, проведенных с одними и теми же людьми. Или проблема может заключаться в том, чтобы по одному и тому же тесту найти степень соответствия между результатами родственников, например, отцов и сыновей. А задачей другого исследования может быть выяснение корреляции результатов одних и тех же людей одним и тем же тестам, но проводимых в разное время, например, до и после каких-либо испытаний. Очевидно, что в дифференциальной психологии существует множество проблем, требующих проведения анализа данного типа.
Примером наиболее распространенного измерения корреляции является коэффициент корреляции Пирсона, который принято обозначать символом г. Этот коэффициент представляет собой единый индекс итоговой корреляции и ее знака в целом по группе. Он может варьироваться от +1,00 (абсолютно позитивная корреляция) до —1,00 (абсолютно негативная, или обратная, корреляция).
Корреляция +1,00 означает, что индивид получает самые высокие результаты в одной серии измерений и в другой серии измерений, а также и в остальных сериях, или, что индивид в двух сериях измерений все время занимает второе место, то есть в любом случае, когда по крайней мере дважды показатели индивида совпадают. С другой стороны, корреляция —1,00 означает, что высшие результаты, полученные в результате измерения в одном случае, сменяются низшими показателями, полученными в другом случае, то есть находятся в отношении обратной корреляции в целом по группе. Нулевая корреляция означает, что между двумя наборами данных отсутствует какая бы то ни было зависимость, или что в организации эксперимента что-то привело к хаотичному смешению показателей. Точно так же интерпретируется корреляция результатов разных индивидов, например, отцов и сыновей. Так, корреляция +1,00 будет означать, что у отцов, имеющих наивысшие показатели в группе, сыновья так же имеют наивысшие показатели, или отцы, занимающие второе место, имеют сыновей, так же занимающих второе место, и так далее. Знак коэффициента корреляции, положительный или отрицательный, показывает качество зависимости. Отрицательная корреляция означает обратное отношение между переменными. Числовая величина коэффициента выражает степень близости, или соответствия. Корреляции, выводимые в рамках психологических исследований, крайне редко достигают 1,00. Иными словами, данные корреляции не абсолютны (ни положительные, ни отрицательные), но отражают некоторую индивидуальную изменчивость внутри группы. Мы проявляем тенденцию к сохранению высоких результирующих значений, которая существует наряду с исключениями, имеющими место внутри группы. Результирующий коэффициент корреляции в числовом выражении будет находиться между 0 и 1,00.
Пример сравнительно высокой положительной корреляции дан на рисунке 1. Этот рисунок показывает «двухвариантное распределение», или распределение в двух вариантах. Первый вариант (данные по нему расположены в основании рисунка) представляет собой совокупность показателей, полученных во время первого испытания тестом «скрытых слов», в котором испытуемые должны были подчеркивать все напечатанные на пестром листе бумаги английские слова, состоящие из четырех букв. Второй вариант (данные по нему расположены по вертикальной оси) представляет собой совокупность показателей, полученных у тех же самых испытуемых в результате прохождения ими в 15-й раз того же самого теста, но другой его формы. Каждая счетная палочка на рисунке показывает результат одного из 114 испытуемых как по первоначальному тестированию, так и по пятнадцатому. Возьмем, к примеру, испытуемого, чьи начальные показатели находились в пределах от 15 до 19, а конечные — в промежутке между 50 и 54. Проделав необходимые вычисления, находим, что коэффициент корреляции Пирсона между этими двумя наборами значений составляет 0,82.
Рис. 1. Двухвариантное распределение результирующих значений 114 субъектов при первичном и окончательном тестировании на скрытые слова: корреляция = 0,82. (Неопубликованные данные Анастази, 1.)
Не вдаваясь в математические подробности, заметим, что данный метод корреляции основывается на учете каждого случая отклонения результирующего значения индивида от группового значения в обоих вариантах. Таким образом, если значения у всех индивидов окажутся намного выше или намного ниже группового значения, как при первом, так и при последнем тестировании корреляция составит +1,00. Легко заметить, что рисунок 1 не показывает такого однозначного соответствия. В то же время, гораздо больше счетных палочек расположено на диагонали, соединяющей левый нижний и правый верхний углы. Такое двухвариантное распределение показывает высокую положительную корреляцию, здесь нет таких индивидуальных значений, которые были бы очень низкими при первом и очень высокими при последнем тестировании или очень высокими в первом и очень низкими в последнем случае. Коэффициент 0,82 по существу показывает, что есть явная тенденция испытуемых к сохранению своего относительного положения в группе как в начале, так и в конце испытаний.
Анализируя множество случаев, в которых подсчитывалась корреляция, мы можем оценить статистическое значение полученного коэффициента г теми методами, о которых говорилось в начале данного раздела. Таким образом, при анализе 114 случаев г = 0,82 будет существенным на уровне 0,001. Это означает, что ошибка могла бы возникнуть в результате такого случая, вероятность которого была бы менее чем один вариант из тысячи. Именно на этом основана наша убежденность в том, что результаты действительно коррелируют друг с другом.