Скотт Миллер - Психология развития: методы исследования
Вторая рекомендация — будьте аккуратны. Выводы, которые можно сделать на основе результатов исследования, полностью зависят от точности статистических расчетов. Ошибка при вычислении может привести к ошибке в выводах, иногда принципиальной. Кроме того, вычислительные ошибки обнаружить труднее, чем другие; в исследовательском отчете можно обнаружить методологические просчеты, но результаты математических действий читатель, как правило, принимает на веру. Поэтому крайне важно, чтобы каждая операция проходила тщательную проверку. В идеальном случае, все расчеты должны произвести, по меньшей мере, два независимых специалиста. Полезно также сравнить результаты двух или более методов подсчета (например, на калькуляторе и на компьютере).
От исследователя требуется не просто обычная аккуратность; иногда возникают ситуации, когда статистические результаты столь необычны, что их нельзя не перепроверить. В частности, подозрения должны вызывать любые случаи несоответствия дескриптивных показателей и логических выводов о значимости. Дескриптивные и логические показатели основаны на одних и тех же данных, и поэтому они всегда должны определенным образом согласовываться. Установление статистической значимости ничтожной разницы или отсутствие значимости довольно существенной разницы должно быть стимулом к перепроверке расчетов.
Есть и еще одно замечание, которое можно сделать о проверке. Исследователь должен избегать дифференцированных проверок, когда результаты, противоречащие ожиданиям, анализируются со всей тщательностью, а результаты, подтверждающие ожидания, не проверяются. Как бы ни было естественным такое поведение, оно позволяет вкрасться эффектам необъективности экспериментатора: результатом исправления только негативных ошибок может быть псевдодоказательство гипотез исследователя. Разумеется, лучше всего проверять и корректировать все.
Последняя рекомендация — обращайтесь за советом. Сегодня доступно столько источников — учебники, компьютерные программы, специалисты в области статистики, — что новичку нужно быть совершено безрассудным человеком, чтобы в одиночку пуститься в плавание по коварным водам статистики. К эксперту можно обратиться на любом этапе процесса исследования, начиная с первичного выбора системы измерения и плана и кончая подготовкой к публикации исследовательского отчета.
Возможно, имеет смысл несколько более подробно рассмотреть письменные источники. Я уже упоминал лучшие учебники по всему курсу статистики, а также по отдельном его темам. Некоторые статистические вопросы и соответствующие процедуры имеют особое значение в исследованиях в области психологии развития. В этой главе мы не рассматривали статистические процедуры, наиболее часто используемые в психологии развития; этому есть два объяснения: большинство вопросов статистики, с которыми имеет дело исследователь в области психологии развития, в действительности ничем не отличаются от вопросов, с которыми сталкиваются все исследователи-психологи; а те вопросы, которые все же специфичны для психологии развития, настолько сложны, что углубляться в них здесь не имеет смысла. Заметьте, однако, что есть полезные (хотя подчас весьма трудные) работы, посвященные статистическим процедурам, имеющим особое значение именно в психологии развития (см. например: Achenbach, 1978; Applebaum & MacCall, 1983; Collins & Horn, 1991; Nunnally, 1982).
Резюме
Психологи используют статистические показатели, преследуя две связанные между собой цели. Дескриптивные статистические показатели дают краткую характеристику данным; они представляют собой своего рода первичное описание того, что было обнаружено в исследовании. К ним относят меры центральной тенденции,
главной из которых является среднее, и меры изменчивости, главными из которых являются дисперсия и стандартное отклонение.
С помощью статистических показателей, выводимых логическим путем, производится не просто описание данных, а определение статистической значимости. Суть вопроса состоит в том, значимо ли отклоняются полученные результаты от того, что могло произойти случайно, при этом случайность является основой нуль-гипотезы об отсутствии различий между сравниваемыми группами. В качестве примера логических критериев рассматривается £-критерий, который можно использовать для сравнения средних значений в двух группах. Как и у большинства логических критериев, значимость Меритерия зависит от трех факторов: степени различия групп, уровня изменчивости значений в каждой группе и объема выборки. Подчеркивается, что выводы, основанные на использовании логических критериев, всегда носят вероятностный характер; всегда существует возможность допустить ошибку: ошибку первого рода, при которой происходит ошибочное отвержение истинной нуль-гипотезы, и ошибку второго рода, при которой не отвергается ложная нуль-гипотеза. Подчеркивается также, что при проверке статистической значимости исключается возможность объяснения результатов случайной дисперсией,'однако сама статистическая значимость не гарантирует ни валидности исследования, ни научной ценности результатов.
Затем рассматриваются виды статистического анализа, которые подходят для разного типа данных, то есть вопрос, как выбрать логический критерий. При выборе критерия следует учитывать три фактора: первый — это уровень измерения — производится измерение по номинальной, порядковой, интервальной шкале или по шкале интервалов. Второй фактор — распределение полученных данных — в частности, распределены ли данные по закону нормального распределения. Так называемые параметрические критерии, например С-критерий и /-"-критерий, зависят от определенных предположений, касающихся распределения данных. Часто они обладают большей мощностью, чем непараметрические критерии, лучше выявляя истинные эффекты. В то же время возможность использования параметрических критериев ограничена рядом условий. Третий фактор — план исследования: сколько включено независимых переменных, сколько уровней имеет каждая переменная, производится внутри- или межсубъектное сравнение.
Помимо выявления межгрушювых различий существует еще одна область использования статистических процедур — установление меры связи между переменными. Корреляционные статистические показатели указывают на степень линейной связи между переменными. Статистическая значимость коэффициента корреляции зависит от его величины и объема выборки. Сила связи зависит от величины коэффициента корреляции: чем ближе он к единице, тем больше возможностей предсказать один показатель, зная другой. На коэффициент корреляции влияет диапазон изменения показателей в двух группах; чтобы результаты можно было генерализировать, этот диапазон должен соответствовать диапазону изменения показателей в популяции.
Как бы ни был гибок дисперсионный анализ, есть ситуации, когда уместнее использовать другую статистическую процедуру. В исследованиях с четкими гипотезами предпочтительнее использовать плановые сравнения, а не обобщенный ДА.
Предварительно спланированные процедуры более эффективны, чем единичные сравнения. Наряду со значимостью исследователя часто интересует сила влияния независимой переменной. Существуют разнообразные меры величины эффекта, простейшая из них — d — разница между двумя средними, разделенная на стандартное отклонение. В исследованиях с двумя и более зависимым переменными возможной альтернативой ДА является мультивариаитный дисперсионный анализ, или МДА. МДА используется в тех случаях, когда зависимые переменные образуют совокупность связанных между собой элементов, при этом МДА дает возможность осуществить более точную проверку эффектов. Наконец, альтернатива ДА — множественный регрессионный анализ, система методов статистического анализа, одним из которых, собственно, и является ДА. Хотя две эти процедуры зачастую взаимозаменяемы, есть ситуации, когда множественный регрессионный анализ предпочтительнее ДА, в частности, когда независимые переменные — непрерывные, а не дискретные величины.
Главу завершает изложение нескольких общих замечаний — три рекомендации: составлять предварительный план, производить расчеты аккуратно и при необходимости обращаться к специалистам.
Упражнения
Исследователь А сравнивает 10 экспериментальные и 10 контрольных испытуемых и выявляет значимое различие между группами на уровне р = 0,04. Исследователь В сравнивает 100 экспериментальных и 100 контрольных испытуемых и выявляет значимое различие между группами на уровне р = 0,04. О каком из этих различий вы бы смогли с большей уверенностью сказать, что это не результат случайности? Какие из результатов отражают более серьезное различие между условиями проведения исследования? Обоснуйте свои выводы.