Внутренняя валидность в экспериментах

Как мы можем проверить, действительно ли разное количество сторонних наблюдателей в эксперименте Латанэ и Дарли (1968) было причиной того, что люди приходили на помощь? Не был ли этот эффект обусловлен каким-то другим аспектом ситуации? В этом заключается красота экспериментального метода: мы совершенно точно знаем о причинной связи между количеством сторонних наблюдателей и помощи, потому что Латанэ и Дарли построили эксперимент так, что ситуации были идентичными, отличалась лишь независимая переменная — количество наблюдателей. Сохранение тех же самых условий, за исключением независимой переменной, называется внутренней валидностью (internal validity) в эксперименте. Латанэ и Дарли старались обеспечить высокую внутреннюю валидность, создавая такую ситуацию, чтобы все участники эксперимента были свидетелями одного и того же случая. Исследователи предварительно записывали на пленку голоса предполагаемых других участников и жертвы и передавали их голоса по системе внутренней двусторонней связи. Проницательный читатель все же обратит внимание на ключевое отличие между условиями в эксперименте Латанэ и Дарли: в различных ситуациях принимали участие разные люди. Может быть, и готовность участников оказать помощь так сильно отличалась из-за их собственных характеристик, а не из-за независимой переменной. Когда свидетелем оказывался какой-то один человек, то сама ситуация настолько отличалась от других, что участники эксперимента, как правило, приходили на помощь. Однако возможно, что именно у этой категории людей были любящие и заботливые родители, может быть, они знали что-нибудь об эпилепсии или им приходилось помогать в чрезвычайной ситуации раньше. Вне зависимости от того, верно ли какое-либо из этих предположений, трудно сделать однозначный вывод о том, что число сторонних наблюдателей, а не что-то относящееся к воспитанию участников, привело к различиям в оказании помощи.

Случайная выборка для ситуации (random assignment to condition) — процесс, при котором у всех испытуемых есть равная возможность принять участие в любой ситуации эксперимента; поскольку, устанавливая случайную выборку, исследователи могут быть относительно уверены, что личностные различия испытуемых или их образование и квалификация будут равномерно распределены во всех ситуациях.

К счастью, существует техника, которая позволяет экспериментаторам свести к минимуму обусловливающие результат различия среди участников — случайная выборка для ситуации (random assignment to condition). Это процесс, при котором у всех испытуемых есть равный шанс принять участие в любом условии эксперимента; при случайном наборе испытуемых исследователи могут быть в какой-то мере уверены, что различия в характеристиках испытуемых будут равномерно встречаться во всех условиях эксперимента. Поскольку участники для экспериментов Дарли и Латанэ выбирались случайно, маловероятно, чтобы в какой-то одной ситуации собрались бы, например, только те, кто хорошо знает об эпилепсии. Знание об эпилепсии должно быть случайно (то есть приблизительно равномерно) распределено в трех условиях эксперимента. Эта техника — самая важная часть экспериментального метода.

Уровень вероятности (величина р) (probability level (p-value)) — статистическое значение вероятности того, что результаты эксперимента обусловлены случаем, а не независимой переменной. В науке, в том числе и в социальной психологии, принято считать результаты значимыми, если уровень вероятности меньше 5 из 100.

Тем не менее даже когда выборка делается случайно, всегда существует, пусть даже и очень маленькая, но вполне реальная возможность того, что различные характеристики людей не распределяются равномерно в разных условиях. Например, если мы случайным образом разделим группу из 40 человек на две, вполне вероятно, что те, кто хорошо знают об эпилепсии, окажутся в какой-то одной — точно так же вероятно, что у вас будет больше орлов, чем решек, если вы подбросите монету 40 раз. Такую возможность в экспериментальной науке приходится принимать всерьез. Анализ наших данных включает и уровень вероятности (величину р) (probability level (p-value)), число, подсчитанное с помощью методов математической статистики, которое говорит исследователям, какова вероятность того, что результаты их эксперимента получены случайно, а не благодаря независимой переменной. В науке, в том числе и в социальной психологии, как правило, результаты считаются заслуживающими доверия, если уровень вероятности того, что результаты получены на основе случайных факторов, а не действия независимых переменных, меньше, чем 5 из 100. Например, если мы бросаем монету 40 раз и у нас 40 раз выпадает «орел», мы скорее всего предположим, что это произошло не случайно и что-то не так с самой монетой (мы, вероятно, посмотрим на другую сторону монеты, чтобы убедиться, что это не какой-нибудь особенный экземпляр с орлами на обеих сторонах!). Точно так же, если результаты в двух условиях эксперимента значительно отличаются от наших ожиданий, основанных на случайности, мы предположим, что различие было обусловлено независимой переменной (то есть числом сторонних наблюдателей чрезвычайного происшествия). Величина р говорит нам, в какой степени мы можем быть уверены, что различие связано со случайностью, а не с независимой переменной.

Внутренняя валидность (internal validity) — проверка того, что ничего кроме независимой переменной не может повлиять на зависимую переменную; это достигается за счет контроля посторонних переменных и случайного набора людей для экспериментальных условий.

Итак, подводя итог, можно сказать, что самое главное для хорошего эксперимента — обеспечивать высокую внутреннюю валидность, которую мы можем теперь определить как уверенность в том, что независимая переменная, и только она одна, влияет на зависимую переменную; это достигается за счет контроля всех внешних переменных и случайного выбора людей для разных условий эксперимента (Campbell & Stanley, 1967). Когда уровень внутренней валидности достаточно высок, экспериментатор в состоянии оценить, действительно ли независимая переменная обусловливает зависимую переменную. Это критерий экспериментального метода, отделяющий его от метода наблюдения или корреляционного метода: только экспериментальный метод может ответить на вопрос о причинности, например на вопрос о том, действительно ли доступность материалов порнографического содержания заставляет людей совершать акты сексуального насилия. В главе 12 мы обсудим некоторые эксперименты, в которых делаются попытки ответить на этот вопрос, — исследователи случайно выбирают людей, показывают им фильм порнографического или непорнографического содержания (независимая переменная) и измеряют степень агрессивности мужчин по отношению к женщинам после фильма (зависимая переменная). Очевидно, что проводить такие эксперименты нелегко и нужно соблюдать осторожность и этику. Однако не стоит их недооценивать — именно с помощью таких экспериментов мы можем определить причинность.