Обобщение результатов экспериментов: статистические выводы
Обобщение результатов экспериментов: статистические выводы
Делая выводы из исследования, мы всегда рискуем допустить ошибку, даже если это хорошо спланированное и тщательно проведенное исследование. Тем не менее степень этого риска можно рассчитать с помощью объективных статистических процедур, разработанных для оценки вероятности того, что данный вывод из конкретной серии наблюдений может оказаться ложным. Допустим, мы хотим выяснить, повлияло ли участие в групповой дискуссии на установки, касающиеся употребления наркотиков. Мы можем оценить мнения участников до начала дискуссии и после ее окончания. Оценки по шкале мнений, полученные испытуемыми из нашей выборки, будут сначала просуммированы удобным и эффективным способом, чтобы преобразовать их в форму определенных статистических данных. Вычислив средние значения, медианы или моды, можно ответить на вопрос «Чему равна типичная или средняя оценка до дискуссии и после нее?» Рассчитав вариабельность реакции (диапазон ее изменения или среднее квадратическое отклонение), можно сказать, насколько реакции индивидуальных испытуемых отклоняются от этого характеристического показателя.
Однако чтобы определить, действительно ли именно групповая дискуссия привела к изменению установок в желательном направлении, необходимо сравнить полученные статистические данные с оценочным значением изменений, которые произошли бы просто за счет повторной оценки мнений, в отсутствие дискуссии. Сравнение полученного распределения оценок с теоретическими распределениями различных типов позволяет оценить вероятность того, что данные не имеют случайного характера, а отражают определенную статистическую закономерность. Вероятность того, что дифференцированное поведение — различное для испытуемых, поведение которых первоначально было сходным, — в ответ на воздействие переменной отражает «истинные» различия, находится в прямой зависимости от трех факторов: количества наблюдений, величины различий и вариабельности реакции. Вероятность статистической значимости полученных различий возрастает с ростом количества (N) наблюдений, с увеличением различий в поведении (представленных в форме каких — либо статистических данных) между группами и с уменьшением отклонений внутри каждой отдельной группы.
Понятие значимости результатов в психологии определяется как соответствие минимальному критерию, по которому устанавливают, что данный результат обусловлен влиянием экспериментального воздействия, а не случайными флуктуациями (дисперсией ошибки) в наблюдениях. В качестве такого минимального стандартного уровня задается уровень вероятности р<0,05 (р меньше, чем 0,05, или 5 %). Это означает, что обнаруженные изменения могут быть обусловлены чистой случайностью в пяти случаях из ста. Поэтому мы можем считать, что наш случай — это один из тех 95 случаев, когда различия нельзя приписать случайности. При определенных обстоятельствах исследователь может задать более строгий вероятностный критерий отвержения, например р<0,01 или даже р<0,001 (т. е. только в одном случае из тысячи экспериментатор сделает ложный вывод, приняв обнаруженные им различия за истинный результат экспериментального воздействия).
Хотя риск ошибки, сопряженный с получением выводов, снижается, если формулировать заключение с использованием вероятностных, а не абсолютных понятий, остается еще значительный риск, связанный с распространением выводов, касающихся данной выборки или поведения, в двух направлениях. Можно распространить выводы на более абстрактный, концептуальный уровень объяснения или перенести их на более конкретный, специфический пример. В первом случае можно совершить ошибку при экстраполировании выводов на более широкую область, поскольку предполагаемая общая закономерность, или теоретический процесс, может не проявляться в частных результатах. Во втором случае возникает необходимость предположить, что по общим закономерностям можно прогнозировать поведение конкретного человека.
В каждом из этих случаев возможны ошибки, относящиеся к двум типам. Если уровень значимости обнаруженных различий р<0,05, то экспериментатор, заключивший, что он обнаружил истинный эффект, ошибется в пяти случаях из ста. Это объясняется тем, что одни только случайные факторы могут порождать различия такой же величины и данный эксперимент может быть как раз одним из этих пяти возможных случаев. Такие ошибки называются ошибками первого рода (или типа альфа): сделан вывод о существовании зависимости, хотя на самом деле она отсутствует. Теперь давайте иначе посмотрим на весь наш вероятностный процесс принятия решений и предположим, что различия не признаны значимыми, потому что они находятся на уровне p<0,06 (т. е. не соответствуют обычному критерию научной обоснованности выводов). Тогда в 94 случаях из 100 исследователь заключит, что зависимость не существует, в то время как в действительности дело обстоит как раз наоборот. Это ошибка второго рода (или типа бета).
Чем руководствуется психолог, принимая решение о том, стоит ли ему рисковать (ошибка первого рода) или следует проявить консерватизм (ошибка второго рода)? Ясно, что при выборе стратегии подобного решения необходимо учитывать практические последствия, вытекающие из экспериментальных выводов, относительную величину потерь или опасности, которые возникнут из — за ошибок каждого типа, и наконец, характер влияния этих ошибок на развитие науки — приведут ли они к стимуляции творческого мышления или будут ему препятствовать. Например, при обобщениях с целью получения концептуальных теоретических утверждений о физических или психологических явлениях прогрессу науки сильнее мешают ошибки второго рода (из — за которых могут преждевременно быть прекращены исследования в какой — либо области), чем ошибки первого рода (которые легко могут обнаружить другие исследователи, проведя независимые репликации экспериментов). Однако если репликации проводятся редко, то ошибка первого рода может так и остаться неисправленной, в результате чего много сил будет потрачено зря на проверку следствий исходной необоснованной гипотезы.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Значение экспериментов Росса
Значение экспериментов Росса Ли Росс сумел опытным путем доказать существование эффекта ложного консенсуса и продемонстрировал, что люди склонны выносить суждения о том, какие решения примут другие, исходя из того, что решили они сами. Росс также показал, что если
2.9. Анализ, основание, обобщение, выводы
2.9. Анализ, основание, обобщение, выводы Обыденное сознание существует в условиях семиотики повседневности. С.Т. Махлина дает следующее определение семиотике повседневности: «Семиотика повседневности – система языков, пронизывающих повседневную жизнь человека.
Интуитивные или статистические прогнозы
Интуитивные или статистические прогнозы При выборе между сердцем и головой клиницисты зачастую прислушиваются к голосу своего опыта и голосуют сердцем. Они предпочитают не руководствоваться холодными расчетами, определяя будущее теплокровных людей. Чувства
9. Выводы из основной теории, полученной как обобщение экспериментов по метапрограммированию положительных состояний с применением ЛСД-25
9. Выводы из основной теории, полученной как обобщение экспериментов по метапрограммированию положительных состояний с применением ЛСД-25 1. ЛСД-25 обеспечивает положительные состояния ЦНС (награда, положительное подкрепление).2. ЛСД-25 сдерживает негативные состояния ЦНС
Список экспериментов
Список экспериментов Первый шаг. Эксперимент «Своей
Дескриптивные статистические показатели
Дескриптивные статистические показатели Вернемся к одному из предыдущих примеров: исследованию агрессии методом наблюдения в условиях детского сада. Допустим, исследователь собрал данные, представленные в табл. 7.1. Как можно заметить, имеют место значительные
Статистические исследования эффектов акупрессуры ень-мо
Статистические исследования эффектов акупрессуры ень-мо В течение 15 лет (с 1974 по 1989 г.) американцы в возрасте от 19 до 64 лет добровольно принимали участие в исследовании. Ниже приводятся некоторые интересные результаты, полученные профессором Стивеном Т. Чаном.По поводу
§ 12. Статистические результаты
§ 12. Статистические результаты Для того чтобы сравнить между собою вопросы Дэля в аспекте их устойчивости и отношения к возрасту, мы выделили три группы по 250 последовательных вопросов, включая туда, конечно, и «почему». Эти вопросы: от 201 до 450 (с сентября по 3 ноября 1921 г.),
Жертвы экспериментов и не только…
Жертвы экспериментов и не только… С некоторых пор с девушкой Татьяной из маленького городка под Киевом, распложенном неподалеку от военного санатория «Звездочка», стали происходить необъяснимые вещи. Будучи правшой, она на шесть месяцев становилась левшой. За год у нее
7.4. Статистические модели опосредующего и смягчающего действия
7.4. Статистические модели опосредующего и смягчающего действия C. Aldwin [233] дает краткое объяснение, толкование некоторых статистических методов, используемых при изучении эффектов преодоления стресса на здоровье. Автор отмечает, что в преодолении упрощенно понимают
Статистические данные
Статистические данные Истории пробуждают эмоции. Факты дают логическое обоснование. Эмоции в речи гораздо важнее, чем логика. Например, если вам нужно убедить людей, что СПИД – это серьезное заболевание, и призвать их делать пожертвования, история окажет на них гораздо
ЛЮБИТЕЛЬ СЕКСУАЛЬНЫХ ЭКСПЕРИМЕНТОВ
ЛЮБИТЕЛЬ СЕКСУАЛЬНЫХ ЭКСПЕРИМЕНТОВ Девиз донжуана: “Люблю тебя всем сексом!” Д.Е.Среди донжуанов есть и экспериментаторы. Это не означает, что он сексуальный гурман. Утонченный, вдумчивый секс подразумевает, в первую очередь, любовь, без которой голая