Дескриптивные статистические показатели
Дескриптивные статистические показатели
Вернемся к одному из предыдущих примеров: исследованию агрессии методом наблюдения в условиях детского сада. Допустим, исследователь собрал данные, представленные в табл. 7.1. Как можно заметить, имеют место значительные индивидуальные различия в частоте агрессивных действий; вполне вероятно, что есть также различия между полами и возрастными группами. Но как разобраться в этом хаосе цифр и определить истинное положение вещей?
Первый шаг — охарактеризовать данные при помощи ряда дескриптивных статистических показателей. Большинство дескриптивных статистических показателей используется для выявления центральной тенденции, или преобладающей формы ответов в выборке. Чаще всего в качестве меры центральной тенденции выступает среднее арифметическое, или просто среднее. Из табл. 7.2 явствует, что группы испытуемых из нашего гипотетического исследования действительно имеют разный средний уровень агрессии.
Чаще всего среднее — наиболее информативный дескриптивный статистический показатель. Однако он не единственный, в ряде случаев знание лишь среднего не дает полного представления о полученных результатах. Сравним группы 3- и 4-летних мальчиков. Как явствует из табл. 7.2, средний уровень агрессии у старших мальчиков выше. Однако сырые данные из табл. 7.1 свидетельствуют о том, что фактически большинство показателей агрессии обеих групп достаточно близки. Более высокое среднее у старших детей явилось следствием наличия нескольких очень высоких показателей. Или же сравним группы 3-летних мальчиков и девочек. Полагаясь на средние значения из табл. 7.2, мы могли бы заключить, что эти группы имеют одинако-
вый уровень агрессии. Однако сырые данные из табл. 7.1 свидетельствуют о том, что эти средние значения имеют разные основания.
Приведенные выше примеры демонстрируют необходимость иных дескриптивных статистических показателей помимо среднего арифметического. Есть еще две меры центральной тенденции. Одна из них — медиана. Медиана — это центр распределения, выше которого находится одна половина показателей, а ниже — другая. Сравним вновь результаты 3- и 4-летних детей. Из табл. 7.2 явствует, что данные результаты имеют общую медиану — 4. Это свидетельствует о фундаментальном сходстве двух распределений, сходстве, которое мешает заметить разница средних. В целом, медиана приобретает особце значение тогда, когда распределение асимметрично, то есть включает несколько необычно высоких или низких показателей. В таких случаях среднее может дать искаженную картину типичных ответов.
Таблица 7.2 Дескриптивные статистические показатели для данных из таблицы 7.1
Среднее Медиана Мода Стандартное отклонение 3-летние 5,6 4 5 5,38 мальчики 3-летние девочки 5,0 3 0 5,88 4-летние 13,4 4 3 13,90 мальчики 4-летние девочки 3,4 3 3 3,29 Мальчики в 9,5 4 3 11,09 целом Деоочки в 4,2 3 . 0 4,75 целом 3-летние в 5,3 3,5 0 5,55 целом 4-летние в целом 8,4 3 3 11,15Третья мера центральной тенденции — мода. Мода — показатель, наиболее часто встречающийся в определенной группе. Эта мера используется редко, однако в некоторых обстоятельствах ее значение довольно информативно. Рассмотрим, к примеру, данные 3-летних девочек из табл. 7.1. Ранее мы отметили, что средний уровень агрессивных действий в этой группе — 5,0 — практически такой же, как и у мальчиков. Однако, в отличие от мальчиков, для 3-летних девочек модальным было нулевое значение. Этот факт вполне заслуживает того, чтобы упомянуть о нем в отчете.
Наряду с центральной тенденцией, дескриптивные статистические показатели характеризуют изменчивость распределения. Нам необходимо знать не только, какова центральная тенденция, но и то, насколько приближаются показатели к центральному значению или отклоняются от него. Чаще всего мерой изменчивости служит дисперсия. При ее расчете сначала находят среднее для выборки. Затем определяется разница между этим средним арифметическим и показателем каждого из испытуемых. Эти значения разности, или «отклонения», возводятся в квадрат, суммируются, а полученная сумма делится на N - 1, результатом чего и является показатель дисперсии. Таким образом, дисперсия — это приблизительно среднее квадратичных отклонений; «приблизительно», поскольку делитель равен N - 1, а не N. Чем больше разница между индивидуальными показателями, тем больше дисперсия.
В научных статьях в качестве меры изменчивости обычно указывается не дисперсия, а стандартное отклонение. Стандартное отклонение — это просто квадратный корень из показателя дисперсии. В табл. 7.2 он подсчитан для каждой из групп нашего гипотетического исследования. Полученныезначеиия стандартного отклонения подтверждают наши интуитивные предположения о степени разброса индивидуальных показателей в группах. Обратите особое внимание на весьма значительное стандартное отклонение у 4-летних мальчиков, в группе, где было отмечено несколько крайне высоких показателей.