3.3. Интерпретация результатов статистического анализа

В случае использования кластерного (или какой-то его разновидности, например, таксономического) анализа для классификации испытуемых исследователь после машинной обработки данных получает распечатку, где тем или иным способом указано число определенных классов и принадлежность каждого из испытуемых к тому или иному классу. Испытуемые, отнесенные к разным классам, различаются между собой по набору исследуемых свойств. Таким образом, интерпретация результатов основана на уяснении того, какими свойствами обладают представители каждого класса. Рекомендуется специально составить списки свойств, характеризующие каждый выделенный класс. Далее каждый такой список можно озаглавить либо посредством указания какого-то обобщающего свойства, либо посредством выбора из списка наиболее представительного свойства, например, наиболее сильно выраженного у всех испытуемых данного класса.

Приведем пример использования таксономического анализа в психологии. В исследовании, проведенном под руководством В.С. Мерлина (Басырова, 1965), для классификации испытуемых использовался ряд психофизиологических и психических свойств человека, таких, как свойства нервной системы, некоторые особенности восприятия, экстравертированность (направленность на общение), и др. В результате было выделено два класса испытуемых, по мысли авторов обладающих соответственно двумя различными типами темперамента. Таким образом, исходный набор свойств был обобщен в понятии «тип темперамента». Далее, основываясь на том, что выборка испытуемых была достаточно велика, авторы сделали вывод о структуре исследуемого свойства в целом, а именно о том, что существует всего два типа темперамента. Обратимся теперь к интерпретации результатов факторного анализа. После машинной обработки данных исследователь располагает распечаткой корреляционной и факторной матриц. Хотя корреляционный анализ (анализ матрицы корреляционных связей исходных свойств) в строгой смысле не является частью факторного анализа, однако, очевидно, по причине пересечения процедур расчета, существуют единые программы машинной обработки данных, включающие и корреляционный и факторный анализ.

Корреляционная матрица представляет собой таблицу коэффициентов корреляции признаков (свойств). Количество коэффициентов корреляции, подлежащих интерпретации, можно рассчитать, исходя из числа признаков, по формуле, приведенной в п. П.3. Если в распечатке корреляционная матрица приведена полностью, то анализировать следует либо ее верхнюю, либо нижнюю часть по отношению к единичной диагонали. После того как выделен нужный кусок матрицы, следует обратиться к таблицам значимости для коэффициента линейной корреляции (см., напр.: Валлон, 1967) и установить критическое значение коэффициента для имеющегося числа степеней свободы, т. е. для того количества испытуемых, которые участвовали в эксперименте.

Далее, обращаясь к корреляционной матрице, все значения коэффициентов, которые меньше критического при 95 %, можно оставить без внимания. Все же большие значения имеет смысл подчеркнуть. При этом все значения, которые больше критического при 99 % вероятности, имеет смысл отметить каким-то другим способом. Все отмеченные коэффициенты теперь могут быть подвергнуты интерпретации. Мы укажем здесь три наиболее употребительных метода интерпретации.

Интерпретация единичной корреляционной связи. Применяется для интерпретации связи двух наиболее важных для исследователя свойств. Чаще всего обращают внимание на величину коэффициента, что характеризует силу связи, а также на знак, характеризующий направление связи, в соответствии с этим могут строиться утверждения, что большая выраженность первого свойства связана с большей (или меньшей при отрицательной связи) выраженностью второго свойства. Далее исследователь может попытаться объяснить причину такого положения вещей из теоретических соображений, не следует, однако, никогда забывать, что саму корреляционную связь никогда нельзя рассматривать как причинную связь между признаками, так как априори неизвестно, обуславливают ли они друг друга или оба обусловлены некоторой третьей причиной.

Метод корреляционных плеяд. Для реализации этого метода все множество корреляционных связей следует сначала представить графически в виде некоторого графа. При изображении признаки обычно представляются кружками, внутри которых записывается номер или название признака. Связи изображаются линиями, связывающими кружки, имеет смысл положительные и отрицательные связи изображать разным цветом, иногда такие отрицательные связи изображают пунктиром. Над каждой связью надписывается ее значение. Изображение графа связей следует начинать с множества связей, значимых на самом высоком уровне (99,9 %). Этот граф представляет собой плеяду наиболее сильных корреляционных связей, его следует проинтерпретировать отдельно. Затем можно построить граф всех связей, значимых на уровне 99 %. Этот граф также интерпретируется отдельно. Затем можно перейти к интерпретации малозначащих связей (95 %).

Основные моменты, на которые обращают внимание при интерпретации корреляционных плеяд, следующие. Количество связей признака: некоторые признаки могут иметь много связей, другие – мало. Признаки, имеющие много связей, рассматриваются как центральные, им из теоретических соображений может быть приписано большое функциональное или системообразующее значение; признаки, имеющие мало связей, рассматриваются как периферийные. Последовательность признаков в цепочке связей: сама отдельно взятая цепочка связей не может быть однозначно интерпретирована, поэтому имеет смысл рассматривать последовательность удаления признаков от некоторого центра. Первый признак в такой последовательности имеет много связей, далее их число уменьшается вплоть до периферийного признака, имеющего единственную связь.

Обратимся вновь к интерпретации результатов факторного анализа. Факторная матрица представляет собой матрицу факторных нагрузок, где в каждой строке записаны нагрузки данного признака, соответствующего строке по каждому фактору. Столбец матрицы представляет собой множество факторных нагрузок всех имеющихся признаков по данному фактору. Таким образом, каждый фактор представлен столбцом факторных нагрузок. Само значение факторной нагрузки можно рассматривать как коэффициент корреляции данного признака с данным фактором. Таким образом, нагрузки также могут быть оценены по значимости. Перед тем как начать интерпретацию данных, следует выписать признаки, нагружающие каждый фактор, в порядке убывания их нагрузок. После этого можно перейти к интерпретации факторов и всей получившейся структуре. В наиболее употребительной технике факторного анализа, называемой «методом главных компонент», сами факторы между собой не коррелированы. Реже используется техника так называемого облического вращения факторов, когда сами факторы являются коррелированными. Факторный анализ может быть применен и для классификации испытуемых. В этом случае строки и столбцы в матрице первичных данных меняются местами, процедура обработки не меняется. Интерпретация данных аналогична интерпретации данных кластерного анализа.

В заключение следует отметить, что интерпретация статистического анализа не является, конечно, завершающим этапом исследования. Соотношения данных многомерного анализа и качественной интерпретации данных мы коснемся в своем месте на конкретных экспериментальных примерах.

Более 800 000 книг и аудиокниг! 📚

Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением

ПОЛУЧИТЬ ПОДАРОК