Тесты, основанные на теории Бине

We use cookies. Read the Privacy and Cookie Policy

Тесты, основанные на теории Бине

Какие же вопросы включают в тесты для определения IQ? Многие из нас слышали о таких тестах, тестировались в свое время раз или два, но едва ли вспомнят конкретное содержание вопросов. В действительности слишком многие любят порассуждать об IQ-тестах, имея смутное понятие об их достоинствах и недостатках. Масса пустых слов отражает часто политические или социальные убеждения, а не объективные факты. Нет ничего плохого в том, что человек привносит в подобные тесты свои политические и социальные пристрастия – я и сам так поступаю. Но сначала необходимо разобраться с тестами, увидеть их сильные и слабые стороны. Так что позвольте мне остановиться на некоторых деталях одного из двух наиболее распространенных тестов, шкале Стэнфорд-Бине, которую можно считать развитием оригинальных разработок Альфреда Бине.

Четвертое издание книги «Шкала интеллекта Стэнфорд-Бине» (Stanford-Binet Intelligence Scale, Forth Edition, SB IV) является последним из серии изданий, первое из которых появилось на свет в 1905 году[9]. Первая ревизия (т. е. второе издание) шкалы Стэнфорд-Бине датируется 1939 годом, а третье издание было выпущено в 1960 году. Тестироваться могут дети в возрасте от двух лет; верхний возрастной предел не устанавливается, хотя реальные испытания тестов (называемые стандартизацией) проводились для молодых людей не старше двадцати трех лет.

В чем достоинства этого теста? Что из себя представляет система Стэнфорд-Бине? Она включает пятнадцать субтестов, но только шесть из них могут использоваться для всех возрастных групп тестируемых. Субтесты разбиваются на четыре категории: вербальное мышление, количественное мышление, фигуральное/абстрактное мышление и краткосрочная память. Рассмотрим некоторые примеры пятнадцати субтестов.

1.-Словарные тесты. Испытуемым предлагается сформулировать значение слов. На низших уровнях слова представляются в виде картинок. Позже они предлагаются в напечатанном варианте. Например, может быть задан вопрос, что означает слово «претенциозный». Словарные тесты предлагаются испытуемым из всех возрастных групп. Вопросы на знание словаря присутствуют во многих тестах проверки интеллекта и других аналогичных испытаниях, например «тестах проверки способностей к обучению». Анализ подобных элементов тестирования позволяет понять сомнения некоторых психологов и педагогов по поводу того, что эти упражнения причисляют к тестам интеллектуальности.

Прежде всего необходимо понять, что укоренившееся представление о принципиальном различии тестов проверки интеллекта, с одной стороны, и тестов оценки достижений, с другой стороны, является во многом мифом. Тесты интеллектуальности, как правило, оценивают достижения испытуемого, которых, как предполагается, он добился за предыдущие несколько лет. Никто, даже самые горячие приверженцы теорий о врожденных и наследственных способностях, не станет утверждать, что мы рождаемся с уже сформировавшимся словарным запасом в мозге. Кроме того, для выполнения тестов оценки достижений также требуется определенный интеллект: как минимум, он нужен для усвоения того материала, который проверяется при тестировании.

Во-вторых, имейте в виду, что при тестировании словарного запаса очень легко может быть нарушен принцип равноправия культур. Тест, основанный на английском словаре, едва ли в той же степени подходит для ребенка, который от рождения разговаривал по-испански, по-вьетнамски или по-японски, как для ребенка, выросшего в англоязычной среде. На практике общее количество слов, которые знает ребенок, говорящий на двух языках, может заметно превышать словарный запас его англоязычного сверстника. Но проблема состоит в том, что тесты формируются только из английских слов, что дает очевидное преимущество тем детям, для которых английский язык является родным.

Что поразительно, желающие использовать тесты проверки интеллекта, разработанные в других странах (как правило, это Соединенные Штаты – крупнейший в мире производитель и потребитель таких тестов), часто просто переводят их на язык своей страны. При этом предполагается, что перевод не искажает тест; что слова, даже после перевода, по сложности и значимости в своем языке эквиваленты словам оригинала; что определение абстрактных слов является в их культуре такой же знакомой процедурой, как и в американской культуре. Как правило, ни одно из этих предположений не выполняется, но это не мешает издавать по существу бессмысленные переводы американских или каких-либо других тестов.

В-третьих, способ тестирования словаря иллюстрирует одно из основных положений настоящей книги – тесты проверки интеллекта оценивают интеллект академический, оторванный от контекста. Не так давно я присутствовал на занятии, где учитель проверял с помощью теста знание словаря учениками средней школы. Каждый ученик должен был дать абстрактное определение слова и использовать это слово в предложении. Рассмотрим два различных ответа, связанных со словом «понижать»:

• уменьшить количество или интенсивность… Чтобы понизить у ребенка температуру, доктор дал ему аспирин.

• сделать меньше… Политик постарался понизить уровень беспокойства в обществе в связи с возможным повышением налогов.

Отметим, что абстрактное определение лучше у первого ученика – у второго оно слишком общее. Но второй ученик, возможно, испытывая проблемы с абстрактным определением, знает, как использовать слово в конкретном контексте. Именно он будет демонстрировать более высокий интеллект в повседневном общении или даже на занятиях в школе. Но с точки зрения IQ-теста преимущество отдается первому ученику.

И последнее (по порядку, но не по значимости). Рассмотрим, что дают эти словарные тесты нашей образовательной системе. Что заставляет учеников средних школ запоминать словарные слова? Это ведь не помогает научиться грамотно писать или читать, говорить или слушать. Наиболее естественный способ обучения состоит в том, чтобы учить слова в контексте – например, читая или слушая других. В конце концов, в жизни важно уметь хорошо читать, писать, слушать и говорить, а не выдавать назубок определения слов. Заучивание словарных слов – не только неестественный процесс; оно очень редко способствует основательному долгосрочному удержанию этих слов в памяти. Поскольку слова учатся в отрыве от значимого контекста, они быстро забываются, как забывается содержание большей части курсов, которые мы зубрим в школе. Но поскольку в школьных тестах проверки способностей знание словаря оценивается, как правило, на основе оторванных от жизни примеров, учителя заставляют миллионы учеников тратить время на запоминание слов, которые они с большой вероятностью не знают, как использовать, и с той же вероятностью очень скоро забудут. Учителя готовят учеников к тестам, а эти тесты вовсе не оценивают то, что действительно должны знать дети или взрослые.

2.-Тесты на понимание. На этом уровне испытуемые должны продемонстрировать понимание общественных или культурных норм – объясняя, например, почему люди иногда одалживают деньги или почему люди голосуют. На первый взгляд может показаться, что эти тесты оценивают интеллект в контексте реального мира, то есть проверяют те способности, в наличии которых мы крайне заинтересованы. Но имеем ли мы здесь дело с действительно реальным миром или карикатурой на этот мир – сказочкой, которую иногда рассказываем себе о том мире, в котором нам хотелось бы жить?

Почему, например, люди просят деньги в долг? Очевидно, потому, что хотят купить то, что в данное время не в состоянии полностью оплатить. Но рассмотрим, почему люди берут взаймы в реальных ситуациях? Иногда, как, например, в случае покупки дома, это связано с необходимостью уплаты налогов. Иногда это вызвано желанием обладать предметами роскоши – автомобилями, яхтами, особняками, – которые они не только не могут, но и не должны покупать. Иногда таким образом добывают себе дополнительные карманные деньги, заведомо не собираясь их возвращать. Иногда эти деньги тратятся на покупку запрещенных препаратов, которые в конечном итоге убивают человека. А иногда, безусловно, и по тем причинам, которые фигурируют в качестве правильных ответов в тесте.

Или почему люди голосуют? В стране, где 99,6 процента населения отдают голоса за узаконенного диктатора (вспомните результаты никого не удивившей недавней победы на выборах Саддама Хусейна), причина в том, что люди вынуждены голосовать за ставленника руководящей верхушки. Иногда, голосуя, люди хотят продемонстрировать недоверие всем выдвигаемым кандидатам – граждане США в подобных случаях вписывают в бюллетени своих кандидатов; иногда люди идут на избирательные участки потому, что им за это платят. Безусловно, иногда голосование есть свободное волеизъявление и выражение своих политических пристрастий – именно такого ответа от вас ждут авторы теста; но в немалом числе случаев данный вопрос не имеет смысла, поскольку в значительной части мира люди не голосуют и никогда в своей жизни голосовать не будут.

В тесте на понимание испытуемые, как правило, излагают не то, что считают правдой, а то, что, по их мнению, желает услышать тестирующий. В смысле оценки понимания людьми «игры в тестирование» эти тесты вполне выполняют свои функции. Они могут быть связанными и с пониманием сути тех игр, которые ведутся в школах. Но эти тесты ни в коей мере не отражают подлинных умственных способностей, особенно у тех, кого с детства не учили разбираться и участвовать в подобных играх. Как это ни странно, многие считают, что подобные тесты связаны с культурой, в рамках которой живут люди, хотя на самом деле это не так. Они связаны с фантазиями конкретных Диков, Джейн и Салли о том, каким образом хочет представить себя эта культура.

3.-Тесты на абсурдности (несоответствия). В этих тестах испытуемым показывают картинки, на которых есть несоответствия, и задача состоит в том, чтобы найти эти несуразности. Например, испытуемые должны указать, что хоккеисты не могут играть на поверхности озера, в котором плавают люди в купальных костюмах. Но откуда ребенку из страны с тропическим климатом знать, что такое хоккей на льду? Сможете ли вы отыскать несоответствия на картинках, изображающих регбистов или играющих в крикет, хотя эти игры вовсе не относятся к числу экзотических? А что вы скажете насчет игры го? Чтобы увидеть абсурдность изображенного, необходимо хорошо знать содержание картинки – и только тогда можно разглядеть хотя бы возможные несоответствия.

4.-Связь слов. Здесь испытуемый должен сказать, что общего у первых трех слов из приведенного набо-ра и почему четвертое слово выпадает из этого ряда. Например, что общего у яблока, банана и апельсина, чего нет у чашки. Тест кажется чрезвычайно простым, но только для тех, кто вырос в среде, где все эти фрукты доступны и, соответственно, хорошо знакомы. Вы знаете, например, что такое гуава? А есть страны, в которых ответ на этот вопрос не вызовет затруднений даже у самых маленьких детей. Очень часто то, что преподносится в качестве тестов на вербальное мышление, оказывается проверкой знания словаря. Оба моих ребенка проходили предварительный тест проверки способностей к учебе, и оба получили одинаковые замечания. Для проверки вербального мышления детям предлагалось находить словесные аналогии, но проблема была не в том, что они не могли найти требуемые аналогии, а в том, что они не знали значения предлагаемых слов.

Таким образом, иногда тесты, предназначенные для оценки одних вещей (вербальное мышление), проверяют главным образом совсем другое (в данном случае знание словаря). Вот пример подобных упражнений, предлагаемых в рамках SAT-тестов: попробуйте указать аналогии – ИНТЕНСИФИЦИРОВАТЬ: УСИЛИВАТЬ: АКТИВИЗИРОВАТЬ: (а) увеличить; (б) уменьшить; (в) усиливать; (г) ослаблять; (д) мешать – если вы не знаете значения указанных слов.

К основным недостаткам подобных тестов относится то, что на основе интерпретации их результатов делаются ложные выводы. Так, в приведенном выше примере те, кто просто не знает значения редко используемых слов, могут получить ярлык людей с неразвитым вербальным мышлением. Думаю, было бы замечательно, если бы каждый знал, что и «интенсифицировать», и «активизировать» может означать «усиливать». Конечно, если вы решили стать учителем словесности, вам положено знать значение подобных слов. В то же время я подозреваю, что очень многие без проблем проживут всю жизнь и, возможно, добьются в ней немалых успехов, не отягощая себя знанием ни одного из этих слов.

5–6.-Анализ и копирование образцов. В тесте на анализ образцов испытуемый воспроизводит с помощью черно-белых двумерных фрагментов различные геометрические формы. Копирование подразумевает воспроизведение нарисованных геометрических фигур.

Эти два субтеста, возможно, отчетливее других демонстрируют ограниченность стандартной точки зрения на интеллект. Само слово «копирование» говорит о многом. Как правило, у испытуемых вознаграждается умение копировать работы других. Так о каком интеллекте идет речь? Это равносильно признанию вершиной творчества деятельность тех, кто день за днем проводит в музеях, копируя работы великих мастеров. В то же время кто возразит, что тесты типа Стэнфорд-Бине нацеливают на учебу, во главу угла которой ставится копирование и точное повторение слов учителя? Преуспеете в этом – будете круглым отличником. Если вы полениваетесь – возможно, потому, что вам претят столь бездумные подходы, – вашу интеллектуальность могут поставить под сомнение. Лично я считаю, что одно из преимуществ взрослых людей перед детьми состоит в том, что от нас, взрослых, уже не требуют закрашивать книжки-раскраски «правильными» цветами, ни в коем случае не выходя за очерченные границы. Если вы верите в подобные тесты, можете использовать эти книжки-раскраски в качестве совершенного мерила интеллекта.

7.-Матрицы. В данном субтесте испытуемому предлагается матрица, часть которой не заполнена, и он должен выбрать среди нескольких альтернатив правильный вариант заполнения. Матрицы уже давно используются для тестирования IQ. Но особое внимание уделяется так называемым «прогрессивным матрицам Равена» – чисто цифровым конструкциям, заслужившим славу наиболее объективного критерия оценки умственных способностей в целом. Их считают образцом справедливости по отношению к различным культурам, поскольку в них отсутствуют слова и, по мнению их приверженцев, они одинаковым образом воспринимаются представителями различных культур. Хотя о подлинном равноправии, конечно, не может быть и речи.

Итак, вы получили некоторое представление о возможных упражнениях, с которыми приходится сталкиваться при индивидуальном тестировании интеллекта. Остановимся теперь на проблемах подсчета и интерпретации результатов.

В методе Стэнфорд-Бине в выборке стандартизации – выборке, на основе которой устанавливается соответствие между количеством правильных ответов и значением IQ, – разность возрастов самых старших и самых младших ее представителей составляет двадцать два года – достаточно широкий диапазон. Данная выборка стандартизации используется в качестве контрольной группы для определения значимых результатов конкретного тестирования. Сколько, по вашему мнению, человек было протестировано для того, чтобы установить однозначную связь между количеством набранных очков (так называемый предварительный счет) и фактическим результатом тестирования (так называемым коэффициентом интеллектуальности, который позже мы обсудим подробнее)? В качестве отправной точки возьмем население Соединенных Штатов, составляющее примерно 250 миллионов человек. Должно быть, вы думаете, что выборка стандартизации включает 500 000 или хотя бы 50 000 человек? А как насчет 5000? Фактически она составляет 5013 человек – не так уж много, когда принятие решений, влияющих на дальнейшую жизнь испытуемых, зависит от точности интерпретации результатов. А если вспомнить, что выборке соответствует возрастной диапазон в двадцать два года, на каждый год возраста приходится менее 250 человек!

Диапазон в двадцать два года выглядит, с одной стороны, достаточно впечатляюще, но если вы посмотрите на проблему с другой точки зрения, он покажется весьма скромным. Он отражает тот факт, что данные тесты предназначены для проверки способностей к обучению. Выборка соответствует тем годам жизни, которые жители Соединенных Штатов проводят за школьными партами и в студенческих аудиториях. Но после двадцати двух лет (или около того) молодые люди покидают стены школы и начинают трудовую жизнь. Способности, которые позволяют добиваться успеха, уже другие, а тесты остаются прежними. Таким образом, система тестирования не только разработана, но и отнормирована с использованием выборки представителей населения со значительным возрастным смещением. Такая застывшая во времени реальность проявляется во всей своей ущербности, когда человеку солидного возраста приходится возвращаться за школьную парту и проходить тесты, отражающие положение вещей для юношей, а не для взрослых людей. Им приходится тратить время на изучение геометрии и прочих премудростей, которые они не использовали уже много лет и, скорее всего, никогда не будут использовать, кроме как при тестировании.

Хотя были предприняты определенные усилия для того, чтобы сделать эту выборку (с возрастным смещением) представительной по отношению к населению США, эти попытки закончились неудачей. Одна группа населения представлена в выборке с избытком – доля ее представителей в выборке выше соответствующей доли в общем населении страны. Что это за группа? Как раз та, которая почти всегда с избытком присутствует в различных психологических исследованиях, особенно в исследованиях интеллектуального развития. Речь идет о людях с более высоким социальным и экономическим статусом. Для компенсации этого недостатка выборки использовались методы статической коррекции. Но подобные корректировки носят заведомо приближенный характер, что опять-таки не добавляет уверенности в точности результатов тестирования.

Сравнения с другими тестами, включая прежние версии шкалы Стэнфорд-Бине, показали следующее: хотя отмечается примерное согласие результатов, количество очков как для одаренных людей, так и для умственно отсталых несколько ниже аналогичных результатов как для прежних версий данного теста, так и для его основного конкурента, теста Векслера. Учитывая, что минимальные результаты используются для вынесения диагноза «умственно отсталый», а максимальные результаты, соответственно, диагноза «интеллектуально одаренный», указанные систематические расхождения не способствует глубокому доверию к тестам, на основе которых выносятся жизненно важные решения.

Существуют и другие проблемы с этим видом тестов. Одна из них заключается в том, что для различного возраста предлагаются и различные субтесты (задачи), и не совсем понятно, как сравнивать результаты тестирования представителей отдельных возрастных групп. Более того, отличаются и допустимые диапазоны начисления очков для различных возрастов, а также для различных субтестов и наборов субтестов, что затрудняет сопоставление результатов не только по возрастам, но и при оценке отдельных способностей (например, когда необходимо определить слабые и сильные стороны испытуемого).

Вероятно, наиболее серьезной проблемой подобного тестирования является то, что статистический анализ (называемый «факторным анализом») структуры теста никак не связан со структурированием теста с целью получения частных результатов. Другими словами, нет соответствия этих результатов и методов выявления средствами статистического анализа действительных мыслей испытуемого. Таким образом, после проведение тестов у вас может оказаться набор результатов, которые никак не отражают процессы мышления тестируемого человека. Например, где конкретно может преуспеть человек с высокими показателями пространственного мышления?

Альтернативой методу Стэнфорд-Бине являются тесты Векслера – наиболее распространенная шкала тестирования интеллектуальности. Они основаны на тех же представлениях об интеллекте, что и шкала Стэнфорд-Бине. Система Векслера включает три уровня тестирования – «Тесты Векслера для проверки уровня интеллектуальности взрослых людей – исправленные» (WAIS-R), третье издание «Тестов Векслера для проверки уровня интеллектуальности детей» (WAIS-III) и «Тесты Векслера для проверки уровня интеллектуальности детей дошкольного и младшего школьного возраста» (WPSSI).

По результатам тестирования Векслера получают три показателя: вербальный, деятельный и общий. Вербальный показатель основан на таких тестах, как «словарь» и «подобие слов», при выполнении которых испытуемый должен указать, в чем состоит схожесть или связь пары объектов или понятий. Показатель деятельности основан на таких тестах, как «заполнение картинок», где нужно идентифицировать недостающую часть на рисунке объекта, или «упорядочение картинок», где нужно расположить перепутанные картинки (например, фрагменты из мультфильма) так, чтобы получилась связная история. При определении общего показателя комбинируются результаты вербального и деятельного тестирования.

Системе Векслера, как и тестам Стэнфорд-Бине, присущи проблемы, связанные с ее содержанием. Например, в тестах «подобие слов» преимущество отдается более категоричным ответам о схожести или несхожести объектов (например, оба объекта принадлежат к классу Х), чем, скажем, ответу, что объекты связаны функционально, то есть первый использует второй. Вывод о том, что первый ответ является в определенном смысле «лучше», чем второй, отражает не столько уровень мышления, сколько понимание процесса тестирования. Некоторые тестируемые способны находить нужные категоричные решения, но просто не знают, что именно они являются более предпочтительными при подсчете результатов. Аналогично, тест на заполнение картинок требует знания содержания этих картинок, а упражнение на упорядочение картинок окажется более простым для тех, кто уже привык к следующим в хронологическом порядке картинкам, например в виде мультфильмов или комиксов.

Данный текст является ознакомительным фрагментом.