Д. Бродбент Внимание и восприятие речи[215]

We use cookies. Read the Privacy and Cookie Policy

Обращать и не обращать внимания — несомненно, две наиболее важные способности человеческих существ. Однако, несмотря на их первостепенное значение в процессе познания и в целом сонме других видов интеллектуальной деятельности, психологи на протяжении многих лет не считали их достойными изучения. Внимание казалось субъективным свойством, которое исторически ассоциировалось с интроспективным методом исследования. Этот метод имеет тенденцию давать противоречивые результаты и потому впал в немилость у психологов-экспериментаторов. В соответствии с этим большинство уважаемых теоретиков не пользовались никакими понятиями, сходными с понятием внимания, а поскольку исследования в психологии главным образом подчинены теории, то экспериментов в тех направлениях, которые могли бы возродить интерес к этой проблеме, проводилось мало.

Однако за последние 10 лет проблема внимания начала различными путями привлекать внимание психологов. Один из этих путей связан с изучением эффективности контрольных систем, например связанных с диспетчерской службой в аэропортах. Основная причина ошибок в работе этих систем заключается в том, что диспетчер должен обработать слишком много одномоментно поступающей информации, или же в том, что он реагирует на второстепенный сигнал, когда должен реагировать на важный. Эти проблемы требуют некоторого понимания тех феноменов, которые в обыденной речи получили название «внимания». В настоящее время идет процесс накопления большого количества экспериментальных данных, которые делают более понятными эти феномены, но основную часть работы еще предстоит сделать. В этой статье я расскажу о некоторых исследованиях, посвященных вниманию к словесной информации.

Уже давно известно и подтверждается повседневным опытом, что два сигнала, поступающих одновременно, труднее понять, чем если они следуют один за другим. Соблазнительно объяснить это явление чисто физической интерференцией между двумя раздражениями; так, например, громкие места одного сигнала могут заглушить тихие места другого и наоборот, так что оба сигнала становятся непонятными. В действительности дело обстоит не так просто. Было показано, что при записи сигналов на магнитную ленту с последующим воспроизведением их для разных людей, получивших инструкцию отвечать на них по-разному, доходчивость сигналов зависит от психологических факторов. В конкретном случае любой сигнал становится понятным, если слушатель инструктирован игнорировать другой. Но два сигнала, поступивших вместе, не могут быть оба поняты, несмотря на то что необходимая информация доступна для слуха. Аналогичная ситуация возникает при включении слов одного предложения в промежутки между словами другого предложения: «О боже, скажи спаси можешь нашу ты милостивую видеть королеву». Трудно понять смысл этих предложений, хотя каждое слово произносится отдельно и отлично слышно. Трудность понимания, очевидно, зависит от нервной системы, которая каким-то образом препятствует адекватной реакции на удовлетворительно «слышимые» сигналы.

Последующие эксперименты показали, что понимание улучшается, если два сигнала отличаются друг от друга по некоторым физическим параметрам. Например, оно становится лучше, если мужской голос произносит одну фразу, а женский — другую или же если репродуктор срезает низкие тоны в одном голосе, но сохраняет их в другом. Наилучшие результаты дает пространственное разделение двух голосов. Разные по значению сигналы не должны исходить из одного репродуктора или даже из разных репродукторов, на расположенных один над другим; два голоса должны отстоять друг от друга на возможно большем расстоянии в горизонтальной плоскости. Интересно и то, что слушатель лучше воспринимает одновременно поступающие сигналы, когда они воспроизводятся не одним репродуктором, а стереофоническим устройством. (Именно эффект пространственного разделения звуков, а не сомнительная достоверность звучания является для многих людей главным достоинством стереофонических систем с высокой точностью воспроизведения звука: слушатель при этом способен различать отдельные музыкальные инструменты, играющие одновременно.)

Различие физических свойств сигналов очень помогает пониманию, когда один из них не имеет значения для слушателя и он не должен на него отвечать. По-видимому, именно эти различия позволяют мозгу фильтровать входящие звуки и отбирать некоторые из них для реакции, а другие игнорировать.

Необходимость отбросить часть поступающей информации может, вероятно, стать понятнее при сравнении мозга с созданными человеком системами связи. Сегодня инженеры говорят о способности к передаче информации, под которой они понимают число равновероятных сигналов, из которых только один может быть послан в строго определенное время. Предположим, к примеру, что подготовлено два сложных военных плана и необходимо послать приказ об исполнении одного из них. Простая система связи, состоящая из двух лампочек — красной и зеленой, — способна с максимальной эффективностью передать приказ, включив одну из них. Однако если бы вместо двух имелось четыре плана, то, как бы просты они ни были, было бы невозможно отдать приказ включением только одной из двух лампочек. В этом случае либо должно быть увеличено число лампочек, либо необходимо больше времени для передачи приказа. Наиболее эффективный код для двух лампочек будет заключаться в следующем: две следующие одна за другой вспышки красной лампочки означают один план, вспышка красной, а затем зеленой — другой и т. д. Один из четырех возможных сигналов может быть передан двумя лампочками, но только каждый сигнал займет две единицы времени. При восьми возможных сигналах код потребует трех вспышек двух лампочек, занимая три единицы времени, вероятность 16 сигналов потребует четырех вспышек и т. д.

Хотя человеческий мозг обладает по сравнению с красной и зеленой лампочками несравненно большим числом возможных состояний, это число, по-видимому, не беспредельно. Таким образом, можно предполагать, что существует предел числа различных возможных состояний для каждого данного промежутка времени. И действительно, ряд экспериментов указывает на большое сходство работы мозга с двухламповой системой; так, во многих случаях время реакции человека на один из нескольких возможных сигналов увеличивается на одинаковую величину всякий раз, когда число возможных сигналов удваивается. Поскольку существует предельная скорость, с которой один сигнал можно отличить от других, то мозг ограничивает число возможных вариантов, которые необходимо рассмотреть в любую единицу времени, отбирая только часть информации, достигающей слуха. Поэтому степень сложности восприятия двух одновременно поступающих словесных сигналов зависит от числа других сигналов, которые могли бы поступить вместо тех двух, которые поступили. Если возможное число других сигналов невелико, то два одномоментно поступивших сигнала могут не превысить способности мозга и слушатель поймет оба эти сигнала. Вместе с тем если каждый сигнал выбирается из очень широкого диапазона возможных сигналов, то единственное, что, по-видимому, сможет сделать слушатель, — это правильно реагировать на один из них.

Некоторые исследования подтверждают эти выводы. Так, Дж. Уэбстер и его сотрудники наблюдали, что диспетчеры центра управления аэропорта могли иногда воспринять два одновременно поступивших позывных радиосигнала двух самолетов, но были в состоянии понять лишь одно из двух последовательных сообщений. Позывные воспринимались потому, что диспетчерам было хорошо известно, какой самолет может дать сигнал, но они не знали, что затем сообщит пилот.

При проведении эксперимента в Исследовательском центре прикладной физиологии в Кембридже испытуемый должен был быстро отвечать на ряд вопросов и одновременно нажимать ключ в ответ на сигнал периодически включаемого зуммера. Нарушение способности отвечать на вопросы, вызванное зуммером, возрастало, после того как испытуемому сообщали, что ему еще придется реагировать на звонок. Даже в тех случаях, когда звонок не включали, испытуемый с большим трудом отвечал на вопросы, чем в то время, когда он ожидал только зуммера.

Результаты этих экспериментов помогают объяснить, почему иногда человек понимает два сообщения, поступивших одновременно, а в другой раз — только одно. Когда слушающему досконально известна ситуация, так что он знает возможное содержание каждого сообщения с небольшим числом вариантов, он сможет понять два одновременно поступивших сигнала. Но если один или оба сигнала происходят из большого числа возможных, то фильтр в мозгу пропустит только один из них.

Как работает этот фильтр? До сих пор ответа на этот вопрос нет. Однако достаточно много известно о физических свойствах речи и физиологии слуха, чтобы стали возможными некоторые осторожные суждения. Человеческая речь возникает при взаимодействии голосовых связок и «голосового тракта», к которому относятся полости гортани, рта и носа. Туго натянутые голосовые связки производят звук при прохождении между ними струи воздуха. Звук состоит из коротких импульсов, или толчков воздуха, возникающих с частотой 100 или более в секунду, причем каждый импульс содержит энергию на многих частотах. Эти импульсы вызывают колебания воздуха, заключенного в полости гортани, носа и рта. Эти полости можно настроить на разные частоты, изменяя положение языка, щек, челюсти и губ (рис. 1). В результате возникает поток импульсов, содержащих определенную группу частот, причем импульсы идут с частотой около 100 в секунду. Каждый импульс начинается в полную силу и быстро затухает, пока энергия звука не возобновится следующим импульсом (рис. 2).

Многие гласные звуки содержат волны в двух или большем числе далеко отстоящих друг от друга частотах (рис. 3 и 4).

Например, чтобы произнести гласный звук в слове «bit», необходима максимальная энергия на частотах 375 и 1700 колебаний в секунду; частоты 450 и 1700 колебаний в секунду дают гласный в слове «bet». (Эти цифры характерны для типичного мужского голоса. Для женского и детского голосов весь диапазон частот может быть выше, но слушатель принимает это во внимание.) Достигнув уха, звуки возбуждают чувствительные образования, расположенные вдоль основной (базилярной) мембраны улитки (рис. 5). Низкие частоты возбуждают образования на одном конце мембраны, высокие — на другом. Сложный звук, состоящий из нескольких частот, возбуждает несколько различных отделов мембраны. Каждое чувствительное образование на мембране связано с определенными нервными волокнами, идущими к мозгу; так, слово «bit» возбуждает одну комбинацию волокон, а слово «bet» — другую.

Если оба слова достигают уха одномоментно, то вступают в игру обе комбинации волокон и мозгу приходится решать, в каких отношениях друг с другом они находятся. Может случиться и так, что два или большее число голосов создадут такую путаницу в ухе, что мозг будет не в состоянии сконцентрировать внимание только на одном из них. Конечно, ряд специфических особенностей помогает отличить один голос от другого; это акцент, скорость речи, ее громкость или плавность. Но использовать эти особенности можно только тогда, когда известно, какие частоты характерны для каждого голоса. Таким образом, остается нерешенным вопрос: каким способом мозгу удается сконцентрировать внимание на одном голосе? Изучение искусственного воспроизведения звуков речи начало проливать некоторый свет на эту проблему.

Совместно с П. Лейдфогдом я проводил эксперименты, пользуясь прибором, разработанным Уолтером Лоуренсом. Наш вариант прибора посылает серию электрических импульсов (аналогичных импульсам от голосовых связок) через два фильтрующих контура, каждый из которых пропускает преимущественно одну частоту (рис. 6). Импульсы от одного фильтрующего контура, подобные тем, которые возникают при прохождении звуком самой большой полости голосового тракта, смешиваются с импульсами из другого контура, которые имитируют частоты, создаваемые второй по величине полостью. Вместе две последовательности волн слышны как вполне приемлемые гласные звуки, которые можно было изменять, настроив фильтры на другие частоты. Изменение частоты импульсов, питающих фильтры, меняет кажущуюся высоту или интонацию «речи»: она повышается при большей частоте импульсов и снижается при меньшей.

Когда одинаковые импульсы возбуждают оба фильтра, человек слышит звуки, вполне идентичные гласным звукам. Это происходит даже тогда, когда в одно ухо подается низкая частота, а в другое — высокая (рис. 5).

Но если в оба фильтра импульсы поступают в различном ритме, то «речь» становится невоспринимаемой и испытуемые говорят, что они слышат не один гласный звук, а два звука, идущих от двух источников (рис. 7 и 8).

Другие эксперименты по слиянию звуков в обоих ушах, выполненные К. Черри и его сотрудниками, также подтверждают идею о том, что когда ритм или модуляции одинаковы для двух звуков, то слушатель воспринимает их как один звук (рис. 9). Это позволяет предположить, что можно слушать одного человека и игнорировать речь другого прежде всего с помощью отбора из массы достигающих слуха звуков всех тех частот, которые модулируют в одном ритме. Поскольку почти невероятно, чтобы голосовые связки двух говорящих вибрировали в какой-либо момент в одном ритме, то модуляция почти всегда является важным средством раздельного восприятия двух голосов.

В настоящее время считается общепризнанным принцип нейрофизиологии, согласно которому сигналы, проходящие по определенному нерву, отличаются друг от друга либо тем, что идут по разным нервным волокнам, либо тем, что вызывают в нервных волокнах разное число импульсов в секунду. Высокочастотные и низкочастотные звуки возбуждают различные нервные волокна. Вполне возможно, что частота звуковых импульсов регулирует частоту разрядов, возникающих в нервных волокнах. Если это так, то мозг может выделить один голос из других, сконцентрировав внимание на всех волокнах слухового нерва, в которых потенциалы возникают с одинаковой частотой (рис. 10).

Дальнейшее свидетельство важности модуляций заключается в том, что, по-видимому, именно они, а не частота колебаний, подвергающаяся модулированию, при некоторых условиях определяют высоту голоса. Это можно продемонстрировать с помощью генератора искусственной речи. На фильтр, настроенный, скажем, на частоту 3000 Гц, поступает звук с частотой модуляции 100 Гц. Слушающего просят подобрать высоту звука, аналогичную любой из двух простых звуковых волн: в 100 и 3000 Гц. Обычно он выбирает 100 Гц.

Описанный механизм выбора является еще гипотетичным, но я полагаю, что нечто очень похожее должно существовать в действительности. Однако не подлежит сомнению, что это не единственный механизм, на котором основано слуховое внимание. Ряд экспериментов ясно указывает на это. В одном из них испытуемому надевают наушники, причем через правый наушник он слышит один голос, а через левый — другой. Обычно испытуемый без труда понимает речь, слышимую одним ухом, и игнорирует слышимую другим. Но при некоторых условиях эти невоспринимаемые звуки доходят до сознания. К примеру, Невиль Морей из Оксфордского университета показал, что человек, внимательно слушающий речь одним ухом, услышит свое имя другим ухом, хотя абсолютно не воспринимает этим ухом другие слова. А. Трейсман в аналогичной ситуации обнаружила, что речь, поступающая в невоспринимающее ухо, может привлечь внимание испытуемого, если она состоит из слов, которые могли бы являться продолжением слов, только что услышанных ухом, на которое направлено внимание. В этих случаях смысл речи преобладал над ее физическими характеристиками.

Каким образом мозг концентрирует внимание на смысле или содержании речи, до сих пор почти совсем неизвестно. Ясно одно: если предложенный принцип выбора между голосами правилен, то должно существовать два механизма внимания. Выбор на основе содержания заключается в оценке раздражителя с точки зрения его возможной пригодности для определенной группы реакций, а не в оценке наличия или отсутствия в нем определенного физического свойства. Например, в данный момент человек готов записать любую цифру от 1 до 9 и абсолютно не готов записывать что-либо другое или же реагировать каким-либо другим способом. Если он слышит с какой-либо стороны звук или голос, который можно расценить как название одной из цифр, то он реагирует, записав ее; если же звук не может быть истолкован подобным образом, то он на него не отреагирует. В другое время он готов записывать буквы алфавита, а не цифры и т. д.

Оба типа внимания в настоящее время интенсивно исследуются. В ближайшие годы должны быть получены более определенные данные о природе каждого из них и по крайней мере предварительный ответ на вопрос об их зависимости от различных механизмов.