Распознавание

We use cookies. Read the Privacy and Cookie Policy

Распознавание

 Посмотрим, как в свете того, что мы уже знаем, выглядит процесс распознавания.

 Описывая устройство коры головного мозга, мы говорили, что существует условное деление коры на три уровня. Первый уровень — проекционный. Информация, поступающая от органов чувств, находит отражение на этом уровне. Иначе можно сказать, что первый уровень отвечает за элементарные, базовые понятия внутреннего языка. Так, если мы говорим про зрение, то к таким понятиям будут относиться, например: восприятие отдельной точки, восприятие горизонтальной линии, вертикальной линии, восприятие точки, двигающейся слева направо, справа налево и так далее. Причем надо понимать, что количество таких элементарных понятий крайне велико.

 На втором уровне происходит более глубокое распознавание. Из элементарных понятий мы собираем узнаваемые образы. Узнаем конкретных людей, распознаем конкретные предметы. Обратите внимание на то, что образы предметов внешнего мира не хранятся в памяти в виде фотографий, а запомнены в виде набора понятий внутреннего языка, которые, в свою очередь, собраны из огромного количества элементарных понятий.

Распознавание явлений — это процесс активации соответствующих понятий внутреннего языка в случае совпадения ряда исходных понятий, которые имели место, когда происходило запоминание явления.

 На третьем уровне коры головного мозга происходит формирование сложных понятий, комплексных воспоминаний. Эти понятия строятся на уже распознанных предметах, ситуациях, действиях. Именно третий уровень коры у человека, в отличие от животных, развит наиболее сильно.

 То, как происходит распознавание чего-либо человеком, полностью определяется той формой хранения информации, которая свойственна нашей памяти. Приведу аналогию.

 Звук представляет собой колебания воздуха, распространяющиеся в пространстве. Записывая звук, мы записываем некую информацию, которую можно сопоставить с исходной звуковой волной. Например, микрофон преобразует акустические волны в электрический сигнал. Электрический сигнал оцифровывается, цифровой поток сохраняется. Или же электрический сигнал пишется на магнитофонную ленту, при этом сила намагниченности участков ленты повторяет форму электрического, а соответственно и звукового сигнала. Во всех этих случаях мы сохраняем информацию о самом звучании «как оно есть» и можем с достаточной степенью точности воспроизвести снова. Записав музыку, мы можем проигрывать ее и слышать запись, адекватную оригиналу.

 Существует и принципиально другой способ записи музыки. Услышав музыку, мы можем определить, какие инструменты ее исполняют, выделить отдельно партию каждого инструмента, записать ее в нотной форме. Зная, как звучит каждый инструмент, мы можем воспроизвести исходную музыку. Это не будет оригинальное звучание, это будет смоделированное звучание, очень похожее на оригинальное (применительно к компьютерам первый вариант носит название WAVE, а второй — MIDI; другое, более знакомое название для сжатого формата WAVE,— MP3, а для формата MIDI — «Полифония»).

 Мозг хранит не «оригинальное звучание», а распознанное и переведенное в свою «нотную форму». Такое хранение делает возможным ту процедуру распознавания, что была описана выше.

 Распознавание нейронными сетями — это не перебор вариантов и сравнение с образцами, а срабатывание в случае совпадения ряда признаков, причем возможны противоречия, ошибки, зашумленность входящей информации. Однако дополнительные элементы — такие как контекст ситуации, совпадение других признаков — позволяют распознаванию сработать.

Попробуйте быстро прочитать следующий текст: По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы блыи на мсете преавя и пслоендяя бквуы. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все- рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все солво цликеом.

 Еще пример распознавания — узнавание лиц.

 Увидев человека, мы запоминаем его лицо и позднее легко можем его узнать. Причем мы узнаем этого человека, даже если он изменит мимику, сменит прическу или мы увидим его в другом ракурсе. Мы можем это сделать потому, что запомнили не «фотографию» лица, а набор признаков, которые мы умеем выделять на лице человека. Мы запомнили форму носа, разрез глаз, форму ушей и множество других характеристик. И когда мы встречаем повторение запомненного набора признаков, тогда мы и говорим, что узнали человека.

 Чтобы вышесказанное стало совсем уж очевидно, вспомните, как легко мы узнаем людей по шаржам на них, где нет никакого фотографического сходства, но где художник четко сохранил те отличительные признаки, которые важны при распознавании.

Рисунок 19. Вспомните, как легко мы узнаем людей по шаржам на них.

Рисунок 20. И вообще, все дело - в шляпе.

 Та же причина лежит в основе объяснения того факта, что европейцы с трудом различают между собой азиатов, и наоборот, азиаты с трудом различают европейцев. У европейцев в силу малого опыта общения с азиатами отсутствуют те понятия внутреннего языка, которые отвечают за распознавание характерных особенностей азиатской внешности. Вот и кажутся они все «на одно лицо». Но  если какое-то время пообщаться в азиатской среде, такие понятия сформируются, и распознавание уже не представит большого труда.

 Вспоминается сцена, которая не вошла в фильм «Мимино»: в гостинице, в лифте, Мимино и Хачикян — грузин и армянин, такие характерные и разные персонажи. И там же — японская делегация, все как близнецы. И один из японцев говорит другим: «Посмотрите, какие же эти русские все одинаковые... ».