и Ib-не-
соответствующий
контекст, непохо-
жий объект. Адапти-
ровано из: Ru-
melhart (1977J по
данным Palmer
11975Ь1.
Сравнение с
эталоном
Распознавание паттернов
85
когда мы пытаемся воспроизвести опознание с помощью искусственных
средств, то оказывается, что результат от нас ускользает. Возьмем для
примера опознание букв и устройство для распознавания слов. Чтобы на-
учиться хорошо читать, нужно потратить несколько лет, но когда мы на-
учились распознавать орфографическую конфигурацию, составляющую
слово, мы можем мгновенно узнать это слово в различных контекстах,
произнести его и вспомнить его значение. Как бы вы смоделировали ис-
ходный процесс опознания буквы на компьютере? Один из способов -
это хранить в "памяти" компьютера каждую из 26 букв. Тогда каждый раз,
когда буква сканировалась бы оптическим устройством, воспринимаемая
зрительная конфигурация "настраивалась" бы на элемент памяти (эта-
лон), связанный с этой буквой. Так, слово CARD (карточка) анализирова-
лось бы как C-A-R-D, т.е. "С" настраивалось бы на ячейку памяти, соот-
ветствующую конфигурации "С", для "А" нашлось бы соответствие в ячейке
"А" и т.д. "Вуа-ля! - мог бы воскликнуть компьютер,- а я читаю буквы!"
Но что если бы мы попросили его опознать буквы в слове "card"? В его
памяти нет конфигураций для написания букв в нижнем регистре. Реше-
ние просто, скажете вы: увеличьте память и включите туда буквы нижне-
го регистра. Но тогда мог бы наш компьютер прочитать (как это делаем
мы) буквы, написанные вот так:
ОРдСГили так Obdили так 0гд/или так Су1й)
Конечно же, в чтении участвуют гораздо более сложные процессы, чем
простое опознание букв. Прием, используемый в компьютерной техни-
ке,- сравнение конфигурации букв с конкретными конфигурациями в
памяти машины - называется "сравнение с эталоном"; это похоже на
поворот ключа в замке. Чтобы открыть замок, конфигурация бороздок Ь
выемок на ключе должна совпасть с конфигурацией замка. На языке рас-
познавания образов при сравнении с эталоном происходит следующее:
когда зрительная конфигурация соответствует совместимой с ней репре-
зентации в памяти, информация высвобождается. Как видно из примера с
компьютером, метод сравнения с эталоном встречается с трудностями при
попытке опознать слово "CARD", если в его написании есть какие-либо
отклонения,- это все равно, что пытаться открыть замок погнутым клю-
чом.
Таким образом, сравнение с эталоном - это элементарная процедура
распознавания паттернов, основанная на том, что конфигурация сенсор-
ной информации точно подходит к соответствующей "конфигурации" в
памяти; и хотя ее возможности ограничены, она имеет определенное тео-
ретическое и практическое значение. Теоретические вопросы, связанные
с этим методом, мы затронем позднее. Что касается его практических
применений, то они весьма многочисленны.
Итак, в случае распознавания паттернов человеком "жесткое" следо-
вание этой модели привело бы к необходимости создания миллионов от-
дельных шаблонов, каждый из которых соответствовал бы отдельному
зрительному паттерну. Если бы нам приходилось хранить так много этало-
нов, наш мозг был бы таким громоздким, что пришлось бы возить его на
тачке. Так что этот трюк не пройдет по неврологическим соображениям.
Обнаружение и интерпретация сенсорных сигналов
в компьютерах
Сравнение с эталоном является основой
многих кодирующих систем, ставших час-
тью нашей повседневной жизни. Например,
; почти все банки в США имеют системы
цену, печатаемую затем на контрольной
ленте кассового аппарата.)
А
1пет|сдг|
STATE
BANK
Mattew A. SWANN
18 Chclsca Place
New York, N.Y. 100П
HO. 159
PAY TO ME ORDER OF _
OTV-- Ю№ 75 47 Д>
Цдля идентификации счетов по специальным
Вб цифрам, отпечатанным на оборотной сто-
,роне чека, а во многих магазинах исполь-
зуютсн аналогичные коды (напечатанные
,У; на упаковках товара) для ускорения про-
|цесса выписки счетов и проведения пере-
йучета товаров. (По этому коду компьютер
% определяет единицу товара и указывает ее
Обе эти разновидности кодов читаются
посредством сравнения с эталоном. Рису-
нок на чеке имеет отличительные детали,
помогающие компьютеру различать буквы,
а торговые коды читаются по положению
линий, их ширине и пространству между
ними. Коды преобразуются сканером в
электрические импульсы, из которых со-
ставляется сигнальный паттерн; последний
передается в компьютер, идентифицирую-
щий этот паттерн путем сравнения его с
аналогом (эталоном), находящимся в его
памяти.
Но даже если бы это было возможно, то для доступа к памяти, где хранят-
ся многие миллионы эталонов, потребовалась бы процедура поиска, зани-
мающая крайне много времени, что никак не соответствует нашей способ-
ности быстро опознавать множество различных паттернов. Наконец, эта
модель маловероятна потому, что мы можем опознавать незнакомые фор-
мы и фигуры (например, новые варианты начертания буквы "А").
Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь-
лов - это подетальный анализ. В соответствии с ним, восприятие - это ный она-
"высокоуровневая" обработка информации, которой предшествует этап лиз
идентификации входных стимулов по их более простым деталям. Так,
прежде чем произойдет оценка информации зрительного паттерна "в полном
объеме", осуществляется минимальный анализ его составных частей. На
элементарном визуальном уровне слово - например, слово ARROW
(стрела) - не переводится непосредственно в свою понятийную или
мысленную репрезентацию в нашей памяти (например, "заостренное древко
для стрельбы из лука" или знак "- "). Оно не читается как "arrow", и
его отдельные буквы не воспринимаются как A-R-R-0-W, а вместо этого
обнаруживаются и анализируются детали или компоненты каждой буквы..
Так, буква "А" может быть разложена на две наклонные линии (/ \) и
Распознавание паттернов
87
Рис. 3.5. Уста-
новка для наблю-
дения за нервной
активностью, вы-
зываемой просты-
ми зрительными
стимулами.
одну горизонталь (--), острый угол (Л.), перевернутую емкость (/--\)
и т.д. Если процесс опознания основан на анализе деталей и это найдет
свое подтверждение, то выходит, что ранние этапы обработки информации
более сложны, чем мы предполагали вначале.4
В двух исследовательских направлениях - неврологическом и бихеви-
ористском - были получены данные в пользу гипотезы о подетальном
анализе. Мы сосредоточимся на втором из них, но сначала обратимся к
экспериментам Хьюбеля и Визеля (Hubel and Wiesel, 1959, 1963; Wiesel,
1963), из которых прямо видно, какой тип информации кодируется в зри-
тельной коре мозга. Эти ученые вживляли микроэлектроды в зрительную
кору кошки и обезьяны, находившихся в состоянии легкого наркоза, а
потом изучали нервную активность, возникавшую в результате проекции
простых световых паттернов на экран непосредственно перед глазами жи-
вотного (Рис.3.5).
Регистрируя возбуждение отдельных нервных клеток и усиливая воз-
никающие в них электрические импульсы, они обнаружили, что некото-
рые клетки реагируют только на горизонтальные фигуры, а некоторые -
Чтобы оценить сложность сенсорного, перцептивного и моторного аппара-
тов, обслуживающих "простое" восприятие и ответные реакции, представьте
себе, сколько всего требуется, чтобы отбить ракеткой на лету теннисный мяч.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185
соответствующий
контекст, непохо-
жий объект. Адапти-
ровано из: Ru-
melhart (1977J по
данным Palmer
11975Ь1.
Сравнение с
эталоном
Распознавание паттернов
85
когда мы пытаемся воспроизвести опознание с помощью искусственных
средств, то оказывается, что результат от нас ускользает. Возьмем для
примера опознание букв и устройство для распознавания слов. Чтобы на-
учиться хорошо читать, нужно потратить несколько лет, но когда мы на-
учились распознавать орфографическую конфигурацию, составляющую
слово, мы можем мгновенно узнать это слово в различных контекстах,
произнести его и вспомнить его значение. Как бы вы смоделировали ис-
ходный процесс опознания буквы на компьютере? Один из способов -
это хранить в "памяти" компьютера каждую из 26 букв. Тогда каждый раз,
когда буква сканировалась бы оптическим устройством, воспринимаемая
зрительная конфигурация "настраивалась" бы на элемент памяти (эта-
лон), связанный с этой буквой. Так, слово CARD (карточка) анализирова-
лось бы как C-A-R-D, т.е. "С" настраивалось бы на ячейку памяти, соот-
ветствующую конфигурации "С", для "А" нашлось бы соответствие в ячейке
"А" и т.д. "Вуа-ля! - мог бы воскликнуть компьютер,- а я читаю буквы!"
Но что если бы мы попросили его опознать буквы в слове "card"? В его
памяти нет конфигураций для написания букв в нижнем регистре. Реше-
ние просто, скажете вы: увеличьте память и включите туда буквы нижне-
го регистра. Но тогда мог бы наш компьютер прочитать (как это делаем
мы) буквы, написанные вот так:
ОРдСГили так Obdили так 0гд/или так Су1й)
Конечно же, в чтении участвуют гораздо более сложные процессы, чем
простое опознание букв. Прием, используемый в компьютерной техни-
ке,- сравнение конфигурации букв с конкретными конфигурациями в
памяти машины - называется "сравнение с эталоном"; это похоже на
поворот ключа в замке. Чтобы открыть замок, конфигурация бороздок Ь
выемок на ключе должна совпасть с конфигурацией замка. На языке рас-
познавания образов при сравнении с эталоном происходит следующее:
когда зрительная конфигурация соответствует совместимой с ней репре-
зентации в памяти, информация высвобождается. Как видно из примера с
компьютером, метод сравнения с эталоном встречается с трудностями при
попытке опознать слово "CARD", если в его написании есть какие-либо
отклонения,- это все равно, что пытаться открыть замок погнутым клю-
чом.
Таким образом, сравнение с эталоном - это элементарная процедура
распознавания паттернов, основанная на том, что конфигурация сенсор-
ной информации точно подходит к соответствующей "конфигурации" в
памяти; и хотя ее возможности ограничены, она имеет определенное тео-
ретическое и практическое значение. Теоретические вопросы, связанные
с этим методом, мы затронем позднее. Что касается его практических
применений, то они весьма многочисленны.
Итак, в случае распознавания паттернов человеком "жесткое" следо-
вание этой модели привело бы к необходимости создания миллионов от-
дельных шаблонов, каждый из которых соответствовал бы отдельному
зрительному паттерну. Если бы нам приходилось хранить так много этало-
нов, наш мозг был бы таким громоздким, что пришлось бы возить его на
тачке. Так что этот трюк не пройдет по неврологическим соображениям.
Обнаружение и интерпретация сенсорных сигналов
в компьютерах
Сравнение с эталоном является основой
многих кодирующих систем, ставших час-
тью нашей повседневной жизни. Например,
; почти все банки в США имеют системы
цену, печатаемую затем на контрольной
ленте кассового аппарата.)
А
1пет|сдг|
STATE
BANK
Mattew A. SWANN
18 Chclsca Place
New York, N.Y. 100П
HO. 159
PAY TO ME ORDER OF _
OTV-- Ю№ 75 47 Д>
Цдля идентификации счетов по специальным
Вб цифрам, отпечатанным на оборотной сто-
,роне чека, а во многих магазинах исполь-
зуютсн аналогичные коды (напечатанные
,У; на упаковках товара) для ускорения про-
|цесса выписки счетов и проведения пере-
йучета товаров. (По этому коду компьютер
% определяет единицу товара и указывает ее
Обе эти разновидности кодов читаются
посредством сравнения с эталоном. Рису-
нок на чеке имеет отличительные детали,
помогающие компьютеру различать буквы,
а торговые коды читаются по положению
линий, их ширине и пространству между
ними. Коды преобразуются сканером в
электрические импульсы, из которых со-
ставляется сигнальный паттерн; последний
передается в компьютер, идентифицирую-
щий этот паттерн путем сравнения его с
аналогом (эталоном), находящимся в его
памяти.
Но даже если бы это было возможно, то для доступа к памяти, где хранят-
ся многие миллионы эталонов, потребовалась бы процедура поиска, зани-
мающая крайне много времени, что никак не соответствует нашей способ-
ности быстро опознавать множество различных паттернов. Наконец, эта
модель маловероятна потому, что мы можем опознавать незнакомые фор-
мы и фигуры (например, новые варианты начертания буквы "А").
Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь-
лов - это подетальный анализ. В соответствии с ним, восприятие - это ный она-
"высокоуровневая" обработка информации, которой предшествует этап лиз
идентификации входных стимулов по их более простым деталям. Так,
прежде чем произойдет оценка информации зрительного паттерна "в полном
объеме", осуществляется минимальный анализ его составных частей. На
элементарном визуальном уровне слово - например, слово ARROW
(стрела) - не переводится непосредственно в свою понятийную или
мысленную репрезентацию в нашей памяти (например, "заостренное древко
для стрельбы из лука" или знак "- "). Оно не читается как "arrow", и
его отдельные буквы не воспринимаются как A-R-R-0-W, а вместо этого
обнаруживаются и анализируются детали или компоненты каждой буквы..
Так, буква "А" может быть разложена на две наклонные линии (/ \) и
Распознавание паттернов
87
Рис. 3.5. Уста-
новка для наблю-
дения за нервной
активностью, вы-
зываемой просты-
ми зрительными
стимулами.
одну горизонталь (--), острый угол (Л.), перевернутую емкость (/--\)
и т.д. Если процесс опознания основан на анализе деталей и это найдет
свое подтверждение, то выходит, что ранние этапы обработки информации
более сложны, чем мы предполагали вначале.4
В двух исследовательских направлениях - неврологическом и бихеви-
ористском - были получены данные в пользу гипотезы о подетальном
анализе. Мы сосредоточимся на втором из них, но сначала обратимся к
экспериментам Хьюбеля и Визеля (Hubel and Wiesel, 1959, 1963; Wiesel,
1963), из которых прямо видно, какой тип информации кодируется в зри-
тельной коре мозга. Эти ученые вживляли микроэлектроды в зрительную
кору кошки и обезьяны, находившихся в состоянии легкого наркоза, а
потом изучали нервную активность, возникавшую в результате проекции
простых световых паттернов на экран непосредственно перед глазами жи-
вотного (Рис.3.5).
Регистрируя возбуждение отдельных нервных клеток и усиливая воз-
никающие в них электрические импульсы, они обнаружили, что некото-
рые клетки реагируют только на горизонтальные фигуры, а некоторые -
Чтобы оценить сложность сенсорного, перцептивного и моторного аппара-
тов, обслуживающих "простое" восприятие и ответные реакции, представьте
себе, сколько всего требуется, чтобы отбить ракеткой на лету теннисный мяч.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185