Рецептивные поля сетчатки
Поскольку существуют пороги, число градаций яркости, различаемых зрением, ограничено. В этом смысле зрительный анализатор ведёт себя как дискретная система, разделяя диапазон яркости на конечное число уровней, хотя, в отличие от идеальной дискретной системы, эти уровни не фиксированы.Согласно теории двойственного зрения, существует 2 типа фоторецепторов. Колбочки – рецепторы аппарата дневного зрения, обладающего малой световой чувствительностью, но зато большой разрешающей способностью и способностью различать цвета. Палочки – рецепторы аппарата ночного зрения, который не обладает способностью различать цвета, имеет малую разрешающую способность, но зато большую световую чувствительность. Согласно закону полной пространственной суммации, пока стимул находится в пределах одной накопительной ячейки, то есть в пределах эффективной площади рецептивного поля, пороговое раздражение зависит только от общего числа поглощённых этой ячейкой квантов света, а не от того, как они распределены внутри зоны суммации. Но полное число падающих квантов света зависит не только от произведения светового потока на площадь стимула, но и от времени. Зрительный порог не следует считать точно фиксированным параметром. В действительности зрительный порог является величиной, флуктуирующей вблизи некоторого среднего значения. При исследовании зрительных порогов надо учитывать не только флуктуации поглощаемого потока световых квантов, но и флуктуации в нервных каналах.
Модель изображения
В простейшем случае достаточно определить изображение как распределение некоторой величины В на части поверхности или, иными словами, как функцию В(x, y), где независимые переменные x и y могут изменятся в заданных пределах. При этом под В можно понимать яркость, освещённость, плотность тока в электронных пучках, величину возбуждения нервной клетки. В более сложных случаях изображения будут представлены функцией трёх независимых переменных В(x, y, t) (подвижные изображения) или несколькими функциями этих переменных (объёмные, цветные изображения). Даже если В(x, y) является непрерывной функцией. реальные изображения всегда можно разбить на конечное число дискретных элементов. Изображения, состоящие из дискретных элементов, каждый из которых может принимать лишь конечное число различимых значений, изменяющихся за конечное время, называются дискретными. Сетчатка передаёт в высшие отделы зрительного анализатора дискретные изображения. Их кажущаяся непрерывность – лишь одна из иллюзий зрения. Это "квантование" первоначально непрерывных изображений определяется не теми ограничениями, которые связаны с разрешающей способностью оптической системы глаза и даже не морфологическими структурными элементами зрительной системы. а функциональной организацией нервных сетей. Изображение разбивается на дискретные элементы рецептивными полями, объединяющими то или иное число фоторецепторов. Рецептивные поля производят первичное выделение полезного светового сигнала путём пространственной и временной суммации. Изображение может быть представлено в виде таблицы, каждая ячейка которой соответствует элементу изображения, а число в ячейке – яркости этого элемента. При этом носитель изображения сохраняет два измерения (строки и столбцы таблицы). Вообще для записи исходного изображения, состоящего из n дискретных элементов, каждый из которых может принимать любую из m градаций, требуется накопитель, который может переводиться в mn различных состояний по числу возможных m-градационных изображений из n элементов. Величина информационной ёмкости, требующейся для представления изображений, зависит от их статистики (от распределения вероятностей, с которыми встречаются те или иные элементы). В обычно встречающихся изображениях между элементами имеются сильные статические связи. Особенно значительны статические связи между соседними элементами. Как правило, весьма велика вероятность того, что яркости двух соседних элементов равны с точностью до одной градации или мало отличаются друг от друга. То есть информация, содержащаяся в сообщении о яркости данного элемента, заметно уменьшается, если уже была известна яркость предшествующего элемента. Появляется возможность соответственно уменьшить информационную ёмкость, требующуюся для записи изображений. Реальная статистическая избыточность изображений определяется вероятностными взаимосвязями, корреляцией между элементами. Статистическое кодирование должно начинаться с устранения или хотя бы частичного уменьшения этих взаимосвязей (с декорреляции изображений). Имеется два основных метода декорреляции, которые могут быть применены в случае статистического кодирования изображений: метод укрупнения и метод предсказания. Метод укрупнения состоит в том, что перед кодированием элементы изображения собирают в группы. Элементы изображения (исходные символы) могут быть равновероятны, но группы, составленные из них, имеют существенно различающиеся вероятности. Однако, как следует из данных статистики изображений, при малом числе элементов в группе такой метод декорреляции недостаточно эффективен, так как при группировке остаются значительные статистические связи между элементами соседних групп. Статистические связи между группами перестают играть существенную роль только при порядка нескольких десятков и даже сотен. Но при этом значительно возрастают технические трудности декорреляции. Можно предположить, что такой метод декорреляции существует на высоких уровнях зрительной системы и связан с механизмами восприятия зрительных образов. При декорреляции методом предсказания используют условные (переходные) вероятности. Зная группу предшествующих элементов, предполагают, что следующий элемент (или группа следующих элементов) будет иметь наиболее вероятное значение в этой ситуации. Получение разностных изображений является частным случаем более общего метода линейного предсказания, представляющего собой линейную экстраполяцию случайной последовательности по определённой совокупности её предшествующих элементов. Зрительная система откликается только на изменения освещённости. Если на сетчатку глаза человека проектировать неподвижное изображение, то оно вскоре перестанет различаться. Вследствие явления адаптации глаза человек не мог бы видеть неподвижных объектов, если бы не существовал дезадаптационный процесс – мелкие колебательные движения глаза. Эти движения происходят всё время, даже когда наблюдатель стремится как можно более тщательно фиксировать взор на неподвижном объекте малых размеров. Одним из примеров проявления физиологического контраста служит то, что серый предмет на черном фоне кажется более светлым, чем такой же предмет на белом фоне. Это пример так называемого одновременного контраста. Известно также и явление последовательного контраста – подчёркивание различия яркостей, сменяющих друг друга во времени. Изображение с несколькими подчёркнутыми контурами кажется более контрастным, даже если эти контуры выделены лишь в одном направлении. Значение контуров в процессе восприятия изображений объясняется тем, что контур несёт основную информацию об объекте. Именно на контурных элементах возникает ошибка предсказания. Контурный элемент менее вероятен, поэтому с ним связан большой прирост информации. Усиление контуров позволяет надёжнее выделить большую часть информации из шумов. Знание контуров зачастую оказывается достаточным для узнавания зрительных образов. Частично статистические согласование изображений и каналов, передающих информацию в высшие отделы зрительного анализатора, по-видимому, выполняется движениями глаз, всегда сопутствующими зрительному восприятию. В процессе рассматривания крупных объектов глаз совершает саккадические (скачкообразные) движения от одной точки фиксации к другой. Угловая скорость движения глаз во время этих скачков очень велика и достигает 4000 в секунду. Благодаря этому на перемещение затрачивается в среднем лишь около 3% всего времени рассматривания, а остальные 97% взор фиксирован (если пренебречь мелкими движениями глаз). Длительность фиксационных пауз в основном лежит в диапазоне 0,2-0,5 секунды. Во время скачка глаз ничего не видит. Отсутствие зрительного восприятия во время скачков полезно. так как исключается эффект смазывания изображений. На выработку сигналов, управляющих движениями глаз, влияет не только положение контуров и мелких деталей, но и положение групп таких элементов, составляющих зрительные образы. Благодаря соответствующему неравномерному распределению точек фиксации поток информации, поступающий в зрительную систему, становится более равномерным, чем если бы точки фиксации были однородно распределены по всему рассматриваемому изображению. Такое выравнивание потока информации как раз и составляет задачу статистического согласования. Основной поток информации поступает через небольшой центральный участок сетчатки, а периферия сетчатки служит в первую очередь для обнаружения объектов и наведения. Процесс смены точек фиксации при рассматривании изображений напоминает способ экономной передачи телевизионных изображений путём развёртки с переменной скоростью. Сигналы ганглиозных клеток представляют собой серии импульсов с одинаковой амплитудой. Принято считать, что частота импульсации пропорциональна логарифму освещённости сетчатки. Так как воспринимаемая яркость также пропорциональна логарифму освещённости сетчатки, то делают вывод, что на уровне сетчатки воспринимаемая яркость закодирована частотой импульсации. В действительности логарифмическая зависимость между освещённостью и частотой импульсации точно не соблюдается. Можно предположить. что для кодирования информации в рецептивном поле существенна не частота. а число импульсов в посылке. Кодирование в нейроне не является цифровым, то есть импульсы здесь не имеют значения цифр двоичной системы счисления. Кодирование числом импульсов менее экономно, чем цифровое, но имеет преимущество большей надёжности при передаче по каналу с шумами. В телевизионной системе передача всех элементов кадра приводит к тому, что приходится строить канал связи, пропускная способность которого во много раз больше того, что требуется, если оценить количество действительно передаваемой информации. Задача зрительного анализатора гораздо сложнее. Простой перенос изображения здесь является второстепенной задачей, а главное состоит в том, чтобы извлечь информацию из изображения, осуществив ту серию выборов, на основании которых мозг может принять то или иное решение, выработать ту или иную команду. Другая важная задача состоит в сохранении части информации, полученной из изображений. Для решения этих задач информация должна быть экономно представлена в форме, удобной для передачи и хранения, то есть эффективно закодирована. Простое поэлементное кодирование не решает задачи, так как не позволяет выявить существенные свойства объекта. Эффективное кодирование может быть получено, если представить декоррелированное изображение, указав только положение новых значений и их величину. Само морфологическое строение зрительного анализатора предполагает возможность применения координатно-кодового принципа представления изображений. Нервная система организована по принципу перекрывающихся секторов. Каждая клетка предыдущего "этажа" связана с большим количеством клеток следующего"этажа". В то же время каждая последующая клетка связана с большим числом нижележащих клеток. Тогда как в клетках сетчатки в ответ на мелькающий свет возникают синхронные группы импульсов, в клетках коленчатого тела ответ такого типа почти не удавалось обнаружить, то есть уже на уровне коленчатого тела происходит переход к собственно статистическому кодированию. На основании того, что известно о рецептивных полях в настоящее время, можно считать, что существуют рецептивные поля двух типов. К первому относятся рецептивные поля на уровне сетчатки. Они выделяют сигнал из шума методом накопления и производят первичную декорреляцию изображений методом предсказания и поэлементного кодирования. Ко второму типу относятся рецептивные поля, выполняющие более сложные функции обнаружения и кодирования простейших конфигураций – элементов зрительных образов. Рецептивные поля второго типа кодируют наиболее часто встречающиеся простейшие конфигурации не поэлементно, а в целом, производят декорреляцию укрупнением и, следовательно, способствуют кодированию зрительных образов. Наиболее важной общей характеристикой системы связи, определяющей количество информации, которое она в состоянии передать за единицу времени, является пропускная способность. Пропускной способностью канала с шумами называется максимальное значение скорости передачи сообщений: Это максимальное значение соответствует случаю наилучшего согласования канала, по которому передаётся сообщение, и источника сообщений. Зрительная система имеет дискретную структуру и использует дискретные двоичные коды, что значительно повышает помехоустойчивость. Функциональная организация зрительной системы хорошо приспособлена к статическим свойствам изображений. Зрительная система по своим свойствам близка к тому, что в теории информации определяют как "идеальную" систему связи. В зрительной системе элементы изображения передаются как последовательно, так и одновременно. Можно предположить, что число степеней свободы зрительной системы в целом пропорционально разрешающей способности зрения. Разрешающая способность зрения обратно пропорциональна минимальному углу, при котором ещё возможно разрешение двух соседних объектов. Следовательно, она определяется эффективным размером рецептивного поля в данных условиях наблюдения. Параметры зрительного канала не остаются неизменными в естественных условиях работы глаза. Фоторецепторы сетчатки имеют различную чувствительность. Увеличение освещённости приводит к увеличению числа действующих рецепторов, следовательно, и к возрастанию остроты зрения. Изолированно рассматриваемая сетчатка действительно может пропустить большой поток информации. Однако получателем сообщений являются высшие отделы зрительного анализатора. Именно эти отделы производят выбор из потока сообщений, поступающих из нижних этажей анализатора. Кроме того, надо иметь в виду, что сообщения в нижних отделах зрительного анализатора характеризуются значительной статистической избыточностью и по мере того как производится статистическое кодирование для передачи в вышележащие этажи анализатора, эти сообщения представляются во всё более и более экономной форме. "Число нейронных каналов, участвующих в передаче зрительной информации, с каждым шагом уменьшается, причём информация становится на один шаг ближе к той форме, в которой она используется и хранится в памяти" (Wiener, 1948).
Число одновременно воспринимаемых предметов за краткий промежуток времени (не более времени критической длительности) обычно имеет порядок семи ["магическое число 7±2", по Миллеру (Miller,1956)].
В высших отделах зрительного анализатора производится кодирование больших совокупностей статистически связанных элементов в форме зрительных образов. Изображение, занимающее поле зрения, может быть описано совокупностью более или менее сложных образов. Весь мыслимый набор образов, имеющийся у данного индивидуума, составляет его "алфавит". Этот полный алфавит, по-видимому, следует разбить на ряд частных алфавитов, находящихся между собой в сложных соотношениях "иерархической соподчинённости". Алфавиты, в которые входят более простые, "элементарные" образы, используются для построения более сложных алфавитов. эти "элементарные" образы естественно связать с кодированием простейших конфигураций в корковых рецептивных полях, а также с механизмами для кодирования простых образов. Полная система образов, "алфавит" зрительного анализатора. не является врождённой, а приобретается в жизненном опыте. Согласно первой гипотезе Сазерленда (Sutherland, 1957), клетки зрительных долей, получающие возбуждения от рецепторов глаза, организованы в виде матрицы. Каждая строка (столбец) матрицы имеет общую клетку, которая суммирует возбуждения, поступающие с клеток строки (столбца). Таким образом, вертикальные размеры объектов в поле зрения представлены возбуждениями в суммирующих клетках столбцов, горизонтальны – в суммирующих клетках строк. Форма объекта характеризуется по горизонтальному и вертикальному направлениям распределением возбуждений. При сопоставлении этих возбуждений с помощью какого-то механизма возникает кодовая комбинация, свойственная данному объекту. Поскольку учитывается отношение возбуждений, кодовые значения не изменяются при изменении угловых размеров объектов. Они инвариантны также относительно положения объектов в поле зрения. В связи с тем, что эта гипотеза не могла объяснить некоторых экспериментальных данных Сазерленд (Sutherland, 1960) предложил ещё одну схему, в которой учитываются отношения "горизонтальных" и "вертикальных" возбуждений к квадратному корню из площади объекта, а также допускается существование механизма для сравнения общего контура предмета с квадратным корнем из его площади. Гипотеза Сазерленда подчёркивает важность горизонтального и вертикального направлений для различения. Это находится в соответствии с морфологическими данными.
|