Я бы хотел начать разговор с того, чтобы напомнить факт, хорошо известный психологам: наше восприятие очень серьезно ограничено двумя вещами. Во-первых, зрительное поле, просто в силу анатомии сетчатки, анатомии вообще зрительного анализатора, имеет очень узкую центральную часть, где мы можем хорошо различать детали, а все остальное — это периферия, где способность к различению очень сильно падает, падает пространственное разрешение. Второе серьезное ограничение заключается в том, что ограничено наше внимание, наша система зрительной и рабочей памяти, в каждый момент времени мы можем в деталях различать и опознавать не больше чем 3–4 объекта.

Откуда берется кажущаяся полнота окружающего мира? Одна из наиболее перспективных современных теорий, которая отвечает на этот вопрос, утверждает, что вместо того, чтобы собирать детальную информацию обо всех объектах сразу, наша зрительная система пытается очень грубо и в очень приблизительной и усредненной форме анализировать то, что доступно. А что нам доступно — это информация о линиях, информация о распределении яркости, о распределении цвета, та информация, которую более или менее различает наша сетчатка на периферии. Оказывается, этой информации может быть вполне достаточно, для того чтобы зрительная система могла каким-то образом восстановить, реконструировать картину окружающей реальности, достаточную для того, чтобы нам казалось, что мы видим весь мир в деталях.

Как она это делает? Теория, о которой я рассказываю, считает, что наша зрительная система способна на какие-то вычисления, которые очень напоминают статистику. Причем разделяют обычно две разновидности такой статистики. Первый вид называют просто статистикой образа, по-английски image summary statistics, то есть это анализ того, о чем я уже сказал: это линии, углы, кривизна этих линий, пространственные частоты (то есть как много элементов помещается в единицу видимой площади), яркость, цвета. Оказывается, этого достаточно для того, чтобы, не распознавая объектов, получить очень хорошее, хотя и грубое, представление о том, что мы вообще видим. Этого достаточно для того, чтобы, например, сказать, увидели ли мы морское побережье или спальню, увидели ли мы автомобиль или какое-то животное. Без анализа объектных признаков, требующего детального анализа и большого количества времени, зрительная система может судить на основе таких статистик, которые я упомянул, о том, что перед нами. На это требуется одна пятидесятая доля секунды, как было измерено в экспериментах, и никакая система распознавания объектов на это не способна. Это какой-то более грубый уровень, и предполагается, что это уровень статистик.

Рекомендуем по этой теме:
18595
Механизмы восприятия

Вторая разновидность таких статистик — это так называемая статистика ансамблей, которая отличается от статистики образа тем, что здесь зрительная система работает не с сырыми элементами образа, а, скорее, с элементами на каком-то более высоком уровне, которые уже каким-то образом распознаны как что-то похожее на объекты. Определены какие-то их границы, и, соответственно, для каждого такого образования можно отдельно вычислить его размер, цвет, пространственную ориентацию по множеству базовых признаков, и по каждому из этих признаков зрительная система считает какую-то сводную статистику.

Один из наиболее ярких экспериментов (хотя и не первый), в котором это было показано, был проведен Дэном Ариэли, известным психологом — правда, он больше известен как исследователь нерационального мышления. В этом эксперименте он поступал как настоящий психофизик, психолог восприятия: он показывал своим испытуемым на короткое время наборы из кругов разных диаметров, варьировал количество этих кругов, а затем просил их ответить на вопрос. Он показывал один-единственный тестовый круг и просил их ответить на вопрос: «Этот круг больше, чем средний круг в этом наборе, или меньше, чем средний круг в этом наборе?» И оказывалось, что испытуемые довольно точно определяют, насколько этот круг больше или меньше. Когда Ариэли повторил эту же манипуляцию, но вместо вопроса о среднем он задавал вопрос: «Присутствовал ли в этом наборе круг такого же размера, что и тестовый?», оказалось, что здесь испытуемые просто угадывают, то есть они не способны точно определить размер кругов.

Оказывается, что среднее мы при коротком взгляде определяем легко и хорошо, точность не зависит от количества объектов, а про каждый конкретный объект мы практически ничего сказать не можем, потому что для этого нам понадобится направить внимание на каждый круг в отдельности и это потребует много времени и малоэффективно. Мы, скорее всего, даже забудем о том, был такой круг или его не было, даже если у нас будет достаточно времени. Этот факт, что, с одной стороны, очень легко определяем среднее, с другой стороны, очень мало знаем об отдельных его представителях, и лег в основу теории статистической репрезентации ансамблей.

Целесообразность системы статистической репрезентации ансамблей заключается в том, что наша система внимания, наша рабочая память довольно сильно ограничены и мы не можем хранить много параметров одномоментно. Гораздо удобнее суммировать множественные грубые наблюдения, свести их в какое-то одно число, например среднее. К среднему можно приложить стандарт отклонения, который будет характеризовать, насколько параметры отклоняются от этого среднего, можно грубо определить количество и с помощью этого нехитрого набора параметров описать сразу большое множество объектов. Это очень удобно, это экономит много ресурсов нашей рабочей памяти, и, более того, по законам обычной статистики оказывается, что это среднее будет очень точной характеристикой всех объектов сразу, особенно учитывая, что в условиях невозможности бесконечного распределения внимания каждый отдельный параметр будет репрезентирован с очень большой ошибкой, причем эти ошибки будут несистематичные, поэтому при усреднении они дадут более точную оценку, чем каждый параметр в отдельности.

Рекомендуем по этой теме:
10223
Предвнимание и внимание

Дальнейшие исследования показали, что, действительно, наша зрительная система, когда производит эти вычисления, оперирует наподобие какого-то статистического калькулятора, поскольку повторяются очень многие законы нормальной статистики. Например, чем больше объектов мы даем, тем точнее, как ни странно, может оказаться оценка среднего, а сами суждения будут выноситься быстрее. Этот закон в статистике известен: ошибка в оценке среднего уменьшается при увеличении количества наблюдений — ровно так ведет себя зрительная система. Или, допустим, когда мы оцениваем среднее в каком-то распределении, мы используем определенные правила, для того чтобы оценки, которые очень сильно отклоняются от распределения, — так называемые статистические выбросы — никак не влияли на оценку среднего, и наша зрительная система тоже умеет это делать, она эти выбросы не учитывает в оценках.

В последнее время мы, в том числе я и мои коллеги в лаборатории, пытаемся думать о том, как эти статистические репрезентации могут быть использованы в каких-то других, более сложных задачах. В частности, представьте ситуацию, что вы подходите к кусту с ягодами и вам нужно сходу определить, стоит ли этот куст вашего внимания: может быть, ягоды на нем в основном неспелые, и вам лучше сразу перейти к другому кусту. Как это можно сделать? С точки зрения статистической репрезентации вы, например, можете оценить среднюю красноту ягод, но проблема заключается в том, что ягоды перемешаны с листьями, а листья обычно зеленые. Если делать общую статистическую репрезентацию, ягоды и листья попадут в одно распределение, потому за счет многочисленных зеленых листьев у вас оценка среднего оттенка очень сильно сместится в сторону зеленого, вы не сможете произвести адекватную оценку красноты ягод.

По всей видимости, зрительная система каким-то образом умеет категоризировать перемешанные группы объектов: это множество — ягоды, это множество — листья, и давайте мы будем делать отдельно оценки для ягод, отдельно — для листьев. И, по всей видимости, этот механизм тоже может быть основан на каких-то более сложных статистических процедурах. Например, зрительная система может анализировать распределение на предмет того, сколько в нем каких-то отдельных пиков. Если у вас есть только один пик где-то между красным и зеленым, то, возможно, все это один и тот же тип объектов, просто в какой-то большой вариации. Например, осенью листья есть зеленые, есть красные, есть какие-то оттенки между ними. Другая ситуация: у вас может быть пик с зеленой стороны, пик с красной стороны, между ними ничего особенно нет, и это для зрительной системы служит хорошим сигналом для того, чтобы считать, что каждый пик репрезентирует отдельный тип объектов. Тогда, значит, можно анализировать каждый из них в отдельности, и за счет этого такая категориальность.

Рекомендуем по этой теме:
10408
Как мы воспринимаем цвета?

В последние годы ведется довольно большое количество исследований, посвященных связи этой способности к статистической репрезентации в зрительной системе с какими-то более сложными когнитивными задачами, например со способностью к пониманию какой-то визуализированной статистической информации — графиков, диаграмм. Или еще более интересные исследования о том, как способность к мгновенному схватыванию количества объектов — так называемое чувство числа — связана с обычными математическими способностями. Очень интересные провокационные исследования. Похоже, эта тема только набирает обороты.