Онлайн книга Айтрекинг в психологической науке и практике. Раздел I. Методы и технологии регистрации окуломоторной активности человека ( Коллектив авторов, 2015)

Айтрекинг в психологической науке и практике ( Коллектив авторов, 2015)

Раздел I

Методы и технологии регистрации окуломоторной активности человека

Окуломоторная активность человека как предмет и метод психологического исследования[1]

В. А. Барабанщиков

Окуломоторная активность является необходимым компонентом психических процессов, связанных с получением, преобразованием и использованием зрительной информации, а также состояний, деятельности и общения человека. Поэтому, регистрируя и анализируя движения глаз, исследователь получает доступ к скрытым (внутренним) формам активности, которые обычно протекают в свернутой форме, исключительно быстро и неосознанно. Как показывают исследования, по характеру движений глаз можно определить:

– направленность взора и динамику оперативного поля зрения воспринимающего;

– стратегии прослеживания движущихся объектов и маршруты сканирования воспринимаемых сцен;

– информационную сложность объекта и точность фиксации его элементов;

– зоны поиска и «проигрывания» вариантов решения наглядно-действенных задач;

– структурные единицы деятельности и уровень сформированности познавательных действий;

– состояния сознания;

– уровень развития зрительных функций на разных стадиях онтогенеза;

– эффективность решения оперативных задач и/или исполнения отдельных этапов практической деятельности;

– деструкции познавательных процессов человека и др.

В отличие от самоотчета или внешнего наблюдения за движениями глаз, окулография – регистрация окуломоторной активности – дает не только непрерывную, достоверную, детализированную, но и качественно иную информацию об изучаемых явлениях. Это один из наиболее чувствительных индикаторов динамики познавательных процессов, функциональных состояний и форм взаимодействия человека с окружающим миром.

Несмотря на кажущуюся простоту и однозначность, связь психических явлений с окуломоторной активностью является исключительно сложной, многократно опосредствованной и изменчивой. Ее содержание составляет самостоятельную проблему исследования, которая выступает как комплексная, объединяющая представителей разных специальностей (психологов, физиологов, инженеров, программистов, оптиков, медиков и искусствоведов), а ее разработка поддерживается не только потребностями фундаментального знания, но и запросами практики: эргономики, офтальмологии, психиатрии, радиологии, инженерной психологии, маркетинга, рекламы и др. По своему научно-практическому потенциалу это «точка роста» нового знания и исследовательских технологий.

Современное состояние проблемы характеризуется многообразием изучаемых явлений (их сторон, планов, измерений) и неравномерностью их проработки. Большое внимание уделяется анализу движений глаз в процессах поиска, обнаружения, опознания и прослеживания значимого элемента среды, рассматривания сюжетных изображений, выполнения сложных зрительных и интеллектуальных задач. Наиболее частым предметом исследования оказываются макросаккады и дрейф либо прослеживающие движения – они исследованы достаточно полно; хуже изучены тремор, вергентные и торзионные движения. В качестве контролируемых параметров обычно выступают относительная позиция глаза в орбите, последовательность (маршруты) и продолжительность зрительных фиксаций; амплитуда, частота и латентный период саккад; векторная скорость и амплитуда дрейфа и плавных прослеживаний; частота, амплитуда и направление различных форм нистагма, причем в каждом отдельном исследовании оценивается не более двух-трех параметров. Многомерное, или «объемное», описание окуломоторной активности, включающее все или большинство видов движений глаз, остается недостижимой мечтой. Наконец, фрагментарен контингент испытуемых, который составляют нормальные взрослые (в основном от 18 до 60 лет), дети (от двухнедельного возраста), а также больные с нарушением окуломоторной активности различного анамнеза.

Функциональная организация окуломоторной активности несет отпечаток многообразия ее связей и отношений и в зависимости от контекста исследования становится индикатором разных аспектов психических процессов, состояний, деятельности либо общения. В плане субъект-объектного взаимодействия, например, стратегия и тактика решения наглядно-действенных задач, выработка или восстановление перцептивного навыка; в плане внутренних условий – структура взаимодействия мотивационного, диспозиционного, когнитивного и исполнительного компонентов познавательного процесса; в плане зрительного образа – динамика стадий и фаз его осуществления. Соответственно, эффективность метода регистрации движений глаз как индикатора психических явлений зависит от того, насколько полно в конкретном исследовании учитывается вся совокупность их связей и опосредствовании.

Окуломоторные структуры

Длительное время окуломоторная активность изучалась поэлементно, на уровне отдельно взятых движений (саккад, плавных прослеживаний и т. п.). Каждое движение рассматривалось как ответ на простейший стимул (локализацию точечного элемента в зрительном поле, его перемещение относительно наблюдателя и т. п.), связывалось с наличием самостоятельного исполнительного механизма и непосредственно соотносилось с процессами познания, прежде всего зрительного восприятия, внимания и деятельности. Предполагалось, что знание закономерностей элементарных движений глаз достаточно для интерпретации сложных или составных форм окуломоторной активности.

На первых порах подобные представления оправдывались, стимулируя быстрое накопление эмпирических знаний. За сравнительно короткий срок были описаны простейшие виды окуломоторной активности и их детерминанты (Ярбус, 1965; Леушина, 1971; Alpern, 1972; Ditchburn, 1973), высказаны гипотезы о механизмах регуляции элементарных движений глаз (Шахнович, 1965; Robinson, 1964,1965), исследовано развитие окуломоторики в фило- и онтогенезе (Гатев, 1973; Walls, 1962), получены важные сведения о характере движений глаз в процессах поиска, обнаружения, опознания и оценки объектов (Леушина, 1966; Зинченко, 1967; Гиппенрейтер, 1978); выявлен ряд окуломоторных феноменов зрительного восприятия (Festinger, Canon, 1965; Festinger, Easton, 1974), прослежены связи элементарных движений глаз с перемещениями головы, рук, локомоциями (Bizzi, 1974; Ebenholtz, Shebilske, 1975; Gauthier, Hofferer, 1976) и др.

Co временем темпы разработки проблемы замедлились, обнажив ограниченность используемых представлений там, где основным предметом исследования оказывается конкретный познавательный процесс, деятельность либо общение человека. Принимаемые допущения выглядят здесь излишне упрощенными и порой неадекватными. Так, нередко малоамплитудный дрейф отождествляется с устойчивой фиксацией, обеспечивающей съем полезной зрительной информации, а саккада – с поворотом глаз, меняющим предмет восприятия. «Спроецировав» окулограмму на поверхность воспринимаемого объекта (напр., приборную панель или текстовый материал), казалось бы, без труда можно определить, что выделяет наблюдатель (что его интересует), в течение какого времени и в какой последовательности. Однако результат подобного анализа далеко не всегда соответствует действительности.

Фиксационный поворот глаз может состоять не из одной, а из нескольких макросаккад, число которых зависит от локализации предмета восприятия (Гуревич, 1971). Возможно появление экспресс-саккады, которая не связана с глубокими (предметно-смысловыми) слоями переработки зрительной информации (Fischer, 1987). Наряду с обслуживанием когнитивных функций, саккады способны корректировать направление глаз, достигнутое в результате предшествующей фиксации (Becker, Jurgens, 1979), возвращать его в позицию покоя (Bender, 1955), «дробить» непрерывный поток зрительных афферентаций на отдельные порции (Филин, 1975) и т. п. Наконец, как макро-, так и микродвижения глаз поддаются произвольному контролю и могут не только инициироваться, но и подавляться наблюдателем (Steinman, 1976). Не меньше вопросов порождает и малоамплитудный дрейфа, который сам по себе не указывает на действительный предмет восприятия. В силу многоканальности зрительного «входа», обеспечивающего симультанное отображение элементов среды разных угловых размеров в различных частях зрительного поля, направленность взора чаще всего оказывается многозначной, а ее отношение к потенциальным предметам восприятия требует дополнительных подтверждений.

Альтернативный путь разработки проблемы связан с изучением целостных окуломоторных образований (структур), выражающих более высокий уровень организации движений глаз. Влияние этого уровня (он исследован в значительно меньшей степени) обнаруживается, например, в программировании паттернов сканирования (Zingale, Kowler, 1985), которые не сводятся к сумме отдельных дрейфов и саккад; каждое из выполняемых движений может быть понято лишь в рамках всего паттерна в целом. Не случайно, несмотря на большой разброс отдельных значений, суммарная длительность фиксаций, сопровождающих чтение слов, остается примерно одинаковой (O'Regan, 1986). В отличие от элементарных движений глаз окуломоторные структуры содержательно включены в процесс зрительного восприятия и имеют собственные закономерности организации (Барабанщиков, 1997; Stark, Ellis, 1981).

В рамках данного подхода окуломоторный акт выражает не просто ответ на проксимальный стимул. Это активность субъекта восприятия, которая направляется как прошлым и настоящим, так и будущим: определенными намерениями, целями, планами или программами. За направленностью взора скрывается уникальная позиция наблюдателя, благодаря которой целенаправленный поворот оказывается столь же пристрастным, сколь пристрастно самое чувственное восприятие действительности. Через отношение к субъекту глазодвигательная активность становится предметом психологического исследования, а ее регистрация – методом изучения психических процессов, состояний, деятельности и общения людей. Отмечаемые в литературе функции движений глаз, такие как гностическая, исполнительная, измерительная, контролирующая и др. (Запорожец и др., 1967; Зинченко, Вергилес, 1969), являются характеристиками субъекта восприятия (содержанием того, что он делает в данный отрезок времени), перенесенными на средства его взаимодействия с объектом; с точки зрения механизма выполнения окуломоторного акта они, конечно, искусственны (Андреева и др., 1975; Гиппенрейтер, 1978).

Методический смысл отнесенности движений глаз к субъекту восприятия состоит в возможности расчленять поток окуломоторной активности на целостные, относительно самостоятельные единицы и внутренне сопоставлять их с динамикой познавательных процессов, состояний человека, форм его деятельности и общения. Через отнесенность к субъекту раскрывается механизм произвольного контроля движений глаз и управления взором наблюдателя, а также индивидуально-психологическая стилистика познавательных процессов.

Окуломоторное целое (структура) обеспечивается интеграцией (прилаженностью друг к другу) эфферентных и афферентных процессов, развертывающихся в центральной нервной системе. Хотя двигательная цель или намерение реализуются в виде последовательности окуломоторных команд, сами по себе они недостаточны: слишком разнообразен и непредсказуем расклад сил, действующих на глазное яблоко. Решающая роль в построении окуломоторного акта принадлежит обратной афферентации (зрительной, проприоцептивной, вестибулярной), которая информирует заинтересованные инстанции ЦНС об эффективности выполняемых движений: отношение прогнозируемой и актуальной направленности глаз. За тем или иным окуломоторным феноменом всегда стоят особенности управления, или способ функционирования глазодвигательной системы.

Информационное содержание афферентации, задействованных в осуществлении окуломоторных структур, весьма разнообразно. Оно включает совокупность пространственно-временных характеристик среды, текущее положение глаз в глазнице, наклоны головы, положение или перемещение наблюдателя и многое другое. Нетрудно допустить, что афферентные потоки, организующие окуломоторную активность и питающие зрительные впечатления, в значительной степени совпадают или, по крайней мере, тесно взаимосвязаны. Есть основания полагать, что информация о пространственно-временных отношениях среды, заключенная в двигательных командах, входит в содержание зрительного образа (Festinger, Canon, 1965; Coren, 1986). Влияние на зрительный процесс проприоцепции экстраокулярных мышц не раз демонстрировалось экспериментально (Shebilske, 1978; Steinbach, 1987). Однако до сих пор и вопросы о роли движений глаз в зрительном восприятии (познавательных процессах вообще), и о перцептивной (когнитивной) регуляции самих движений остаются открытыми. В конечном счете они упираются в знание принципов зрительно-окуломоторной интеграции, которые пока сформулированы в самом общем виде.

Наконец, целенаправленная окуломоторная активность открывается исследователю как конфигурация (паттерн), образованная на основе элементарных генетически заданных движений – саккад и дрейфов. Типичными примерами могут служить оптокинетический нистагм (Курашвили, Бабияк, 1975), п-образные движения во время фиксации точечного источника света (Карпов и др., 1982), синусоидальные колебания глаз у пациентов с локальными нарушениями центральной нервной системы (Dell'Osso et al., 1974), регулярные паттерны движений глаз, сопровождающие процессы чтения и рассматривания сложных изображений (Ярбус, 1965; Нотон, Старк, 1974; Rayner, 1992, 1998). Несмотря на широкую вариативность двигательных элементов (изменения амплитуды, направления, латентного периода саккад, скорости, ускорения, амплитуды и направления дрейфа или прослеживающих движений), характер их отношений остается неизменным, а окуломоторное целое несводимо к сумме своих частей.

Способы включения глазодвигательной активности в процесс взаимодействия наблюдателя (субъекта восприятия) со средой (объектом), механизмы зрительно-окуломоторной интеграции, которая складывается для выполнения конкретной зрительной или двигательной задачи, и соответствующая ей устойчивая конфигурация (паттерн) собственно движений глаз характеризуют разные уровни организации и функционирования окуломоторных структур, без анализа которых окулография сама по себе оказывается малоэффективной.

Типичным примером и репрезентативной моделью окуломоторных структур восприятия является целенаправленный фиксационный поворот глаз (Барабанщиков, 1997, 2002). Нередко, особенно в психологических работах, фиксационный поворот рассматривают абстрактно – как двигательный автоматизм, характеристики которого определяются особенностями воспринимаемого объекта. В действительности же он формируется в ходе онтогенеза, имеет собственную организацию и подчиняется не только внешним, сколько внутренним детерминантам, к которым относятся прогнозирование конечного и/или промежуточного результата, способ управления движениями глаз, ведущий уровень, на котором они строятся, сопряженность окуломоторики с другими двигательными актами и т. п. Действие внешних детерминант фиксационного поворота глаз опосредствовано констелляцией его внутренних условий. Без их учета анализ окулограмм оказывается неполным или недостаточно корректным. Чаще всего именно внутренние условия являются источником дисперсии амплитуды саккад, нелинейности и ограниченности влияния внешних детерминант, продолжительности и амплитуды дрейфов, состава поворотов глаз и др. Согласно исследованиям, фиксационный поворот глаз представляет собой целостный поведенческий акт, реализующий познавательное либо коммуникативное отношение индивида к среде. Его результатом становится новое, относительно устойчивое направление взора, которое обеспечивает оптимальные условия восприятия значимого элемента или отношения среды. Этому направлению соответствует локализация (или тенденция локализации) проекции объекта в центральной области сетчатки. Визуальная данность субъекту значимых свойств действительности оказывается здесь и побуждением, и полезным эффектом движения, и условием его завершения. Как и любой поведенческий акт, фиксационный поворот имеет сложную архитектуру, которая неплохо описывается в понятиях теории функциональных систем (Барабанщиков, 1997; 2002).

В рамках психологического исследования вертикальная организация целенаправленных движений глаз может быть представлена в виде иерархии окуломоторных событий трех уровней.

Уровень интенции и произвольного контроля движений выражает отнесенность окуломоторной активности к субъекту восприятия (наблюдателю). Здесь складываются намерение и «первичный проект» движений, «сформулированные» на языке зрительно данных предметных отношений действительности: куда смотреть, на что обратить внимание, что контролировать, в какой последовательности, как долго и т. п. «Первичный проект» непосредственно увязан со схемой ситуации и планом выполняемого наблюдателем действия и соотносится с системой координат внешнего пространства (среды). На этом уровне ставятся или принимаются зрительные (окуломоторные) задачи и осуществляется произвольный контроль за их исполнением.

На уровне механизмов организации движений «первичный проект» переводится в цепочки исполнительных команд и критерии адекватности их выполнения. События этого уровня описываются на языке информационных потоков, или эфферентно-афферентных процессов в глазодвигательной системе (ГДС), соотнесенных с ретинальной и окуломоторной системами координат. Здесь учитываются либо устанавливаются взаимосвязи окуломоторики с другими двигательными актами (поворотами головы, локомоциями и т. п.).

Уровень феноменов движений характеризует способ выполнения поворота глаз. Здесь доминирует язык моторных единиц, сокращений и растяжений экстраокулярных мышц, развертывается действие активных и реактивных сил, влияющих на глазное яблоко и т. п. Выполняемые движения соотносимы как с внешней, так и с ретинальной (окуломоторной) системами координат.

Хотя содержание, функции и язык событий каждого из уровней существенно отличаются друг от друга, они подчинены выполнению общей задачи и выступают как одно целое.

Целостный взгляд на природу окуломоторной активности

Накопленные наукой эмпирические данные (Андреева, Вергилес, Ломов, 1975; Барабанщиков, 1990, 1997, 2002, 2011, 2012, 2015; Барабанщиков, Белопольский, Вергилес, 1980; Барабанщиков, Белопольский, 2008; Барабанщиков, Жегалло, 2013, 2014; Барабанщиков, Жердев, 2014; Белопольский, 2007; Владимиров, Хомская, 1981; Гиппенрейтер, 1978; Гуревич, 1971; Зинченко, Вергилес, 1969; Моторные компоненты зрения, 1975; Филин, 2002; Ярбус, 1965; Bachy-Rita, Collins, 1971; Bizzi, 1974; Ditchburn, 1973; Duchowski, 2003; Engbert, 2006; Findlay, Gilhrist, 2005; Fisher, Monty, Senders, 1981; Gale, Johnson, 1984; Groner, Menz, Fisher, Monty, 1983, Holmqvistet al., 2011; Monty, Senders, 1976; Rayner, 1992; van Gopel, Fisher, Murray, Hill, 2007; Underwood, 1998; Wong, 2008) позволяют наметить целостное представление о природе окуломоторной активности человека в процессах познания, деятельности и общения.

Прежде всего, необходимо отметить тот факт, что в рамках психологического анализа движения глаз соотносятся с человеком как субъектом жизни и включены в систему его взаимосвязей с миром. Уже это свидетельствует о многомерности и иерархической организации окуломоторной активности. Одна и та же направленность взора может указывать одновременно на 1) содержание (предмет) восприятия; 2) способ выполнения решаемой задачи; 3) область интереса наблюдателя; 4) его состояние; 5) характер выполняемых действий; 6) индивидуально-психологические особенности глазодвигательной системы и др. Для того чтобы разобраться в клубке взаимосвязей, необходимо выделить интересующее измерение либо путем конструирования подходящей ситуации, либо введением дополнительных методических средств, снижающих исходную многозначность.

Иерархическая организация окуломоторной активности означает ее многоуровневость и, следовательно, несводимость к отдельным видам движений (саккадам, дрейфам, прослеживанию и др.) и их характеристикам. При изучении познавательных процессов, деятельности и общения людей единицами анализа становятся окуломоторные структуры – устойчивые конфигурации, или паттерны движений глаз, обладающие, по сравнению с окуломоторными примитивами, новыми свойствами. Они соотносятся как с объектом, так и с субъектом восприятия, что позволяет вводить собственно психологический план анализа и презентирует окуломоторную активность как целостный поведенческий акт. Та или иная направленность взора характеризует не столько ответ организма на события среды, сколько целенаправленное действие наблюдателя, обеспеченное функциональной интеграцией афферентных и эфферентных сигналов в ГДС.

Обращение к окуломоторным структурам предполагает целостный взгляд на природу перцептивного процесса. В центре внимания оказывается не отдельное явление (сторона, аспект, момент) восприятия и не восприятия вообще (абстрактно-всеобщая форма), а конкретное событие жизни человека, реализующее его познавательное отношение к среде. Взаимосвязь субъекта и объекта восприятия выражает единство разных сторон одного и того же целого, имеет собственный онтологический статус, внутренне дифференцирована, развернута в пространстве и времени, включено в цепь других событий. Раскрывая закономерности окуломоторных структур, исследователь получает возможность реконструировать способ организации перцептивного процесса в целом.

С точки зрения системной парадигмы обращение только к идиомам, указывающим на связь движений глаз с процессом зрительного внимания: «Где» (Г. Гельмгольц) и «Что» (У. Джемс), – явно недостаточно. В силу анизотропности сетчатки фиксационные повороты действительно инициируются парафовеально – отдельными областями зрительного поля, имеющими сравнительно низкую различительную чувствительность, а их фовеализация (фиксация предмета) позволяет собирать ясную и отчетливую информацию об интересующем объекте или событии. Но существуют и другие причины, влияющие на окуломоторную активность и определяющие ее характер, в том числе и самую возможность выполнения целенаправленных поворотов глаз и распределения фиксаций.

Важнейшим фактором, обусловливающим характеристики движений глаз, является задача, решаемая наблюдателем. Любая среда, в которой оказывается человек, информационно избыточна. Где, что и как будет воспринято, определяется целью, данной в определенных условиях. Задача, стоящая перед наблюдателем, структурирует наличную ситуацию, вносит значимость (информативность) элементов среды, определяет существенные и несущественные отношения. Направленность движения взора обеспечивают адекватные условия восприятия. Зная, куда направлен взор, как долго, какова траектория (маршрут) движения и т. п., можно реконструировать психологическую структуру ситуации и динамику решения зрительной задачи. Данное обстоятельство, собственно, и является основанием использования окулографии в качестве метода психологического исследования. За каждой устойчивой фиксацией просматриваются меняющиеся установки и отношения субъекта восприятия, его интерес к объекту, величина и длительность когнитивной нагрузки и другие психологические характеристики.

Очевидно, что с изменением цели и условий деятельности человека рисунок окуломоторной активности меняется. При этом меняется не только содержание значимых элементов (где и что воспринимается), но и требования к их восприятию (как воспринимать, насколько точно или дифференцированно). С последним связано понятие функционального поля зрения, величина которого в ходе перцептивного процесса перманентно меняется. В силу многоканальности зрительной системы одной и той же направленности взора может соответствовать и элемент среды, на который он непосредственно ориентирован, и констелляция элементов, входящих в его окружение. Оценка предмета восприятия на основе местоположения точки фиксации перестает быть однозначной и требует использования дополнительных критериев. Вектор направленности взора может входить, а может не входить в границы функционального поля зрения либо находиться на его периферии. В любом случае образуется относительно самостоятельная область направленности глаз, обеспечивающая необходимое восприятие значимых элементов среды, – оперативная зона фиксаций, которая в зависимости от требований задачи легко меняет свою локализацию, форму и величину. Оперативная зона фиксаций комплексных объектов имеет неоднородное строение и включает 1) ядро, или «центр тяжести» – наиболее часто фиксируемые области предмета; 2) область менее интенсивных фоновых фиксаций, ограниченную поверхностью объекта; и 3) область разреженных фиксаций вне поверхности объекта (периферию). Расположение «центра тяжести» часто не совпадает ни с геометрическим центром поверхности объекта, ни с геометрическими центрами его компонентов. Возможно наличие нескольких «центров тяжести» одновременно. Фиксационный «центр тяжести» характеризуется следующими параметрами: локализацией, фронтом (формой) и интенсивностью. Его профиль, наряду с содержанием зрительной задачи, зависит от конфигурации поверхности объекта, его локализации в поле зрения и социокультурных навыков наблюдателя.

Таким образом, проблема соотношения направленности взора и расположения (зрительного направления) предмета восприятия трансформируется в проблему соотношения функционального поля зрения и оперативной зоны фиксации, закономерности которого требуют более внимательного исследования. На сегодняшний день описаны два крайних способа восприятия объекта: симультанный («амбьентный», «глобальный») и сукцессивный («фокальный», «локальный»). Первый обеспечивает общую ориентировку в объекте, когда взор направлен в область его геометрического центра, второй – получение более детальной информации о фрагментах (элементах) объекта, когда направленность взора локализуется в пределах сравнительно узкого участка поля зрения. Нетрудно предположить существование промежуточных, или переходных, способов восприятия, которые расширяют и конкретизируют картину перцептивно-окуломоторных отношений. Добавим, что выполнение человеком не зрительной, а интеллектуальной задачи (решение «в уме») сопровождается длительным дрейфом глаз, не связанным с содержанием и структурой окружающей среды.

При повторных решениях однотипных зрительных задач характер окуломоторной активности также меняется. С укрупнением оперативных единиц восприятия стратегия и тактика решения оптимизируются, а объем движений глаз сводится к минимуму. Благодаря этим тенденциям окулография является эффективным методом изучения и/или контроля за формированием зрительных (когнитивных) действий.

В число важных детерминант окуломоторной активности входят пространственно-временные свойства окружающей среды, локализация предмета в поле зрения, стадия или этап осуществления перцептивного процесса, социокультурный опыт наблюдателя и др.

Текущая позиция взора в значительной степени определяется конфигурацией объекта восприятия и его расположением в поле зрения. Целевые и фоновые стимулы визуально объединяются в фигуры, имеющие собственный «центр тяжести». Воздействие стимулов на параметры саккад асимметрично: чаще всего амплитуда первой саккады меньше расстояния до цели, а фиксационный поворот как целое включает несколько саккад, прерывающихся короткими фиксациями; с увеличением расстояния до цели количество дополнительных саккад возрастает. Субъективно систематическое отклонение взора от предмета восприятия, как и наличие сложных по структуре поворотов глаз, наблюдателями не замечаются. Расположение предмета восприятия в зрительном поле, его значимость для наблюдателя, а также конфигурационный контекст оказывают влияние и на продолжительность латентного периода саккад.

При восприятии контурных фигур точки фиксации располагаются внутри ее границ и могут как совпадать, так и не совпадать с геометрическим центром. Точность выполнения саккады зависит от того, на какой стадии зрительного микропроцесса принимается решение о движении. Локальному выделению целевого стимула предшествует глобальное восприятие объекта и его ближайшего окружения. Чем продолжительней латентный период саккады (и, соответственно, длительность предшествующей фиксации), тем выше ее точность. Распределение фиксаций зависит от конфигурации объекта, его симметричности, размера, полноты и завершенности. Скопление фиксаций, или «зона интереса», соответствует тем областям среды, где существует наибольшая вероятность получения прогностической информации. Вместе с тем при экспозиции комплексного объекта фиксации могут как «притягиваться» к позиции целевого стимула (якорный эффект), так и «выталкиваться» им в свободное пространство, окружающее стимул (эффект вытеснения). В общем случае зрительный и фиксационный «центры тяжести» одной и той же фигуры не совпадают.

К числу детерминант, обусловливающих динамику направленности взора, относятся социокультурные навыки человека, включая навыки чтения, письма и рисования, а также выработанные в онтогенезе индивидуальные стили восприятия и действия. В частности, фиксационные повороты глаз и распределения зрительных фиксаций русскоязычных и арабоязычных наблюдателей в одних и тех же частях поля зрения, как правило, различны, а в некоторых случаях – диаметрально противоположны.

Совокупность всех возможных направлений взора при неизменном положении головы образует окуломоторное поле человека. Его структура включает 1) центральную область (от нескольких угловых минут до 1,5°); 2) парацентральную область (до 3–6°); 3) зону оптимальных поворотов (до 12–15°); 4) область, прилегающую к функциональной границе (до 25–30°); и 5) зону морфологической границы (до 40–45°). При выполнении сходных зрительных задач параметры окуломоторной активности в каждой из зон могут иметь различные значения. Окуломоторное поле асимметрично относительно вертикальной и горизонтальной осей и функционально изменчиво.

Таким образом, в каждый момент времени направленность взора полидетерминирована, причем уже в следующем микроакте восприятия структура детерминации может быть изменена. Зрительное выделение элемента среды ведет не только к увеличению, но и к уменьшению частоты фиксаций. Используемый наблюдателями способ восприятия играет роль катализатора, усиливающего действие одной из детерминант (или их группы) и меняющего соотношение остальных. В данном контексте степень точности зрительных фиксаций определяется не метрикой их отношения к зрительному направлению предмета восприятия, а положением относительно его «центра тяжести», т. е. является функциональным параметром. С изменением структуры детерминант (даже если проксимальная стимуляция остается той же самой) «эталон точности» направленности глаз меняется.

Влияние поведенческих детерминант опосредовано собственными механизмами регуляции движений глаз. Без их учета анализ окулограмм оказывается как минимум неполным.

Глазодвигательная система человека представляет собой сложноорганизованное многомерное целое, каждый акт которого складывается в самом процессе зрительного восприятия. Он включает моменты побуждения, прогнозирования, эфферентной готовности, двигательных синергии, полисенсорности и многоуровневости процессов управления. И целенаправленное смещение взора, и его устойчивая фиксация подчиняются принципам функциональной системы. В архитектонику окуломоторных актов входят: афферентный синтез – интеграция исходных предпосылок движений, принятие решения, которое реализуется путем формирования программы поворота глаз и акцептора результата действия, исполнение целенаправленных движений и обратная связь, или реафферентация, позволяющая контролировать ход выполнения программы. В терминах теории автоматического регулирования ГДС рассматривается как следящая система с отрицательной обратной связью.

Соотношение направленности взора с положением головы контролируется системой центрации, которая стремится удерживать глаз в позиции покоя. При неизменном положении головы система центрации ограничивает возможности смещения взора, устанавливая функциональную границу окуломоторного поля.

Зрительная фиксация объекта, или относительная стабилизация направленности взора, осуществляется с помощью разнонаправленного дрейфа и микросаккад. Их соотношение широко варьирует, конституируя индивидуальный тип фиксаций. Параметры (скорость, направление, амплитуда, ускорение) дрейфов и микросаккад тесно связаны с требованиями решаемой задачи, параметрами оптической стимуляции (среды), настройками внимания и др., а их биодинамические возможности в ходе устойчивой фиксации реализуются в зависимости от конкретного сочетания внешних и внутренних условий выполнения окуломоторного акта.

Большая часть фазических микродвижений глаз обеспечивает обследование миниатюрных объектов. Около трети микросаккад корректируют дрейфовые сплывы глаз во время фиксаций. По сравнению с макросаккадами, микросаккады более независимы от параметров среды и более привязаны к центральной точке фиксации.

Нечувствительность ГДС к непроизвольному смещению оптических осей порождает «зону блуждания» взора. Ее величина редко выходит за пределы 1°, варьируя в зависимости от стимульных условий, решаемой наблюдателем задачи, его состояния и др. обстоятельств. С увеличением продолжительности фиксации или в условиях безориентирного поля зрения она расширяется, при уменьшении размеров объекта восприятия – сужается.

Отсутствие реакции ГДС на небольшие по величине (2-50°) оптические изменения среды указывает на существование «мертвого пространства», или зоны нечувствительности сетчатки. Она носит функциональный характер, зависит от способа схематизации зрительного пространства и установок наблюдателя.

При дискоординациях сенсорных и моторных компонентов ГДС запускается адаптивный процесс, направленный на воссоздание согласованности компонентов и оптимальность выполнения перцептивных актов. Окуломоторная адаптация протекает в двух формах: оперативной и консервативной. Оперативное перепрограммирование ГДС выражается в быстрой (практически мгновенной) корректировке параметров цели и критериев оценки результатов движений глаз. Консервативная форма адаптации, предполагает длительную (от нескольких дней) перестройку всей системы обеспечения окуломоторного акта, включая его нормы и эталоны. Условием адаптации ГДС является активное включение субъекта в решение зрительных и двигательных задач. Психологически и целенаправленный поворот глаз и устойчивая фиксация строятся как волевое действие, достигающее заданного результата путем преодоления внешне навязанных движений. Этот процесс принимает вид приспособления субъекта к необычным условиям восприятия, зависит от величины рассогласования зрительного и эгоцентрического направлений объекта восприятия и включает этапы: 1) компенсации рассогласования; 2) оптимизации двигательного состава фиксационного поворота глаз и 3) закрепления и стабилизации окуломоторного навыка. В результате адаптации складывается новый «функциональный орган», способный обеспечить оптимальное взаимодействие субъекта восприятия с окружающим миром. В ходе адаптации ГДС выступает в трех ипостасях, как а) поисковая, б) обучающаяся и в) следящая.

Экспериментальный анализ гносеологической функции ГДС – ее способности непосредственно снимать информацию о пространственно-временных свойствах среды – показывает наличие широкого диапазона рассогласований между направлением взора и зрительным направлением объекта. Существует функциональный зазор между восприятием и действием, который характеризует меру относительной независимости параметров зрительного образа от движений глаз и одновременно пространство их ближайших преобразований. В обычной ситуации он проявляется в виде оперативной зоны фиксаций и в зависимости от условий восприятия меняет размер. До тех пор пока рассогласование зрительных и окуломоторных компонентов совершается внутри «функционального зазора», оно не оказывает серьезного влияния ни на ход восприятия, ни на характер движений глаз. Лишь выйдя за его пределы, тот или иной параметр окуломоторной активности приобретает статус внешнего, возмущающего перцептивный процесс «лимитирующего» фактора. С этой точки зрения уподобление отдельных параметров движений глаз пространственно-временным свойствам объекта выражает акт приспособления индивида к среде. Согласованность окуломоторных и собственно зрительных компонентов перцептивного процесса, а не воспроизведение «геометрии предмета» в «геометрии движений (направленности) глаз» является главным условием адекватного отражения действительности.

Рассмотренные представления образуют каркас психологической теории окуломоторной активности человека. В ее основе лежит идея системной организации психических явлений (Ломов, 1984, 1991, 1996, 2006) и положения онтологического подхода в исследованиях перцептивного процесса (Барабанщиков, 2002, 2006; Современная экспериментальная психология, 2011).

* * *

Российская психология накопила серьезный методический и концептуальный потенциал, ориентированный на решение проблем природы окуломоторной активности человека и ее использования в исследовательских и практических целях. Важным ресурсом дальнейшего развития отечественной науки является освоение новых методов регистрации и оценки движений глаз, опирающихся на широкое использование современных информационных технологий. К их числу относится айтрекинг[2] – совокупность инструментов и процедур видеорегистрации взора человека.

Литература

Андреева Е. А., Вергилес Н. Ю., Ломов Б. Ф. Механизм элементарных движений глаз как следящая система // Моторные компоненты зрения. М.: Наука, 1975. С. 7–55.

Барабанщиков В. А., Жердев И. Ю. Восприятие сложных социально значимых объектов во время быстрых движений глаз наблюдателя // Экспериментальная психология. 2014. Т. 7. № 2. С. 5–25.

Барабанщиков В. А. Восприятие и событие. СПб.: Алетейя, 2002.

Барабанщиков В. А. Динамика зрительного восприятия. М.: Наука, 1990.

Барабанщиков В. А. Жегалло А. В. Айтрекинг: методы регистрации движений глаз в психологических исследованиях и практике. М.: Когито-Центр,2014.

Барабанщиков В. А. Окуломоторные структуры восприятия. М.: Изд-во «Институт психологии РАН», 1997.

Барабанщиков В. А. Психология восприятия. Организация и развитие перцептивного процесса. М.: Когито-Центр, 2006.

Барабанщиков В. А. Экспрессии лица и их восприятие. М.: Изд-во «Институт психологии РАН», 2012.

Барабанщиков В. А., Белопольский В. И. Стабильность видимого мира. М.: Изд-во «Институт психологии РАН», 2008.

Барабанщиков В. А., Белопольский В. И., Вергилес Н. Ю. Оптические методы трансформации зрительной обратной связи // Психологический журнал. 1980. № 3. С. 35–90.

Барабанщиков В. А., Жегалло А. В. Распознавание экспрессии лица в ближней периферии зрительного поля // Экспериментальная психология. 2013. № 2. С. 59–85.

Белопольский В. И. Взор человека: механизмы, модели, функции. М.: Изд-во «Институт психологии РАН», 2007.

Владимиров А. Д., Хомская Е. Д. Процессы экстраполяции в глазодвигательной системе. М.: Наука, 1981.

Гатев В. А. Развитие зрительно-двигательной координации в детском возрасте. София: Изд-во Болгарской Академии наук, 1973.

Гиппенрейтер Ю. Б. Движение человеческого глаза. М.: Изд-во Моск. ун-та, 1978.

Гуревич Б. Х. Движения глаз как основа пространственного зрения и как модель поведения. Л.: Наука, 1971.

Запорожец А. В., Ветер Л. А., Зинченко В. П., Рузская А. Г. Восприятие и действие. М.: Просвещение, 1967.

Зинченко В. П., Вергилес Н. Ю. Формирование зрительного образа. М.: Изд-во Моск. ун-та, 1969.

Карпов Б. А., Карпова А. Н., Зеленкин В. В. Амплитудно-частотный и автокорреляционный анализ фиксационных микроскачков глаз // Сенсорные системы. Зрение. Л.: Наука, 1982. С. 196–207.

КурашвилиА.Е., БабиякВ.И. Физиологические функции вестибулярной системы. Л.: Медицина, 1975.

Леушина Л. И. Глазодвигательная система и ее функция // Физиология сенсорных систем. М.-Л.: Наука, 1971. Ч. 1: Физиология зрения. С. 60–77.

Леушина Л. И. Движение глаз и пространственное зрение // Вопросы физиологии сенсорных систем. М.-Л.: Наука, 1966. С. 60–77.

Моторные компоненты зрения / Отв. ред. Б. Ф. Ломов, Н. Ю. Вергилес. М.: Наука, 1975.

Нотон Н., СтаркЛ. Движения глаз и зрительное восприятие// Восприятие: механизмы и модели. М.: Мир, 1974. С. 226–240.

Современная экспериментальная психология / Отв. ред. В. А. Барабанщиков. М.: Изд-во «Институт психологии РАН», 2011.

Филин В. А. Автоматия саккад. М.: Изд-во Моск. ун-та, 2002.

Филин В. А. О механизме непроизвольных скачков и их роли в зрительном процессе // Моторные компоненты зрения. М.: Наука, 1975. С. 69–101.

Шахнович А. Р. О роли афферентации в регуляции двигательных функций глаз // Бионика. М., 1965. С. 110–115.

ЯрбусА.Л. Роль движений глаз в процессе зрения. М.: Наука, 1965.

Alpern M. Eye movements // Handbook of sensory physiology / Eds D. Jameson, L. Hurvich. Berlin: Springer, 1972. V. 7/4. P. 303–330.

Bach Y-Rita P., Collins С. С (Eds). The control of eye movements. N. Y.: Acad. Press., 1971.

Becker W., Jurgens R. An analysis of the saccadic system by means of double step stimuli //Vision Research. 1979. V. 19. P. 967–983.

Bender M. B. The eye-centering system: a theoretical consideration //Arch. Neurol. Psychiatr. 1955. V. 73. P. 685–699.

Bizzi E. The coordination of eye-head movements // Scientific American. 1974. V. 231. P. 100–106.

Coven S. An efferent component in the visual perception of direction and extent // Psychological Review. 1986. V. 93. P. 391–410.

Dell'Osso L. F., Flynn J. Т., Daroff R. B. Hereditary congenital nystagmus // Archives of Ophthalmology. 1974. V. 92. P. 366–374.

DitchburnR. W. Eye movements and visual perception. Oxford: Clarendon. 1973.

Duchowski A. Eyetracking methodology: Theory and Practice. L.: Springer-Verlag, 2003.

Ebenholtz S. M., Shebilske W. L. The doll reflex: ocular counterrolling with head-body tilt in the median plane // Vision Research. 1975. V. 15. P. 713–717.

EngbertR. Microsaccades: A microcosm for research on oculomotor control, attention, and visual perception // Progress in Brain Research. 2006. V. 154. P. 177–192.

FestingerL., Canon L. Information about spatial location based on knowledge about efference // Psychological Review. 1965. V. 72. P. 373–384.

FestingerL., EastonA. M. Inferences about the efferent system based on a perceptual illusion produced by eye movements // Psychological Review. 1974. v. 84. P. 44–58.

Fisher D. F., Monty R. A., Senders J. W. (Eds). Eye movements: cognition and visual perception. Hillsdale, N.J.: Erlbaum, 1981.

Gale A. G., JohnsonF. (Eds). Theoretical and applied aspects of eye movement research. Amsterdam: North-Holland, 1984.

GauthierG.M., Hofferer J. M. Eye tracking of self-moved targets in absence of vision // Experimental Brain Research. 1976. V. 26. P. 121–139.

Groner R., Menz Ch., Fisher D. F., Monty T. A. (Eds). Eye movements and psychological functions; International views. N. J.: Erlbaum, 1983.

Holmqvist K., Nystrom M., Andersson R., Dewhurst R., Jarodzka H., Weijer J. Eye Tracking. A comprehensive Guide to Methods and Measures. N.Y.: Oxford University Press, 2011.

Monty R. A., Senders J. W. (Eds). Eye movements and psychological processes. Hillsdale, N. J.: Erlbaum, 1976.

RaynerK. Eye movements in reading and information processing: 20 years of research // Psychological Bulletin. 1998. V. 124. P. 372–422.

Robinson D. A. The mechanics of human pursuit movements // The Journal of Physiology. 1965. V. 180. P. 569–591.

Robinson D. A. The mechanisms of human saccadic eye movement //The Journal of Physiology. 1964. V. 174. P. 245–264.

Shebilske W. L. Visuamotor coordination in visual direction and position constancies // Stability and constancy in visual perception. N. Y.: Wiley, 1978. P. 21–70.

Steinbach M. J. Proprioceptive knowledge of eye position // Vision Research. 1987. V. 27. P. 1737–1744.

Steinman R. M. Role of eye movements in maintaining a phenomenally clear and stable world // Eye movements and psychological processes. N. J.:

Erlbaum. 1976. P. 73–83. Underwood G. (Ed.). Eye Guidance in Reading, Driving and Scene Perception.

N.Y.:Elsever, 1998. Walls G. L. The evolutionary history of eye movements //Vis. Res. 1962. V 2. P. 69–80. col1_0 Eye Movement Disorders. Oxford: Oxford University Press, 2008.

Технологии айтрекинга: от видеорегистрации до наложения треков на изображение[3]

В. Н. Анисимов, А. В. Краснопёрое, Ф. Л. Серженко, Л. В. Терещенко

Введение

Нашим научным коллективом разработана установка для регистрации движений глаз на основе скоростной цифровой видеокамеры. Для обеспечения синхронизации компонентов системы, записи данных и их обработки создано оригинальное программное обеспечение. Преимуществом работы с нашей системой является доступ к полному циклу обработки регистрируемых данных, что позволяет быстро и эффективно решать задачи идентификации событий, а также визуально контролировать полученные результаты с помощью синхронного вывода видеозаписи изображения глаза. Также важной является возможность синхронизации регистрации треков движений глаз с внешними устройствами, например, с электроэнцефалографом или полиграфом. Известно, что подобная задача часто возникает при проведении научных или практических исследований и не всегда легко и корректно реализуется на основе решений, предлагаемых производителями айтрекеров.

Скоростная цифровая видеокамера Fastvideo

Движения глаз регистрируются монокулярно с использованием цифровой видеокамеры Fastvideo-ЗОО (Стандартная система скоростной видеозаписи, электронный ресурс) производства компании «Фаствидео», Россия. Камера позволяет вести видеосъемку с частотой до 300 кадров в секунду при разрешении 640x480 пикселей и разрядности аналого-цифрового преобразования 10 бит. В основе камеры используется монохромный сенсор «ШРА-300» (Скоростная матрица ШРА-300, электронный ресурс), максимум спектральной чувствительности которого лежит в области длин волн порядка 700 нм, поэтому при работе применяется инфракрасная (ИК) подсветка. ИК подсветка также позволяет добиться максимальной контрастности зрачка на регистрируемом изображении. Камера соединена специальным высокочастотным кабелем с установленной в персональном компьютере (ПК) платой ввода изображения PIXCI® EB1 (PIXCI® EB1 PCI Express xl Base Camera Link Frame Grabber, электронный ресурс). Плата обеспечивает передачу управляющих сигналов в камеру, прием в непрерывном режиме захваченных кадров от камеры и сохранение кадров в оперативной памяти ПК. Обмен данными между камерой и платой ввода осуществляется по протоколу Base Camera Link, поток данных достигает 960 Мегабит в секунду при настройках камеры по умолчанию (640x480,10 бит, 300 кадров в секунду).

Программное обеспечение

Для обеспечения синхронизации компонентов системы, записи данных и их обработки разработано оригинальное программное обеспечение. Оно включает в себя две программы: программное обеспечение Fastvideo Lab для скоростной видеосъемки (Программное обеспечение Fastvideo Lab для скоростной видеосъемки, электронный ресурс) и разработанная нами программа VisualStimulator.

3.1

Программное обеспечение Fastvideo Lab и параметры съемки

Программное обеспечение, поставляемое с камерой, дает пользователю широкий спектр возможностей для ведения высокоскоростной съемки. Доступны, в частности, настройка режимов работы камеры – изменение области сканирования сенсора, частоты захвата кадров, времени экспозиции, выделение фрагмента кадра и др., просмотр изображения на экране монитора, непрерывная запись видеопотока в память ПК или в файл на жесткий диск, чтение, просмотр и преобразование записанных данных.

Регистрация движений зрачка в ИК свете, направленном под углом к оптической оси камеры, основана на эффекте «темного зрачка», когда вторичное отражение от сетчатки глаза не поступает в камеру. Отображение зрачка на кадре является, как правило, самой затемненной областью, интенсивность пикселей в которой меньше, чем интенсивность пикселей в других частях кадра. Наиболее распространенное и простое определение центра положения зрачка сводится к усреднению х и у координат пикселей, интенсивность которых не превышает заранее выбранного порогового значения. Заметим, что точность этого метода ограничена наличием светодиодных бликов подсветки на роговице глаза, так как положение этих бликов может совпадать с положением зрачка. Кроме того, на точность могут влиять области с еще большим затемнением (ресницы, затемнения у краев кадра и др.). С другой стороны, результат зависит от выбора порога бинаризации изображения, а фиксированное значение порога делает этот метод практически неприменимым в режиме реального времени из-за изменений затемнения зрачка в процессе съемки.

Стандартное программное обеспечение камеры было дополнено автоматическим алгоритмом (фильтром) распознавания зрачка на изображении (Программное обеспечение для видео нистагмографии, электронный ресурс), изначально разработанным «Фаствидео» для медицинских систем видеонистагмографии на основе аналоговых ИК камер (Видео нистагмограф, электронный ресурс). Координаты зрачка на изображении определяются по его эллиптическому контуру, который является проекцией контура зрачка на плоскость сенсора камеры при любом направлении взора испытуемого. Заметим, что метод нечувствителен к бликам ИК подсветки и работает в случаях, когда зрачок частично прикрыт веками или ресницами (рисунок 1).

Рис. 1

В используемой нами версии алгоритм был в значительной степени переработан с целью увеличения производительности, что позволило применять его в режиме реального времени со 100 %-й эффективностью при частоте работы камеры 300 кадров в секунду и выше и размерах изображения от 320x240 до 640x480 пикселей. Измерения показали, что время, необходимое для выделения зрачка на кадре с размером 640x480 пикселей, не превышает 3 мс на ПК с процессором уровня Intel® Core™ i7-920 (2,66 ГГц).

Предельная точность определения центра эллиптической области оценивалась в модельном эксперименте с изображением черного круга на белом фоне. Было установлено, что при различных проекциях изображения на плоскость матрицы видеокамеры, координаты центра определяются с точностью лучшей, чем один пиксель сенсора, что соответствует предельной точности угла поворота глаза 0,5 градуса. Эта точность ограничена шумами матрицы, механическими колебаниями установки, стабильностью освещенности изображения, а также точностью работы выбранного алгоритма.

В наших измерениях камера, программа и фильтр настраиваются на непрерывную съемку и запись видео в файл. Временная привязка координат зрачка ведется от момента запуска камеры по порядковому номеру кадра с учетом периода следования кадров. Координаты, время и номера кадров передаются в программу VisualStimualtor по мере регистрации с помощью интерфейса межпроцессного взаимодействия mailslot (Центр разработки Windows, электронный ресурс).

3.2

Программа VisualStimulator

Для анализа движений глаз нами было разработано оригинальное программное обеспечение VisualStimulator, использующее в качестве предъявляемых стимулов статические изображения (рисунки), динамические ряды (видеофайлы), а также имеющее возможность реализовывать захват экрана монитора, на котором происходит предъявление. Последний пункт может быть очень важен при решении задач, связанных с процессами навигации по сайтам, анализу расположения элементов на рабочем столе и т. д.

3.2.1

Отображающая координатная функция и калибровка

Программа управления камерой определяет координаты взора в системе координат сенсора, переход от измеренных координат к координатам предъявляемого изображения производится в программе VisualStimulator. Детальный обзор методов, позволяющих связать координаты «сенсор-стимул», представлен в работе Шила (Sheela, 2011). В нашей программе переход от измеренных координат (х, у) к предъявляемым (X, У) осуществляется с помощью отображающей функции вида:

где коэффициенты и (i = 1.. 6) определяются методом наименьших квадратов из калибровочного измерения.

Калибровка состоит в последовательной демонстрации на экране монитора точек с известными координатами (X, Y) с синхронной регистрацией направленного на них взора испытуемого с координатами (х, у) (рисунок 2). Точки расположены в узлах калибровочной сетки монитора, число узлов по вертикали и по горизонтали задается в настройках программы. При демонстрации изображений на мониторе с соотношением сторон 16:9 использовалось 18 точек, соответствующих шести узлам сетки по горизонтали и трем – по вертикали. Предъявление точек проводится с заданной длительностью по одной, друг за другом.

Рис. 2. Пример удачной калибровки с наложенными на калибровочные точки восстановленными позициями взора. Фиксация в центре – начальная позиция взора испытуемого

3.2.2

Выделение фиксаций и саккад

Первоначально координаты трека анализируются независимо друг от друга. Каждый временной ряд аппроксимируется кусочной ступенчатой функцией (Lemire, 2007), разбивающей последовательность на интервалы, в пределах которых координата не изменяется или изменяется незначительно. Пересечения полученных интервалов во времени определяют положения фиксаций на треке (рисунок 3). Восстановление положения фиксаций на экране монитора проводится с помощью отображающей функции по координатам, полученным из усреднения измерений на выделенных временных интервалах. Угловое изменение направления взора между двумя последовательными фиксациями определяет амплитуду саккады. В случае, когда амплитуда не превышает 1,4°, две последовательные фиксации объединяются в одну. Выбор данного критерия многократно обсуждался в литературе (Velichkovsky et al., 2005) и может быть обусловлен целями эксперимента, а также анатомо-физиологическими свойствами сетчатки. Так, известно, что угловой размер фовеа глаза человека составляет около 2°. Примером причины выбора иного амплитудного критерия, обусловленного целями эксперимента, может быть, например, необходимость оценки стабильности фиксации взора на одной точке длительное время. В этом случае критичными могут быть также микросаккады и дрейф. Отметим также, что в программе предусмотрена возможность опциональной настройки данного критерия.

Рис. 3. Зарегистрированные X и Y координаты взора в зависимости от времени. Найденные интервалы фиксаций показаны горизонтальными линиями с подписями, соответствующими их длительности в миллисекундах

В случае, когда изучается зрительное внимание в стандартных глазодвигательных парадигмах, интерес представляют саккадические движения глаз. При объединении фиксаций, которые отстоят друг от друга на угол, меньший, чем заданный параметр, происходит пересчет лежащих рядом амплитуд саккад, а также общей длительности полученной новой фиксации, которая является суммой двух объединяемых.

Методика предъявления и регистрации

Камера устанавливается сбоку под прямым углом к направлению взора испытуемого и регистрирует изображение глаза, отраженное от «теплого зеркала» – специального эмиссионного фильтра, пропускающего свет видимого спектра и отражающего волны инфракрасного диапазона (более 800 нм). Эмиссионный фильтр располагается в плоскости, расположенной под углом 45° к плоскости зрачка. Это позволяет убрать видеокамеру из поля зрения испытуемого, а также расположить ее в плоскости, параллельной плоскости зрачка. Такое расположение видеокамеры позволяет избежать погрешностей, обусловленных угловыми искажениями при вычислении координат центра зрачка.

Изображение предъявляют на экране монитора Samsung с диагональю 23' (с разрешением 1920x1080 пикселей) на расстоянии 60 см от глаз испытуемых, занимая 47° по горизонтали и 26° по вертикали их зрительного поля. В экспериментах голову испытуемых фиксируют с помощью лобно-подбородной подставки.

С точки зрения построения эксперимента необходима возможность составления набора предъявляемых стимулов, как статических, так и динамических. Эта возможность предусмотрена в разработанном программном обеспечении. Интерфейс позволяет добавлять графические файлы разных форматов, задавать время предъявления стимулов.

Также в программе предусмотрена возможность проведения повторной калибровки в течение эксперимента, в том числе в «горячем» режиме, и добавления фонового изображение между предъявляемыми стимулами.

В экспериментах на экране монитора предъявляют различные зрительные стимулы и регистрируют изображение глаза. Координаты взора отражают траекторию движения глаза и периоды фиксаций. Такие траектории можно «наложить» на изображения, предъявляемые на мониторе, что позволяет качественно оценить процесс сканирования испытуемым зрительной сцены во время эксперимента (рисунок 4).

Рис. 4. Стимульное изображение с наложенными на него треками и выделенными фиксациями. Испытуемый сканирует взором детали интерьера и фигуру человека

У многих современных трекеров, предлагаемых на рынке, существует ряд ограничений, связанных с закрытыми алгоритмами анализа и удобством работы с конкретным программным обеспечением. Программа VisualStimulator дает исследователю максимально необходимый доступ к разным уровням обработки, начиная с потока исходных данных, на основе которых строятся треки, и заканчивая выделенными из них событиям (фиксации, саккады и моргания). В программе предусмотрены возможности изменения цветов накладываемых треков; существует возможность изменения цвета трека, саккад и фиксаций отдельно. Для большей наглядности линия, соответствующая саккаде, передается с разной толщиной: тонкая в том месте, где саккада начинается, и утолщающаяся в сторону конца саккады.

Возможность синхронного вывода видеозаписи и прорисовки треков взора, наложенных на изображение (рисунок 4) позволяет верифицировать моменты генерации событий (саккад и фиксаций) при проведении эксперимента. Этот метод дополняет преимущества использования открытых алгоритмов работы программно-аппаратного комплекса, которые, в свою очередь, также позволяют получать как массивы исходных координат центра зрачка в системе координат матрицы видеокамеры, так и в системе координат монитора, на котором предъявляются стимульные изображения. Большое внимание при разработке описанного программного обеспечения уделялось именно возможностям визуализации, что является очень важным аспектом при анализе полученных записей. Специальной опцией является то, что координаты треков или соответствующие им события могут «выгружаться» непосредственно за тот промежуток времени, который отражается на картинке в данный момент. Также возможно делать временные отступы от начала или конца записи, чтобы точно определить интересующий исследователя фрагмент записи.

Известно, что у ряда трекеров, даже современных, отсутствует возможность загрузки динамических стимулов, что сильно ограничивает возможности исследователя. В нашем ПО специально была предусмотрена такая возможность и представлены все необходимые для анализа записанных данных инструменты. Для вывода стимульного видеоряда с наложенными на него треками движений глаз в программу VisualStimulator был интегрирован видеоплейер (рисунок 5), автоматически вызываемый при просмотре сделанной в эксперименте записи.

Рис. 5. Синхронный вывод трека в интервале 500 мс и видеоизображения глаза, которое хранится в отдельном файле

Применение технологии айтрекинга в исследованиях

Разработанный программно-аппаратный комплекс с успехом применялся нашей научной группой в целом ряде исследований. Основными направлениями исследований стали работы со статическими и динамическими изображениями (Шурупова и др., 2015) и исследования движений глаз при чтении предложений с синтаксической неоднозначностью (Жондо и др., 2015). По результатам проведенных исследований были защищены две дипломные работы на кафедре высшей нервной деятельности биологического факультета МГУ им. М. В. Ломоносова. Результаты, полученные в указанных работах подтвердили динамику зависимости параметров движений глаз при просмотре статических и динамических сцен, а также при чтении предложений с синтаксической неоднозначностью, которая описана в ранее опубликованных работах, что говорит о релевантности полученных результатов и косвенно свидетельствует о точности работы программно-аппаратного комплекса. При этом с использованием описанного оборудования и программного обеспечения были получены новые содержательные результаты. Высокая частота и удобство работы с программно-аппаратным комплексом позволяет эффективно регистрировать данные в экспериментах и получать результаты на уровне работ современной мировой науки.

Заключение

Приведено описание программно-аппаратного комплекса, разработанного нашей научной группой. В нем предусмотрены широкие возможности настройки как аппаратной части (изменение частоты, разрешения и др.), так и широкий спектр программных настроек, необходимых для удобной и продуктивной работы с данными регистрации движений глаз.

Установка позволяет быстро освоить навыки работы с ней, что является также существенным преимуществом, особенно для начинающих работать с айтрекингом. Важными особенностями являются возможности синхронного вывода треков движений глаз и видео изображения глаза с выделенным на нем зрачком и оперативного добавления калибровки в процессе проведения эксперимента.

Циклы работы программы VisualStimulator и поток координат зрачка синхронизованы по времени. В настоящее время формат принимаемых данных определяется программным обеспечением цифровой камеры Fastvideo-ЗОО, однако потенциально существует возможность работы с данными в любом другом формате и с другими типами камер. Этот фактор дает преимущества перед используемыми в настоящее время коммерческими айтрекерами, так как позволяет изменять аппаратную часть, базируясь на серийно производимых типах видеокамер в широком ценовом диапазоне.

Существует потенциальная возможность применения программно-аппаратного комплекса для работы с животными (низшими приматами).

Литература

Видео нистагмограф. URL: http://www.vdvs.ru/products/vng/vng.htm (дата обращения: 15.06.2015).

Жондо А. С, Анисимов В. Н., Фёдорова О. В., Латаное А. В. Движения глаз при чтении предложений с локальной и глобальной синтаксической неоднозначностью // Когнитивная наука в Москве: новые исследования. М.: ООО «Буки Веди», ИППиП, 2015. С. 131–134.

Скоростная матрица ШРА-300. URL: http://www.fastvideo.ru/info/sensor/ cypress/lupa300.htm; http://www.fastvideo.ru/info/sensor/cypress/ lupa_300.pdf (дата обращения: 15.06.2015).

Стандартная система скоростной видеозаписи: 640x480,10 бит, 300 fps. URL: http://fastvideo.ru/products/vga/fv300.htm http://fastvideo.ru/ products/vga/fv300.htm (дата обращения: 15.06.2015).

Программное обеспечение Fastvideo Lab для скоростной видеосъемки. URL: http://www.fastvideo.ru/products/software/software.htm (дата обращения: 15.06.2015).

Программное обеспечение для видео нистагмографии. URL: http://www. vdvs.ru/products/software/software.htm (дата обращения: 15.06.2015).

Центр разработки для Windows. Mailslots. URL: https://msdn.microsoft. com/ru-ru/library/windows/desktop/aa365576%28v=vs.85%29.aspx (дата обращения: 15.06.2015).

Шурупова М. А., Анисимов В. Н., Красноперое А. В., Латаное А. В. Параметры движений глаз при просмотре динамических сцен // Когнитивная наука в Москве: новые исследования. М.: ООО «Буки Веди»-ИППиП, 2015. С. 492–498.

Шурупова М. А., Анисимов В. Н., Латаное А. В. Параметры движений глаз при просмотре динамических сцен // Одиннадцатый международный междисциплинарный прогресс «Нейронаука для медицины и психологии». Тезисы докладов. Судак, 2015. С. 456.

Lemire D. A Better Alternative to Piecewise Linear Time Series Segmentation // SDM. 2007. P. 545–550.

PIXCI® EB1 PCI Express xl Base Camera Link Frame Grabber. URL: www.epixinc.com/products/pixci_ebl.htm (дата обращения: 15.06. 2015).

Sheela S. V., Vijaya P. A. Mapping Functions in Gaze Tracking // International Journal of Computer Applications. 2011. V. 26. № 3. P. 36–42.

Velichkovsky B. M. et al. Two visual systems and their eye movements: Evidence from static and dynamic scene perception // Proceedings of the XXVII conference of the cognitive science society. Mahwah, N.J.: Lawrence Erlbaum, 2005. С 2283–2288.

Обзор изобретений, полученных при использовании айтрекинговых исследований в процессе изучения способности 3D-восприятия образов плоскостных изображений

В. Н. Антипов, А. В. Жегалло, В. В. Курчавов, Н. В. Звёздочкина, Л. М. Попов

Введение

Айтрекинговые исследования, изучение движения глаз позволяют получить первичную информацию о новой способности зрительного восприятия – способности воспринимать образы плоскостных изображений с эффектами глубины, объема, пространственной перспективы (далее – феномен) (Антипов, 2005). Естественно-природный механизм зрительного восприятия – стереоскопическое зрение, бинокулярная диспаратность однозначно препятствует наблюдению атрибутов феномена. Однако в настоящее время по различным направлениям феномена получено 19 патентов на изобретения. Авторами и патентообладателями изобретений являются научные работники Казанского университета, ИП РАН, ЦЭП МГППУ, ИФ РАН, Ульяновского училища гражданской авиации. Существенный вклад в доказательство существования феномена внесли именно исследования на бинокулярном айтрекере. Экспериментально показано наличие восприятия глубины, объема образов плоскостных изображений, величина которых соизмерима с трехмерными параметрами, наблюдаемыми при рассматривании 3D-растровых изображений. При этом элементы феномена не меньше уровня наблюдаемой стереоскопической глубины стереограмм в условиях фузии.

В настоящей работе приводится информация по изобретениям, полученная в результате проведенных исследований. Фактический материал сгруппирован по нескольким направлениям изобретательской деятельности. Первое – непосредственно доказательство способности восприятия глубины и объема. Второе – визуализация наблюдаемых эффектов восприятия глубины. Третье – применение айтрекинговых исследований для: 1) изучения ЭЭГ активности мозга при наблюдении феномена; 2) разработки системы тестов; 3) выявление особенностей коллективно-когнитивного бессознательного восприятия. Четвертое – использование результатов работы для усовершенствования пособий для тренинга, применяемых при развитии новой способности восприятия, при обучении операторов интроскопа.

Процедура и методы исследований

Работы проводились в Центре экспериментальной психологии МГППУ (айтрекер SMI HiSpeed) и в лаборатории физиологии зрения Института физиологии им. И. П. Павлова РАН (айтрекер SMI RED). В качестве стимульных изображений использовались: плоскостные, растровые изображения, стереограммы в плоскостном и трехмерном вариантах наблюдения. Испытуемым был один из авторов настоящей работы. При написании изобретений использовалась информация: числовых массивов значений Х-, Y-координат направления взора правого и левого глаз и построение гистограмм разности. Проводилась регистрация траектории движения глаз, визуализация текущих значений координат. Обработка информации: методы нелинейной динамики с построением гистограмм разности Х-, Y-координат. Траектории движения глаз на стимульных изображениях позволяют визуализировать наблюдаемые эффекты восприятия глубины. Оперативные результаты величины Х-, Y-координат непосредственно демонстрируют возникновение горизонтальной и вертикальной диспаратности.

Результаты исследований

Первое направление – непосредственное доказательство способности восприятия глубины и объема, патент № 2530660 (Антипов, Жегалло, 2014а).

При восприятии объема фокусировка глаз происходит далее плоскости расположения стимульных плоскостных изображений. Непосредственно на плоскости монитора фиксируется разность Х-, Y координат: ΔX=Х^Ra—Х^Le≠0, ΔУ=У^Ra—У^Le≠0. На рисунке 1 показаны гистограммы разности: на верхнем рисунке по Y-координатам, на нижнем – по Х-координатам. По горизонтальной шкале откладывается величина разности координат на экране монитора, пересчитанная в сантиметрах (т. е. диспаратность). На вертикальной – вероятности значений разности координат за время регистрации.

На рисунке 2 приводятся построенные текущие записи разности координат. Отрицательные значения показаний гистограмм разности (рисунок 1) и текущих значений разности координат (рисунок 2) показывают, что плоскости наблюдаемых эффектов глубины изображений располагаются далее плоскости монитора компьютера ай-трекера. Особо отметим выбросы амплитуды показаний рисунке 2. Не анализируя причин возникновения, отметим, что их продолжительность не превышала 40 мс. Как правило, они попадают под условия, когда разность ДХ приближается к значению межзрачкового расстояния испытуемого. Они отмечены стрелками на рисунке 1. Анализ показывает, что при таких условиях кратковременно фиксируются протяженное восприятие эффектов возникновения глубины.

Рис. 1. Контуры гистограмм разности

Рис. 2. Текущие значения разности по X и Y-координатам Х и Y-координат

Допустим, что операторы или летчики на экранах своих мониторов наблюдают эффекты глубины, тогда возникают проблемы с оперативностью принятия решения.

Возникновение стационарных и нестационарных условий восприятия глубины плоскостного изображения представлено и в патенте № 2532401 (Антипов, Жегалло, 20146). В материалах изобретения приводятся спектрограммы условий восприятия плоскостного изображения. Показано, что среднее время фиксации правого глаза превышает показания для левого глаза почти в два раза.

Доказательство величины наблюдения глубины и объема, сопоставимой с уровнем восприятия растровых 3D-изображений, стереоглубины стереограмм в условиях фузии описано в содержании патента № 2538452 (Антипов, Жегалло, 2015). В пунтке 1 формулы анализируется гистограмма разности при восприятии глубины растрового 3D-изображения (рисунок 3). Далее она сопоставляется с гистограммой разности при восприятии глубины феномена плоскостного изображения (рисунок 4).

Рис. 3. Гистограмма разности восприятия растрового изображения

Рис. 4. Гистограмма разности восприятия 2D изображения

На рисунках 3 и 4 видно: сдвиг максимума контура гистограмм разности в область отрицательных значений, ширина контура изображений показывает общие закономерности наблюдения глубины плоскостного и растрового изображений.

В пункте 2 формулы показано, что контур гистограммы разности плоскостного восприятия стереограммы сопоставим с контуром гистограммы разности восприятия стереоглубины стереограммы (рисунок 5).

На рисунке 5 по горизонтальной шкале откладываются показания, получаемые непосредственно из значений числовых массивов.

Рис. 5. Контуры гистограмм разности при восприятии стереограммы: плоскостное восприятие (I) трехмерное восприятия (II)

Контур гистограммы при восприятии стереоскопической глубины (II) формируется величиной диспаратности построения стереограммы. Сравнение контуров гистограмм показывает, что ширина контура плоскостного восприятия (I), как минимум, не меньше второго контура. Иными словами, величина восприятия глубины плоскостного изображения сопоставима с глубиной восприятия стереоглубины стереограммы. Контур восприятия (I) позволяет пояснить эффекты восприятия рельефности, который выявлен нами по выборке приблизительно из 1000 чел.

Второе направление – визуализация наблюдаемых эффектов восприятия глубины. Прямое наблюдение значений текущих значений Х-координат плоскостного изображения (рисунок 6) однозначно показывает возникновение диспаратности (Антипов и др., 20136), следовательно, как показано выше, и восприятия глубины образов плоскостных изображений.

На рисунке 6 показан фрагмент записи координат правого (R) и левого (L) глаз при восприятии глубины плоскостного изображения. Рисунок 7 иллюстрирует начало записи Х-координат при восприятии стереоглубины стереограммы. На рисунке 7 видно, что в условиях плоскостного восприятия левый и правый глаза имеют общие координаты (620 ед. верт. шкалы – начало записи). Рисунок 7 получен при фокусировке глаз осуществляемой до плоскости расположения стереограммы. Видно, что разность АХ на рисунке 7 почти в два раза больше разности показаний рисунка 6. Однако такие отличия не означают, что восприятие глубины, показанной на рисунке 6, меньше, чем стереоскопическая глубина стереопары. Просто для наблюдения стереоглубины стереопары необходимо обеспечить горизонтальную диспаратность на величину горизонтального смещения двух изображений.

Рис. 6. Текущие значения Х-координат при восприятии 2D-изображения стереопары

Рис. 7. Текущие значения Х-координат при восприятии стереоглубины

Рисунок 8 иллюстрирует соотношения глубины наблюдения 2D-изображения и стереогубины стереопары в одних условиях наблюдения. На верхней паре (I) показаны траектории движения правого и левого глаз при восприятии глубины феномена одиночного изображения. На нижней паре (II) приводятся траектории движения глаз в условиях восприятия стереоглубины стереопары. Если сфокусировать глаза до расположения стереопар так, чтобы изображений стало три, то средние изображения позволяют сопоставить различные типы наблюдения глубины. Видно, что отделение траекторий движения (белый цвет) от плоскости изображений одного уровня восприятия глубины. Отличие лишь в том, что верхняя пара показывает условия восприятия глубины феномена для плоскостного изображения. Нижняя пара иллюстрирует возникновение стереоглубины, возникающей за счет получения горизонтальной диспаратности черно-белых распределений изображений.

Рис. 8. Траектории движения глаз, построенные при восприятии глубины плоскостного изображения (I) и стереопары (II)

Третье направление:

1. Экспериментально выявленная способность восприятия глубины 2D-изображений позволила провести изучение ЭЭГ активности тех же изображений, которые использовались в айтрекинговых исследованиях (Антипов, Звездочкина, 2014). В работе регистрации ЭЭГ активности принимали участие 4 человека – В. Н. Антипов и три студента, прошедшие курс обучения. Все испытуемые утверждали, что могли обеспечить плоскостное и трехмерное восприятие изображений. Информация была получена от 8 симметрично расположенных отведений правого и левого полушарий, расположенных по международной схеме 10–20. Основные результаты: во-первых, при восприятии глубины в 1,8 и более раз увеличивается полная амплитуда когерентности по всем отведениям. Во-вторых в два и более раз повышается мощность альфа-, тета-ритмов правого и левого полушарий мозга.

2. На рисунке 1 приведена гистограмма разности при восприятии глубины образов плоскостного изображения. Она показывает, что плоскости фокусировки образов распределены по вполне определенному пространственному столбу. Формально реализуется вариант аналога наблюдения различных цветовых распределений с различной величиной значений горизонтальной диспаратности. При развитой способности восприятия глубины образов 2D-изображений можно зафиксировать расположение глубины цветовых распределений. Например, в условиях концентрации взгляда на некоторых изученных при айтрекинговых исследованиях 2D-изображениях можно воспринимать движение одних образов относительно других. Такая особенность позволила разработать тест по выявлению новой способности восприятия 2D-изображений (Антипов, 2015). 3. К фундаментальным результатам приводят гистограммы разности рисунках 3, 4, 5. Они демонстрируют экспериментально доказанные способности восприятия глубины, объема образов плоскостных изображений. В совмещении с проведенным опросом выборки – 1000 чел. по восприятию рельефности это позволило разработать «способ выявления феномена коллективно-когнитивного бессознательного восприятия» (Антипов, Звездочкина, 2015).

Четвертое направление. Гистограмма разности, показанная на рисунке 3 позволяет подобрать вполне определенные наборы ЗD-растровых изображений, которые соответствовали бы условиям восприятия глубины 2D-изображений. Иными словами, при попадании подобранных растровых изображений в поле зрения зрительная система любого человека будет получать опыт наблюдения глубины вне плоскости расположения изображения. Именно такая технология использована в тренинге развития новой способности восприятия. Айтрекинговые исследования позволяют построить наборы ЗD-изображений с требуемыми характеристиками (Антипов, 2013). Такого типа растровые изображения предлагается применить и для обучения операторов интроскопа, проводящих контроль за багажом пассажиров при досмотре в аэропорту (Антипов, Курчавов, 2013).

Выводы обзора изобретений

1. Айтрекинговые исследования показали, что при восприятии глубины, объема образов плоскостных изображений фокусировка глаз осуществляется за плоскостью расположения стимульного 2D-изображения. Возможны состояния с пространственно-протяженным «столбом», заполненным образами изображения.

2. Установлено, что продолжительность фиксации правого и левого глаза различается в два раза.

3. Выявлено, что восприятие глубины характеризуется горизонтальной и вертикальной диспаратностью.

4. Уровень восприятия глубины плоскостного изображения сопоставим с глубиной восприятия ЗD-растровых изображений, стереоскопической глубиной стереограмм в условиях фузии.

5. При возникновении глубины 2D-изображения возникают кратковременные неустойчивые состояния восприятия. Такие состояния могут стать «помехой» в процессе скорости принятия решений операторов, диспетчеров, летного состава и т. д. при наблюдении плоскостных изображений на экранах различного типа мониторов, пультовых приборов или при посадке в ночных условиях полета.

6. Для получения достоверной информации влияния восприятия глубины плоскостных изображений на скорость приятия решения целесообразно изучение конкретных условий наблюдения.

7. Полученные результаты исследований позволяют сделать предположение, что восприятие рельефности относится к уровню автоматического явления бессознательного когнитивного процесса.

Подробная информация по приведенным в статье изобретениям может быть найдена по номеру патента на сайте Роспатента в разделе «Открытые реестры».

В перспективе предполагается продолжить исследование с целью получения информации по 2D-изображениям с пространственным расположением образов.

Литература

Антипов В. Н. Способ формирования трехмерных изображений (варианты) // Бюл. № 32. Опуб. 20.11.2005. Пат. № 2264299 RU.

Антипов В. Н. Способ выявления феномена коллективно-когнитивного бессознательного восприятия // Опуб. 2015. Пат. № 2553495 RU.

Антипов В. Н., Вахрамеева О. А., Жегалло А. В., Хараузов А. К., Шелепин Ю. Е., Галимуллин Д. 3. Способ развития когнитивного трехмерного восприятия плоскостных изображений // Бюл. № 17. Опуб. 20.06.2013а. Пат. № 2484790 RU.

Антипов В. Н., Вахрамеева О. А., Жегалло А. В., Хараузов А. К., Шелепин Ю. Е. Способ выявления способности восприятия глубины и объема плоскостного изображения // Бюл. № 23. Опуб. 20.08.20136. Пат. № 2489961 RU.

Антипов В. Н., Жегалло А. В. Способ выявления диапазона условий восприятия глубины образов плоскостных изображений // Бюл. № 28. Опуб. 10.10.2014а. Пат. № 2530660 RU.

Антипов В. Н., Жегалло А. В. Способ выявления условий восприятия глубины образов плоскостных изображений // Бюл. № 31. Опуб. 10.11.20146. Пат. № 2532401 RU.

Антипов В. Н., Жегалло А. В. Способ выявления уровня восприятия глубины образов плоскостных изображений // Бюл. № 1. Опуб. 10.01.2015. Пат. № 2538452 RU.

Антипов В. Н., Звездочкина Н. В. Способ выявления способности трехмерного восприятия плоскостных изображений // Бюл. № 19. Опуб. 10.07.2014. Пат. № 2521842 RU.

Антипов В. Н., Курчавое В. В. Способ тренинга когнитивного восприятия // Бюл. № 22. Опуб. 10.08.2013. Пат. № 2489743 RU.

Антипов В. Н., Попов Л. М. Способ визуализации многоуровневого восприятия глубины образов плоскостных изображений // Бюл. № 10. Опуб. 10.04.2015. Пат. № 2547957 RU.

Методика исследования зрительного восприятия недоношенных младенцев

А. И. Котюсов, К. И. Гришина

Недоношенность является одной из часто встречающихся причин отклонений в развитии ребенка. Согласно критериям ВОЗ, недоношенным считается ребенок, родившийся при сроке беременности от 22 до 37 недель (Кулаков, 2006). Процент недоношенных детей из общего числа рождения в развитых странах колеблется от 4 % до 12 %, в России 6 % – 8 %. Выявление отклонений в развитии детей уже на ранних стадиях в настоящее время является ключевой проблемой ряда наук, таких как возрастная психология, нейрофизиология, медицина.

Биологические факторы, влияющие на развитие недоношенных детей, разделяют на две группы: врожденные пороки, нарушение развития ребенка вследствие патологий внутриутробного развития; нарушения, являющиеся следствием преждевременного рождения. Среди психосоциальных факторов, влияющих на развитие ребенка, можно выявить следующие: ранняя сенсорная и эмоциональная депривация новорожденного, а также лишение матери контакта с ребенком; госпитальная депривация (Васильева, 2010).

Довольно часто встречающейся патологией у новорожденных вследствие перенесенной гипоксии является «перинатальная энцефалопатия» (Барашнев, 2001). Это расстройство центральной нервной системы имеет ряд проявлений, таких как синдром гипервозбудимости, синдром угнетения ЦНС и синдром мышечного гипертонуса. Но даже при отсутствии органических поражений мозга психическое развитие недоношенных детей может отличаться от нормативного (Луковцева, 1999; Кулаков, 2006).

Существуют исследования глубоко недоношенных детей, результаты которых показывают отставание зрительного восприятия по сравнению с родившимися в срок детьми в возрасте 2 и 4 месяца (Strand-Brodd, 2011). Другими исследователями была отмечена меньшая чувствительность при зрительном восприятии, а также меньшая согласованность движений глаз у недоношенных детей по сравнению с доношенными детьми (Taylor, 2010).

При нормативном развитии в период между третей и пятой неделями у младенца появляется зрительное сосредоточение на объекте (Эльконин, 2007). К четырем месяцам время зрительного сосредоточения достигает 7–8 минут, при этом ребенок начинает активно реагировать на увиденное, выделять контур, определять форму предметов. Ребенка больше привлекают изогнутые элементы, фигуры концентрической формы, движущиеся предметы. В норме у детей наблюдается выраженная реакция на социальные стимулы, т. е. лица привлекают внимание в большей степени, чем предметы. Новые предметы привлекают внимание ребенка больше, чем знакомые. Таким образом, можно говорить о наличии перцептивного анализа уже у самых маленьких детей, однако внимание ребенка в этом возрасте носит еще непроизвольный характер (Крайг, 2005).

Сенсорное развитие ребенка в 5 месяцев опережает моторное. Так, в этом возрасте развитие фокусирующей способность глаз уже близко к взрослому, высока острота зрения, при этом ребенок еще не умеет ползать и сидеть (Крайг, 2005).

Исследование зрительного восприятия методом айтрекинга представляется перспективным, так как позволяет исследовать непосредственно когнитивные процессы младенцев с момента, когда восприятие начинает формироваться, т. е. уже со второго месяца жизни.

Исследование в настоящее время проводится на базе «Лаборатории мозга и нейрокогнитивного развития» УрФУ и рассчитано на диагностику детей в возрасте от 5 месяцев в течение последующих трех лет. Используется стимульный материал, разработанный в «Centre for Brain and Cognitive Development» в Лондоне (Bedford, 2012; Gliga, 2012).

Регистрация движения глаз осуществляется с помощью айтрекера модели RED500 – бесконтактной удаленно контролируемой инфракрасной камеры.

Для работы с айтрекером RED500 было установлено программное обеспечение компании SensoMotoricInstruments (SMI):

– SMI iView X2.8.26 – интерфейс взаимодействия установки RED500 и операционной системы Windows;

– SMI ExperimentCenter 3.5.101 – программа для предъявления стимульного материала и записи характеристик движения взгляда;

– SMI BeGaze 3.5.74 – программа для обработки результатов, полученных при помощи SMI ExperimentCenter.

Сам эксперимент состоит из трех блоков. Каждый блок включает процедуру калибровки, стимульный материал и процедуру валидации. Между демонстрацией каждого блока возможно делать перерыв, во время которого ребенок может отдохнуть и восстановить психические ресурсы.

Во время эксперимента ребенок находится на коленях у родителей или сидит в кресле. Расположение айтрекера регулируется так, чтобы середина монитора находилась на одной высоте с глазами ребенка, расстояние от монитора до ребенка 70 см.

Процедура калибровки – процесс, при котором iViewX производит установление соответствия между позицией глаза, зафиксированной камерой, и точкой взгляда в пространстве, так называемой точки связи. Калибровка также определяет плоскость в пространстве, в которой фиксируется взгляд. Так как установленное соотношение сильно зависит от системных настроек, испытуемого и его положения, калибровка проводится перед каждым блоком и для каждого испытуемого. В исследовании проводится калибровка с девятью калибровочными точками, что дает достаточно высокую точность.

Рис. 1. Результат процедуры калибровки

Время предъявления каждого стимула в данном исследовании фиксировано, периодически между экспериментальными стимулами включаются дополнительные, цель которых заключается в привлечении внимании ребенка.

Первый блок состоит из трех видов стимулов. Первый вид представляет собой социальные стимулы – видеоролики, на которых записаны три модели, держащие в руках яркие разноцветные шарики. Модели по очереди или одновременно танцуют с шариками.

Рис. 2. Пример социального стимула

Второй вид – нейтральные стимулы, где фигуры моделей из первого ролика с помощью компьютерной обработки искажены так, что воспринимаются как движущиеся пятна.

Рис. 3. Пример нейтрального стимула

Третий вид представляет собой восемь изображений, на которых помещены разные объекты: изображение телефона, машины, птицы, лица человека и контур человеческого лица, заполненный шумовым фоном.

Рис. 4. Пример изображения

Анализируемые параметры:

– Суммарное время фиксации на движущихся объектах, отношение времени фиксации на социальных стимулах ко времени фиксации на нейтральных стимулах.

– Общее время и количество фиксаций на лице человека.

– Общее количество переключений между предметами и суммарное время рассматривания изображения.

Второй блок состоит из шестнадцати изображений, на которых по окружности распределены абстрактные символы, один из которых отличается от остальных. Одинаковые символы – диагональный крест (X), отличающийся символ-круг (0 или +). Ребенку в возрасте 5 месяцев проще выделить отличающийся стимул в виде круга, так как внимание младенцев привлекают фигуры концентрической формы. Отличающийся символ в виде горизонтального креста считается более сложным для восприятия детей этого возраста.

а)

б)

Рис. 5. Стимульное изображение а) с простым символом; б) со сложным символом

Анализируемые параметры:

– Время фиксации на отличающемся символе.

– Общее количество переключений.

– Общее время рассматривания изображения.

Третий блок состоит из шести видеороликов, на которых модель сидит за столом, опустив голову; слева и справа от нее находится по одной игрушке. Модель поднимает голову и смотрит прямо, привлекая внимание ребенка, затем поворачивает голову и переводит взгляд на одну из игрушек.

Рис. 6. Стимульный материал третьего блока

Анализируемые параметры:

– Наличие фиксации взгляда на модели во время второго этапа.

– Перевод взгляда на игрушку за моделью.

– Общая стратегия рассматривания: количество переключений, время фиксации на релевантном и нерелевантном объекте.

Стимулы в каждом блоке демонстрируются в случайном порядке.

Завершающим этапом каждого блока проводится валидация, предназначенная для проверки точности отслеживания взгляда. Во время процедуры валидации объекты показываются на тех же местах, на которых находились объекты для калибровки.

Таким образом, данная методика позволяет выявить следующие параметры когнитивного компонента зрительного восприятия:

– Ориентировочная реакция на движение.

– Предпочтение социальных стимулов (человеческое лицо) нейтральным.

– Ориентировочная реакция на отличающийся стимул.

– Совместное внимание.

Анализ динамики когнитивного развития недоношенных младенцев в сравнении с нормативно развивающимися дает возможность на раннем этапе выявить маркеры развития, специфичные для данной группы, что позволяет провести своевременную коррекцию когнитивного и сенсомоторного развития детей.

Литература

Барашнев Ю. И. Перинатальная неврология. М.: Триада-Х, 2001.

Васильева М. Ю. Недоношенные дети: предсказуемое отставание или опережающее развитие? // Четвертая международная конференция по когнитивной науке: Тезисы докладов ТГУ. Т. 2. Томск, 2010.

Крайг Г., Бокум Д. Психология развития. 9-е изд. СПб.: Питер, 2005.

Кулаков В. И., Антонов А. Г., Байбарина Е. Н. Проблемы и перспективы выхаживания детей с экстремально низкой массой тела на современном этапе // Российский вестник перинатологии и педиатрии. М., 2006. № 4. С. 8–11.

Луковцева З. В., Ваз Л. Л. Психическое развитие недоношенного младенца // Вопросы психологии. 1999. № 6. С. 29–36.

Эльконин Д. Б. Детская психология: учебное пособие для студ. выс. учеб. заведений. 4-е изд., стер. М.: ИЦ «Академия», 2007.

Bedford R., Elsabbagh M., Gliga Т., Senju A. & the BASIS team. Precursors to social and communication difficulties in infants at-risk for autism: gaze following and attentional engagement // Journal of Autism and Developmental Disorders. 2012. № 42 (10). P. 2208–2218.

Gliga Т., Elsabbagh M., Hudry K., Charman Т., Johnson M. Gaze following, gaze reading and word learning in children at-risk for autism // Child Development. 2012. № 83 (3). P. 926–938.

Strand-Brodd K., Ewald U., Gronqvis H., Holmstrom G., Stromberg В., Gronqvist E., von Hofsten C., Rosander K. Development of smooth pursuit eye movements in very preterm infants: General aspects // Acta Paediatrica. 2011. № 100 (7). P. 983–991.

Taylor N. M., Jakobson L. S. Representational momentum in children born preterm and at term // Brain and Cognition. 2010. № 72. P. 464–471.

Окуломоторная активность при восприятии лиц: основные направления исследований[4]

А. А. Демидов, К. И. Ананьева

Исследования, связанные с регистрацией движений глаз при восприятии изображений лиц, исходят из гипотезы, постулирующей непосредственную связь направленности взора человека и его внимания, т. е. внимание, локализуется в пространстве там, куда направлен взор человека. Для многих ситуаций поведения человека это гипотеза является вполне обоснованной, хотя имеется целый ряд исключений, связанных с динамикой так называемого функционального поля зрения.

Современные исследования в области регистрации движений глаз при восприятии выражений лиц можно условно разделить на 5 взаимосвязанных областей.

Локализация взора наблюдателя при рассматривании лица человека

Это традиционное направление исследований, ведущее свое начало с классических работ А. Л. Ярбуса и направленное на изучение маршрутов движений глаз (паттернов рассматривания) при восприятии изображений лиц. Так, регистрация движений глаз при рассматривании лица человека наиболее часто свидетельствует о том, что взор человека фиксирует наиболее информативные элементы лица – глаза, брови, нос, рот и др.

Целый ряд ученых (напр.: Hsiao, Cottrell, 2008) выдвигает гипотезу о том, что для успешного распознавания лица достаточно всего двух фиксаций, причем первая из них преимущественно локализуется в области носа. Целью исследования Дж. Хсао и Г. Коттрелла (Hsiao, Cottrell, 2007, 2008) являлось изучение влияния количества зрительных фиксаций на успешность распознавания лиц. Эксперимент включал два этапа: первый – обучающий, второй – «идентификационный». В рамках «идентификационного» этапа экспериментально ограничивалась возможность рассматривания изображения лица – восприятие изображений либо ограничивалось 1, 2 или 3 фиксациями, либо не ограничивалось вовсе (свободное рассматривание). Было выявлено, что испытуемые способны успешно идентифицировать предъявляемые им лица даже при одной зрительной фиксации, хотя результативность их деятельности все же улучшалась, если они могли сделать 2 фиксации. Но при дальнейшем увеличении возможности рассматривания изображений эффективность распознавания не повышалась. Поэтому вполне возможно заключить, что для распознавания лица требуется всего лишь 2 зрительные фиксации. Результаты, полученные в других исследованиях (Rozhkova, Ogninov, 2009) действительно свидетельствуют о том, что для успешного распознавания лица достаточно всего одной-двух фиксаций, однако не всегда первая из них располагается в области носа. Локализация первой фиксации может варьироваться в зависимости от экспериментальных условий и от индивидуальных особенностей испытуемых.

В ряде исследований было показано, что наиболее значимая информация для решения задач по различению лиц расположена в верхней его части (Fisher, Сох, 1975; Langdell, 1978; Schyns et al., 2002), в то время как значимая информация для распознавания экспрессии (напр., счастья или отвращения) локализована в нижней части лица (Smith et al., 2005). Были получены данные, подтверждающие указанные предположения (Malcolm et al., 2010). Было показано, что движения глаз при восприятии лиц скорее определяется той перцептивной задачей, которая стоит перед испытуемым, нежели особенностями самого стимульного объекта (лица).

В ряде исследований (Henderson et al., 2005; Mantyna & Holm, 2006) было показано, что движения глаз в процессе решения задач на распознавание лиц играют функциональную роль, и если специально ограничить возможность испытуемого рассматривать предъявляемые изображения лиц, то это приведет к снижению эффективности распознавания.

Достаточно хорошо известны факты о том, что культурный контекст определяет конкретные стратегии зрительного восприятия объектов. Так, для представителей восточных культур характерна холистическая стратегия восприятия окружающего мира, а для представителей западной культуры – аналитическая. Применительно к процессу распознавания лиц это находит выражение в том, что представители западных культур обычно фиксируют области рта и глаз, в то время как представители восточных культур – область носа (точность распознавания лиц в обеих популяциях примерно одинаковая). Потенциальным объяснением данных различий могут выступать социальные нормы, принятые в этих культурах, регламентирующие использование взора в качестве средства коммуникации.

Однако следует помнить, что локализация фиксации не предоставляет прямого ответа на вопрос, какую информацию вычленяет в данный момент испытуемый (Posner, 1980; Kuhn, Tatler, 2005). Так, хотя представители восточных культур при свободном рассматривании лица фиксируют его центральную область – нос, это вовсе не означает, что информация, «содержащаяся» в данной области, используется ими для идентификации лица. Результаты ряда исследований (Gosselin, Schyns, 2001; Calrada et al., 2005), в которых применялись различные методики, свидетельствуют о том, что информация, используемая испытуемыми для точной идентификации воспринимаемых лиц, «расположена» в области глаз. Таким образом, представляется возможным предположить, что представители восточных культур при восприятии лиц фиксируют область носа, но в реальности опираются, видимо, посредством парафовеального зрения на информацию, заключенную в области глаз.

В исследовании Калрада с соавт. (Calrada et al., 2010) изучались различия стратегий опознания лиц представителями западной и восточной культур. С этой целью была использована апертура Гаусса, которая ограничивала область видения (ее размеры составляли 2, 5 и 8 градусов). В ситуациях, когда размер апертуры был 2 или 5 градусов, область видения была достаточной, чтобы воспринимать какой-то один элемент лица (напр., нос или глаз), но в то же время была ограниченной, чтобы воспринимать одновременно глаза или рот при фиксации области носа. В ситуации же, когда размер апертуры составлял 8 градусов, испытуемый мог одновременно воспринимать и глаза, и рот при фиксации носа. В ходе решения задач на опознание лиц у испытуемых производилась регистрация движений глаз, с последующим анализом распределения их фиксаций. Показано, что в ситуациях, когда использовалась апертура в 2 и 5 градусов, различия в стратегиях фиксаций, которые отмечались целым рядом исследователей, нивелируются. Испытуемые обеих популяций («восточной» и «западной») преимущественно фиксировали область глаз. В ситуациях, когда использовалась апертура в 8 градусов (т. е. в ситуации, когда при фиксации носа были видны и глаза) представители восточной культуры вновь демонстрировали «традиционную» для них стратегию холистического восприятия лица. Авторы исследования заключают, что когнитивные механизмы, используемые для точной идентификации представителей своей культуры, – инвариантны, но вот используемые стратегии для извлечения информации для этого, вероятно, модулируются социальным опытом и культурным контекстом.

Результаты, полученные в исследовании Келли (Kelly et al., 2010) свидетельствуют о том, что зрительные фиксации испытуемых – представителей западной культуры – систематически располагаются в области глаз и рта (на этапе знакомства со стимульным набором лиц) и в области рта (на этапе идентификации ранее предъявленных лиц). Напротив, зрительные фиксации представителей восточных культур преимущественно располагаются в области носа (на обоих этапах решения экспериментальной задачи). Подобная стратегия рассматривания изображений лиц воспроизводится испытуемыми и при восприятии других изображений (морд животных и абстрактных фигур). Фиксации испытуемых – представителей западной культуры – более распределены по поверхности этих изображений, в то время как фиксации представителей восточных культур более центрированы. Таким образом, можно предположить, что различия в стратегиях рассматривания человеческого лица определяются не исключительно социальными нормами коммуникации, но и более фундаментальными когнитивными особенностями приема и переработки информации (такими как, напр., аналитический или холистический способ обработки информации).

Особенности рассматривания лиц людьми, имеющими различные отклонения в психическом развитии

Этот тип исследований представлен в современной психологической периодике достаточно хорошо, связано это с тем, что многие виды нарушений психического развития и функционирования ведут к нарушению восприятия и переработки информации о социальных объектах и событиях, прежде всего, связанных с поведением людей. И в этом плане изучение процесса восприятия изображений лиц позволяет реконструировать сложную систему детерминант социального восприятия.

В исследовании Далтон (Dalton et al.,2005) было показано, что у аутистов продолжительность фиксаций в области глаз при восприятии лиц уменьшается, при этом наблюдается гиперактивация латеральной затылочно-височной извилины. Также показано, что аутисты имеют тенденцию делать меньшее количество зрительных фиксаций во внутренней области лица (Pelphrey et al., 2002; Dalton et al., 2005). В исследовании Клин (Klin et al., 2002) было показано, что аутисты при просмотре динамичных изображений лиц имеют тенденцию больше времени фиксировать свой взгляд в области рта воспринимаемого человека, нежели в области его глаз.

Исследование Стердинг (Sterling, 2008) проводилось на двух группах испытуемых: группа аутистов и группа здоровых. Им предъявлялись изображения лиц 3 категорий: 1 – «хорошо знакомые лица» – лица близких людей (мать, отец, супруг, друг и т. д.), 2 – лица незнакомых людей, 3 – лица условно знакомых людей (лица, которые испытуемые могли наблюдать несколько раз). Задачей испытуемых было простое рассматривание изображений лиц в течение 10 с.

В соответствии с ранее полученными результатами показано, что здоровые испытуемые по сравнению с аутистами больший процент времени фиксируют область глаз независимо от того, знакомое или незнакомое лицо они воспринимают. Эти результаты воспроизводят клинические данные, свидетельствующие о редукции внимания аутистов к такой области воспринимаемого лица, как глаза. При этом на факт уменьшения внимания аутистов к области глаз влияет степень знакомства с воспринимаемым лицом.

Новым результатом в данном исследовании является то, что в противоположность здоровым испытуемым у аутистов не наблюдается различий между паттерном рассматривания знакомых и незнакомых лиц. Особенно если учесть, что для здоровых испытуемых характерно большее количество фиксаций при рассматривании незнакомых лиц по сравнению с рассматриванием знакомых лиц, в то время как для аутистов количество фиксаций при рассматривании лиц обеих категорий не различается.

Больший процент фиксаций и большее время фиксаций для обеих групп испытуемых приходится на области глаз воспринимаемого лица по сравнению с областью рта (независимо от категории рассматриваемого лица). Особо интересно, что это справедливо и для группы аутистов (несмотря, конечно, на то, что для них характерно общее снижение внимания к области глаз по сравнению со здоровыми испытуемыми). Данный результат отличается от того, который часто представляется другими исследователями (Klin et al., 2002; Spezio et al., 2007a). Авторы описанного исследования объясняют это, во-первых, различиями в использованных стимульных изображений, а во-вторых, особенностями экспериментальной задачи, стоящей перед испытуемыми.

В исследовании Пелпрей (Pelphrey et al., 2002) показано, что аутисты при распознавании экспрессии лица значительно большее время рассматривают области, лишенные опорных опознавательных признаков (напр., область уха, подбородок, прическа) по сравнению с контрольной группой здоровых испытуемых, преимущественно фиксирующих области глаз, носа и рта.

Это свидетельствует о различии стратегий восприятия лиц у аутистов и здоровых людей, которые выражаются в аналитической у первых и холистической направленности у вторых.

В работе Брунет с соавт. (Brunet et al., 2009) рассматриваются особенности окуломоторной активности при рассматривании лица застенчивыми детьми. В исследовании принимали участие здоровые дети в возрасте 11 лет. Уровень застенчивости определялся по заполняемому родителями опроснику «Колорадский Детский Темпераментальный опросник» (Colorado Childhood Temperament Inventory, CCTI). Выполняемое детьми задание представляло собой задачу «одинаковый-разный» (same-different) на широком спектре стимульного материала (трансформированные и ретушированные изображения лица). Результаты исследования показали наличие корреляций между уровнями застенчивости и отдельными показателями окуломоторной активности (более продолжительное время рассматривания левого глаза; большее число фиксаций в зону левого глаза и т. д. для отдельных типов стимульного материала).

Особенности движений глаз
при рассматривании знакомых и незнакомых лиц

В исследовании Альтоф и Кохет (Althoff, Cohen,1999) было показано, что паттерны движений глаз при восприятии знакомых и незнакомых («новых») лиц различаются. Несмотря на это, можно указать не так много исследований, в которых изучаются факторы, определяющие процесс «перехода» незнакомых лиц в знакомые. В исследовании О'Доннел и Брюс (O'Donnell, Bruce, 2001) было показано, что наблюдатели более «чувствительны» к изменению внутренних черт у знакомых изображений лиц, нежели у незнакомых. Схожие результаты были получены и в исследовании Стэйси с коллегами (Stacey et al., 2005). Показано, что наблюдатели более продолжительное время рассматривают внутренние черты лица (прежде всего, глаза) у известных им лиц, нежели у неизвестных. В противоположность этому при рассматривании незнакомых лиц наблюдатели большее время тратят на фиксацию внешних черт лица (прическа, форма лица и т. д.). Интересно отметить, что данные закономерности наблюдались только тогда, когда испытуемые выполняли задачу на сравнение воспринимаемых лиц (matching task); при выполнении задачи на опознание предъявляемых лиц (familiarity judgment task) испытуемые большее время рассматривают внутренние черты и знакомых, и незнакомых им лиц. Таким образом, упомянутые результаты исследований позволяют предположить, что внутренние черты лица «предоставляют» более важную информацию об идентичности лица, нежели его внешние черты.

Различия могут наблюдаться и в том, как мы вычленяем информацию об идентичности лица при восприятии знакомых и незнакомых лиц. Было показано (Althoff & Cohen, 1999), что при рассматривании знакомых лиц наблюдатели большее время фиксируют область глаз, нежели область рта воспринимаемого лица. В то время как при рассматривании незнакомых лиц наблюдатели фиксируют большее количество областей лица. Эти различия возникают уже на самых ранних этапах восприятия лиц (в ходе первых пяти фиксаций). Кроме того, паттерны движений глаз при восприятии знакомых лиц носят более разнообразный, непредсказуемый характер, нежели чем при восприятии незнакомых лиц.

Также было показано (Henderson et al., 2005), что движения глаз могут играть функциональную роль в процессе знакомства («заучивания») с новыми лицами. В этом исследовании испытуемые знакомились с новыми лицами при двух различных условиях восприятия – при свободном рассматривании лиц и при вынужденной фиксации центра лица. Эффективность выполнения задачи на распознавание была выше при первом условии восприятия, чем при втором. Интересно отметить, что при рассматривании лиц на этапе распознавания движения глаз испытуемых были в большей степени сосредоточены на внутренних чертах лица, чем на этапе знакомства с лицами.

В исследовании Дж. Хейс и Д. Шор (Heisz, Shore, 2008) изучалось то, как изменяются паттерны движений глаз при первичном и повторном рассматривании изображений лиц в ходе выполнения задач идентификации и распознавания данных изображений. На протяжении четырех дней испытуемым предъявлялись для знакомства новые изображения лиц, а также повторно экспонировались ранее предъявленные лица. В первые три дня испытуемые выполняли задачу идентификации по именам предъявленных им новых и ранее экспонированных лиц. На четвертый день испытуемые выполняли задачу распознавания лиц. Им предъявлялись ранее экспонированные в течение первых трех дней лица, а также набор новых изображений лиц. Задача испытуемых состояла в том, чтобы определить, предъявлялось ли ранее изображение лица или нет. В ходе выполнения задач по идентификации и задач по распознаванию осуществлялась регистрация движений глаз испытуемых. Производился анализ пространственно-временных характеристик движений глаз в зависимости от количества ранее произведенных предъявлений рассматриваемого лица от типа задачи.

Были получены следующие результаты. Выявлены изменения характеристик движений глаз в зависимости от «знакомости» рассматриваемого лица (face familiarity). Точность выполнения задач по идентификации и задачи по распознаванию лиц повышается с увеличением числа предъявлений лиц. Среднее же число фиксаций, наоборот, сокращается с увеличением числа предъявлений лиц. Область глаз воспринимаемого лица фиксируется более продолжительное время и чаще, чем другие области лица, независимо от степени знакомства с ним. Хотя следует отметить, что по мере того, как степень знакомства рассматриваемого лица возрастает, испытуемые больше рассматривают область глаз, в то время как области носа, рта, лба, подбородка и щек привлекают меньшее внимание испытуемых. Данная закономерность была выявлена только при решении задач на идентификацию лиц, но не по их распознаванию. Различия между паттернами движений глаз при рассматривании одних и тех же лиц начинают наблюдаться только после четвертой экспозиции лица, т. е. изменения в окуломоторной активности при рассматривании одного и того же лица несколько раз происходят постепенно.

Стоит отметить, что по мере того, как воспринимаемое лицо становится более знакомым, у испытуемых меняются стратегии их рассматривания; когда испытуемые воспринимают лицо при первом его предъявлении, паттерн движений глаз распределен по всему «пространству лица», по мере того как степень знакомства лица возрастает, испытуемые преимущественно фиксируют только область глаз. Можно говорить о существование разных стратегий восприятия знакомых и незнакомых лиц: первая – аналитическая стратегия, основанная на рассматривании одной, ключевой области лица (преимущественно, области глаз), вторая – целостная стратегия, основанная на рассматривании всей поверхности воспринимаемого лица. Подобные данные можно найти и в других исследованиях (Althoff, Cohen, 1999; Stacey et al., 2005), однако в описанном исследовании эти две различные стратегии восприятия были продемонстрированы на одном и том же стимульном материале.

В работе Девью с соавт. (Devue et al., 2009) исследователи попытались выяснить, различаются ли особенности рассматривания знакомых и незнакомых лиц (при выполнении испытуемыми нерелевантной, т. е. напрямую не связанной с оценкой знакомости), задачи. Предполагалось, что знакомые лица будут быстрее обращать на себя внимание. Испытуемые должны были указать, присутствует ли в наборе из шести лиц целевое изображение. Целевое изображение представляло собой лицо человека, издающего звук «м» или «о», на изображениях-дистрактрах натурщики издавали противоположный звук. В число рассматриваемых изображений входило лицо самого наблюдателя и человека, с которым он хорошо знаком. В половине экспериментальных ситуаций присутствовали изображения знакомых лиц, в половине – нет. Результаты показали, что время реакции выше для экспериментальных ситуаций, в которых отсутствует целевое изображение. В случае, если присутствовало изображение знакомого лица, время реакции несколько увеличивалось, но различие не являлось значимым. Также для экспериментальных ситуаций с отсутствующим целевым изображением значимо увеличивалось количество саккад. Было установлено, что если знакомое изображение не является целевым, то оно рассматривается значимо дольше, чем дистрактор, представляющий собой незнакомое изображение. Различий в среднем времени от начала предъявления до начала рассматривания изображения (в зависимости от того, знакомое оно или нет), не выявлено.

В работе Мав с соавт. (Maw et al., 2004) та же проблема восприятия знакомых и незнакомых лиц изучалась с использованием методики предъявляющей стимульный материал с учетом направленности взора наблюдателя (gaze-contingent paradigme). Стимульный материал представлял собой фотоизображения известных и неизвестных людей (угловые размеры 18°х24°). От испытуемых требовалось рассмотреть фотоизображение и дать ответ на вопрос: известен ли им этот человек? Изображения предъявлялись в четырех условиях рассматривания. В условии 1 поле зрения наблюдателя не было ограничено, он мог свободно рассматривать все изображение. В условии 2 поле зрения представляло собой круг диаметром 8,2° центр круга соответствует позиции взора наблюдателя. За пределами круга изображение было маскировано. При изменении позиции взора наблюдателя круг автоматически перемещался в новую позицию. Условия 3 и 4 были аналогичны условию 2, но диаметр круга составлял 5,5° и 4,1° соответственно. От участников эксперимента требовалось рассмотреть предъявленное изображение и нажатием соответствующей кнопки указать, знакомо ли ему данное лицо. Результаты исследования показали, что время реакции значимо возрастает с усложнением условий экспозиции как для изображений известных людей (1,9 с, 4,57 с, 6,57 с, 9,34 с соответственно), так и для изображений неизвестных людей (1,82 с, 5,69 с, 7,60 с, 11,33 с соответственно). Также с усложнением условий экспозиции уменьшается доля верных ответов (91,3 %, 78,0 %, 67,8 %, 68,7 %). Продолжительность фиксаций при усложнении условий предъявления значимо возрастает как для изображений известных людей (266 мс, 315 мс, 312 мс, 336 мс), так и для изображений неизвестных людей (263 мс, 293 мс, 304 мс, 316 мс). Амплитуда саккад при этом значимо не изменяется и составляет 5,3°-6,45°. Авторы полагают, что данный результат объясняется тем, что наблюдатели осуществляют перемещение взора в определенные «ключевые позиции», несущие важную информацию о знакомости или незнакомости изображения. Величина раскрытия зрачка при усложнении условий экспозиции значимо уменьшается, что объясняется авторами уменьшением количества поступающей информации.

Индивидуально-психологические характеристики окуломоторной активности

В исследовании Д. М. Исакович (Isaacowitz, 2005) было показано, что люди с высоким уровнем оптимизма чаще отводят свой взгляд от изображений лица, на которых был представлен рак кожи, чем пессимисты.

В целом ряде исследований (Bradley et al., 2000; Mogg et al., 2000) было обнаружено, что люди с повышенной тревожностью демонстрируют выраженную чувствительность к негативным социальным стимулам. Так, для людей с выраженной тревожностью, а также с клиническими тревожными расстройствами характерно повышенное внимание к изображению лиц, выражающих угрозу, что проявляется в более детальном их рассматривании. В частности, тревожные люди делают большее число фиксаций в области глаз воспринимаемого лица (Bradley et al., 2000).

Известно, что глаза человека являются эффективным средством выражения его эмоций, соответственно, они предоставляет значимую информацию для идентификации этих эмоций (Adolphs, 2006). Однако это справедливо в отношении не всех, а только некоторых эмоций (напр., страха) (Adolphs et al., 2005).

Цель исследования С. Б. Перлман (Perlman, 2009) состояла в том, чтобы изучить особенности движений глаз людей с различной выраженностью личностных особенностей при восприятии лиц, выражающих базовые эмоции. Личностные особенности диагностировались с помощью методики «Большая пятерка» (Big Five). При анализе данных, особое внимание уделялось анализу паттернов движений глаз у людей с различным уровнем нейротизма. В исследовании принимало участие 30 человек, которым на 5 секунд для свободного рассматривания демонстрировались изображения лиц с различной экспрессией (счастье, печаль, гнев, страх, удивление, отвращение и нейтральное выражение лица – Ekman, Friesen, 1975). Была обнаружена умеренная положительная, но значимая корреляция между уровнем нейротизма и продолжительностью рассматривания области глаз для всех изображений стимульного ряда. В частности, тестовый балл по шкале «нейротизм» значимо связан с продолжительностью фиксации области глаз при восприятии экспрессии страха, счастья и печали. При этом значение корреляции между уровнем нейротизма и продолжительностью фиксации области глаз при восприятии экспрессии страха было значимо выше, чем при восприятии экспрессии радости и печали. Из первоначальной выборки испытуемых были выделены две подгруппы: первая – испытуемые с высоким уровнем нейротизма, вторая – испытуемые с низким уровнем нейротизма. Было обнаружено, что при восприятии экспрессии страха испытуемые с высоким уровнем нейротизма рассматривают область глаз более продолжительное время, чем испытуемые с низким уровнем.

Исследователями был выполнен анализ количества фиксаций, приходящихся на область глаз при восприятии разных экспрессии. Обнаружена значимая положительная корреляция между уровнем нейротизма испытуемых и количеством фиксаций, приходящихся на область глаз при восприятии экспрессии страха. При восприятии же других эмоциональных экспрессии лица подобной связи обнаружено не было.

Известно, что распознавание экспрессии происходит уже в течение первых нескольких секунд восприятия лица, поэтому был выполнен специальный анализ – пересчет продолжительности рассматривания области глаз в течение первых трех секунд восприятия лица. Полученные результаты были сходны с результатами анализа восприятия лица в течение пяти секунд. Так, обнаружены значимые положительные корреляции между уровнем нейротизма испытуемых и продолжительностью фиксации области глаз при восприятии экспрессии страха, счастья и печали. К ним прибавилась еще и нейтральная экспрессия. Однако после выполнения статистической коррекции Бонферрони значимой осталась только одна подобная корреляция – при восприятии экспрессии страха.

К неожиданным данным этого исследования можно отнести то, что фактор «сознательности» (conscientiousness в «Большой пятерки») отрицательно связан с продолжительностью рассматривания области глаз при восприятии экспрессии страха, счастья и печали. Авторы объясняют эти данные тем, что для их выборки испытуемых была характерна отрицательная корреляция между уровнем их нейротизма и сознательности.

Результаты исследования Перлман (Perlman, 2009) согласуются с моделью «согласованности черт» (trait congruency model) (Bargh et al., 1988), согласно которой люди вычленяют только ту информацию, которая согласуется с их личностными чертами, и избегают информации, не соответствующей данным чертам.

Особенности окуломоторной активности в процессе восприятия искусственно трансформированных изображений лиц

В работе Батлер с соавт. (Butler et al., 2005) рассматривались особенности восприятия химерных лиц, в которых левая и правая половины представляют собой обобщенные изображения разных групп натурщиков. Усредненное изображение (blend image) строилось путем обобщения 10–30 изображений. Обобщение выполнялось путем усреднения группы изображений, на которые были нанесен набор контрольных точек. Следует отметить, что используемые приемы обеспечили крайне высокое качество химерных изображений, так что стык между левой и правой половинами абсолютно незаметен. Всего в стимульный материал было включено 10 обобщенных изображений мужчин, 10 обобщенных изображений женщин, 10 «химер» мужчина-женщина и 10 «химер» женщина-мужчина. Время экспозиции изображений составило 2 с. Анализ результатов показал, что в большинстве экспериментальных ситуаций (75 %) первая фиксация была сделана в левой половине предъявленных изображения. Ответы испытуемых давались по левой стороне лица в 62,8 % случаев ответов. В 70 % случаев половая принадлежность химерных изображений определялась по стороне, на которую приходилась первая фиксация. Для разных испытуемых положение первой фиксации значимо различалось, т. е., по-видимому, данный показатель является индивидуально-специфичным. В целом по выборке на левую половину изображения приходилось 55 % фиксаций (р = 0,06). В случае ответов по левой стороне изображения число фиксаций в левой половине значимо превышало число фиксаций в правой половине. В случае ответов по правой стороне изображения разница в числе фиксаций отсутствовала.

Работа Роксан с соавт. (Roxane et al., 2007) посвящена изучению того, какие механизмы отвечают за определение направления взора собеседника. Является ли данный механизм врожденным (reflexive) или развившимся в онтогенезе (learned). В качестве стимульного материала использовались фотоизображения 12 человек, съемка выполнялась анфас и в 3/4; взор модели мог быть направлен в камеру или вправо на 30°. В эксперименте участвовало 15 человек. Требовалось выполнить одну из двух задач: Gaze task, т. е. определить, смотрит ли модель на вас или в сторону и Head task – определить способ съемки: анфас или 3/4. Исследователи предполагали, что если механизм определения направления взора является врожденным, то в обеих задачах область глаз будет привлекать наибольшее внимание наблюдателя, причем первая саккада во всех случаях должна будет выполняться в область глаз. Полученные результаты показали, что в Gaze task зона глаз рассматривалась значимо дольше, чем в Head task; число первых саккад в зону глаз также значимо выше в Gaze task. Таким образом, зона глаз важна для наблюдателя при решении обеих задач, но для Gaze task она более важна, т. е. наблюдатель может сознательно изменять стратегию рассматривания в зависимости от поставленной задачи. Предположение о наличии автоматического врожденного механизма, ответственного за определение направления взора собеседника, не подтвердилось.

Литература

Brunet P. M., Heisz J. J., Mondloch C. J., Shore D. I., Schmidt L. A. Shyness and face scanning in children // Journal of Anxiety Disorders. 2009. V. 23. P. 909–914.

Butler S., Gilchrist I. D., Burt D. M., Perrettd D. L, Jonesa E., Harvey M. Are the perceptual biases found in chimeric face processing reflected in eye-movement patterns? // Neuropsychologia. 2005. V. 43. P. 52–59.

Devue C, Van der Stigchel S., Bredart S., Theeuwes J. You do not find your own face faster; you just look at it longer // Cognition. 2009. V. 111. P. 114–122.

Heisz J. J., Shore D. I. More efficient scanning for familiar faces // Journal of Vision. 2008. V. 8 (1). 9. P. 1–10.

Hsiao J., Cottrell G. The influence of number of eye fixations on face recognition // Journal of vision. 2007. June 30. V. 7. № 9. Article 494. doi:10/1167/7.9.494.

Hsiao J. H. Eye movements in face recognition. URL: http://cdn.intechweb. org/pdfs/10208.pdf (дата обращения: 15.01.2015).

Itier R. J., Villate C., Ryan J. D. Eyes always attract attention but gaze orienting is task-dependent: Evidence from eye movement monitoring // Neuropsychologia. 2007. V. 45. P. 1019–1028.

Kelly D. J., Miellet S., Caldara R. Culture shapes eye movements for visually homogeneous objects // Frontiers in Psychology. 2010.1:6. doi: 10.3389/ fpsyg.2010.00006.

Malcolm G. L., Lanyon L. J., FugardA. J. В., col1_0 Scan patterns during the processing of facial expression versus identity: An exploration of task-driven and stimulus-driven effects // Journal of vision. 2008. V. 8 (8). № 2. P. 1–9. ULR: http://journalofvision.Org/8/8/2 (дата обращения: 10.07.2015) doi:10.1167/8.8.2.

Maw N. N., Pomplun M. Studying Human Face Recognition with the Gaze-Contingent Window Technique //K. Forbus, D. Gentner, T. Regier (Eds). Proceedings of the Twenty-Sixth Annual Meeting of the Cognitive Science Society, 2004. Chicago, Illinois, 2004. P. 927–932.

Perlman S. В., Morris J. P., Vander Wyk B. C., Green S. R., Doyle J. L., Pelphrey K. A. (2009). Individual differences in personality predict how people look at faces // PLoS ONE. 2009. V. 4 (6). e5952.

Rozhkova G. I., Ogninov V. V. Face recognition and eye movements: landing on the nose is not always necessary // Perception. 2009. 38. ECVP Abstract Supplement, 77.

Sterling L., Dawson G., Webb S., Murias M., Munson J., Panagiotides H., Aylward E. The role of face familiarity in eye tracking of faces by individuals with autism spectrum disorders // Journal Autism Dev. Disord. 2008 October. V. 38 (9). P. 1666–1675.

Использование технологий отслеживания взора при разработке систем объективации экспертного опыта[5]

И. Н. Макаров, И. Ю. Владимиров

Введение

Факт существования экспертов, специалистов высокого уровня в различных областях деятельности давно определялся различными авторами, однако понимания того, что лежит в основе выдающихся способностей этих специалистов, до сих пор неизвестно.

Для того чтобы разобраться в этом вопросе, используется следующий подход: сравнение экспертов с новичками. У этого подхода есть свои сильные и слабые стороны. Сильная сторона: данный подход дает много информации о различиях в результатах и способах деятельности между этими двумя группами. Оценивая эти различия, можно определить, за счет каких именно психологических механизмов это происходит. Однако здесь же находится и слабость – знания новичков отличаются от знаний экспертов как в количественном, так и в содержательном аспектах. Вследствие этого выделить причину различий между ними очень сложно.

Однако более важной и сложной проблемой, помимо определения того, что делает эксперта экспертом, является то, как происходит трансляция экспертных знаний и каким способом можно сделать ее более эффективной. Одна из проблем, стоящих на этом пути, заключается в наличии такого феномена, как молчаливое знание или «tacit knowledge» в иностранной литературе (Wagner, 1986). Под молчаливым знанием профессионала понимают ту часть знаний, которые профессионал не может или не хочет передать. Ю. К. Корнилов (2002) выделяет несколько типов молчаливого знания, которые отличаются разной степенью вербализуемости и причинами происхождения. Из всех этих факторов возникает проблема создания обучающих систем в связи с тем, что не удается точно выделить причины экспертности, следовательно, неизвестно, чему именно необходимо обучать.

Между тем для того, чтобы создать обучающую систему, можно использовать другой подход и воспользоваться методом видеорегистрации деятельности эксперта. Этот метод позволяет зафиксировать все действия, выполняемые им при работе. Но и у него есть недостаток, если использовать только фиксацию деятельности и построения исключительно на ней обучения – простое копирование действий профессионала неэффективно по двум причинам. Первая: не во всех случаях известно, что именно вызвало те или иные его действия. Вторая: у обучающегося отсутствует понимание того, что именно он делает, а соответственно, любые трудности, возникающие в процессе, становятся неразрешимыми.

Способом обойти это затруднение является технология «субъективной камеры» (далее SubCam), позволяющая получить данные с точки зрения самого профессионала и в дальнейшем интерпретировать полученные данные с помощью метода «кооперативного де-брифинга» (Лалу и др., 2009). Используя две эти процедуры вместе, исключается недостаток обычной видеорегистрации, так как эксперт объясняет причины своих действий.

Однако данный метод не фиксирует собственно движение глаз. А как известно (Барабанщиков, Жегало, 2014), направленность взора и его перемещение отражают внутреннюю активность субъекта, а также показывают, какая именно информация из внешней среды послужила причиной дальнейших действий.

Проблема исследования

Мы стремимся добавить к технологии SubCam дополнительный источник информации, получаемый с помощью мобильного айтрекера SMI ETG. Это не только даст дополнительную информацию о деятельности эксперта, но и расширит возможности извлечения экспертного опыта с помощью процедуры «кооперативного дебрифинга». И чтобы оценить полезность информации для обучения, получаемой с помощью айтрекера, мы в ходе исследования создаем два обучающих видео, в одном из которых будет представлена информация, полученная с помощью трекера, а в другом нет.

Процедура и методы исследования

Исследование состояло из двух экспериментальных этапов. На первом этапе происходила запись самостоятельного обучения одним испытуемым пилотированию радиоуправляемым вертолетом. Перед испытуемым стояло задание пролететь полосу препятствий (рисунок 1). Задание для испытуемого включало полет по определенному маршруту состоящему из двух частей, туда и обратно (рисунки 2,3) и 2 посадок на стул и обратно на место взлета. При этом испытуемому необходимо было соблюдать ряд правил: не взлетать выше препятствий и не касаться пола.

Рис. 1. Полоса препятствий

Рис. 2. Первая часть маршрута. Изображение вертолета обозначает место взлета, линия – траекторию полета, квадрат с крестом – место посадки (стул)

Рис. 3. Вторая часть маршрута. Изображение вертолета обозначает место взлета (стул), линия – траекторию полета, квадрат с крестом – место посадки (место взлета в первой части маршрута)

Видеорегистрация фиксировала события, происходящие в зрительном поле и ответную реакцию оператора. Метод видеорегистрации включал запись деятельности оператора с трех ракурсов: первый фиксировал панорамное видение поля деятельности (собственно вертолет и траектории его полета) с помощью веб-камеры, установленной на фиксированном расстоянии в 2,7 метра. Второй фиксировал субъективное видение поля деятельности (непосредственно то, что видел сам оператор) с помощью регистрации движения глаз (айтрекер). Третий фиксировал манипуляции оператора джойстиком (конкретные действия по управлению вертолетом) с помощью видеокамеры, находящейся на расстоянии 30 см от рук оператора. Далее из отснятого материала было создано два обучающих видео. В первом случае использовалось видео, снятое только с панорамной камеры. Имелось также звуковое сопровождение, объясняющее основные моменты управления, записанные экспериментатором на основе анализа полета с позиции «новичка». Во втором случае применялось звуковое сопровождение, а видео содержало записи со всех трех камер. Причем в звуковом сопровождении были учтены комментарии эксперта, относительно особенностей управления и целей его действия, которые были получены при использовании процедуры «кооперативного дебрифинга».

На втором этапе в эксперименте приняли участие 30 человек (24 – женского и 6 – мужского пола) в возрасте от 18 до 26 лет (М = 20,5; а= 1,35). Всего испытуемые было выполнено 150 экспериментальных проб (полетов).

Испытуемые были разделены на три группы по 10 человек в каждой. Первая группа была контрольной и не смотрела обучающих видео. Вторая группа смотрела обучающее видео с одной камеры. Третья группа смотрела обучающее видео с трех камер. Для всех групп начало эксперимента было одинаковым: начиналось с прохождения тренировочной серии, состоящей из трех заданий. Первое задание заключалось в плавном взлете до верхней границы и такой же плавной посадке обратно на землю.

Второе задание заключалось во взлете на любую высоту, с последующим полетом по прямой и посадке между двумя вторыми препятствиями (рисунок 4).

Третье задание заключалось во взлете на любую высоту, но ниже верхней границы, в дальнейшем полете по прямой, повороте между первыми и вторыми препятствиями направо и посадке справа от полосы препятствий (рисунок 5). Только после успешного завершения всех трех заданий испытуемые переходили к собственно выполнению экспериментального задания.

Рис. 4. Второе тренировочное задание

Рис. 5. Третье тренировочное задание

Экспериментальное задание было таким же и с теми же правилами, что и для эксперта.

В контрольной группе испытуемые сразу приступали к его выполнению, а в экспериментальных группах сначала смотрели соответствующие обучающие видео.

Результаты исследования

Для определения эффективности воздействия обучающих видео были выделены 14 критериев успешности пилотирования вертолетом. Из них только по двум есть статистически значимые различия. Наличие значимых различий лишь по двум из четырнадцати показателей может быть связано с самой структурой построения эксперимента: у испытуемых было всего пять попыток, чтобы использовать усвоенные знания. Сравнительно большой объем информации, содержащийся в обоих обучающих видео, не запоминался полностью и, соответственно, не улучшал умение управлять вертолетом в той мере, насколько можно было бы ожидать. С другой стороны, стоит проанализировать, почему именно эти два показателя оказались наиболее чувствительны. По правилам испытуемые заканчивали попытку в двух случаях: либо когда вертолет улетал туда, откуда его невозможно достать, либо в том случае, когда вертолет падал на боковую часть, что считалось критически падением. Критическое падение было вызвано двумя основными причинами: столкновение с объектами (которые могли находиться на пути движения вертолета в полете или с боку от него либо же являться следствием конструкции вертолета – наличие балансира над винтами. В некоторых случаях объектом столкновения становился потолок) или неправильное использование регулятора высоты (резкие перемещения вертолета или, наоборот, резкое глушение мотора). Однако, кроме критических падений, были прикосновения к полу, вызванные разными причинами. Похоже, что в первую очередь полученные знания влияли на способность удерживать вертолет в воздухе и делали испытуемых более осторожными, что отражалось именно в этих двух показателях.

Таблица 1

Статистическая оценка значимости различий между контрольной группой и группой, смотревшей обучающее видео с использование одной камеры (U-критерий Манна-Уитни)

Таблица 2

Статистическая оценка значимости различий между контрольной группой и группой, смотревшей обучающее видео с использованием трех камер (U-критерий Манна-Уитни)

А вот между экспериментальными группами не было получено значимых различий. Поэтому на данный момент нельзя с уверенностью сказать о пользе, которую приносит или не приносит добавление дополнительной информации.

Однако с помощью айтрекера удалось получить другие интересные качественные данные. Так, среди тех испытуемых, которые смогли посадить вертолет, распространена стратегия предварительной оценки расстояния и направления как при полете (рисунок 6), так и при посадке (рисунок 7). А испытуемые, которые долетели до места посадки, но у которых так и не получилось посадить вертолет, используют в основном следящие движения (рисунок 8).

Рис. 6. Оценка направления

Рис. 7. Предварительная проверка перед посадкой

Рис. 8. Следящие движения

Более того, чем больше следящих движений (вплоть до неотрывного слежения), тем хуже полет. Кроме этого, общее количество саккад выше у тех испытуемых, кто лучше управляет вертолетом. Это, вероятно, может быть связано с включением и важным значением процессов внимания в виде поиска релевантной задачам информации в зрительной среде, рассматривания цели и т. п. Таким образом, успешность управления связана со сбором разнообразной информации и встраивании ее в свою деятельность.

Заключение

Полученные результаты позволяют говорить о том, что обучение с помощью видео является эффективным способом передачи знания в операторской деятельности. Также добавление технологии отслеживания взора позволяет получить больше полезной информации от эксперта за счет того, что часть информации скрыта и от самого профессионала (напр., какие именно движения совершаются глазами, чтобы получить нужную ему информацию). Однако простого добавления этой дополнительной информации в обучающее видео недостаточно, чтобы улучшить летные показатели новичков.

Литература

Барабанщиков В. А., Жегалло А. В. Айтрекинг: методы регистрации движений глаз в психологических исследованиях и практике. М.: Когито-Центр,2014.

Корнилов Ю. К. Молчаливое знание как «следы деятельности» субъекта // Психология субъекта профессиональной деятельности: Сб. науч. трудов / Под ред. В. А. Барабанщикова, А. В. Карпова. Вып. П. М.-Ярославль, 2002. С. 140–147.

Лалу С, Носуленко В. Н., Самойленко Е. С. SUBCAM как инструмент психологического исследования // Экспериментальная психология. 2009. Т. 2. № 1.С. 72–80.

Wagner R. К., Sternberg R. G. Tacit Knoledge and intelligence in the everyday world // Practical intelligence. Cambridge, Un. Press, 1986.

Выявление информативных характеристик глазодвигательной активности с применением метода главных компонент и обучаемых моделей[6]

П. А. Мармалюк, Б. Ю. Поляков

Введение

Возможно ли получать надежную оценку уровня компетенции (Куравский и др., 2014), предсказывать заранее итоговый результат выполнения теста интеллекта (Хохлова, 2011), определять возраст человека с помощью анализа пространственно-временных особенностей движений взора? Существуют и проявляются ли во время чтения различия характеристик окуломоторной активности детей разного возраста и насколько эти характеристики информативны для диагностики сформированности такого комплексного навыка, как чтение? (Куравский и др., 2014). Существуют ли и каковы стратегии зрительного восприятия, свидетельствующие о тех или иных качествах тестируемого или обучающегося, например, такие, как когнитивные стили восприятия (Мармалюк, Звонкина, 2013)? Быть может, представители разных расовых типов отличаются в силу генетических и культурных причин в том, как они рассматривают лицо собеседника (Ананьева, Демидов, Швец, 2013)? Эти и многие другие подобные вопросы, выраженные в виде научных содержательных гипотез, формулируются экспериментальными психологами как при проведении фундаментальных поисковых исследований, так и в рамках прикладных проектов по созданию объективных методик психолого-педагогической диагностики.

Применяемые в таких исследованиях средства регистрации движений глаз регистрируют массивные объемы данных (траектории движения взора испытуемых на плоскости стимула), которые необходимо обрабатывать статистически для проверки выдвинутых гипотез. Исследователям-психологам в рамках разведочного анализа данных зачастую приходится сталкиваться с высокой степенью неопределенности, связанной с поиском релевантных количественных и качественных признаков глазодвигательной активности, отражающих изменчивость исследуемых факторов, будь то категории испытуемых или выраженность индивидуальных непрерывных свойств.

Для облегчения поиска подобных закономерностей разработано множество средств математического анализа, реализованных в соответствующих статистических пакетах. Однако в силу возрастания сложности и повышения размерности данных особо актуально использование автоматизированных средств, позволяющих сокращать размерность набора анализируемых переменных. При этом часто возникает необходимость дополнять набор традиционных интегральных характеристик глазодвигательной активности (таких как время прочтения текста, средняя длительность фиксаций, число фиксаций, прогрессивных и регрессивных саккад и подобных) показателями, отражающими пространственно-временные особенности процесса зрительного поиска, которые могут содержать дополнительную информацию об объекте изучения, улавливая интересующие исследователя паттерны переходов взора между областями интереса.

Примером подобного средства может послужить представленный далее подход к анализу траекторий взора, основанный на расчете информативных показателей глазодвигательной активности и последовательном применении современных математических методов анализа данных, таких, как метод главных компонент или факторный анализ, деревья решений, дискриминантные модели, регрессионные модели.

Основные этапы рассматриваемого подхода

Расчет показателей глазодвигательной активности. В качестве базовых показателей глазодвигательной активности могут выступать как традиционные универсальные показатели (число и средняя продолжительность фиксаций, число саккад в различных направлениях, амплитуда и кривизна саккад, общая длительность испытания и т. п.), рассчитываемые, как правило, по выявленным окуломоторным событиям с помощью средств проприетарного программного обеспечения, поставляемого вместе с оборудованием (Барабанщиков, Жегалло, 2013). Такие показатели удобны тем, что они не привязаны к контексту задачи или стимульному материалу и могут вычисляться для любого набора выявленных окуломоторных событий. Однако универсальность подобных показателей может рассматриваться и как недостаток в силу невозможности учесть при их расчете специфику стимульного материала и невозможности отразить с их помощью динамические свойства изучаемого процесса зрительного поиска.

Для отражения динамических характеристик глазодвигательной активности целесообразно использовать в качестве дополнительных информативных признаков элементы матриц вероятностей переходов либо матриц представления преемника (Successor Representation matrix, SR-matrix – Dayan, 1993), рассчитываемых по последовательностям фиксаций взора в областях интереса стимульного материала. Указанные матрицы позволяют выявлять выраженные интегральные закономерности переходов взора из одной области интереса к другой как первого порядка (матрица вероятностей переходов), так и с учетом предыстории (матрица представления преемника).

Основы рассматриваемого подхода к анализу данных видео-окулографии с использованием матриц представления преемника, названного «Successor Representation Scanpath Analysis (SRSA)», заложены Алексом Петровым и Тейлором Хэйесом, сотрудниками лаборатории когнитивного моделирования и вычислительной когнитивной нейронауки Университета штата Огайо, США. Пример применения подхода проиллюстрирован в статье, посвященной анализу последовательностей фиксаций при выполнении теста интеллекта Равена (Hayeset al., 2011). Полученные результаты демонстрируют несомненную эффективность подхода. Например, построенная (по выборке значений главных компонент элементов матриц представления преемника) регрессионная модель объясняла 56 % дисперсии итогового балла по тесту Равена. Детали алгоритма расчета матрицы представления преемника приведены ниже.

Обязательным условием для расчета матриц является наличие пространственных областей интереса, выделяемых на стимульном материале автоматически или при участии экспериментатора-психолога.

Автоматическое выделение в простейшем случае подразумевает разделение плоскости стимула на нумерованные прямоугольные ячейки заданного размера, которые и рассматриваются как области интереса (см. пример на рисунке 1). Такой способ выделения областей интереса универсален и наиболее адекватен при отсутствии по различным причинам исходных предположений о вероятных «аттракторах внимания» в стимульном материале.

Рис. 1. Участок текстового стимула, автоматически размеченный вертикальными областями интереса, используемыми для обработки последовательностей позиций фиксаций и последующего анализа динамики горизонтальных движений взора испытуемых

Ручное выделение областей интереса подразумевает указание на стимуле именованных плоских фигур требуемых размеров (прямоугольников, многогранников, эллипсов и пр.). Итоговое расположение областей в данном случае, разумеется, зависит от стимульного материала и гипотез исследования, поскольку требует обоснованных предположений о том, какие именно области стимула действительно привлекают зрительное внимание исследуемых категорий испытуемых.

Рис. 2. Участок стимула задачи теста Равена, размеченный вручную областями интереса, используемыми для обработки последовательностей позиций фиксаций и последующего анализа динамики движений взора испытуемых между элементами матрицы задания и областью альтернатив ответа

Формирование последовательностей посещенных областей интереса. По позиционным данным выделенных областей интереса и зарегистрированным траекториям взора на плоскости стимула или последовательностям точек фиксаций взора строятся последовательности номеров «посещенных» областей, в которых пребывал взор испытуемых. Обычно в таких последовательностях повторные смежные пребывания в одной и той же области интереса «склеиваются», т. е. рассматриваются как единое событие. Сформированные последовательности подвергаются дальнейшему анализу: по ним строятся матрицы частот или вероятностей переходов между областями интереса, либо матрица представления преемника, алгоритмы построения которых представлены в следующем подразделе.

Вычисление матриц частотности переходов. По полученным последовательностям далее вычисляются матрица вероятностей переходов и матрица представления преемника. Расчет элементов матрицы вероятностей переходов между зонами интереса несложен и выполняется следующим образом:

– инициализируется (заполняется нулями) квадратная матрица, чьи размерности соответствуют количеству областей интереса;

– по очереди перебираются элементы последовательности посещенных областей интереса (исключая последнюю) – фиксируется текущий элемент последовательности (номер посещенной зоны, обозначаемый как i) и последующий элемент (номер зоны, в которую совершен переход, обозначаемый как j), а сама матрица обновляется: элемент с индексом (i, j) увеличивается на единицу;

– формируется матрица оценок вероятностей переходов, состоящая из элементов полученной на предыдущем шаге матрицы абсолютных частот переходов, поделенных на сумму всех ее элементов.

Расчет элементов матрицы представления преемника более сложен для понимания, однако, так же легко реализуется программно:

– инициализируется (заполняется нулями) квадратная матрица М, чьи размерности соответствуют количеству областей интереса;

– по очереди перебираются элементы последовательности посещенных областей интереса (исключая последнюю) – фиксируется текущий элемент последовательности (номер посещенной зоны, обозначаемый как О и последующий элемент (номер зоны, в которую совершен переход, обозначаемый как;'), a i-я строка матрицы М обновляется по следующему правилу:

где I – единичная матрица того же порядка, что и М, а – параметр скорости обучения, (0<а<1), у – временной весовой коэффициент, (0<у<1).

Таким образом, при наблюдении перемещения из области интереса i в область; набор ожидаемых преемников для «отправителя» i (строка М_i) обновляется так, чтобы учесть переход в «преемника» j, а также в предполагаемые (с учетом предыстории процесса) преемники посещаемой области; (столбец М), но с уменьшенным влиянием на результат (для этого производится умножение на понижающий временной коэффициент у). В итоге мы учитываем не только сам факт перемещения из области i в область l, но и предысторию перемещения из области j в другие области.

Оценка SR-матрицы, построенная по заданной последовательности посещенных областей интереса, содержит сумму взвешенных по удаленности во времени будущих попаданий в некоторую область интереса, определяемую заданным столбцом при условии, что в данный момент посещена область, определяемая строкой. Заметим, что получаемая матрица не является стохастической (т. е. ее элементы не представляют собой оценки вероятностей). Поэтому сумма всех значений столбца SR-матрицы может превышать единицу. Для корректного сопоставления SR-матриц, полученных для записей различной длительности, необходимо эти матрицы нормировать (делить каждый элемент на сумму элементов матрицы). Однако нормирование может и не проводиться, если исследователя интересует, в частности, вариация длительностей траекторий взора.

Стоит заметить, что относительно недавно была продемонстрирована формальная связь концепции представления преемника и модели эпизодической и семантической памяти (Howard, Kahana, 2002; Sederberg et al, 2008).

Важным отличием между матрицей представления преемника и матрицей вероятностей переходов является то, что последняя отражает закономерности только первого порядка (касающиеся переходов между смежными элементами последовательности), в то время как первая настраивается для предсказания будущих посещений в рамках временного окна, чья эффективная ширина зависит от коэффициента у (Gershman et al., 2012).

Пусть дана следующая последовательность номеров посещенных областей интереса: [1, 2, 4, 2, 4, 1, 4, 2, 3, 1, 3, 2, 1, 3, 1, 2, 4, 1, 3, 1, 3]. По заданной последовательности вычислены матрица вероятностей переходов и нормированная SR-матрица, представленные в таблицах 1 и 2.

Приведенный пример матриц демонстрирует, например, что оценка вероятности переходов из области № 4 в область № 3 является нулевой, поскольку прямых переходов из области № 4 в область № 3 в последовательности не наблюдается. При этом матрица представления преемника отражает взвешенное по временной удаленности нормированное количество будущих пребываний в области № 3 после пребывания в области № 4 (ячейка № 3.4), а также указывает, например, на то, что ближайшие по времени будущие попадания в область № 3 после пребывания в ней же более вероятны (ячейка № 3.3), нежели будущие попадания в область № 4.

Сокращение размерности пространства переменных и анализ выделенных компонент или факторов. Рассчитав значения традиционных интегральных показателей и дополнительные информативные признаки, для сокращения размерности пространства анализируемых переменных можно с помощью соответствующего метода выделять скрытые главные компоненты или факторы, объясняющие высокую долю суммарной дисперсии полученного набора переменных. Важным аспектом при выборе компоненты/фактора является как доля описываемой дисперсии, так и возможность интерпретации новой переменной по величинам компонентных нагрузок наблюдаемых переменных (частных корреляций переменных и компонент). Примеры двух главных компонент, описывающих 19,5 % доли суммарной дисперсии элементов SR-матриц, построенных по последовательностям фиксаций взора в областях интереса, выделенных на стимульном материале теста Равена, приведены на рисунках 3 и 4. Номера столбцов и строк данных матриц совпадают с номерами областей интереса, выделенных в стимульном материале заданий теста Равена (1, 2, 3 – верхняя строка элементов матрицы задания; 4, 5, 6 – средняя строка; 7, 8, 9 – нижняя строка; 10 – область альтернатив ответа).

Рис. 3. Цветовые матрицы, отражающие величину нагрузок первой главной компоненты, описывающей 12,5 % суммарной дисперсии элементов SR-матриц: слева приведена матрица для положительных нагрузок (диапазон значений нагрузок – от 0 до 0,4), а справа – для отрицательных (диапазон – от -0,4 до 0)

Рис. 4. Цветовые матрицы, отражающие величину нагрузок второй главной компоненты, описывающей 7 % суммарной дисперсии элементов SR-матриц: слева приведена матрица для положительных нагрузок (диапазон значений нагрузок – от 0 до 0,4), а справа – для отрицательных (диапазон – от -0,4 до 0)

Приведенные матрицы позволяют интерпретировать компоненты как индикаторы использования определенных пространственных стратегий, которые используются испытуемыми в разной степени. Первая компонента может быть интерпретирована как показатель приверженности стратегии «не использовать горизонтальные переходы и использовать вертикальные». Вторая компонента – как показатель приверженности стратегии «использовать вертикальные переходы в правой нижней части матрицы Равена».

Обучение модели представления закономерностей. Значения выделенных факторов и значения целевых переменных, чья взаимная изменчивость является предметом анализа и интерпретации, используются для обучения модели распознавания образов (модели-классификатора или модели регрессии).

Обучение модели заключается в настройке ее параметров таким образом, чтобы получаемые предсказания значений целевой переменной отличались от реальных измеренных значений как можно меньше в терминах используемой меры ошибки. Освещение тех или иных алгоритмов обучения предсказательных моделей, равно как и подходов к оценке ее обобщающей (предсказательной) способности (напр., методика скользящего контроля), подробности методов распознавания образов и такого научного направления, как машинное обучение, можно уточнить, например, в соответствующих изданиях (Воронцов, 2007; Лепский, Броневич, 2009; Alpaydin, 2010).

Обученная модель в случае высокой степени ее предсказательной способности может успешно использоваться для предсказания значений целевых переменных: как дискретных категорий испытуемых (таких как, напр., индикатор правильности выполненного задания теста способностей, пол испытуемого, уровень навыка чтения), так и соответствующих им непрерывных случайных величин (таких, напр., как возраст, итоговый балл по тесту).

Интерпретация модели. Обученная и надежная модель представления закономерностей часто может быть легко интерпретирована путем определения входных переменных, учитываемых при принятии решения в первую очередь (или с большим весом). Например, такие модели, как деревья решений, обобщенная линейная модель или дискриминантная модель, не только способны решать задачу предсказания значения целевой переменной, но и позволяют трактовать прогноз в терминах предметной области путем анализа структуры модели и ее идентифицированных параметров.

В случае деревьев решений объяснение может строиться путем выписывания последовательности условий, проверенных для данного испытуемого на пути от корня дерева до листа. Эти условия образуют конъюнкцию, т. е. легко интерпретируемое логическое правило (Воронцов, 2007). Пример дерева, построенного с использованием выборки значений интерпретированных выше главных компонент SR-матриц и предсказывающего успешность выполнения задания теста Равена, приведен на рисунке 5.

Рис. 5. Дерево классификации, позволяющее правильно (в 70 % случаев) предсказывать результат выполнения задания («Выполнил верно» – «Pass» и «Выполнил неверно» – «NotPass») по величинам главных компонент «Horis» («He использовать горизонтальные переходы и использовать вертикальные») и «Vertic» («Использовать вертикальные переходы в правой нижней части матрицы Равена»)

В целом данное дерево можно интерпретировать следующим образом: если испытуемый придерживается определенных стратегий глазодвигательной активности, то скорее всего задания теста Равена будут пройдены успешно. Однако, если испытуемый зацикливается при рассмотрении элементов матрицы задания по углам, т. е. в верхней левой либо в нижней правой частях, то, вероятно, он не может установить зависимость между элементами матрицы задания и само задание пройдено не будет.

В случае применения линейных регрессионных моделей или дискриминантных функций выявление значимых объясняющих признаков также не составляет труда (достаточно воспользоваться подходящими статистическими критериями значимости коэффициентов модели), а их интерпретация зависит от абсолютной величины коэффициента и знака при нем.

Заключение

В ходе проекта было разработано программное обеспечение, позволяющее психологу проводить анализ экспериментальных данных видеоокулографии с помощью рассмотренного метода статистического анализа и методов выделения информативных признаков (в том числе и скрытых), не имея при этом глубоких познаний ни в математике, ни в программировании, точнее, при минимальных познаниях в данных областях. На данный момент на языке R (R Core Team, 2014) программно реализованы (автор – Борислав Поляков, выпускник факультета информационных технологий МГППУ):

– загрузка и предобработка входных данных, – ручная и автоматическая разметка стимульных материалов (выделение зон интереса), – алгоритм вычисления матрицы представления преемника, – построение расширенной таблицы данных со значениями входных переменных, необходимых для последующего анализа, – метод снижения размерности пространства признаков (метод главных компонент), – визуализация компонентных нагрузок для выбора интерпретируемых компонент, – алгоритм обучения дерева решений, – алгоритм оценки предсказательной способности дерева, – визуализация дерева решений.

Разработанное ПО было применено для исследовательского анализа данных видеоокулографии, полученных при прохождении испытуемыми теста интеллекта Равена и при чтении учениками начальных классов небольшого отрывка текста с целью выделения показателей, информативных с точки зрения предсказания результатов выполнения заданий теста Равена, возрастной группы и уровня сформированности навыка чтения. Успешное применение предложенного подхода свидетельствует о его эффективности и большом потенциале при использовании в качестве метода исследовательского анализа глазодвигательной активности.

Литература

Ананьева К. И., Демидов А. А., Швец Т. А. Оценка психологических особенностей человека по изображению его лица представителями разных расовых групп // Экспериментальная психология. 2013. Т. 6. № 3. С. 98–109.

Барабанщиков В. А., Жегалло А. В. Регистрация и анализ направленности взора человека. М.: Изд-во «Институт психологии РАН», 2013.

Безруких М. М., Демидов А. А., Иванов В. В. Возрастные особенности окуломоторной активности детей в процессе чтения // Психология человека в современном мире. Том 2: Матер. Всеросс. юбил. науч. конф., посв. 120-летию со дня рождения С. Л. Рубинштейна. М.: Изд-во «Институт психологии РАН» 2009. С. 151–155.

Воронцов К. В. Логические алгоритмы классификации. Материалы лекций факультета управления и прикладной математики Московского физико-технического института. М.: МФТИ, 2007.

Куравский Л. С, Мармалюк П. А., Барабанщиков В. А., Безруких М. М., Демидов А. А., Иванов В. В., Юрьев Г. А. Оценка степени сформированности навыков и компетенций на основе вероятностных распределений глазодвигательной активности. Вопросы психологии. 2013. № 5. С. 64–81.

Куравский Л. С, Мармалюк П. А., Баранов С. Н., Алхимов В. И., Юрьев Г. А., Артюхина С. В. (Марковские модели глазодвигательной активности и их применение для тестирования профессиональных навыков. Информационные технологии. 2014. № 8. С. 34–43.

Лепский А. Е. Математические методы распознавания образов: Курс лекций. Таганрог: ТТИ ЮФУ, 2009. URL: http://lepskiy.ucoz.com/ lect_lepskiy_bronevich_pass.pdf (дата обращения: 18.06.2015).

Мармалюк П. А., Звонкина О. М. Опорные показатели глазодвигательной активности при прохождении теста Равена и автоматизация их расчета. Молодые ученые – нашей новой школе. Матер. XI Межвуз. науч. – практ. конф. с межд. участием. М.: МГППУ, 2012. С. 350–352.

Хохлова А. А. Исследование глазодвигательной активности при прохождении матричного теста интеллекта Равена. Молодые ученые – нашей новой школе. Матер. X науч. – практ. межвуз. конф. М.: МГППУ, 2011. С. 343–345.

Alpaydin E. Introduction to machine learning. 2^nd edition. The MIT Press, 2010.

Dayan P. Improving generalization for temporal difference learning – the Successor Representation // Neural Computing. 1993. V. 5. P. 613–624.

Gershman S., Moore C, ToddM., NormanK., SederbergP. The Successor Representation and Temporal Context // Neural Computing. 2012. V. 24 (6). P. 1553–1568.

Hayes T. R., PetrovA. A., Sederberg P. B. A novel method for analyzing sequential eye movements reveals strategic influence on Raven's Advanced Progressive Matrices // Journal of Vision. 2011. V. 10. P. 1–11.

Howard M., & Kahana M. A distributed representation of temporal context // Journal of Mathematical Psychology. 2002. V. 46. P. 269–299.

R Core Team: R: A language and environment for statistical computing. R Foundation for Statistical Computing. 2014. URL: http://www.r-project. org (дата обращения: 18.06.2015).

Sederberg P., Howard M., Kahana M. A context-based theory of recency and contiguity in free recall. Psychological Review. 2008. V. 115. P. 893–912.

О чем говорит окуломоторика

А. А. Митькин

Разносторонний анализ движений глаз имеет собственную историю, начало которой было положено Дюбуа-Реймоном в середине XIX в. (Du Bois-Reymond, 1849). Нейрофизиология обнаруженного явления была обозначена как роговично-сетчаточный потенциал (передний полюс глазного яблока имеет знак «плюс», а задний – знак «минус»).

Дальнейшее изучение окуломоторной активности (ОМА), проходившее в острых дискуссиях (Митькин, 1982), позволило ученым отказаться от расширительной трактовки эффективности окулографических методик. Наиболее жесткой элиминации подверглась попытка напрямую связать ОМА с интеллектуальными процессами.

Опыт экспериментальных исследований показал, что испытуемый зачастую оказывается «хитрее», чем предполагает экспериментатор, и выбирает для решения поставленной задачи собственные оригинальные варианты. В конечном счете мы всегда имеем дело с сотрудничеством двух индивидов, а характер этого сотрудничества существенно зависит от специфики метода. Личный опыт автора побуждает его сделать акцент на методе электроокулографии (ЭОГ). Этот метод обладает рядом преимуществ, касающихся положения испытуемого и общей организации исследования. ЭОГ позволяет изучать окуломоторику в самом широком диапозоне профессионального поведения индивида, при любой пространственной ориентации оператора и неблагоприятных внешних условиях. ЭОГ дает возможность «дробить» эксперимент (в пространстве и времени), а затем интегрировать итоговую картину результата. Незаменимость ЭОГ в исследованиях, проводимых на маленьких детях, давно признана всеми психологами (накожные датчики-электроды не доставляют детям беспокойства и не влияют на их спонтанное поведение).

Применение ЭОГ сопряжено с решением ряда сопутствующих проблем.

Динамика и статика объектов восприятия. Ранние представления о приоритетном восприятии неподвижных предметов подверглись радикальной корректировке. Выяснилось, что зрительная детекция динамичных объектов предшествует (как в филогенезе, так и онтогенезе) аналогичному обнаружению стационарных объектов.

Поле зрения. ЭОГ существенно помогла расширить наши знания, относящиеся к структуре поля зрения при его бинокулярном и монокулярном функционировании, а также получить объективные данные об утомляемости зрительной системы в разных режимах работы (Козлова, Митькин, 1977).

Иерархическое управление окуломоторикой. ЭОГ в ее тесном взаимодействии с современной нейрофизиологией позволило отказаться от архаичных представлений о дихотомической затылочно-лобной кортикальной организации окуломоторики. Их закономерно сменила уровневая концепция сенсомоторных процессов (Митькин, 1974, 1982), дальнейшая разработка которой продолжается. Обновление научных «декораций» инициировалось невозможностью объяснить со старых позиций ряд фактов: а) значительную степень непроизвольности, неконтролируемости и неосознанности движений глаз; б) наличие врожденных окуломоторных реакций у младенцев при слабой кортикализации моторных функций; в) сохранение основных окуломоторных функций при декортикализации животных; г) универсальные формы окуломоторики на всем протяжении эволюции (даже у низших позвоночных с практически отсутствующей корой). Однако такая смена позиции не избавила исследователей от появления других не менее трудных проблем. Дело в том, что все отделы ствола мозга (т. е. уровня, ставшего теперь ответственным за окуломоторику) так или иначе связаны с этим процессом, что, в свою очередь, провоцирует вопрос о наличии общего для всех управляющего центра. Многолетний поиске использованием эволюционных данных привел исследователей к выводу, что роль такого интегратора выполняют верхние двухолмия (ВД) – мезэнцефалическое нервное образование, в котором оканчиваются аксоны ганглиозных клеток сетчатки. Полисенсорная конвергенция на нейронах ВД обеспечивает соотнесение окуломоторики с общей соматической моторикой и адекватные реакции на зрительные сигналы (в обоих случаях требуется участие интернейронов). Таким образом, кратчайший путь окуломоторного ответа на зрительный стимул включает следующие инстанции: рецепторы сетчатки – ганглиозные клетки – клетки афферентного поверхностного слоя ВД – интернейроны ВД – премоторные нейроны глубоких слоев ВД – мотонейроны глазодвигательных ядер (Батуев, Таиров, 1978).

ЭОГ для клинического использования. Медицинская практика свидетельствует о привилегированном положении окуломоторики, которая обычно сохраняется у больного, лишившегося иных видов соматической активности. Интересные возможности открываются перед психологами на пути привлечения современных технических средств к решению комплексных задач этого круга.

Неоспоримые успехи применения иерархической концепции становятся стимулом к дальнейшему поиску (что естественно для науки). Теперь уже во главу угла ставится дилемма между иерархией и гетерархией, поскольку границы между уровнями откровенно демонстрируют свою лабильность.

Литература

Барабанщиков В. А. Окуломоторные структуры восприятия. М.: Изд-во «Институт психологии РАН», 1997.

Батуев А. С, Таиров О. П. Мозг и организация движений. Концептуальные модели. Л.: Наука, 1978.

Козлова Е. В., Митькин А. А. Развитие глазодвигательной активности в раннем онтогенезе бинокулярного зрения // Stud. Psychol. 1977. V. 19. № 4. P. 301–303.

Милсум Дж. Анализ биологических систем управления. М.: Мир, 1968.

Митькин А. А. Дискуссионные аспекты психологии и физиологии зрения // Психол. журн. 1982. № 1. С. 31–42.

Митькин А. А. Об уровнях управления движениями глаз //Системный подход к психофизиологической проблеме. М.: Наука, 1982. С. 57–64.

Митькин А. А. Электроокулография в инженерно-психологических исследованиях. М.: Наука, 1974.

Митькин А. А. Электроокулография. Методы и критерии оценки функционального комфорта. М.: ВНИИТЭ, 1978. С. 44–54.

Goldbery M. E., Wurtz R. H. Activity of superior colliculus in leaving monkey. I. Receptive fields of single neurons. II. Effect of attention on neuronal responses // Journal Neurophysiol. 1972. V. 35. № 4. P. 542–574.

Wurtz R. H., Albano J. E. Visual-motor function of the primate superior colliculus //Annu. Rev. Neurosci. 1980. V. 3. P. 477–483.

Zee D. S., Yamazuki A., Butler P. H., Gucer G. Effect of ablation of flocculus and paraflocculus on eye movements in primate // Journal Neurophysiol. 1981. V. 46. № 4. P. 878–899.

К вопросу о терминологии в исследованиях движений глаз

О. Л. Окутин

В окулографии с некоторых пор по отношению к траекториям саккад часто применяется термин «баллистическая». Насколько это верно и насколько теоретически обосновано? Попытаемся ответить на этот вопрос.

В учебнике Маиевского (Маиевский, 1870) по баллистике еще в 1870 г. было описано, что баллистическая траектория – это траектория, по которой движется тело, обладающее начальной скоростью, под действием силы тяжести и силы аэродинамического сопротивления воздуха. Без учета сопротивления воздуха баллистическая траектория представляет собой часть эллипса, один из фокусов которого расположен в центре Земли. Это справедливо для летательных аппаратов, выходящих в процессе движения за плотные слои атмосферы. Для вычислений движения ядер Галилей в свое время, не учитывая сопротивления воздуха, строил параболические траектории движения снарядов. Что было вполне приемлемым до появления реактивных двигателей, а с ними баллистических ракет, для которых стало необходимым учитывать сопротивление воздуха в силу больших скоростей.

В психологию, очевидно, термин «баллистическая траектория саккады» попал по нескольким причинам. Во-первых, потому, что саккада неуправляема в процессе движения, во-вторых, из-за геометрической формы некоторых саккад, которые напоминают параболы. Вероятно, автор термина «баллистическая траектория саккады» применил эту метафору к движению мнимой точки взора, которая является пересечением оси взора и рассматриваемого предмета, опираясь на всем известные факты из школьного курса физики о движениях тел, брошенных под углом к горизонту. Там решением задач являются квадратичные параболы и соответствующие распределения скоростей. Для физического тела, движущегося в результате броска или выстрела, словом, получившего начальную скорость и описывающего баллистическую траекторию, скорость на пассивном участке траектории постепенно падает до нуля в верхней точке, находящейся в середине пути, а затем в идеале нарастает до скорости, с которой тело было брошено. В конце траектории физическое тело имеет максимум скорости. Таким образом, будучи производной от пути, скорость линейно падает до нуля и затем линейно растет до своего максимума.

Что же мы имеем при рассмотрении саккад? С появлением высокочастотных айтрекеров, обладающих достаточной точностью, познание процесса движения точки взора сводится к анализу графиков окулограмм. Высокая частотность детекции позволяет «проникать» в процессы, не осознаваемые человеком в силу их быстротечности. Так, например, айтрекер SMI High Speed позволяет регистрировать положение точки взора через каждые 2 мс. Это интервал времени, при котором многие ранее казавшиеся непрерывными процессы становятся существенно дискретными. Это похоже на то, как при рассматривании целостной фотографии увеличение детализации изображения приводит к появлению цветных квадратиков, мало напоминающих первичный образ. Так, например, нарисованная окружность при изображении на уровне экранных пикселей, представляет собой конструкцию из квадратиков. Современные айтрекеры тоже являются своеобразными микроскопами, позволяющими заглянуть вглубь процессов, которые, казалось бы, хорошо описаны. Аргументы в пользу аналоговых айтрекеров, которые используют непосредственно установленную на глаз присоску и не имеют побочных математических и аппаратных шумов, принять трудно по причине регистрации глазодвигательной активности с помощью отраженного луча от установленного на присоске зеркала на светочувствительную бумагу. В таком способе регистрации химическая реакция на поверхности бумаги тоже является процессом во времени, а также зависит от силы светового потока и времени его воздействия на рассматриваемую точку поверхности. И мелкие, краткосрочные попадания отраженного луча не вызывают соответствующей засветки. Проявляются только достаточно сильные и относительно долговременные положения отраженного луча. Проблемы «шумов» современных айтрекеров снимаются с помощью манекен-тестов, а в остальном это прекрасные комплексы, позволяющие совершать путешествия во времени, по сути, останавливать время до нескольких миллисекунд.

Конец ознакомительного фрагмента.

Вы здесь

Айтрекинг в психологической науке и практике. Раздел I. Методы и технологии регистрации окуломоторной активности человека ( Коллектив авторов, 2015)