2. Думающие машины
Как многие «бэби-бумеры» (дети, родившиеся в период демографического всплеска после Второй мировой войны. – Прим. пер.), я впервые столкнулся с философскими проблемами, оказавшись в другом измерении, причем не только в смысле зрительного восприятия и звука, но и в смысле сознания: предприняв путешествие в чудесную страну, где границами были границы воображения. Я говорю о сериале Рода Серлинга «Сумеречная зона», который был популярен в годы моего детства. Философы часто пытаются пояснить сложные понятия, используя мысленные эксперименты, необычные гипотетические ситуации, которые помогают нам лучше понять, что подразумевает та или иная идея. Можно сказать, что в эпизодах «Сумеречной зоны» как раз такие ситуации разыгрывались перед камерой.
Один из первых эпизодов назывался «Одинокий». Джеймс Корри отбывает пятидесятилетнее одиночное заключение на необитаемом астероиде на расстоянии девять миллионов миль от Земли. Алленби, капитан корабля, доставляющего на астероид провизию, сжалившись над ним, привозит ему ящик, в котором находится «Алисия»: робот, который выглядит и ведет себя как женщина. Поначалу она вызывает у Корри неприятие, но вскоре он, конечно, влюбляется. Через год Алленби возвращается с новостью, что Корри прощен и что он прилетел, чтобы его забрать. К сожалению, Корри может взять с собой только пятнадцать фунтов груза, а Алисия весит больше. Когда Корри отказывается лететь на Землю, Алленби неохотно достает пистолет и выстреливает Алисии в лицо, превратив его в месиво из дымящихся проводов. Он говорит Корри: «Все, что ты оставляешь здесь, – одиночество». Подавленный Корри бормочет: «Я должен помнить это. Я должен не забыть помнить это». Я до сих пор помню, какой ужас у меня вызвала кульминационная сцена; в кругу моих знакомых юных критиков этот эпизод спровоцировал бурю обсуждений. («Почему он не мог взять с собой хотя бы ее голову?» – спрашивал один из них.) Воодушевление, с которым мы обсуждали фильм, происходило от сочувствия к Корри, переживающему потерю, и от ощущения, что на наших глазах было убито разумное существо. Естественно, режиссеры фильма сыграли на чувствах аудитории, выбрав на роль Алисии красивую актрису, а не показав ее просто в виде кучи жестянок. Тем не менее, вызвав наше сочувствие, они подняли сразу два неприятных вопроса. Может ли механическое устройство обладать равным человеку интеллектом (решающим критерием при этом будет то, сможет ли устройство заставить человека влюбиться в него)? И если человекоподобную машину можно сконструировать, то будет ли она обладать сознанием в полном смысле слова – то есть будет ли акт выведения ее из строя убийством, каковым он нам показался на телеэкране?61
Два самых серьезных вопроса, связанных с разумом, таковы: «Что делает возможным интеллект?» и «Что делает возможным сознание?». С началом эпохи когнитивистики интеллект стал доступным для понимания. Не будет большой ошибкой сказать, что на уровне абстракции проблема решена. Но вот сознание или способность ощущать – чувственное восприятие таких нюансов, как зубная боль, красный цвет, соленый вкус, «до» средней октавы – по-прежнему остается загадкой, завернутой в тайну и помещенной внутрь головоломки. На вопрос о том, что такое сознание, мы едва ли можем ответить лучше, чем ответил Луи Армстронг, когда одна из журналисток спросила его, что такое джаз: «Леди, если вы задаете такой вопрос, то вам этого никогда не понять»62. И все же сегодня и сознание уже не остается такой непроницаемой тайной, как раньше. К некоторым аспектам этой тайны уже найден подход, и теперь они представляют собой обыкновенные научные проблемы. В этой главе я сначала проанализирую, что такое интеллект, как физический объект – будь то мозг или робот – может им обладать, и за счет чего им обладает наш мозг. Затем я перейду к тому, что мы знаем и чего не знаем о сознании.
В поисках признаков интеллектуальной жизни во вселенной
«В поисках признаков интеллектуальной жизни во Вселенной» – название постановки комедийной актрисы Лили Томлин, в которой предметом рассмотрения становятся человеческие слабости и глупости. Название пьесы – это игра слов, основанная на двух значениях слова «интеллект» (англ, intelligence): сообразительность (как в известной шутке: интеллект – это «то, что измеряют с помощью теста на ай-кью») и способность мыслить рационально, как человек. Именно о втором значении интеллекта я и повествую в этой книге.
Пусть дать определение интеллекту не так легко, но мы сразу узнаем интеллект, когда встречаем его. Возможно, прояснить значение этого слова поможет мысленный эксперимент. Представим, что перед нами инопланетное создание, которое по всем параметрам выглядит непохожим на нас. Что ему нужно сделать, чтобы мы поняли, что оно разумно? Конечно, авторы научной фантастики сталкиваются с этой проблемой на каждом шагу; кто лучше них сможет ответить на этот вопрос! Самую удачную характеристику интеллекта, которую мне когда-либо приходилось слышать, дал писатель Дэвид Александр Смит, когда в интервью его спросили: «Каким должен быть хороший пришелец?»
Во-первых, они [пришельцы] должны реагировать на ситуацию разумно, но непонятно – так, чтобы вы, увидев поведение пришельца, сказали: «Я не понимаю правила, которыми этот пришелец руководствуется при принятии решений, но он явно действует рационально, основываясь на некоей совокупности правил»… Второе требование – они должны быть небезразличны к чему-то или кому-то, должны желать чего-то и добиваться этого, не останавливаясь перед лицом трудностей63.
Принимать решения «рационально», руководствуясь совокупностью правил, означает исходить в своих решениях из неких оснований истинности: из соответствия реальности или из логичности вывода. Пришелец, который врезается на пути в деревья, шагает вниз со скалы, делает такие движения, как будто рубит дерево, когда перед ним на самом деле камень или пустое место, едва ли покажется нам разумным. То же самое можно сказать и о пришельце, который, увидев, как в пещеру вошли три хищных зверя, а из пещеры вышли только два, войдет в эту пещеру, как будто она совершенно пуста.
То же можно сказать и о втором критерии: о желании чего-то и о стремлении его получить вопреки трудностям. Если мы не знаем, чего хочет существо, нас нисколько не впечатлит все, что это существо сделает для его достижения. Кто знает, может быть, оно хочет как раз врезаться в деревья или рубить камни, и ему блестяще удается то, чего оно хочет. Более того, без указания целей существа сама идея разумности будет лишена смысла. Тогда можно вручить премию за интеллект мухомору, который с такой прицельной точностью и несгибаемым упорством выполняет сложнейшую задачу: сидит всю жизнь ровно на одном и том же месте. И тогда ничто не мешает нам согласиться с утверждением когнитивиста Зенона Пылишина, что камень умнее кошки, потому что если ударить камень ногой, у него хватит ума укатиться прочь.
Наконец, разумное существо должно использовать рациональные правила для достижения целей разными способами, в зависимости от того, какие препятствия ему приходится преодолевать на пути. Как поясняет Уильям Джеймс:
Джульетта притягивает Ромео, как магнит притягивает металлические опилки; если ему не мешают обстоятельства, он движется к ней по такой же прямой линии, как они. Но Ромео и Джульетта, если между ними будет воздвигнута стена, не будут стоять, как идиоты, прижавшись лицами к противоположным сторонам стены, как это бывает в случае, если между магнитом и опилками поставить бумагу. Ромео вскоре найдет альтернативный путь – взобравшись на стену или как-то еще – беспрепятственно припасть к губам Джульетты. В случае с металлическими опилками, их траектория движения неизменна; любая случайность может определить, достигнут они цели или нет. В случае с влюбленным Ромео, неизменной остается только цель, а траектория движения может меняться как угодно64.
Выходит, что интеллект – это способность достичь цели, невзирая на препятствия, принимая решения, основанные на рациональных (подчиняющихся критерию истинности) правилах. Компьютерщики Алан Ньюэлл и Герберт Саймон конкретизировали эту идею, отметив, что интеллект состоит в способности определить цель, оценить текущую ситуацию, чтобы увидеть, насколько она отличается от цели, и применить ряд действий, позволяющих уменьшить это различие. С облегчением отметим, что под это определение существа, обладающего интеллектом, подходят не только инопланетяне, но и мы, люди. У нас есть желания и мы добиваемся желаемого, опираясь на наши знания, которые при хорошем раскладе являются по меньшей мере приблизительно или вероятностно истинными65.
То, что понятие «интеллект» должно определяться через такие термины, как знание и желание, далеко не очевидный факт. Старая теория стимула и реакции, предложенная бихевиористами, предполагала, что знания и желания не имеют ничего общего с поведением – и вообще, научного в них не больше, чем в привидениях и черной магии. У людей и животных определенный стимул вызывает реакцию, потому что ранее с этой реакцией был связан триггер рефлекса (пример – выделение слюны как реакция на звук колокольчика, который ранее был связан с появлением пищи) или потому что реакция в присутствии данного стимула получила подкрепление (пример – животное получает еду, нажимая на рычажок). По словам известного бихевиориста Б. Ф. Скиннера, «вопрос не в том, может ли машина мыслить, а в том, может ли мыслить человек»66.
Конечно же человек может мыслить; теория стимула и реакции оказалась несостоятельной. Почему Салли выбежала из здания? Потому что она была убеждена, что дом горит, и не хотела погибнуть. То, что она выбежала из здания, – предсказуемая реакция на определенный стимул, который может быть объективно описан в терминах физики и химии. Возможно, она выбежала из здания, увидев дым; возможно, это было реакцией на телефонный звонок с сообщением о том, что здание горит, или на появление перед домом пожарных машин, или на звук пожарной сигнализации. Однако ни один из этих стимулов не должен был неизбежно заставить ее выйти на улицу. Она не вышла бы, если бы знала, что дым идет от булки в тостере, или что по телефону ей позвонила подруга, которая репетирует свою роль для спектакля, или что кто-то по ошибке или ради шутки включил пожарную сигнализацию, или что сигнализацию проверяет электрик. Свет, звук, частицы, которые можно измерить физическими приборами, не могут предопределять поведение человека. Если что-то и предопределяет в данном случае поведение Салли, так это то, убеждена ли она, что находится в опасности. Естественно, убеждения Салли связаны с воздействующими на нее стимулами, но только косвенным, весьма замысловатым путем, через посредство прочих ее убеждений относительно того, где она находится и как устроен мир. В не меньшей мере поведение Салли зависит от того, насколько сильно она желает избежать опасности. Можно предположить, что она бы не выбежала из здания, если бы была членом добровольческой пожарной бригады или самоубийцей, или фанатичкой, решившей пойти на самосожжение, чтобы привлечь внимание к своим идеалам, или у нее на верхнем этаже здания остались дети.
Сам Скиннер тоже был не так глуп, чтобы утверждать, что измеряемые стимулы вроде длины волн или формы могут предопределять поведение. Он определял стимулы по наитию, удовлетворяясь такими наименованиями, как «опасность», «похвала», «красота», «английский язык». В этом заключалось определенное преимущество его теории, позволявшее ей не расходиться с реальностью, но это было преимущество грабежа над честным трудом. Мы все понимаем, что механическое устройство может реагировать на красный свет или громкий звук – мы даже можем сконструировать такое устройство, но ведь человек – единственное устройство во Вселенной, способное реагировать на опасность, похвалу, английский язык и красоту. Способность человека реагировать на что-то столь физически неуловимое, как похвала, – это один из элементов головоломки, которую мы пытаемся разгадать, а вовсе не элемент решения этой головоломки. Похвала, опасность, английский язык и все остальные вещи, на которые мы реагируем, точно так же, как красота, оказываются в глазах смотрящего. И как раз «глаза смотрящего» – это то, что нам остается объяснить. Между тем, что можно измерить приборами, и тем, что может вызывать поведение, лежит целая пропасть, и именно поэтому мы не имеем права отказывать людям в наличии у них убеждений и желаний.
В повседневной жизни мы прогнозируем и интерпретируем поведение других людей, исходя из того, что, по нашему мнению, они знают и чего, как нам кажется, они хотят. Убеждения и желания – инструменты, которыми мы пользуемся для толкования мира в нашем интуитивном мышлении, и именно психология интуиции по сей день остается наиболее полноценной и полезной наукой о поведении. Чтобы прогнозировать большинство действий человека – то, что он подойдет к холодильнику, сядет в автобус, откроет кошелек, – не нужно разрабатывать математическую модель, моделировать нейронные сети на компьютере или нанимать профессионального психолога; достаточно спросить у своей бабушки67.
Я не хочу сказать, что психология должна больше полагаться на здравый смысл, чем физика или астрономия. И все же этот самый здравый смысл позволяет с такой точностью прогнозировать, регулировать и интерпретировать повседневное поведение по сравнению с любой другой когда-либо предложенной для этих целей альтернативой, что велика вероятность того, что он в той или иной форме будет встроен в наши лучшие научные теории. Я звоню старому другу, который живет на другом побережье, и мы договариваемся встретиться в Чикаго у входа в бар в определенном отеле в 19:45, в определенный день через два месяца. Я прогнозирую, он прогнозирует, и все, кто знает нас, прогнозируют, что в этот день мы встретимся. И мы действительно встречаемся. Поразительно! В какой еще научной области может дилетант – да и специалист тоже, собственно говоря, – прогнозировать на несколько месяцев вперед траектории двух объектов, находящихся на расстоянии тысяч миль друг от друга, с точностью до сантиметров и минут? Да еще и делать это на основе информации, которая укладывается в несколько секунд разговора? Расчеты, лежащие в основе прогнозирования, и представляют собой интуитивное мышление: знание, что я желаю встретиться со своим другом, а он желает встретиться со мной, и каждый из нас убежден, что другой будет в определенном месте в определенное время и знает последовательность перелетов, поездок и пересадок, которые необходимо совершить, чтобы туда добраться. Никакая наука, изучающая мозг и мышление, не способна достичь лучшего результата. Это не означает, что интуитивная психология убеждений и желаний сама собой представляет собой науку, однако из этого следует, что научной психологии еще предстоит объяснить, как физический объект – такой, как человеческий организм, – может иметь убеждения и желания и как выходит, что эти убеждения и желания так хорошо работают.
Традиционное объяснение сути интеллекта заключается в том, что человеческая плоть проникнута нематериальной сущностью – душой, которую обычно представляют в виде духа или привидения. Однако эта идея наталкивается на неразрешимую проблему: как этот призрак взаимодействует с твердым веществом? Как эфемерное ничто реагирует на вспышки, толчки, звуковые сигналы и заставляет наши руки и ноги двигаться? Еще одна проблема – это наличие явных доказательств того, что мышление связано с деятельностью мозга. Душу, которую называют невещественной, как мы теперь знаем, можно рассечь ножом, изменить путем воздействия химических веществ, запустить и остановить с помощью электричества, уничтожить резким ударом или недостаточным количеством кислорода. Если на мозг посмотреть в микроскоп, мы увидим, что он обладает захватывающей сложностью физической структуры, полностью соизмеримой с богатством мышления.
Есть версия, что мышление порождает некая особая форма материи – подобно тому, как Пиноккио появился из найденного Джузеппе волшебного полена, которое говорило, смеялось и двигалось само по себе. Увы, никому еще не удалось обнаружить такого чудесного вещества. Можно подумать, что таким чудесным веществом является мозговая ткань. Дарвин писал, что мозг «выделяет» мысль, а не так давно философ Джон Серль утверждал, что физико-химические свойства мозга каким-то образом позволяют ему производить мысль, как молочная железа производит молоко, а растительная ткань производит сахар. Но вспомним, что мозговая ткань всех представителей царства животных содержит одни и те же виды мембран, пор и химических веществ, не говоря уже об опухолях мозга и пробирочных культурах. Каждая частица нервной ткани обладает одними и теми же физико-химическими свойствами, но не каждая способна порождать интеллект, подобный интеллекту человека. Конечно, ткани человеческого мозга отличают некоторые свойства, необходимые для нашего интеллекта. Но одних только физических свойств недостаточно – точно так же, как физических свойств кирпичей недостаточно, чтобы объяснить особенности архитектуры, а физических свойств частиц воздуха недостаточно, чтобы объяснить музыку. Критическое значение имеет нечто в структурировании нервной ткани.
Нередко мышление пытаются объяснить за счет некоего потока энергии или силового поля. Магические шары, таинственный дым, ауры, вибрации, магнитные поля, линии силы – все это неизменные атрибуты спиритизма, псевдонауки и дешевых фильмов в жанре научной фантастики. Представители школы гештальт-психологии попытались объяснить зрительные иллюзии, ссылаясь на действие электромагнитных полей на поверхности мозга, однако обнаружить эти поля так и не удалось. Периодически поверхность мозга пытаются описать как некий носитель колебаний, который поддерживает голограммы и другие интерференционные картины, однако и эта идея не завоевала признания. Ставшая основой для теории Фрейда гидравлическая модель, подразумевающая, что психическое давление накапливается, прорывается наружу или отводится через альтернативные каналы, и по сей день прослеживается в десятках привычных для нашего уха метафор; мы говорим: накопилась злость, выпустить пар, взорваться от гнева, выплеснуть эмоции, сдержать ярость. Но даже самый большой накал страстей не означает буквально, что где-то в мозге накапливается и высвобождается энергия (в физическом смысле). В главе 6 я попытаюсь убедить вас в том, что внутреннее давление не лежит в основе деятельности мозга; скорее мозг намеренно использует его как средство ведения переговоров – как террорист, привязавший к своему телу взрывчатку.
Недостаток всех этих теорий в том, что даже если мы когда-нибудь и откроем какую-нибудь субстанцию, или вибрацию, или магический шар, который будет говорить и проказничать, как найденное Джузеппе полено, или просто будет принимать решения, основанные на совокупности рациональных правил, и преследовать свою цель, невзирая на препятствия, перед нами по-прежнему будет стоять главный вопрос: как ему это удается?
Нет, интеллект происходит не от какой-то особой разновидности духа, материи или энергии. Его источником является информация. Информация – это корреляция между двумя объектами, возникающая в результате закономерного процесса (в противоположность возникающему по чистой случайности)68. Мы говорим, что кольца на пне коррелируют с возрастом срубленного дерева (чем старше дерево, тем больше на пне колец), и эта корреляция не случайна, а связана с тем, как деревья растут. Корреляция – понятие математическое и логическое, она не имеет ничего общего с тем, из чего состоят коррелирующие объекты.
В информации как таковой нет ничего особенного; с ней мы встречаемся каждый раз, когда причина ведет к следствию. Особенное начинается, когда речь идет об обработке информации. Мы можем рассматривать частицу материи, передающую информацию о положении дел, как символ; она может «обозначать» это положение дел. Однако будучи частицей материи, она может выполнять и другие функции – физические функции, зависящие от того, что может происходить с данным типом материи в данного типа ситуации по законам физики и химии. Годичные кольца несут информацию о возрасте деревьев, но они также способны отражать свет и поглощать красящие вещества. Следы несут информацию о передвижении животного, но они также способны удерживать воду и образовывать завихрения воздушного потока.
А сейчас давайте представим вот что. Предположим, что кто-то создал машину с деталями, действия которых зависят от физических свойств какого-либо символа. Некий рычаг, привод, фотоэлемент или магнит приводится в движение пигментом, поглощенным годичным кольцом дерева, или водой, собравшейся в отпечатке ноги, или светом, отражаемым следом мела, или магнитным зарядом на участке магнитной ленты. Предположим, что далее машина производит некое другое действие с другой массой вещества: наносит еще одну отметку на кусок дерева, оставляет отпечатки следов на мокрой земле, сообщает магнитный заряд еще одному участку магнитной ленты. Пока ничего особенного не происходит: все, что я описал, – это цепь физических действий, осуществленных бесполезным приспособлением.
А теперь перейдем к особенному. Представим, что мы пытаемся интерпретировать только что полученное материальное явление, используя схему, согласно которой исходный элемент несет в себе информацию. Например, посчитаем только что полученные годичные кольца и будем интерпретировать их как возраст данного дерева в данный момент времени, несмотря на то, что их источником вовсе не был рост дерева. Допустим, что машина была сконструирована таким образом, чтобы полученные метки действительно что-то означали – то есть чтобы они несли в себе информацию о каком-то явлении в мире. Например, представим, что машина сканирует годичные кольца на пне и выжигает на специальной доске по одной метке на каждое кольцо, потом переходит к пню более молодого дерева, срубленного в то же самое время, и стирает с доски по одной метке на каждое кольцо. Сосчитав оставшиеся отметки на доске, мы получим возраст первого дерева на тот момент, когда было посажено второе дерево. В этом случае перед нами будет разумная машина, машина, которая делает истинные выводы из истинных посылок – не за счет какого-то особого вида материи или энергии и не за счет того, что какая-то из ее деталей обладает интеллектом или рассудком. Все, что мы видим, – это тщательно сконструированная цепь самых обыкновенных физических действий, первым звеном которой было конфигурирование материи, несущей в себе информацию. Наша разумная машина своей разумностью обязана двум свойствам, неразделимо соединенным в той сущности, которую мы называем символом: символ несет в себе информацию и одновременно обусловливает другие события (годичные кольца коррелируют с возрастом дерева и могут поглощать световой луч сканера). Когда явление, обусловленное другим явлением, само несет в себе информацию, мы называем такую систему процессором данных или компьютером.
Вообще вся эта схема может показаться вам нереализуемой на практике. Кто может гарантировать, что можно соединить между собой несколько штуковин так, чтобы они падали, раскачивались, мигали ровно таким образом, что получившиеся результаты можно было интерпретировать и обнаружить некий смысл? (А еще лучше, чтобы это был смысл, вписывающийся в ранее сформулированную концепцию или закономерность, которая представляется нам интересной – в конце концов, ведь постфактум толкование можно дать любым результатам, даже самым бессмысленным.) Можем ли мы быть уверены, что подобная машина будет выдавать знаки, которые будут действительно соответствовать какой-то значимой ситуации в мире (например, возрасту дерева в тот момент, когда было посажено другое дерево, или среднему возрасту отростка этого дерева, или чему-нибудь еще), а не будут просто бессмысленным рисунком, не означающим ничего вообще?
Гарантией того, что это возможно, являются труды математика Алана Тьюринга. Он разработал гипотетическую машину, входные и выходные символы которой могут соответствовать в зависимости от специфики машины одной из огромного количества разумных интерпретаций. Машина состоит из ленты, разделенной на ячейки, головки записи-чтения, которая может печатать или считывать символ в ячейке и двигать ленту в обоих направлениях, указателя, который может указывать на фиксированное количество отметок времени на корпусе машины, и набора механических рефлексов. Каждый рефлекс запускается прочитанным символом и текущим положением указателя; машина печатает символ на ленте, передвигает ленту и/или перемещает указатель. Лента, подаваемая в машину, не ограничена по количеству. Эта конструкция получила название «машина Тьюринга».
Что может делать эта простая машина? Она может считывать символы, обозначающие цифры или совокупности цифр, и печатать символы, обозначающие новые цифры, которые являются значением той или иной математической функции, решаемой посредством пошаговой последовательности операций (сложения, умножения, возведения в степень, разложения на множители и так далее – я намеренно не закрываю список, чтобы подчеркнуть важность открытия Тьюринга, не вдаваясь в технические подробности). Она может применять правила любой применимой логической системы, чтобы получать истинные утверждения из других истинных утверждений. Она может применять правила грамматики любого языка, получая грамматически правильные предложения. Эквивалентность между машинами Тьюринга, математическими функциями, логическими правилами и грамматиками привела логика Алонсо Черча к положению о том, что любая четко определенная пошаговая инструкция, которая гарантированно дает решение данной проблемы за ограниченное время (иными словами, любой алгоритм) может быть выполнена с помощью машины Тьюринга.
Что это значит? Это значит, что в той мере, в которой наш мир подчиняется решаемым пошагово математическим уравнениям, может быть создана машина, которая имитирует мир и может делать относительно него прогнозы. В той мере, в которой рациональная мысль соответствует законам логики, может быть создана машина, которая осуществляет рациональное мышление. В той мере, в которой язык можно описать как совокупность грамматических правил, может быть создана машина, которая синтезирует грамматически правильные предложения. В той мере, в которой мысль представляет собой результат применения той или иной совокупности четко определенных правил, может быть создана машина, которая в некотором смысле этого слова думает.
Тьюринг показал, что думающие машины – машины, которые, опираясь на физические свойства символов, выдают новые символы, имеющие смысл, – создать можно; более того, создать их довольно легко. Специалист по теории вычислительной техники Джозеф Вейценбаум как-то продемонстрировал, что такую машину можно построить из штемпеля, нескольких камней и рулона туалетной бумаги. На самом деле, не нужно даже иметь кучу таких машин для разных функций – одну для сложения, другую для вычисления квадратного корня, третью – для того, чтобы писать предложения на английском языке, и так далее. Существует разновидность машины Тьюринга, которая называется универсальной машиной Тьюринга. Она может считывать описание работы любой другой машины Тьюринга, напечатанной на специальной пленке, а затем в точности воспроизводить работу этой машины. Одну и туже машину можно запрограммировать делать любую работу, которую можно описать совокупностью правил69.
Означает ли это, что человеческий мозг – это машина Тьюринга? Конечно же нет. Машины Тьюринга не используются нигде и уж тем более не используются у нас в голове. На практике они бесполезны: слишком неудобны в использовании, слишком сложны для программирования, слишком медленны и громоздки. Но это неважно. Тьюринг хотел доказать только, что система из расположенных в определенном порядке приспособлений может функционировать как разумный процессор символов. Вскоре после его открытия были разработаны более практичные процессоры символов, некоторые из которых впоследствии превратились в универсальные вычислительные машины: в «Ай-би-эм», «Юнивак», а чуть позже – в «Макинтоши» и персональные компьютеры. Все они по сути представляли собой универсальную машину Тьюринга. Если не принимать во внимание размер и скорость и предоставить им столько памяти, сколько нужно, их можно запрограммировать таким образом, чтобы они выдавали одинаковые выходные данные в ответ на одинаковые входные данные.
Были предложены и такие процессоры символов, которые должны были симулировать работу человеческого мозга. Такие модели часто воспроизводятся на персональных компьютерах, но это условные модели. Персональный компьютер изначально запрограммирован на то, чтобы эмулировать деятельность гипотетического ментального компьютера (образуя то, что специалисты по вычислительной технике называют виртуальной машиной); примерно также можно запрограммировать «Макинтош» эмулировать работу персонального компьютера. Всерьез воспринимается только виртуальный ментальный компьютер, а не кремниевые микросхемы, которые реализуют его. Далее на виртуальном ментальном компьютере запускается программа, моделирующая тот или иной вид мозговой деятельности (решение задачи, понимание предложения). Перед нами – новый путь к пониманию человеческого интеллекта.
Позвольте показать, как работает одна из таких моделей. В наш век, когда реальные компьютеры стали столь сложными, что непосвященному человеку понять их так же невообразимо трудно, как и работу мозга, достаточно показательным будет пример вычисления в пошаговом рассмотрении. Только так можно оценить, насколько простые устройства способны, будучи соединены между собой, образовывать процессор символов, демонстрирующий реальные проявления интеллекта.
Неуклюжая машина Тьюринга – не лучшая реклама теории о том, что мозг – это компьютер, поэтому я возьму за образец модель, которая может хотя бы отдаленно претендовать на сходство с нашим ментальным компьютером. Я покажу, как она решает настолько сложную задачу из повседневной жизни (родственные отношения), чтобы способность машины решить ее действительно производила впечатление.
Модель, которую мы будем использовать, называется продукционной системой. В ней отсутствует явно небиологическая характеристика всех серийных компьютеров: упорядоченный список этапов программы, который машина выполняет последовательно и целенаправленно. Продукционная система состоит из памяти и совокупности реакций, которые иногда называют «демонами», потому что они представляют собой простые автономные сущности, которые, образно говоря, сидят и ждут, когда их запустят. Память – это что-то вроде доски, на которую вешают объявления. Каждый демон – как коленный рефлекс; он ждет, когда на доске появится конкретное объявление, и реагирует на его появление тем, что прикрепляет к ней свое собственное объявление. Все демоны в совокупности образуют программу. По мере того, как они реагируют на появление объявлений на доске тем, что вывешивают собственные объявления, и тем самым вызывают реакцию других демонов, и так далее, информация в памяти меняется и в конечном итоге превращается в правильную выходную информацию для данной входной информации. Некоторые демоны связаны с органами чувств и запускаются они не информацией в памяти, а информацией, поступающей из окружающего мира. Другие демоны связаны с конечностями и реагируют тем, что двигают конечности, а не тем, что вывешивают новые объявления на доске памяти.
Предположим, что ваша долгосрочная память содержит знание о всех ваших родственниках и близких. Содержимое этого знания может быть представлено в виде совокупности суждений вроде «Алекс – отец Эндрю». Согласно вычислительной теории сознания, эта информация воплощается в виде символов: совокупности физических знаков, которые коррелируют с состоянием мира, отраженным в суждениях70.
В роли символов, о которых идет речь, не могут использоваться английские слова и предложения, вопреки распространенному заблуждению о том, что мы мыслим на родном языке. Как я показал в книге «Язык как инстинкт», предложения в устной форме языка – например, английского или японского – предназначены для устной коммуникации между разумными и очень нетерпеливыми членами социума. Они стремятся к краткости, поэтому опускают всю информацию, которую слушатель может мысленно восстановить, исходя из контекста. Напротив, «язык мысли», на котором формулируются суждения, не может ничего оставлять воображению, поскольку он сам и есть воображение. Еще одна проблема с использованием английского языка как посредника в передаче знания заключается в том, что предложения на естественном языке могут быть двусмысленными. Предположим, серийный убийца Тед Банди добился отсрочки приведения в исполнение смертного приговора, и в газете появляется заголовок Bundy Beats Date with Chair, но мы не сразу понимаем, о чем идет речь, потому что наш мозг приписывает этой последовательности слов два смысла (из-за многозначности слов beats, date и chair высказывание может означать «Банди избежал казни на электрическом стуле» или «Банди ударил свою девушку стулом». – Прим. пер.). Если одна последовательность слов в английском языке может соответствовать двум значениям в мышлении, значения в мышлении не могут быть последовательностями слов в английском языке. Наконец, предложения естественного языка могут быть осложнены артиклями, предлогами, суффиксами рода, другими грамматическими деталями. Они нужны для того, чтобы легче передать информацию из одной головы в другую посредством говорения и слуха, то есть через очень медленный канал связи, но они совершенно не нужны внутри головы, где информация передается напрямую по пучкам нейронов. Итак, утверждения в системе знания – это не предложения на английском языке, а конструкции на более насыщенном информацией языке мысли, «мыслекоде».
В нашем примере образец мыслекода, который выражает семейные отношения, представлен двумя типами утверждений. Пример первого типа – Alex father-of Andrew (Алекс отец Эндрю): имя, за которым следует указание на тип родственных отношений, а затем еще одно имя. Пример второго типа – Alex is-male (Алекс мужского пола): имя, за которым следует указание на пол. Пусть вас не смущает то, что в записях мыслекода я использую английскую лексику и синтаксис. Это делается только для того, чтобы вам, читатель, было легче понять, что означают символы. В случае с машиной эти символы представляют собой разные метки. Это могут быть какие угодно символы, расположенные в каком угодно порядке – при условии, что каждый символ последовательно используется для обозначения одного и того же человека (например, тот символ, который мы используем для обозначения Алекса, всегда используется для Алекса и никогда не используется для обозначения кого-либо еще), и что они располагаются в одном и том же порядке (чтобы они могли правильно передавать информацию о том, кто чей отец). Метки могут иметь форму штрихов в штрих-коде, распознаваемом сканером, или замочных скважин, к каждой из которых подходит только один ключ, или форм, которые подходят только к одному шаблону. Естественно, в случае серийных компьютеров это будут разные последовательности расположения зарядов в кристаллах микросхем, а в случае мозга – последовательности возбуждения в группах нейронов. Здесь очень важно отметить, что машина не может понимать символы таким же образом, как вы и я; элементы конструкции машины реагируют на их форму, выполняя ту или иную операцию – как автомат для продажи жвачки реагирует на вес и форму монетки, выдавая покупателю жвачку.
Приводимый ниже пример – это попытка пролить свет на суть машинного вычисления, показать вам, как машине удается это провернуть. Чтобы более наглядно представить мое положение о том, что символ может одновременно обозначать некое понятие и механическим путем обусловливать некое событие, я покажу весь процесс работы продукционной системы шаг за шагом и опишу все происходящее дважды: на концептуальном уровне, в терминах содержания задачи и логики, которая используется для ее решения, и на механическом уровне, в терминах действий машины – считывания данных и нанесения меток. Система разумна в том смысле, что эти два уровня точно соответствуют друг другу: каждая идея соответствует метке, каждый логический шаг соответствует действию.
Назовем ту часть памяти системы, в которой содержатся записи о родственных отношениях, «Долгосрочной памятью». Другую часть назовем «Краткосрочной памятью» – это нечто вроде чернового блокнота для вычислений. Часть «Краткосрочной памяти» представляет собой область задач; в ней содержится список вопросов, на которые система пытается ответить. Системе нужно узнать, является ли Горди родным дядей по отношению ко мне (условное обозначение – Я). В самом начале память выглядит следующим образом:
На концептуальном уровне наша цель – ответить на вопрос; ответ будет положительным, если факт, которого он касается, истинен. На механическом уровне система должна определить, есть ли где-нибудь в ее памяти последовательность знаков, идентичная той последовательности, которую мы видим со знаком вопроса в колонке «Задачи». Функция одного из демонов системы – отвечать на вопросы, связанные с поиском, считывая аналогичные знаки в колонках «Задачи» и «Долгосрочная память». Обнаружив совпадение, он печатает метку рядом с вопросом, что означает, что вопрос получил положительный ответ. Для удобства давайте скажем, что метка имеет форму слова Yes (Да).
IF: Goal = blah-blah-blah?
Long-Term Memory = blah-blah-blah
THEN: MARK GOAL
Yes
(ЕСЛИ: Задача = то-то и то-то?
Долгосрочная память = то-то и то-то
ТО: МЕТКА ЗАДАЧИ
Да)
Концептуальная проблема, стоящая перед системой, состоит в том, что у нее нет эксплицитного знания о том, кто чей дядя. Это знание имплицитно следует из других фактов, которые она знает. На механическом уровне то же самое будет значить вот что: в разделе «Долгосрочная память» нет метки uncle-of (дядя); там есть только метки sibling-of (брат/сестра) и parent-of (родитель). На концептуальном уровне нам нужно вывести знание о том, кто чей дядя, из знания о том, кто приходится кому родителем и братом/сестрой. На механическом уровне нам нужен демон, который сделает запись uncle-of (дядя), по обе стороны от которой будут нужные метки, обнаруженные в записях с элементами sibling-of (брат/сестра) и parent-of (родитель). На концептуальном уровне нам нужно выяснить, кто у нас родители, идентифицировать их братьев и сестер, потом выбрать из них лиц мужского пола. На механическом уровне нам нужен следующий демон, который сделает в области «Задачи» новые записи, запускающие соответствующие операции поиска в памяти:
IF: Goal = Q uncle-of Р
THEN: ADD GOAL
Find P’s Parents
Find Parents’ Siblings
Distinguish Uncles/Aunts
(ЕСЛИ: Задача = Q дядя PTO: ДОБАВИТЬ ЗАДАЧУ
Найти родителей Р
Найти братьев/сестер родителей
Различить дядь/теть)
Этот демон запускается записью uncle-of (дядя) в колонке «Задачи». В этой колонке действительно есть такая запись, поэтому демон начинает действовать и добавляет к этой колонке новые метки:
Необходим также элемент программы – еще один демон или дополнительный механизм внутри данного демона, который будет отвечать за Р и Q, то есть заменять ярлык Р списком конкретных ярлыков имен: Me (Я), Abel (Абель), Gordie (Горди) и т. д. Эти детали я здесь не привожу, чтобы не усложнять восприятие процесса.
Новые записи в колонке «Задачи» побуждают к действию других демонов. Один из них (на концептуальном уровне) ищет родителей системы, копируя (на механическом уровне) все записи, содержащие имена родителей, в раздел «Краткосрочная память» (если только там уже нет таких записей, конечно; это условие необходимо, чтобы демон не продолжал бессмысленно делать одну копию за другой, как ученик чародея):
IF: Goal = Find P’s Parents
Long-Term Memory = X parent-of P
Short-Term Memory ≠ X parent-of P
THEN: COPY TO Short-Term Memory
X parent-of P
ERASE GOAL
(ЕСЛИ: Задача = найти родителей P
Долгосрочная память = X родитель P
Краткосрочная память ≠ X родитель P
ТО: КОПИРОВАТЬ В КРАТКОСРОЧНУЮ ПАМЯТЬ
X родитель P
СТЕРЕТЬ ЗАДАЧУ)
Теперь наша доска объявлений выглядит следующим образом:
Теперь, когда мы знаем родителей, мы можем найти братьев и сестер родителей. На механическом уровне это означает, что теперь, когда имена родителей записаны в разделе «Краткосрочная память», может начинать работу демон, копирующий записи о братьях и сестрах родителей:
IF: Goal = Find Parents’ Siblings
Short-Term Memory = X parent-of Y
Long-Term Memory = Z sibling-of X
Short-Term Memory
Z sibling-of X
THEN: COPY TO Short-Term Memory
Z sibling-of X
ERASE GOAL
(ЕСЛИ: Задача = найти родителей P
Краткосрочная память = X родитель Y
Долгосрочная память = Z брат/сестра X
Краткосрочная память
Z брат/сестра X
ТО: КОПИРОВАТЬ В КРАТКОСРОЧНУЮ ПАМЯТЬ
Z брат/сестра X
СТЕРЕТЬ ЗАДАЧУ)
Вот что у него получается:
На данном этапе мы рассматриваем дядь и теть вместе. Чтобы отделить дядь от теть, нам нужно найти среди них мужчин. На механическом уровне система должна найти записи, рядом с которыми в разделе «Долгосрочная память» стоят метки is-male (мужского пола). Вот демон, который выполняет эту проверку:
IF: Goal = Distinguish Uncles/Aunts
Short-Term Memory = X parent-of Y
Long-Term Memory = Z sibling-of X
Long-Term Memory = Z is-male
THEN: STORE IN LONG-TERM MEMORY
Z uncle-of Y
ERASE GOAL
(ЕСЛИ: Задача = различить дядь/теть
Краткосрочная память = X родитель Y
Долгосрочная память = Z брат/сестра X
Долгосрочная память = Z мужского пола
ТО: ХРАНИТЬ В ДОЛГОСРОЧНОЙ ПАМЯТИ
Z дядя Y
СТЕРЕТЬ ЗАДАЧУ)
Это демон, который наиболее явно воплощает в себе понимание системой значения слова «дядя»: это человек мужского пола, брат одного из родителей. Система добавляет запись о том, кто является дядей, в раздел «Долгосрочная память», а не «Краткосрочная память», потому что эта запись представляет собой элемент знания, который всегда истинен:
На концептуальном уровне мы всего лишь логически вывели факт, который был запрошен. На механическом уровне мы только что создали идентичные друг другу вплоть до последней метки записи в колонках «Задачи» и «Долгосрочная память». Запускается самый первый из упомянутых мной демонов, который осуществляет поиск таких пар; он ставит метку, обозначающую, что задача решена:
Чего мы достигли? Мы построили из безжизненных деталей автомата по продаже жвачки систему, которая делает нечто, отдаленно напоминающее работу мышления: она устанавливает истинность утверждения, с которым ранее никогда не имела дела. Из утверждений о конкретных родителях, братьях и сестрах и знания о том, что значит быть чьим-то дядей, она выработала истинные утверждения о конкретных дядях. И все это, повторю еще раз, было сделано путем обработки символов – материальных изображений, обладающих репрезентативными и каузальными свойствами, то есть одновременно способных нести в себе информацию о чем-либо и принимать участие в цепочке физических событий. Указанные события и составляют процесс вычисления: вычислительные механизмы задуманы таким образом, что если интерпретация символов, запускающих машину, является истинным утверждением, тогда и интерпретация символов, синтезированная машиной, тоже является истинным утверждением. Вычислительная теория сознания – это гипотеза о том, что интеллект как раз представляет собой вычисление в этом значении слова.
«Это значение» довольно широко и позволяет избежать дополнительных посылок, связанных с другими определениями вычисления. Так, нам не нужно принимать в качестве исходного положения, что вычисление состоит из последовательности отдельных шагов, что символы должны либо явно наличествовать, либо явно отсутствовать (в противопоставление градации признака: более выраженный – менее выраженный, более активный – менее активный), что мы гарантированно получим правильный ответ за ограниченный промежуток времени, или что истинное значение должно быть «абсолютно истинным» или «абсолютно ложным», а не подразумевать вероятность или некоторую степень уверенности. Таким образом, вычислительная теория охватывает и альтернативный вариант компьютера с множеством элементов, активных в той или иной степени, в зависимости от вероятности того, что то или иное утверждение истинно или ложно; компьютера, в котором уровень активности может постепенно меняться, отражая новые и приближенно точные вероятности. (Как будет показано ниже, вполне возможно, что именно так работает мозг.) Главная идея заключается в том, что ответ на вопрос «Что делает систему умной?» – не материя, из которой сделана система, и не какая-то особенная энергия, протекающая через нее, а то, для чего предназначен каждый из элементов машины, и каким образом закономерности изменений внутри системы отражают соответствующие параметру истинности отношения (включая случаи, когда истинность является вероятностной или недостаточно четко определенной)71.
Естественные вычисления
Почему вычислительной теории сознания можно верить? Потому что это теория, которая позволила разрешить многовековые проблемы философии, стала началом компьютерной революции, подняла ключевые вопросы нейробиологии и дала психологии потрясающе плодотворное поле для исследований.
Целые поколения мыслителей безрезультатно ломали головы над тем, каким образом мышление взаимодействует с материей. Как сказал Джерри Фодор, «жалость к себе может довести до слез, и лук тоже». Как могут наши неосязаемые убеждения, желания, представления, планы, цели отражать мир вокруг нас и давить на рычаги, с помощью которых мы, в свою очередь, меняем мир? Декарт через много столетий после смерти стал посмешищем для ученых (и совершенно незаслуженно), потому что высказал идею о том, что мышление и материя – разные виды вещества, которые каким-то образом взаимодействуют в части мозга, называемой шишковидной железой. Философ Гилберт Райл высмеял эту идею, назвав ее «доктриной призрака в машине»72 (эту фразу позже использовали в качестве заголовка для книг писатель Артур Кестлер и психолог Стивен Косслин и рок-группа «Полис» в качестве названия своего альбома). Райл и другие философы утверждали, что такие термины ментализма, как «убеждения», «желания» и «представления», бессмысленны и происходят от небрежной, неправильной трактовки языка. Имеющие схожие взгляды бихевиористы заявляли, что говорить о невидимых сущностях так же ненаучно, как верить в Зубную Фею, и старались полностью исключить их из своих психологических теорий.
А потом появились компьютеры: не имеющие ничего общего с феями и невидимыми сущностями куски железа, работу которых никак нельзя было объяснить без полного арсенала «запретных» словечек ментализма. «Почему мой компьютер не печатает документ?» – «Потому что программа не знает, что ты заменил струйный принтер на лазерный. Она до сих пор думает, что говорит со струйным принтером, и пытается распечатать документ, прося принтер подтвердить получение сообщения. Но принтер не понимает ее сообщение и игнорирует его, потому что ожидает, что вводные данные будут начинаться с символа “%”! Программа отказывается вернуть управление, пока она продолжает разговаривать с принтером, поэтому тебе нужно привлечь внимание диспетчера задач, чтобы он отобрал управление у программы. Как только программа узнает, какой принтер к ней подключен, они начнут общаться». Чем сложнее система и чем опытнее пользователи, тем больше обсуждение технических деталей напоминает сюжет мыльной оперы.
Философы-бихевиористы все-таки продолжали бы настаивать на том, что все это праздные разговоры. Машины на самом деле ничего не понимают и не пытаются, сказали бы они; просто пользователи легкомысленно подходят к выбору слов и поэтому рискуют поддаться на соблазн серьезных концептуальных ошибок. И все же, что здесь не так? Философы обвиняют компьютерщиков в недостаточной ясности мышления? Да ведь компьютер – это самый формальный, педантичный, реалистичный, неумолимый ревнитель точности и недвусмысленности во Вселенной. Судя по формулировке обвинения, можно подумать, что это компьютерщики в замешательстве зовут на помощь философов, когда у них перестают работать компьютеры, а не наоборот. Гораздо лучшее объяснение состоит в том, что вычислительная теория наконец позволила развеять туман мистики, окутывавший менталистские термины: убеждения – это записи в памяти, желания – это записи в разделе задач, мышление – это вычисления, запускаемые датчиками, попытка – это выполнение операции, запускаемое задачей.
(Вы возразите, что мы, люди, что-то чувствуем, когда у нас возникает убеждение или желание или ощущение, а обычная запись в памяти не способна создавать такие чувства. Справедливое замечание. Но давайте попытаемся не смешивать проблему объяснения интеллекта с проблемой объяснения осознанных ощущений. Пока я пытаюсь объяснить, что такое интеллект; а до сознания мы дойдем чуть позже в этой же главе.)
Вычислительная теория сознания также позволяет реабилитировать раз и навсегда печально известного гомункула. Типичное возражение против идеи, что мысли – это внутренние репрезентации (это возражение очень популярно среди ученых, старающихся всячески показать, насколько они прагматичны), состоит в том, что если есть образ, то в голове должен быть маленький человечек, который на него смотрит, а если есть маленький человечек, то должен быть человечек еще меньше, который смотрит на образы в голове первого человека, и так далее, до бесконечности. Но вот перед нами в очередной раз тот же самый спор: теоретик упорно убеждает инженера-электрика в том, что, если инженер прав, то в его рабочей станции должны жить толпы крошечных человечков. В вычислительной технике без гомункулов не обойтись. Здесь постоянно считываются, интерпретируются, анализируются, распознаются и проверяются структуры данных, и подпрограммы, которые за это отвечают, без зазрения совести называют «агентами», «демонами», «контроллерами», «диспетчерами», «интерпретаторами». Почему все эти разговоры о гомункулах не ведут к бесконечному регрессу? Потому что внутренняя репрезентация – это не реалистичная фотография мира, а гомункул, который «смотрит на нее», – не миниатюрная копия всей системы, обладающая таким же интеллектом. В этом случае это бы и в самом деле ничего не объясняло. Нет, репрезентация – это совокупность символов, соответствующая тому или иному аспекту мира, и каждому гомункулу остается только реагировать несколькими заранее предписанными действиями на некоторые из этих символов: эта задача гораздо проще того, что делает вся система в целом. Интеллект системы образован действиями не столь интеллектуальных механических демонов внутри нее. Эту мысль, впервые высказанную в 1968 году Джерри Фодором, следующим образом сформулировал Дэниел Деннетт:
Гомункулы превращаются в призраков только в тех случаях, когда они полностью дублируют те способности, которые они должны были объяснить… Когда получается сделать так, чтобы команда или комитет относительно невежественных, ограниченных и зашоренных гомункулов обеспечивали разумное поведение в целом, это уже успех. Блок-схема программы обычно представляет собой схему организационной структуры комитета гомункулов (экспертов, библиотекарей, счетоводов, администраторов); каждый блок схемы определяет гомункула, предписывая некую функцию, но не уточняя, как ее выполнить (в самом деле, мы ведь говорим «назначить человечка выполнять ту или иную работу»). Далее, если мы посмотрим повнимательнее на отдельные блоки, то увидим, что функция каждого из них выполняется путем ее разбиения при помощи другой блок-схемы на еще более мелких и более глупых гомункулов. В конце концов, помещая одни блоки внутрь других, мы придем к гомункулам настолько глупым (все, что от них требуется, это отвечать на вопросы «да» или «нет»), что их можно, так сказать, «заменить машиной». Мы можем исключить из схемы сказочных гомункулов, организовав для выполнения работы целые армии идиотов73.
Вероятно, вы по-прежнему задаетесь вопросом, каким образом метки, которые пишут и стирают демоны внутри компьютера, представляют или обозначают вещи в реальном мире. Кто решает, что данная метка в системе соответствует данному кусочку мира? В случае с компьютером ответ очевиден: мы решаем, что обозначают эти символы, потому что мы создаем машину. Но кто определяет значение символов, которые якобы присутствуют в нашей голове? В философии данная проблема известна как проблема «интенциональности» (этот термин может ввести в заблуждение, потому что интенциональность не имеет ничего общего с намерениями; англ, intentionality образовано от intention, у которого помимо специального логического значения «интенция» есть также общеязыковое значение «намерение». – Прим. пер.) На этот вопрос есть два широкоизвестных ответа. Первый – что символ связан с референтом (обозначаемым объектом) в реальном мире посредством наших органов чувств. Лицо матери отражает свет, который возбуждает зрительные рецепторы, что приводит к каскаду эталонов или подобных схем, которые вписывают символ мать в ваше мышление. Второй ответ – что уникальный паттерн манипуляций с символами, запускаемый первым символом, отражает уникальный паттерн взаимоотношений между референтом первого символа и референтами инициируемых символов. Если мы условимся (какими бы ни были причины) говорить, что символ мать обозначает мать, дядя обозначает дядю, и так далее, все новые утверждения о взаимном родстве, генерируемые демонами, чудесным образом вновь и вновь будут оказываться истинными. Устройство напечатает утверждение Bella mother-of Me (Белла мать Я) – и будет право, потому что Белла и впрямь моя мать. Символ мать обозначает мать, потому что он выполняет определенную роль во всех умозаключениях о матерях.
Эти две теории известны как теория причинно-следственной связи и теория инференциальных ролей, и для опровержения каждой из них оппонентами было выдумано немало нелепых мысленных экспериментов. Эдип не хотел жениться на своей матери, но все равно это сделал. Почему? Потому что эта женщина вызвала в его сознании символ Иокаста, а не символ мать, а его желание было сформулировано как «Если это мама, не женись на ней». Причинное влияние символа Иокаста (а это женщина, которая на самом деле была матерью Эдипа) здесь были нерелевантны; единственное, что имело значение, – это инференциальная роль, которую играли в голове Эдипа символы Иокаста и мать. Молния ударяет в сухое дерево посреди болота, и каким-то чудесным образом болотная тина сливается в точную копию меня в данный момент, воспроизводящую меня вплоть до молекулы, включая мои воспоминания. Этот Болотный человек никогда не видел мою мать, но большинство людей сказали бы, что его мысли о матери будут о моей матери – точно так же, как и мои собственные мысли. Отсюда также следует вывод, что символу не обязательно быть связанным причинно-следственными связями с чем-либо в этом мире, чтобы напоминать о чем-то; достаточно его инференциальной роли74.
И все-таки… Предположим, что последовательность действий по обработке информации, выполняемых компьютером, играющим в шахматы, оказывается по какому-то удивительному стечению обстоятельств аналогичной событиям на поле боя в ходе Шестидневной войны[8]: королевский конь = Моше Даян, ладья на с7 = израильская армия захватывает Голанские высоты и т. д. Можно ли будет сказать, что эта программа в такой же степени воспроизводит Шестидневную войну, в какой она воспроизводит игру в шахматы? Предположим, однажды мы обнаружим, что кошки – вовсе не животные, а очень похожие на животных роботы, управляемые с Марса. Любое правило логического вывода, которое приведет к выводу «если это существо – кошка, то это животное», будет недействительным. Инференциальная роль нашего ментального символа кошка в этом случае изменится до неузнаваемости. Однако значение символа кошка останется неизменным: вы все равно подумаете «кошка», увидев крадущегося мимо робота по кличке Феликс. Уже два очка в пользу теории причинно-следственной связи.
Третью точку зрения можно кратко выразить фразой из пародии на телерекламу в передаче «Субботним вечером в прямом эфире»: «Вы оба правы – это мастика для натирки пола и украшение для десерта». Что обозначает символ, определяют каузальная и инференциальная роли символа в сочетании. (С этой точки зрения мысли Болотного человека будут о моей матери, потому что у него будет ориентированная на будущее каузальная связь с ней: он узнает мою мать, если встретит ее). Каузальная и инференциальная роли обычно бывают синхронизированы, поскольку благодаря естественному отбору наши системы восприятия и модули логического вывода в этом мире по большей части работают правильно. Не все философы согласятся с тем, что сочетания причинности, инференции и естественного отбора достаточно для такого описания понятия «значение», которое будет идеально работать в любой альтернативной Вселенной. («Предположим, у Болотного человека есть идентичный близнец на другой планете…») Но если его и достаточно, ответим мы, тем хуже для этой концепции значения. Значение может иметь смысл только относительно устройства, которое было создано (инженерами или естественным отбором) для работы в данном, конкретном мире. Иными словами, насчет Марса, Болотной страны или Сумеречной зоны сказать наверняка ничего нельзя. Даже если с философской точки зрения наша теория каузальности в сочетании с инференцией не совсем совершенна, она по крайней мере снимает покров тайны с того, каким образом символ в нашей голове или в компьютере может что-то обозначать75.
Еще один признак того, что вычислительная теория сознания на правильном пути, – существование искусственного интеллекта: компьютеров, которые выполняют интеллектуальные задачи, посильные только для человека. В любом магазине подержанной аппаратуры вам продадут компьютер, который превосходит человека по способности вычислять, хранить и находить данные, строить чертежи, проверять орфографию, переправлять почту и набирать текст. В хорошо укомплектованном магазине программного обеспечения вам предложат программы, которые отлично играют в шахматы, распознают буквы алфавита и отчетливую речь. Покупатель с кошельком потолще может позволить себе программы, способные поддерживать разговор по-английски на ряд тем и управлять роботизированной рукой, выполняющей сварку и покраску, и не уступающие человеку по мастерству в сотнях областей – таких, как подбор акций, диагностика болезней, назначение лекарств, устранение неполадок в оборудовании. В 1996 году компьютер «Дип Блю» обыграл в одиночной партии чемпиона мира по шахматам Гарри Каспарова. Еще две партии закончились вничью, а последнюю компьютер проиграл; можно сказать, что всего лишь вопрос времени, когда компьютер окончательно победит чемпиона мира. Роботов такого класса, как Терминатор, в мире пока нет, однако есть тысячи менее масштабных программ искусственного интеллекта – в том числе они есть у вас в компьютере, в машине и в телевизоре. И это не предел.
Эти скромные успехи заслуживают внимания в связи с горячими спорами по поводу того, что компьютеры вскоре смогут или, наоборот, никогда не смогут делать. Одна сторона дебатов заявляет, что появление роботов уже не за горами (что доказывает, что мозг – это компьютер), а вторая утверждает, что этого никогда не будет (что доказывает обратное)76. Создается ощущение, что эта дискуссия сошла со страниц книги «Говорят эксперты» Кристофера Серфа и Виктора Наваски:
Знающие люди уверены, что передавать голос по проводам невозможно, а если даже это и было бы возможно, то не принесло бы никакой практической пользы.
Пятьдесят лет спустя… мы откажемся без абсурдной необходимости выращивать целую курицу, чтобы съесть грудку или крылышко, и начнем выращивать эти части по отдельности в подходящих условиях.
Летающие машины тяжелее воздуха невозможны.
[К 1965 году] автомобиль высшего класса будет около 20 футов длиной, работать будет на энергии газотурбинного двигателя, младшего брата реактивного двигателя.
Человек никогда не долетит до Луны, невзирая на все будущие научные достижения.
Пылесосы, работающие за счет ядерной энергии, станут реальностью через 10 лет.
Единственное явно справедливое утверждение, следующее из рассуждений футурологов, – что в будущем все их рассуждения будут выглядеть глупо. Мы не можем знать пределов возможностей искусственного интеллекта, его достижения будут зависеть от того, с какими практическими сложностями столкнется его развитие. Не подлежит сомнению лишь одно: вычислительные машины могут обладать интеллектом.
Связь между научным пониманием и технологическими достижениями очень слаба. Мы уже достаточно давно обладаем значительными знаниями о суставах и о сердце, но вот искусственные суставы уже стали привычным делом, а искусственных сердец пока не наблюдается. Об этой пропасти между теорией и практикой нужно помнить и тогда, когда мы ищем в искусственном интеллекте ответы на вопросы о компьютере и мышлении. Более подходящим названием для изучения мышления с опорой на информацию о компьютерах будет не «искусственный интеллект», а «естественное вычисление»78.
Вычислительная теория сознания незаметно закрепилась в качестве основы нейробиологии – науки, изучающей мозг и нервную систему. Ни один уголок этой науки не остался незатронутым идеей о том, что обработка информации – это основная деятельность мозга. Именно обработка информации заставляет нейробиологов больше интересоваться нейронами, чем глиальными клетками, несмотря на то, что глии занимают больше места в мозге. Аксон (длинный отросток) нейрона вплоть до молекулы специально предназначен для того, чтобы распространять информацию с высокой точностью на большое расстояние, а когда электрический сигнал преобразуется в химический в синапсе (месте соприкосновения нейронов), физический формат информации меняется, в то время как информация остается той же. Как мы увидим далее, дерево дендритов (подводящих волокон) на каждом нейроне, по-видимому, выполняет основные логические и статистические операции, лежащие в основе вычисления. Язык нейробиологии насыщен такими терминами теории информации, как «сигналы», «коды», «репрезентации», «трансформации», «обработка»79.
Обработка информации определяет и вполне закономерные вопросы, имеющие отношение к этой сфере. Если изображение на сетчатке перевернуто, как же получается, что мы видим мир правильной стороной кверху? Если зрительная зона коры располагается в задней части головного мозга, почему нам не кажется, что мы видим картинку в задней части головы? Как это возможно, что человек чувствует фантомную конечность на месте ампутированной? Как мы можем воспринимать зеленый кубик с помощью нейронов, которые не имеют форму кубика и не окрашены в зеленый цвет? Каждый нейробиолог знает, что это псевдовопросы, но почему? Потому что речь в них идет о свойствах мозга, которые не имеют никакого отношения к передаче и обработке информации.
Если ценность научной теории определяется ее способностью объяснять факты и вдохновлять ученых на открытия, то самый большой плюс вычислительной теории сознания – это то влияние, которое она оказала на психологию. Скиннер и другие бихевиористы утверждали, что все разговоры о ментальных событиях – бесплодные рассуждения; в лабораторных и полевых условиях можно изучать только стимул и реакцию. Оказалось, что справедливо все с точностью до наоборот. До того, как в 1950-1960-е годы Ньюэлл и Саймон и психологи Джордж Миллер и Дональд Бродбент привнесли в психологию идеи вычислительной теории, она была бесконечно скучной. В обязательную программу психологии входила физиологическая психология (рефлексы), восприятие (звуковые сигналы), обучение (крысы), память (бессмысленные слоги), интеллект (коэффициент интеллекта) и личность (тесты личности). За прошедшее время психологи привлекли в свои лаборатории вопросы, волновавшие лучших мыслителей в истории, сделали по каждому из аспектов мышления тысячи открытий, о которых несколько десятилетий назад нельзя было и мечтать.
Причиной этого расцвета стала главная задача, поставленная перед психологией вычислительной теорией: выявить форму ментальных репрезентаций (символических записей, используемых мозгом) и процессов (демонов), которые их оценивают. Платон сказал, что мы заперты в пещере и знаем мир только по теням, которые он отбрасывает на стене. Наша пещера – это череп, а тени – ментальные репрезентации. Информация во внутренней репрезентации – вот все, что мы знаем о мире. Рассмотрим в качестве аналогии то, как работают внешние репрезентации. В выписке из моего банковского счета каждый вклад указывается как единая сумма. Если я сделал вклад, состоящий из нескольких чеков и некоторой суммы наличности, я не могу проверить, есть ли среди них конкретный чек; эта информация в репрезентации утрачена. Более того, сама форма репрезентации определяет, какие выводы из нее можно сделать, потому что символы и их расположение – это единственное, на что может реагировать гомункул, который достаточно глуп, чтобы его могла заменить машина. Наша репрезентация чисел ценна потому, что она позволяет выполнять сложение, используя набор полуавтоматических операций: нам достаточно найти нужную отметку в таблице сложения и разряды переноса. Римские числа практически не используются (разве что в названиях и в декоративных целях), потому что с ними сложение становится значительно сложнее, а умножение и деление практически невозможны.
Определение ментальных репрезентаций – это путь к точности в психологии. Многие определения поведения производят впечатление чего-то несерьезного, потому что в них психологические явления объясняются в терминах других, не менее загадочных психологических явлений. Почему людям это задание труднее выполнить, чем то? Потому что первое задание «более сложное». Почему люди распространяют информацию об одном объекте на другой объект? Потому что эти объекты «похожи». Почему люди замечают одно событие, но не замечают другое? Потому что первое событие «более заметно». Все эти объяснения – сплошное надувательство. Сложность, схожесть, важность – все это зависит от обладателя мышления, и как раз это мы и должны попытаться объяснить. Компьютеру сложнее запомнить сюжет «Красной Шапочки», чем двадцатиразрядное число; нам сложнее запомнить число, чем сюжет. Два комка из смятой газеты нам кажутся похожими, хотя по форме они могут быть совершенно разными, а лица двух людей – разными, хотя их форма почти одинакова. Для мигрирующих птиц, ориентирующихся по звездам на небе, положение созвездий в разные периоды ночи будет весьма примечательным; среднестатистический человек вообще едва ли заметит их положение.
Но если мы опускаемся на уровень репрезентаций, мы сталкиваемся с менее эфемерными сущностями, которые можно точно сосчитать и сравнить. Хорошая теория психологии должна предполагать, что репрезентации, требующиеся для более «сложной» задачи, содержат больше символов или запускают более длинную цепочку демонов, чем репрезентации, требующиеся для «легкой» задачи. Она должна предполагать, что репрезентации «похожих» объектов содержат больше общих символов и меньше различных символов, чем репрезентации «непохожих» объектов. «Примечательные» объекты должны иметь репрезентации, отличные от всех соседних объектов; «незаметные» объекты должны иметь одинаковые репрезентации.
Исследователи в русле когнитивной психологии пытались рассматривать под разными углами вопрос о внутренних ментальных репрезентациях, анализируя сообщения людей, время реакции и совершенные ошибки в то время, когда эти люди запоминали, решали задачи, узнавали объекты и делали выводы из опыта. То, как люди обобщают опыт, пожалуй, самое наглядное доказательство того, что мозг использует ментальные репрезентации, причем в огромном количестве.
Предположим, вам требуется некоторое время, чтобы научиться читать слова, написанные новым причудливым шрифтом, украшенным завитушками. Вы потренировались на нескольких словах и теперь читаете этот шрифт также быстро, как любой другой. Теперь вы видите знакомое вам слово, которого не было в вашем тренировочном упражнении, – скажем, слово elk («лось»). Придется ли вам заново узнавать, что это слово – существительное? Придется ли вам заново учиться произносить его? Узнавать, что референт этого слова – животное, как этот референт выглядит, что он обладает весом, дышит и кормит детенышей молоком? Конечно, нет. Но это тривиальное умение кое о чем говорит. Ваше знание о слове elk не привязано напрямую к физическим очертаниям напечатанных букв. Если бы это было так, то при использовании нового шрифта ваше знание не имело бы связи с буквами, написанными иначе, и было бы недоступно до тех пор, пока вы не выучите заново все связи. Значит, ваше знание должно быть связано с неким узлом, номером, адресом в памяти или статьей в ментальном словаре, представляющей абстрактное слово elk, причем эта статья должна быть нейтральна по отношению к тому, как это слово пишется и произносится. Запомнив новый шрифт, вы создали новый визуальный механизм запускания для букв алфавита, которые, в свою очередь, запускают старую статью, соответствующую слову elk; в результате все, что связано с этой статьей, моментально становится доступно для использования – вам не нужно заново привязывать по кусочку все, что вы знаете о лосях, к новой форме букв, составляющих это слово. Это доказывает, что наше мышление содержит ментальные репрезентации, привязанные к абстрактным статьям на каждое слово, а не к форме слов, напечатанных на бумаге80.
Такие неожиданные изменения и арсенал внутренних репрезентаций, о котором они свидетельствуют, представляют собой отличительную особенность когнитивной способности человека. Если бы вы узнали, что другое название лося – wapiti («вапити»), вы бы взяли все факты, привязанные к слову elk, и моментально перенесли их на слово wapiti вместо того, чтобы по одной переносить каждую связь на новое слово. Конечно, перенесенными оказались бы только ваши познания в области зоологии; вы же не станете произносить слово wapiti так же, как и слово elk. Это наводит на мысль, что мышление обладает уровнем репрезентации, специфичным для концептов, стоящих за словами, а не для самих слов. Наше знание фактов о лосях привязано к концепту; слова elk и wapiti тоже привязаны к концепту, а написание е-1-k и произношение [elk] привязаны к слову elk.
До сих пор мы двигались от шрифта вверх; теперь давайте попробуем двигаться вниз. Если вы научились распознавать этот шрифт написанным черными чернилами на белой бумаге, то вам не придется переучиваться, чтобы распознать его написанным белыми чернилами на красной бумаге. Здесь мы подходим к уровню визуальных границ. Любой цвет, стыкующийся с любым другим цветом, воспринимается как граница; границы определяют очертание штрихов; определенное расположение штрихов составляет буквенно-цифровой символ.
Разнообразные ментальные репрезентации, связанные с концептом «лось», могут быть представлены с помощью одной диаграммы, которую иногда называют семантической сетью, репрезентацией знаний или пропозициональной базой данных.
Это лишь фрагмент гигантского мультимедийного словаря, совмещенного с энциклопедией и инструкцией по применению, который содержится у нас в голове. Из таких же многослойных репрезентаций состоит все наше мышление. Скажем, я попросил вас написать слово elk любым шрифтом на ваш выбор, но только левой рукой (если вы правша), или написать его на песке большим пальцем ноги, или мини-фонариком, зажатым в зубах. Результат будет небрежным, но узнаваемым. Вероятно, вам придется потренироваться, чтобы движения выходили более плавными, но вам не придется заново переучиваться писать штрихи, из которых состоит каждая буква, не говоря уже про алфавит или написание каждого слова в английском языке. Этот перенос опыта основан на уровне репрезентации двигательного контроля, который определяет геометрическую траекторию, а не сокращения мышц или движения конечностей, которые ее образуют. Траектория будет преобразована в реальные движения управляющей программой низшего уровня для каждой конечности.
Вспомним историю Салли, выбежавшей из горящего здания, которую мы обсуждали в начале этой главы. Ее желание было сформулировано в виде абстрактной репрезентации «спасайся от опасности». Оно не могло быть сформулировано как «убегай от дыма», потому что желание спастись могло быть инициировано не только дымом, но и другими признаками (а бывают случаи, когда дым не инициирует это желание), а спастись из горящего дома она могла не только бегом, но и с помощью других действий. И все же ее поведенческая реакция была сформирована мгновенно и впервые. Значит, мышление Салли должно быть модульным: один его элемент оценил опасность, другой решил, нужно ли спасаться, а третий определил, каким образом это сделать.
Комбинаторный анализ мыслекода и других репрезентаций, состоящих из частей, позволяет объяснить неистощимый репертуар человеческих мыслей и действий. Используя несколько элементов и несколько правил их сочетаемости, можно получить неизмеримо огромное количество самых разных репрезентаций, поскольку количество возможных репрезентаций увеличивается в геометрической прогрессии относительно их размера. Очевидный пример – язык. Скажем, у вас есть десять вариантов слова, с которого вы начнете предложение, десять вариантов второго слова (а это уже сто вариантов начала предложения из двух слов), десять вариантов третьего слова (а это тысяча вариантов начала из трех слов), и т. д. (Кстати, десять – это среднее геометрическое значение количества вариантов слов, имеющихся в нашем распоряжении в каждый момент, когда мы составляем грамматически правильное и имеющее смысл предложение). Элементарная арифметика показывает, что количество предложений из двадцати и менее слов (это достаточно распространенная длина предложения) составляет примерно 1020, то есть единица и еще двадцать нолей, или сто миллионов триллионов, или в сто раз больше количества секунд, прошедших с момента рождения Вселенной. Я привел этот пример не для того, чтобы поразить вас богатством языка, а чтобы поразить вас богатством нашего мышления. Ведь язык, в конце концов, это не подражание голосом музыкальному инструменту в джазе: каждое предложение выражает ясную мысль. (Не существует совершенно синонимичных друг другу предложений.) Так что если у людей и есть мысли, которые сложно выразить словами, помимо них есть еще примерно сотня миллионов триллионов других, вполне выразимых81.
Комбинаторное богатство теоретически возможных структур мы находим во многих сферах человеческой деятельности. Юный Джон Стюарт Милль с тревогой обнаружил, что, поскольку количество музыкальных нот ограничено и максимальный размер музыкального произведения тоже не бесконечен, это означает, что запас мелодий в мире скоро истощится82. В то время, когда он грустил по этому поводу, Брамс, Чайковский, Рахманинов и Стравинский еще даже не родились, не говоря уже о целом ряде новых жанров – таких, как рэгтайм, джаз, бродвейские мюзиклы, электрик-блюз, кантри-энд-вестерн, рок-н-ролл, регги, панк. И запас мелодий в ближайшее время вряд ли истощится, потому что музыка по своей сути основана на комбинировании: если каждую ноту мелодии мы выбираем, скажем, в среднем из восьми нот, то получается 64 пар нот, 512 мотивов из трех нот, 4096 музыкальных фраз из четырех нот, и так далее – до множества триллионов музыкальных произведений.
То, с какой будничной легкостью мы обобщаем свои знания, – лишь одно из доказательств того, что в нашей голове есть несколько типов репрезентации данных. Ментальные репрезентации также можно выявить в психологической лаборатории83. Используя тонкие приемы, психологи способны поймать мозг в процессе перехода от одной репрезентации к другой. Прекрасным примером может служить эксперимент, который предлагает нашему вниманию психолог Майкл Познер и его коллеги. Испытуемые сидят перед видеоэкраном, на котором на короткое время появляются буквы: например, «АА». Испытуемых просят нажать одну кнопку, если это одинаковые буквы, и другую кнопку, если буквы разные (например, «АВ»). Иногда обе буквы на экране бывают верхнего регистра или нижнего регистра («АА» или «аа»), то есть они идентичны по физической форме. Иногда одна из букв бывает верхнего регистра, а вторая – нижнего («Аа» или «аА»); это одна и та же буква алфавита, но по физической форме буквы разные. Когда буквы физически идентичны, люди нажимают на кнопки быстрее и правильнее, чем когда они видят физически разные буквы – по-видимому, потому, что люди обрабатывают буквы как зрительные образы и могут сравнивать их по геометрической форме, как шаблоны. Когда одна буква – «А», а другая – «а», людям нужно еще преобразовать их в тот формат, в котором они окажутся эквивалентными, а именно – «буква “а”»; это преобразование добавляет еще около десятой доли секунды к тому времени, которое затрачивается на реакцию. Но вот если две буквы появляются на экране с перерывом в несколько секунд, то не имеет значения, были ли они идентичны по физической форме: последовательность из «А» и «А» обрабатывается так же медленно, как из «А» и «а». Быстрое сравнение с шаблоном уже невозможно. Очевидно, через несколько секунд мозг автоматически преобразует визуальную репрезентацию в алфавитную, не учитывая информацию о геометрической форме.
Подобные эксперименты свидетельствуют о том, что человеческий мозг использует как минимум четыре основных формата репрезентаций. Один из форматов – визуальный образ: это что-то вроде шаблона в виде двухмерной мозаики. (О визуальных образах будет подробнее рассказано в главе 4.) Второй – это фонологическая репрезентация, последовательность слогов, которые мы проигрываем в голове, как петлю магнитной ленты, планируя движения рта и представляя, как будут звучать слоги. Такая линейная репрезентация – важный компонент нашей краткосрочной памяти: например, найдя в справочнике нужный телефонный номер, мы повторяем его про себя, пока не наберем его на телефоне. Фонологическая краткосрочная память может удерживать от четырех до семи «кусков» информации в течение времени от одной до пяти секунд. (Краткосрочная память измеряется «кусками», а не звуками, потому что каждый из таких «кусков» может быть ярлыком, указывающим на более крупную структуру информации в долгосрочной памяти – такую, как содержание целой фразы или предложения.) Третий формат – это грамматическая репрезентация: существительные и глаголы, фразы и предложения, основы и корни, фонемы и слоги – все это образует иерархические структуры. В книге «Язык как инстинкт» я объясняю, каким образом эти репрезентации предопределяют, из чего будет состоять предложение, и как люди общаются и играют с языком84.
Четвертый формат – это мыслекод, язык мыслей, которым формулируются наши концептуальные знания. Отложив в сторону книгу, вы забываете практически все про то, какие в ней были фразы, каким шрифтом были напечатаны предложения и как они были расположены на странице, а запоминаете только их содержание, основную суть. (Участники тестов на память уверенно «узнают» предложения, которые они никогда не видели, если они представляют собой перифразы предложений, которые они действительно видели.) Мыслекод – это язык-посредник, которым выражается содержание или суть; некоторые элементы мыслекода я уже приводил, когда говорил о «доске объявлений» продукционной системы и об уровнях «знания» и «концептах» в семантической сети (см. схему на с. 102). Мыслекод – это лингва-франка нашего мышления, поток информации между ментальными модулями, позволяющий нам описывать то, что мы видим, представлять то, что нам рассказывают, выполнять указания, и т. д.85 Этот информационный поток отражает и анатомия мозга. Гиппокамп и связанные с ним структуры, помещающие наши воспоминания в долгосрочную память, и лобные доли мозга, в которых размещаются зоны принятия решений, не связаны напрямую с зонами мозга, обрабатывающими входные сигналы от органов чувств (мозаику цветов и цветовых переходов, ленту изменения высоты звука). По большинству подводящих волокон к ним подается то, что нейробиологи называют данными «с высокой степенью переработки»; он поступает из областей, расположенных на один-два уровня ниже зон первоначального сенсорного восприятия. Эта входная информация состоит из кодов, соответствующих объектам, словам и другим сложным концептам86.
Зачем нам столько разных видов репрезентаций? Не проще было бы мозгу оперировать чем-то вроде языка эсперанто? На самом деле, это было бы ужасно сложно. Модульная организация ментального «программного обеспечения», предусматривающая пакетирование разных типов данных в отдельные форматы, – отличный пример того, как эволюция и инженерная мысль приходят к одинаковым решениям. Брайан Керниган, настоящий знаток программирования, написал в соавторстве с П.Ж.Плоджером книгу под названием «Элементы стиля программирования», в названии которой обыгрывается заголовок известного учебника Странка и Уайта по писательскому мастерству «Элементы стиля»87. Авторы дают советы относительно того, что нужно, чтобы программа отличалась высокой производительностью, эффективностью работы и способностью правильно развиваться. Один из их главных принципов – «Заменяйте повторяющиеся выражения обращениями к функциям». К примеру, если программа должна вычислить площадь трех треугольников, для этого ей не нужно иметь три разные команды, в каждой из которых содержится отдельная копия формулы вычисления площади треугольника с координатами одного из треугольников. Вместо этого формула должна быть указана в программе один раз. Должна быть функция «вычисление площади треугольника» и слоты X, Y и Z, которые могут заполняться любъини координатами треугольника. Эта функция может использоваться трижды, при этом слоты X, Y и Z будут заполняться координатами, полученными из вводных данных. Описанный принцип устройства приобретает еще большую значимость, когда функция превращается из линейной формулы в многоступенчатую подпрограмму; на этом принципе основаны следующие ниже взаимосвязанные максимы, которым, кажется, следовал и естественный отбор, когда создавал наше модульное, многоформатное мышление:
Разбивайте программу на модули.
Используйте подпрограммы.
Каждый модуль должен выполнять одну функцию, но хорошо.
Убедитесь в том, что в каждом модуле что-то локализовано.
Ввод и вывод выделяйте в подпрограммы.
Второй принцип отражен в следующей максиме:
Выбирайте такое представление данных, которое упрощает программу[9].
Керниган и Плоджер приводят пример программы, которая считывает строку текста, а потом должна распечатать ее с выравниванием по центру. Строка текста может храниться в разных форматах (как последовательность знаков, как список координат и т. д.), но только один из форматов делает центрирование по-настоящему простой задачей: выделение в памяти восьмидесяти последовательных слотов, отражающих восемьдесят возможных положений символа на дисплее ввода-вывода. В этом случае центрирование может быть безошибочно выполнено в несколько шагов для входных данных любого объема; при использовании любого другого формата потребуется гораздо более сложная программа. Предположительно, разные форматы репрезентации, используемые человеческим мозгом, – изображения, фонологические петли, иерархические структуры, мыслекод – сформировались в процессе эволюции потому, что они позволяют простым программам (глупым демонам или гомункулам) получать полезные для них результаты.
А если вас привлекает интеллектуальная стратосфера, в которой объединены «сложные системы» всех типов, вас, вероятно, заинтересует аргумент Герберта Саймона о том, что модульная структура компьютера и мозга – это лишь частный случай модульной, иерархической организации всех сложных систем. Тела состоят из тканей, сделанных из клеток, состоящих из органелл; вооруженные силы включают в себя армии, каждая из которых состоит из дивизий, разделенных на батальоны, состоящие из взводов; книги состоят из глав, разделенных на части, разделы, абзацы и предложения; империи состоят из стран, областей и территорий. Эти «почти разложимые» системы определяются масштабными взаимодействиями между элементами одного и того же компонента и менее многочисленными взаимодействиями между элементами разных компонентов. Сложные системы представляют собой иерархии модулей, потому что только элементы, увязанные друг с другом в пределах одного модуля, могут оставаться стабильными достаточно долго, чтобы монтироваться в более крупные и еще более крупные модули88. Саймон приводит аналогию с двумя часовщиками, которых звали Хора и Темпус:
Каждые часы, изготовленные мастерами, состояли примерно из 1000 деталей. Темпус сконструировал свои таким образом, что если одни часы были частично собраны и ему приходилось отложить их – скажем, чтобы ответить на звонок, – они тут же рассыпались на части, и приходилось собирать их сначала…
Часы, которые изготавливал Хора, были не менее сложными, чем у Темпуса. Но он спроектировал их таким образом, что мог собирать узлы, состоящие примерно из десяти элементов каждый. Десять таких узлов, опять же, можно было объединить в более крупный узел, а система из десяти больших узлов составляла готовые часы. Таким образом, когда Хора был вынужден отложить незаконченные часы, чтобы ответить на телефонный звонок, он терял лишь малую часть своей работы, и на сборку у него уходила лишь часть того времени, которое затрачивал Темпус89.
Наша сложная умственная деятельность подобна мудрости Хоры. Проживая свою жизнь, нам совсем не нужно продумывать каждую закорючку и планировать каждое сокращение мышц. Благодаря словесным символам, любой шрифт может пробудить в сознании какой угодно элемент знаний. Благодаря символам целей, любой признак опасности может активизировать любой способ защиты.
Смею надеяться, что вознаграждением за долгие рассуждения о ментальных вычислениях и ментальных репрезентациях, через которые я вас провел, стало понимание того, на какую сложность, тонкость и гибкость способен человеческий разум, даже если он – всего лишь машина, всего-навсего бортовой компьютер робота, сделанного из живых тканей. Нам не нужны духи или оккультные силы, чтобы объяснить интеллект. Не нужно нам и игнорировать очевидное в надежде сделать свое объяснение более научным, утверждая, что человек – всего лишь куча обусловленных ассоциаций, марионетка генов или раб примитивных инстинктов. Мы можем совместить живость и проницательность человеческого ума с механистической основой, без которой сложно его объяснить. Последующие главы, в которых предпринимается попытка дать объяснение здравому смыслу, эмоциям, общественным отношениям, юмору, искусству, основаны на фундаменте представлений о сложной вычислительной психике.
Действующий чемпион
Конечно, если бы никто не взялся оспаривать истинность вычислительной теории, это означало бы, что она бессодержательна. На самом деле она подвергалась самой жесткой критике. Как в случае с любой теорией, которая стала столь незаменимой, обыкновенных придирок было недостаточно; чтобы разрушить ее, нужно было подорвать ее основания, никак не меньше. За эту задачу решили взяться два ярких автора. Оба выбрали оружие вполне подходящее для такого случая, но совершенно разное: один решил прибегнуть к здравому смыслу; второй – к понятным лишь посвященным физике и математике.
Первым с критикой выступил философ Джон Серль. Серль считает, что опроверг вычислительную теорию сознания еще в 1980 году с помощью мысленного эксперимента, который он с небольшими изменениями позаимствовал у другого философа, Неда Блока (который, как ни парадоксально, был одним из наиболее активных сторонников вычислительной теории). Версия Серля стала известна под названием «китайская комната». Человека, который не знает китайского языка, помещают в комнату. Под дверь подсовывают листки бумаги с какими-то закорючками. Человеку дают целый список сложных указаний вроде следующего: «Если увидите надпись [закорючка закорючка закорючка], напишите [каракули каракули каракули]». Некоторые из этих правил предписывают подсовывать написанные им каракули обратно под дверь. Он достаточно прилежно выполняет инструкции, не подозревая, что закорючки и каракули – это китайские иероглифы, а инструкции – это программа искусственного интеллекта, предназначенная для того, чтобы отвечать на вопросы о рассказах на китайском языке. Человек, находящийся по другую сторону двери, делает вывод, что в комнате находится человек, владеющий китайским как родным. Так вот, если понимание заключается в том, чтобы запустить подходящую компьютерную программу, значит, участник эксперимента понимает китайский, потому что он как раз использует подходящую программу. Но этот человек не понимает ни слова по-китайски; он просто манипулирует символами. Следовательно, понимание – и, если уж на то пошло, любой другой аспект интеллекта – не то же самое, что манипуляция символами или вычисление90.
Серль утверждает, что программе не хватает интенциональности: связи между символом и тем, что он обозначает. Многие интерпретировали его слова так, будто программе не хватает сознания. Действительно, Серль считает, что сознание и интенциональность тесно связаны, ведь мы осознаем, что мы имеем в виду, когда думаем о чем-то или используем какое-либо слово. Интенциональность, сознание, другие явления мыслительной деятельности обусловлены не обработкой информации, заключает Серль, а «реальными физико-химическими свойствами реального человеческого мозга» (хотя что это за свойства, он так и не уточняет)91.
«Китайский эксперимент» вызвал поистине невообразимые дебаты. В ответ на него было опубликовано более сотни статей, и для меня это стало прекрасной причиной удалить свое имя из всех списков участников интернет-обсуждений. Тем, кто утверждает, что вся комната в целом (человек плюс список инструкций) понимает китайский язык, Серль отвечает: ладно, представим, что этот парень выучил наизусть все правила, теперь он производит все вычисления в уме и работает вне комнаты. Комнаты больше нет, но наш с вами манипулятор символами по-прежнему не понимает по-китайски. Тем, кто заявляет, что у этого человека нет никакой сенсорно-двигательной связи с миром, и что именно это – главное недостающее звено, Серль отвечает: предположим, что поступающие в комнату каракули – выходной сигнал телевизионной камеры, а закорючки, поступающие из комнаты, – команды роботизированной руке. Теперь у него есть связь с миром, но он по-прежнему не говорит на китайском языке. Тем, кто говорит, что эта программа не отражает деятельность мозга, Серль приводит аналог «китайской комнаты», придуманный Блоком, – «китайский спортзал»: миллионы людей в огромном спортзале ведут себя так, словно они – нейроны; они кричат друг другу по рации сообщения, воспроизводя работу нейронной сети, которая отвечает на вопросы к рассказам на китайском языке. Но и люди в этом спортзале понимают по-китайски не больше, чем тот парень в закрытой комнате.
Тактика Серля заключается в том, чтобы вновь и вновь обращаться к нашему здравому смыслу. Так и кажется, что он говорит: «Эй, да ладно! Вы что, хотите сказать, что этот парень понимает по-китайски??!!! Да хватит вам! Он не понимает ни слова! Он всю жизнь прожил в Бруклине!!» и так далее. И все же история доказывает, что наука, мягко говоря, не слишком снисходительно относится к простодушной интуиции здравого смысла. Философы Патриция и Пол Черчленд предлагают нам представить, как аргумент Серля можно использовать против теории Максвелла о том, что свет состоит из электромагнитных волн. Человек держит в руке магнит и машет им вверх-вниз. Человек создает электромагнитное излучение, но никакого света не видно; следовательно, свет – это не электромагнитные волны. Мысленный эксперимент замедляет волны до такого диапазона, при котором мы, люди, уже не видим их как свет. Доверяя своему восприятию в ходе мысленного эксперимента, мы можем прийти к ложным выводам о том, что быстрые волны тоже не могут быть светом92. Серль аналогичным образом свел мысленные вычисления к тому скоростному диапазону, в котором мы, люди, уже не воспринимаем его как понимание (ведь понимание обычно происходит гораздо быстрее). Доверяя своей интуиции во время мысленного эксперимента, мы приходим к ложному заключению о том, что быстрое вычисление тоже не может быть пониманием. Если бы ускоренная версия нелепой истории, предложенной Серлем, стала реальностью, и мы бы встретили человека, который производил впечатление свободно общающегося на китайском языке, но на самом деле за доли секунды осуществлял бы миллионы мысленных операций в соответствии с выученными правилами, неясно, стали ли бы мы отрицать, что он понимает по-китайски.
Мое личное мнение – что Серль просто исследует факты, связанные с английским словом understand («понимать»). Люди не хотят использовать это слово, если ситуация не характеризуется определенными стереотипными условиями: правила языка используются быстро и неосознанно, а содержание языка связано с убеждениями человека как единого целого. Если люди отказываются описывать этим повседневным словом экзотические условия, разрушающие стереотип, но при этом сохраняющие суть этого явления, то с научной точки зрения мы ничем особенно не рискуем. Можно подобрать другое слово или условиться использовать старое слово в специальном значении, какая разница! Трактовка того, как устроено понимание, останется той же. В конце концов, цель науки – исследовать устройство вещей, а не определять, какие из этих вещей «действительно» являются примерами знакомого всем слова. Если какой-нибудь ученый объясняет функционирование локтевого сустава человека, говоря, что это рычаг второго рода, что за опровержение будет, если мы попросим представить человека, держащего в руке рычаг второго рода, и заявим: «Посмотрите, ведь у этого человека не три локтя\\»
Что касается «физико-химических свойств» мозга, я уже обозначил основную проблему: опухоли мозга, мышиные мозги, нервные ткани в пробирке понимать не могут, но их физико-химические свойства остаются такими же, как и у нашего мозга. Вычислительная теория так объясняет различие: эти куски нервной ткани не образуют структуру связей, нужную для данного типа обработки информации. Например, у них нет компонентов, которые отличают глагол от существительного; их модели деятельности не рассчитаны на соблюдение правил синтаксиса, семантики, здравого смысла. Конечно, это всегда можно назвать различием в физико-химических свойствах (в том же самом смысле, в котором две книги различаются своими физико-химическими свойствами), но тогда этот термин будет бессмысленным, потому что он уже не будет определяться языком физики и химии.
В том, что касается мысленных экспериментов, переход на другую сторону – привычное дело. Вероятно, самый весомый контраргумент «китайской комнате» Серля мы находим в рассказе фантаста Терри Биссона, получившем широкое распространение в Интернете. Рассказ написан в форме разговора между предводителем межпланетного флота исследовательских космических кораблей и его главнокомандующим, и начинается этот диалог так:
– Они сделаны из мяса.
– Из мяса?
…
– В этом не может быть сомнений. Мы отобрали нескольких представителей из разных мест планеты, доставили их на борт нашей лаборатории и исследовали их до мельчайших подробностей. Они полностью мясные.
– Это невозможно! А как же радиосигналы? Послания к звездам?
– Они используют радиоволны для общения, но сигналы исходят не от них, а от машин.
– Так кто сделал машины? Вот с кем нам надо найти контакт!
– ОНИ сделали машины. Об этом я тебе и пытаюсь сказать. Мясо сделало машины.
– Это смешно! Как может мясо сделать машину? Ты просишь меня поверить в разумное мясо?
– Я не прошу, я говорю. Эти создания – единственная разумная раса в этом секторе, и они сделаны из мяса.
– Может, они как орфоли? Ну тот углеводный интеллект, который проходит через стадию мяса?
– Вовсе нет. Они как рождаются мясом, так мясом и умирают. Мы изучили их в нескольких поколениях, которые очень недолговечны. Как ты думаешь, сколько живет мясо?
– Не до того! Хорошо, может они только частично мясные. Знаешь, как веддили. Мясная голова, а внутри мозг из электронной плазмы.
– И снова мимо. Мы подумали об этом сразу как увидели эти мясные головы, похожие на веддилические. Но я же сказал, что мы проверили их. Они мясные целиком, сплошь.
– Ну то есть мозга нет?
– О, у них нормальный мозг. Просто этот мозг СДЕЛАН ИЗ МЯСА! Я давно уже пытаюсь тебе это сказать!
– Так… а что же думает?
– Ты что, не понимаешь? Ты не слышишь, что я говорю? Мозг думает! Мясо.
– Думающее мясо! Ты просишь меня поверить в думающее мясо!
– Да, думающее мясо! Сознательное мясо! Любящее мясо. Мечтающее мясо. Всё в мясе. Ты начинаешь понимать или мне начать все с начала?[10]93
Второй критик вычислительной теории сознания – математик и физик Роджер Пенроуз – в своем бестселлере под названием «Новый ум короля» (вот это я понимаю, сильное опровержение!) строит критику не на обращении к здравому смыслу, а на глубокомысленных вопросах логики и физики. Он утверждает, что из знаменитой теоремы Гёделя следует, что все математики – и, соответственно, все люди вообще – не компьютерные программы.
Грубо говоря, Гёдель доказал, что любая формальная система (такая, как компьютерная программа или совокупность аксиом и правил логического вывода в математике), даже умеренно эффективная (достаточно эффективная, чтобы констатировать арифметические истины) и последовательная (не порождающая противоречащих друг другу утверждений) может генерировать утверждения, которые истинны, но истинность которых не может быть доказана системой. Поскольку мы, математики, будучи людьми, можем просто увидеть, что эти утверждения истинны, мы не являемся формальными системами, как компьютеры. Пенроуз считает, что способности математика происходят от аспекта сознания, который не может быть интерпретирован как вычисление. Более того, не может он объясняться и деятельностью нейронов – они слишком велики для этого. Он не может объясняться теорией эволюции Дарвина. Он не может быть объяснен даже физикой в современном понимании этого слова. В микротрубочках, составляющих миниатюрный скелет нейронов, имеют место квантово-механические эффекты, которые должны интерпретироваться в рамках пока не сформулированной квантовой теории гравитации. Эффекты эти настолько непостижимы, что это сравнимо с непостижимостью самого сознания94.
Математический аргумент Пенроуза логики назвали ошибочным; другие его утверждения получили нелестные отзывы от специалистов в других областях, относящихся к предмету. Одна из главных проблем заключается в том, что реальные математики не обладают талантами, которые Пенроуз приписывает идеализируемому математику: такими, как уверенность в том, что система правил, на которую он полагается, последовательна. Другая проблема – в том, что квантовые эффекты почти наверняка сводятся на нет в нервной ткани. Третья – в том, что микротрубочки имеются во всех видах клеток и, по-видимому, не играют никакой роли для наличия у мозга интеллекта. Четвертая – в том, что сложно даже представить себе, как сознание может возникнуть из квантовой механики.
Аргументы Пенроуза и Серля объединяет нечто большее, чем общий противник. В отличие от теории, против которой они направлены, они имеют так ничтожно мало общего с открытием и интерпретацией явлений в научной практике, что остаются эмпирически стерильными; они не позволяют проникнуть в суть вещей и не вдохновляют на научные открытия относительно того, как работает мышление. Собственно, на самый интересный вывод, следующий из «Нового ума короля», указывает Деннетт. Выдвигая обвинения в адрес вычислительной теории сознания, Пенроуз, сам того не желая, делает ей комплимент. Вычислительная теория так хорошо вписывается в наше понимание мира, что для того, чтобы ее опровергнуть, Пенроузу приходится отвергнуть подавляющую часть современных достижений нейробиологии, эволюционной биологии и физики!95
Заменят ли нас машины?
В рассказе Льюиса Кэрролла «Что Черепаха сказала Ахиллу» быстроногий греческий воин догоняет неспешную черепаху, тем самым опровергая апорию Зенона о том, что, сколь бы малое преимущество на старте ни получила черепаха, Ахилл не сможет ее догнать. (За то время, которое потребуется Ахиллу, чтобы преодолеть это расстояние, черепаха пройдет еще небольшую часть пути; за то время, которое потребуется Ахиллу, чтобы преодолеть это небольшое расстояние, черепаха пройдет еще немного, и так до бесконечности.) Черепаха предлагает Ахиллу аналогичный парадокс из области логики. Ахилл достает из своего шлема огромный блокнот и карандаш, а черепаха диктует ему первую аксиому Евклида:
(A) Равные одному и тому же равны между собой.
(B) Две стороны этого треугольника равны одному и тому же.
(Z) Две стороны этого треугольника равны между собой.
Ахиллу приходится согласиться с тем, что любой, кто считает истинными посылки А и В и суждение «Если А и В, тогда Z», должен будет признать истинным также Z. Но теперь черепаха не соглашается с логикой Ахилла. Она говорит, что вынуждена отвергнуть заключение Z, потому что никем и никогда не было написано правило логического вывода из списка посылок, которые она должна принять. Она призывает Ахилла заставить ее признать истинность Z. Ахилл в ответ добавляет в свой блокнот суждение С:
(C) Если А и В истинны, то Z должно быть истинным.
Черепаха отвечает, что не понимает, почему она должна признать, что, поскольку истинны А, В и С, Z тоже должно быть истинным. Ахилл добавляет еще одно суждение —
(D) Если А, В и С истинны, то Z должно быть истинным —
и заявляет, что «логика возьмет вас за горло и вынудит» принять Z. Черепаха отвечает так:
«То, что мне сказала Логика, следовало бы записать, – заметила Черепаха. – Внесите, пожалуйста, в свой блокнот условное суждение, которое мы обозначим Е:
Е. «Если А, В, С и D истинны, то Z должно быть истинным».
– Согласен, – ответил Ахилл с оттенком печали в голосе.
В этот момент неотложные дела в банке вынудили рассказчика оставить счастливую пару. Лишь через несколько месяцев ему довелось снова проходить мимо того места, где беседовали Ахилл и Черепаха. Ахилл по-прежнему сидел на спине у многотерпеливой Черепахи и что-то писал в почти заполненном блокноте. Приблизившись, рассказчик услышал, как Черепаха сказала:
– Записали последнее условное суждение? Если я не сбилась со счета, оно должно быть тысяча первым. Осталось еще несколько миллионов96[11].
Решение этого парадокса, конечно же, заключается в том, что ни одна система гипотетических умозаключений не может строго следовать явно выраженным правилам. В тот или иной момент она должна, как сказал Джерри Рубин (а чуть позже – и корпорация «Найк»), «просто делать это» (имеется в виду рекламный слоган фирмы «Найк» Just do it! – Прим. пер.). Подразумевается, что правило должно просто выполняться за счет рефлекторной, грубой силы системы, без лишних вопросов. В этот момент система, если она имеет форму машины, будет не следовать правилам, а просто подчиняться законам физики. Аналогичным образом, если демоны (правила замещения одних символов другими символами) считывают и записывают репрезентации, а внутри каждого демона есть демоны еще меньше (и еще глупее), то в какой-то момент нам все же придется отказаться от их услуг, позвать охотников за привидениями и заменить самых маленьких и самых глупых демонов машинами. В случае людей и животных это будут машины, построенные из нейронов: нейронные сети. Давайте посмотрим, каким образом наша картина того, как работает мышление, подкрепляется простыми идеями о том, как работает мозг.
Первые шаги в этом направлении сделали математики Уоррен Маккалок и Уолтер Питтс, которые писали о «нейрологических» свойствах связанных между собой нейронов97. Нейроны сложны и до сих пор не объяснены, однако Маккалок и Питтс (а вслед за ними – и многие другие разработчики моделей нейронных сетей) выделяют как наиболее значимую одну из их функций. Нейроны складывают совокупность атрибутов, сравнивают полученную сумму с порогом и сигнализируют о том, превышен ли порог. Это описание того, что они делают, с концептуальной точки зрения; с физической точки зрения то же самое можно описать следующим образом: возбужденный нейрон может быть активен в разной степени, и степень активности зависит от уровня активности входящих аксонов других нейронов, присоединенных в синапсах к дендритам нейрона (входящим структурам). Синапс имеет вес, варьирующийся от положительного (возбуждающий синапс) до нулевого (без воздействия) и далее до отрицательного (тормозящий синапс). Уровень возбуждения каждого входящего аксона умножается на вес синапса. Нейрон суммирует эти входящие уровни; если сумма превышает пороговый уровень, то нейрон возбуждается и поочередно посылает сигналы всем нейронам, соединенным с ним. Хотя нейроны всегда находятся в возбужденном состоянии, и входящие сигналы только заставляют их возбуждаться заметно быстрее или медленнее, иногда бывает удобно говорить о них как о неактивных (низкий уровень возбуждения) и активных (высокий уровень).
Маккаллок и Питтс показали, каким образом эти модельные нейроны, будучи связаны между собой, образуют логические вентили. Логические вентили реализуют отношения фундаментальных логических операций, лежащих в основе простых умозаключений: «и», «или», «не». Суждение «А и В» (на концептуальном уровне) истинно только тогда, когда истинно А и истинно В. Вентиль И (на механическом уровне) выдает единицу на выходе, только если есть сигнал на обоих входах. Чтобы сделать логический вентиль из модельных нейронов, нужно установить порог выходного узла на величину больше веса каждого из входов, но меньше их суммы, как показано на рисунке мини-сети слева внизу. «А или В» (на концептуальном уровне) истинно, если истинно А или истинно В. Логический вентиль ИЛИ (на механическом уровне) выдает сигнал на выходе, если есть сигнал хотя бы на одном из входов. Чтобы получить единицу на выходе, нужно установить порог на величину меньше веса каждого из входов, как показано на схеме мини-сети внизу посередине. Наконец, утверждение «не А» (на логическом уровне) истинно, если ложно А, и наоборот. Логический вентиль «НЕ» выдает единицу на выходе, когда на входе ноль, и наоборот. Чтобы получить единицу, нужно установить порог равным нулю, чтобы нейрон возбуждался, получая на входе ноль, а вес входа сделать отрицательным, чтобы входной сигнал выключал нейрон, как на схеме минисети внизу справа.
Предположим, что каждый из модельных нейронов отображает простое суждение. Мини-сети можно соединить между собой таким образом, чтобы выход одной сети поступал на вход другой, с целью оценить истинность сложного суждения. Например, нейронная сеть может оценивать суждение {[(X жует жвачку) и (у X раздвоенные копыта)] или [(у X есть плавники) и (у X есть чешуя)]}, суммирующее признаки, которыми должно обладать животное, чтобы оно считалось кошерным. Собственно, если сеть модельных нейронов соединить с любым видом расширяемой памяти (например, с рулоном бумаги, над которой размещены штамп и ластик), то получится машина Тьюринга, полноценный компьютер.
И все же абсолютно непрактичным было бы представлять суждения или даже составляющие их концепты в виде логических вентилей, независимо от того, из чего состоят эти логические вентили – из нейронов или из полупроводников. Проблема в том, что каждый концепт и каждое суждение в этом случае должно быть заранее встроенным в виде отдельного узла. На деле и компьютер и мозг представляют концепты в виде моделей действий, совершаемых над совокупностями единиц. Простой пример – скромный байт, который в каждом компьютере используется для репрезентации буквенноцифровых символов. Форма репрезентации буквы В – 01000010, где каждая цифра (бит) соответствует одному из крохотных кусочков кремния, выложенных в ряд. Второй и восьмой кусочек заряжены, что соответствует единицам, а остальные – не заряжены, что соответствует нулям. Построить байт можно и из модельных нейронов, при этом схема распознавания шаблона буквы В будет организована по принципу простой нейронной сети:
Несложно представить, что эта сеть – одна из составляющих частей демона. Если нижний ряд модельных нейронов присоединить к краткосрочной памяти, то верхний нейрон будет определять, содержатся ли в краткосрочной памяти экземпляры символа В. А на странице 118 изображена сеть той части демона, которая записывает в память символ В98.
Мы уже на пути к тому, чтобы создать из модельных нейронов условную цифровую вычислительную машину; но давайте немного отклонимся от курса и сделаем более биоморфный компьютер. Во-первых, мы можем сделать так, чтобы наши модельные нейроны следовали не классической логике, а нечеткой логике. Во многих сферах у людей нет однозначных убеждений касательно того, истинно данное суждение или ложно. Бывает так, что о предмете сложно сказать, принадлежит он к данной категории или нет, скорее можно говорить о том, что он более удачный или менее удачный пример данной категории. Возьмем категорию «овощи». Большинство людей согласятся с тем, что сельдерей – это полноценный овощ, а чеснок – не очень хороший пример.
А если верить администрации президента Рейгана, пытавшейся оправдать урезанное финансирование школьного питания, овощем можно считать даже кетчуп (хотя после обрушившейся на эту программу критики администрация была вынуждена признать, что кетчуп – не очень хороший пример). На концептуальном уровне мы воздерживаемся от однозначных заявлений о том, является ли данный предмет овощем или нет, и предпочитаем говорить, что этот предмет – более удачный или менее удачный пример овоща. На механическом уровне мы уже не утверждаем, что узел, представляющий «овощность», должен быть включен или выключен, а допускаем варьирование значения, которое может составлять от 0 (для камня) и 0,1 (для кетчупа) до 0,4 (для чеснока) и 1,0 (для сельдерея).
Мы можем также отказаться от произвольно выбранного кода, связывающего каждый концепт с бессмысленной последовательностью битов. Пусть каждый бит сам представляет какой-нибудь элемент концепта. Скажем, один будет представлять зеленый цвет, другой – наличие листьев, третий – хрусткость, и так далее. Каждый из этих узлов, представляющих свойства овощей, может быть присоединен с небольшим значением веса к самому узлу, представляющему овощ. Другие узлы, представляющие характеристики, которых у овощей нет (такие, как «магнитный» или «мобильный»), могут быть присоединены с отрицательными значениями веса. На концептуальном уровне чем больше качеств овоща есть у данного предмета, тем более удачным примером овоща является этот предмет. На механическом уровне чем больше узлов качеств овоща срабатывают, тем выше уровень активации узла, представляющего овощ.
Как только мы разрешим сети быть неточной, она сможет представлять разные степени очевидности и вероятности событий и принимать статистические решения. Предположим, что каждый узел сети представляет какую-то одну улику, доказывающую причастность дворецкого к преступлению (отпечатки пальцев на ноже, любовные письма, адресованные жене убитого, и так далее). Предположим, что верхний узел представляет вывод о том, что это сделал дворецкий. На концептуальном уровне чем больше у нас улик, указывающих на то, что убийство мог совершить дворецкий, тем выше будет вероятность того, что это действительно сделал дворецкий.
На механическом уровне чем больше у нас возбужденных узлов, обозначающих улики, тем выше будет уровень активации узла принятия решения. В сети мы можем реализовать различные статистические процедуры, сконструировав узел принятия решения таким образом, чтобы интегрировать в него вводы разными способами. Например, узел принятия решения может быть пороговым, как в случае со схемами четкой логики; это позволило бы принимать решение только тогда, когда вес доказательств превышал бы критическое значение (как принято говорить, когда вина доказана «вне всяких разумных сомнений»). Либо активность узла принятия решения может увеличиваться постепенно; степень уверенности с первыми немногочисленными уликами будет повышаться медленно, затем будет быстро нарастать по мере поступления все большего и большего их количества и выравниваться на этапе снижающегося эффекта. Именно эти два типа узлов предпочитают использовать разработчики нейронных сетей.
Мы же можем экспериментировать еще больше, вдохновляясь тем фактом, что в случае нейронов, в отличие от кремниевых процессоров, связи обходятся дешево. Почему бы не соединить каждый узел с другим узлом? Такая сеть сможет воплощать не только знание о том, что зеленый цвет означает «овощность», а хрусткость подразумевает «овощность», но и что зеленый цвет подразумевает хрусткость, хрусткость означает наличие листьев, наличие листьев означает отсутствие мобильности, и так далее:
Здесь начинают происходить интереснейшие вещи. Сеть начинает напоминать мыслительные процессы в голове человека, чего нельзя сказать о слабо соединенных сетях. По этой причине психологи и исследователи искусственного интеллекта используют сети, в которых все соединено со всем, для моделирования самых разных примеров распознавания простых шаблонов. Созданы сети для распознавания линий, из которых состоят буквы; букв, из которых состоят слова; частей тела, из которых состоят животные, предметов мебели, из которых состоит интерьер комнаты. Зачастую при этом отказываются от узла принятия решений, ведется исчисление только корреляций свойств. Эти сети, называемые иногда блоками автоматического ассоциативного установления соединений, или автоассоциативными сетями, имеют пять привлекательных особенностей.
Во-первых, блок автоматического ассоциативного установления соединений – это память с адресацией по содержимому. В любом серийном компьютере биты сами по себе не несут никакого значения, а байтам, состоящим из них, присвоены произвольные адреса, как номера домов на улице, не имеющие ничего общего с их содержимым. Доступ к ячейкам памяти осуществляется по адресам, а чтобы определить, хранится ли где-либо в памяти тот или иной шаблон, нужно проверить каждую ячейку (или использовать пути быстрого доступа). В случае с памятью, адресуемой по содержимому, напротив, при указании объекта автоматически активизируется любая ячейка памяти, в которой содержится копия этого объекта. Поскольку объект представлен в автоассоциативной сети путем возбуждения узлов, представляющих его свойства (в нашем случае с сельдереем – это зеленый цвет, наличие листвы и так далее), а поскольку эти узлы соединены друг с другом сильными связями, возбужденные узлы будут подкреплять друг друга, и после нескольких таких кругов, в течение которых будет активизирована вся сеть, все узлы, связанные с объектом, перейдут в возбужденное состояние. Это означает, что объект распознан. Нужно отметить, что совокупность связей одной автоассоциативной сети может вмещать не одну, а несколько групп весов, благодаря чему память может хранить одновременно несколько объектов.
Что еще более важно, связи являются избыточными, так что даже если автоассоциативная сеть получает лишь часть шаблона объекта, скажем, только информацию о зелености и хрусткости, то остаток шаблона (в данном случае наличие листвы) заполняется автоматически. Это в некотором смысле напоминает мышление. Нам не нужны встроенные ярлыки для каждого объекта в памяти; практически любой признак того или иного объекта сразу вызывает его в памяти целиком. Например, мы можем вспомнить про овощи, подумав о чем-то покрытом листвой, или зеленом и хрустящем, или имеющем листву и хрустящем. Наглядный пример – наша способность восстановить слово по его фрагментам. Мы видим этот рисунок не как беспорядочные обрывки линий или даже как бессмысленную последовательность букв вроде MIHB, а как что-то больше похожее на правду (на рисунке слово MIND – англ, «разум, мышление». – Прим. пер.):
Второе преимущество, известное как «изящная деградация», позволяет решить проблемы зашумленного входного сигнала или аппаратного отказа. Кому из нас не хотелось бросить чем-нибудь тяжелым в монитор, увидев, что в ответ на команду pritn file (англ, «печаьт файла») компьютер отвечает сообщением об ошибке pritn: command not found (англ, «печаьт: команда не найдена»)? В фильме Вуди Аллена «Хватай деньги и беги» (Take the Money and Run) грабителя банка Верджила Старквела подводит его же собственный почерк: кассирша не может понять, что он написал в записке, принимая слово gun («пистолет») за gub. На карикатуре Гари Ларсона, украшающей дверь не одного психолога-когнитивиста, пилот пролетает над необитаемым островом, на котором потерпевший кораблекрушение человек написал на песке послание. Пилот, прочитав надпись, кричит по рации: «Подождите! Подождите!… Нет, отбой – кажется, там написано “ПОМОРИТЕ”!» (в оригинале – HELF вместо англ. HELP «помогите». – Прим. пер.). Люди справляются с этими трудностями лучше, потому что у нас есть автоассоциативные сети, которые, принимая во внимание преобладание взаимно состоятельных элементов информации, исключают единственный не соответствующий элемент. На слово pritn мозг отреагирует активацией более привычного шаблона print, слово gub будет заменено шаблоном gun, a HELF – шаблоном HELP. Компьютер, столкнувшись с единственным испорченным битом на диске, крохотной каплей ржавчины в одном из разъемов или кратковременным понижением напряжения в сети, может зависнуть или выйти из строя. Но человек – даже если он устал, у него похмелье или травма головного мозга – не зависнет и не выйдет из строя; скорее всего, он будет действовать не так быстро и точно, но все-таки сможет выдать вразумительный ответ.
Третье преимущество автоассоциативных сетей в том, что они могут выполнять простой тип вычислений, известный как удовлетворение ограничений. Многие задачи, которые пытаются решить люди, относятся к разряду задач, в которых причину трудно отделить от следствия. В главе 1 я приводил пример о том, что мы определяем яркость поверхности, исходя из предположений об угле наклона, и вычисляем угол поверхности, исходя из предположений о ее яркости, при этом не зная наверняка ни того, ни другого. Многие подобные задачи относятся к сфере восприятия, языка и здравого смысла. Что я вижу – сгиб поверхности или ее край? Что я слышу – гласную [I] (как в слове pin) или гласную [е] (как в слове реп), произнесенную с южным акцентом? Стал ли я жертвой человеческой злобы или глупости? Подобные неоднозначные ситуации иногда можно разрешить, выбрав интерпретацию, которая была бы непротиворечивой относительно самого большого количества интерпретаций других неоднозначных ситуаций, если бы их все можно было разрешить одновременно. Например, если один звук речи позволяет интерпретировать слово либо как send, либо как sinned, а другой – либо как реп, либо как pin, я могу разрешить эту неопределенность, если услышу, как один и тот же говорящий произносит оба слова с одним и тем же гласным звуком. Я бы рассуждал следующим образом: видимо, говорящий имел в виду слова send и реп, потому что фраза send а реп («послать ручку») – единственный вариант, который не нарушает никаких ограничений. Если предположить, что это были слова sinned и pin, то получится sinned a pin (англ, «согрешил булавку»), фраза, которая нарушает правила грамматики и вероятной сочетаемости слов по смыслу; вариант send и pin исключается из-за другого ограничения: известно, что обе гласные были произнесены одинаково; вариант sinned и реп («согрешил» и «ручка») можно исключить, потому что он нарушает оба ограничения.
Подобные рассуждения займут много времени, если мы будем проверять все варианты сочетаемости по одному. Однако в автоассоциативной сети они заранее закодированы в связях, и сеть может оценить все варианты одновременно. Предположим, что каждая интерпретация – это модельный нейрон; один нейрон – для варианта sinned, еще один – для send, и т. д. Предположим, что пары узлов, интерпретации которых непротиворечивы, соединены с положительными весами, а пары узлов, интерпретации которых противоречат друг другу, – соединены с отрицательными весами. Возбуждение затронет всю сеть, и если все пройдет успешно, то мы получим состояние сети, при котором активным будет самое большое количество взаимно непротиворечивых интерпретаций. Хорошим сравнением здесь будет мыльный пузырь, который колеблется, принимая разнообразные яйцевидные и амебовидные формы из-за того, что притяжение соседних молекул заставляет его оставаться шарообразным.
Бывает, что у сети ограничений могут быть взаимно противоречивые, но одинаково стабильные состояния. Это отражение такого явления, как противоречивость целого: целостный объект, но не его части, может быть интерпретирован двояко. Если пристально смотреть на рисунок куба на странице 123 (куб Неккера"), в какой-то момент ваше восприятие перевернется: вам начнет казаться, что вы видите не верхнюю его грань (вид снизу), а нижнюю грань (вид сверху). Когда происходит целостный переворот, изменение затрагивает интерпретацию каждой из частей объекта. Каждая ближняя к нам грань становится дальней гранью, каждый внутренний угол становится внешним углом, и так далее. И наоборот: если вы намеренно постараетесь увидеть внешний угол как внутренний, то можно произвольно вызвать обратный переворот всего куба. Динамика этого отражена в схеме под рисунком куба. Узлы представляют интерпретации элементов куба, и интерпретации, не противоречащие друг другу в структуре трехмерного объекта, возбуждают друг друга, в то время как противоречивые интерпретации тормозят друг друга.
Четвертое преимущество связано со способностью сети автоматически делать заключения. Если бы мы подключили наш распознаватель (который направлял бы данные с группы входных узлов на узел принятия решений) к нашему принтеру (у которого был бы узел намерений, от которого сигнал разветвлялся бы на группу выходных узлов), то получили бы простейший демон подстановок – например, на букву «В» он бы реагировал тем, что печатал бы «С». Однако если обойтись без посредника и присоединить входные узлы непосредственно к выходным узлам, можно получить очень интересный результат.
Вместо верного букве демона подстановок мы получим демона, который может делать простые обобщения. Такая сеть называется ассоциатором паттернов100.
Предположим, что входные узлы нижнего уровня представляют внешние признаки животных: «покрытое шерстью», «четвероногое», «покрытое перьями», «зеленое», «длинношеее» и т. д. Если создать достаточное количество узлов, каждое животное можно будет представить, включив узлы, соответствующие его уникальному набору признаков. Например, попугай будет представлен включением узла «покрытое перьями», выключением узла «покрытое шерстью» и т. д. Теперь представим, что выходные узлы верхнего уровня соответствуют зоологическим категориям. Один из них представляет тот факт, что животное травоядное, другой – что оно теплокровное и т. д. При том, что у нас нет узлов, соответствующих конкретным животным (так, у нас нет блока «попугай»), весы будут автоматически представлять статистическое знание о классах животных. Они воплощают знание о том, что животные с перьями обычно бывают теплокровными, что животные, покрытые шерстью, обычно живородящие, и т. д. Любой факт, хранящийся в связях для одного животного (попугаи – теплокровные) автоматически переносится на похожих животных (волнистые попугайчики – теплокровные), потому что для сети неважно, что связи относятся к конкретному животному. Связи просто указывают, какие внешние характеристики предполагают какие внешне невидимые свойства, вообще не учитывая факт разделения животных на виды.
На концептуальном уровне ассоциатор паттернов отражает понятие о том, что если два объекта схожи в чем-то одном, то они могут быть схожи и в чем-то еще. На механическом уровне схожие объекты представлены одними и теми же узлами, поэтому любая единица информации, связанная с узлами для одного объекта, будет в силу самого факта связана с блоками для другого. Более того, классы разной степени включения накладываются друг на друга в пределах одной сети, потому что любое подмножество узлов неявным образом определяет тот или иной класс. Чем меньше узлов, тем больше класс. Скажем, у нас есть входные узлы для следующих признаков: «движется», «дышит», «покрыто шерстью», «лает», «кусается» и «задирает ногу рядом с пожарным гидрантом». Связи, исходящие из всех шести узлов, активизируют факты, касающиеся собак. Связи, исходящие из первых трех узлов, активизируют факты, касающиеся млекопитающих. Связи, исходящие из первых двух, активизируют факты, касающиеся животных. Установление подходящих весов связей позволяет распространить элемент знания, запрограммированный для одного животного, на непосредственных и дальних его родственников.
Пятая хитрость нейронных сетей в том, что они могут учиться на примерах, при этом обучение состоит в изменении весов связей. Разработчику модели (как и процессу эволюции) не приходится устанавливать вручную тысячи коэффициентов веса, необходимых для того, чтобы получить нужный выход. Представим, что «учитель» подает в ассоциатор паттернов не только вход, но и правильный выход. Механизм обучения сравнивает реальный выход, полученный сетью (а он поначалу будет достаточно произвольным), с правильным ответом и корректирует коэффициенты веса с тем, чтобы минимизировать разницу между этими двумя значениями. Если сеть тормозит выходной узел, который по версии учителя должен быть возбужден, нам нужно сделать так, чтобы текущее поступление активных входов в будущем приводило к его возбуждению. Следовательно, коэффициенты веса на активных входах к этому мятежному выходному узлу нужно немного увеличить. Кроме того, нужно слегка снизить величину порога самого выходного узла, чтобы сделать его более чувствительным к любому инициирующему сигналу. Если сеть активизирует выходной узел, а учитель говорит, что он должен быть выключен, происходит противоположное: коэффициенты весов активных на данный момент входных элементов немного снижаются (возможно даже снижение веса ниже нуля, до отрицательного значения), а величина порога нужного узла увеличивается. Благодаря этому повышается вероятность того, что «гиперактивный» выходной узел в будущем будет выключаться при получении таких входных сигналов. В сеть вновь и вновь подаются целые серии входных сигналов и соответствующих им выходов, каждый раз при этом возникают волны небольших изменений в весах связей, пока сеть не начнет выдавать правильный выход для каждого входа – по крайней мере, в той мере, в которой это возможно.
Ассоциатор паттернов, оснащенный таким методом обучения, называется персептроном. Персептроны интересны, однако у них есть один большой недостаток. Они напоминают плохого повара, который считает, что если каждый ингредиент в небольшом количестве хорош, то все ингредиенты сразу и помногу – это будет еще лучше. Решая, правомерно ли определенный набор сигнальных входов приводит к выключению выходного сигнала, персептрон взвешивает их и складывает. Это зачастую дает неверный ответ, причем даже к простой задаче. Хрестоматийный пример этого недостатка – это то, как персептрон справляется с простой логической операцией, называемой «исключающее ИЛИ», что означает «А или В, но не оба сразу».
Когда активизируется А, сеть должна включить «А исключающее или В». Когда включается В, сеть должна включить А исключающее или В. Эти факты заставят сеть увеличить вес связи, исходящей от А (скажем, до 0,6) и увеличить вес связи, исходящей от В (скажем, до 0,6), тем самым сделав каждый из этих весов достаточно большим, чтобы преодолеть пороговое значение выходного узла (скажем, 0,5). Но когда включены и А и В одновременно, получается слишком много хорошего сразу: узел «А исключающее или В» ревет белугой как раз тогда, когда нам нужно, чтобы он молчал. Если мы попытаемся применить более низкие коэффициенты весов и более высокий порог, мы можем заставить его молчать, когда включены и А и В, но, увы, он будет молчать и тогда, когда включится только А или только В. Можно экспериментировать с весами сколько угодно, но это ничего не даст. Исключающее или – лишь один из многих демонов, которых нельзя создать на основе персептронов. В числе других – демоны, определяющие, четное или нечетное число блоков активизировано; демоны, определяющие, симметрична ли последовательность активных узлов, а также демоны, выполняющие простейшие задачи на сложение101.
Выход из этой ситуации – сделать сеть менее похожей на пресловутую собаку Павлова и добавить между уровнями входа и выхода еще один уровень: внутреннюю репрезентацию. Нужна такая репрезентация, которая эксплицирует все ключевые виды информации, связанные с входными сигналами, чтобы каждый выходной узел мог просто складывать входные значения и получать правильный ответ. Вот как это работает в случае с исключающим или:
Два скрытых узла между вводом и выводом вычисляют полезные промежуточные результаты. Узел слева вычисляет результат для простого случая «А или В», который, в свою очередь, активизирует выходной узел. Узел справа вычисляет результат для более сложного случая «А и В», и этот результат тормозит выходной узел. Выходной узел может просто вычислить «(А или В) и не (А и В)», это ему вполне по силам. Отметим, что на микроскопическом уровне построения простейших демонов из модельных нейронов без внутренних репрезентаций не обойтись; одних только связей по типу стимула и реакции не достаточно.
Более того, скрытый уровень сети можно научить самостоятельно устанавливать веса связей, используя более хитроумную версию метода обучения, чем в случае персептрона. Как и ранее, учитель задает сети правильный выход для каждого входа, а сеть подстраивает веса связей в большую или меньшую сторону, пытаясь сократить разницу. Однако в связи с этим возникает проблема, с которой не приходилось сталкиваться персептрону: как настроить связи, исходящие от узлов ввода к скрытым узлам. Проблема заключается в том, что учитель, если только он не умеет читать мысли, никак не может знать «правильные» значения для скрытых узлов, запечатанных внутри сети. Психологи Дэвид Румельхарт, Джеффри Хинтон и Рональд Уильямс пришли к хитрому решению. Узлы вывода распространяют обратно к каждому из скрытых узлов сигнал, представляющий сумму ошибок скрытого узла по всем узлам вывода, с которыми он связан («ты посылаешь слишком интенсивный сигнал возбуждения» или «ты посылаешь недостаточно интенсивный сигнал возбуждения» с количественным указанием отклонения). Этот сигнал может служить в качестве суррогата обучающего сигнала, который может использоваться для настройки вводов скрытых узлов. Связи, идущие от узлов уровня ввода к каждому из скрытых узлов, можно немного уменьшить или увеличить, чтобы сократить тенденцию скрытого узла к отклонению вверх или вниз с учетом текущего паттерна ввода. Данный метод, известный как метод обратного распространения ошибки обучения, может быть применен повторно к любому количеству уровней сети.
Мы пришли к тому, что многие психологи считают вершиной мастерства разработчика нейронных сетей. В некотором смысле мы сделали полный круг, потому что сеть, включающая скрытый уровень, напоминает ту самую условную карту логических вентилей, которую Мак-Каллок и Питтс предложили как модель нейронно-логического компьютера. На концептуальном уровне сеть со скрытыми узлами – это способ составить из совокупности суждений, которые могут быть истинными или ложными, сложную логическую функцию, скрепляемую связями «и», «или», «не» – но только с двумя отличительными особенностями. Первая особенность – это то, что значения здесь могут быть не только однозначно включенными или выключенными, но и варьируемыми, а следовательно – могут представлять ту или иную степень истинности или вероятности истинности данного утверждения, а не только абсолютно истинные или абсолютно ложные утверждения. Вторая особенность в том, что эту сеть можно во многих случаях обучить устанавливать правильные веса, подавая вводы и правильные для них выводы. Вдобавок к этим двум особенностям нужно отметить особое отношение: нужно ориентироваться на огромное количество связей между нейронами мозга и не смущаться, как бы много связей и логических элементов ни пришлось добавить в сеть. Придерживаясь такого морального принципа, можно создать сети, способные рассчитывать множество возможностей и, следовательно, использовать статистическую избыточность характеристик мира. А это, в свою очередь, позволит нейронным сетям распространять информацию с одного ввода на другие подобные вводы без дополнительного обучения, при условии, что для данной задачи подобные вводы дают подобные выводы102.
Это всего лишь несколько идей относительно того, как можно воплотить наших крохотных демонов с их досками объявлений в форму машин, отдаленно напоминающих нейронные сети. Эти идеи служат мостиком – пусть пока довольно шатким – на пути объяснения, которое начинается в концептуальной сфере (народная интуитивная психология и лежащие в ее основе своеобразные версии знаний, логики и теории вероятности), ведет дальше к правилам и репрезентациям (демонам и символам) и в конечном итоге приводит к реальным нейронам. Нейронные сети также скрывают приятные сюрпризы. Пытаясь разобраться в «программном обеспечении» мозга, мы в конечном итоге можем использовать только демонов достаточно глупых, чтобы их можно было заменить машиной. Если нам понадобится более умный демон, то придется еще как-то разгадать, как построить его из более глупых демонов. Процесс идет быстрее, а иногда и совсем иначе, когда разработчики нейронных сетей, идущие от нейронов к верхним уровням, создают целый арсенал готовых демонов, которые выполняют простые действия (как в случае с памятью, адресуемой по содержимому или с автоматически обобщающим информацию ассоциатором паттернов). Разработчики ментального программного обеспечения (которые, по сути, занимаются обратным проектированием) располагают неплохим арсеналом запчастей, из которых они могут собрать умных демонов.
Коннектоплазма
В какой же части мыслекода заканчиваются правила и репрезентации, и начинаются нейронные сети? Большинство когнитивистов приходят к единому мнению по крайней мере по поводу крайних точек. На высших уровнях когнитивной способности, где мы сознательно проходим каждый шаг, применяя правила, которые мы выучили в школе или обнаружили сами, мышление похоже на продукционную систему с символическими записями в памяти и демонами, выполняющими операции. На нижнем уровне записи и правила выполняются в рамках чего-то вроде нейронной сети, которая реагирует на знакомые паттерны и ассоциирует их с другими паттернами. Однако граница между ними остается предметом споров. Можно ли сказать, что простые нейронные сети отвечают за преобладающую часть повседневного мышления, а уровню явных правил и суждений оставляют только плоды учености? Или сети больше напоминают строительный материал, не способный на проявление человеческого рассудка, пока из него не будут построены структурированные репрезентации и программы?
Представители научной школы, получившей название «коннекционизм», во главе с психологами Дэвидом Румельхартом и Джеймсом Мак-Клелландом, утверждают, что простые сети сами по себе отвечают за преобладающую часть человеческого интеллекта. В своей крайней форме коннекционизм гласит, что мышление – это одна большая сеть обратного распространения ошибок скрытого уровня, или, возможно, группа из похожих или идентичных сетей, и интеллект формируется за счет того, что учитель – среда – настраивает веса связей. Единственная причина, по которой люди умнее крыс, состоит в том, что в наших сетях между стимулом и реакцией больше скрытых уровней, и мы живем в среде других людей, которые выступают в роли учителей сети. Правила и символы могут быть полезны как приближенная модель того, что происходит в сети, для психолога, который не может угнаться за миллионами потоков возбуждения, протекающих в связях, но не более того103.
Другой подход – который мне нравится больше – состоит в том, что одни только нейронные сети не могут выполнить всю работу. В значительной мере человеческий интеллект объясняется структурированием сетей на программы манипулирования символами. В частности, манипулирование символами лежит в основе языка и тех компонентов мышления, которые с ним взаимодействуют. Этим когнитивная способность не ограничивается, но это значительная ее часть. Это все, о чем мы можем рассуждать про себя и в разговоре с другими. Занимаясь психолингвистикой, я собрал множество доказательств того, что даже простейший навык, связанный с говорением на английском языке, – такой, как умение образовывать форму прошедшего времени от глагола (walked от walk, came от come) – с вычислительной точки зрения слишком сложен, чтобы его могла обслуживать одна нейронная сеть104. В этом разделе книги я представлю более общие доказательства. Требует ли содержание наших повседневных мыслей (информация, которой мы обмениваемся в разговоре) вычислительного устройства, предназначенного для реализации глубоко структурированного мыслекода, или с ним может справляться нейронная сеть общего назначения – то, что один остряк назвал «коннекто-плазмой»?105 Я покажу вам, что наши мысли отличаются тонким логическим структурированием, которое не под силу никакой сети однородных уровней, состоящей из узлов.
Зачем нам это, спросите вы? Затем, что эти доказательства ставят под сомнение наиболее авторитетную теорию устройства нашего мышления из когда-либо предложенных учеными. Сам по себе персептрон или сеть со скрытыми уровнями – это высокотехнологичное воплощение старой теории об ассоциации идей. Британские философы Джон Локк, Дэвид Юм, Джордж Беркли, Дэвид Хартли и Джон Стюарт Милль утверждали, что мысль подчиняется двум законам. Первый – закон смежности: между идеями, которые часто встречаются вместе, в мышлении образуются ассоциации. Впоследствии, когда активизируется одна идея, активизируется и вторая. Второй закон – это сходство: когда две идеи обладают сходством, все, что ассоциируется с первой идеей, автоматически начинает ассоциироваться со второй. Юм таким образом резюмировал суть этой теории в 1748 году:
Опыт лишь показывает нам ряд единообразных действий, производимых определенными объектами, и учит нас, что такие-то объекты в такое-то время обладали известными способностями и силами. Когда появляется новый объект, обладающий подобными чувственными качествами, мы ожидаем, что найдем в нем подобные же силы и способности, и ждем от него такого же действия. От тела одинакового с хлебом цвета и плотности мы ожидаем сходной же питательности и способности поддерживать организм106[12].
Ассоциацию по смежности и сходству считали тем самым писцом, который пишет на знаменитой «чистой доске» (так Локк метафорически называл мозг новорожденного). Теория, получившая название «ассоциационизм», веками играла доминирующую роль во взглядах британских и американских ученых на работу мышления, и в определенной степени доминирует и по сей день. Когда «идеи» заменили стимулы и реакции, ассоциационизм превратился в бихевиоризм. Чистая доска и два универсальных закона обучения являются психологической основой и стандартной социологической модели. Отзвуки этой теории мы слышим и в расхожих фразах о том, как наше воспитание заставляет нас «ассоциировать» еду с любовью, богатство со счастьем, рост с властью и т. д.
До недавнего времени ассоциационизм был слишком абстрактной теорией, чтобы быть проверенным на практике, однако модели нейронных сетей, которые сейчас ничего не стоит создать с помощью компьютера, позволяют сделать его идеи более точными. Схема обучения, в которой учитель дает сети вход и правильный выход, а сеть старается в будущем воспроизвести это соответствие, представляет собой очень хорошую модель закона смежности. Распределенная репрезентация входа, при которой концепт не получает собственного узла («попугай»), а представляется паттерном активности узлов, соответствующих его свойствам («покрытый перьями», «имеет крылья» и т. д.), позволяет добиться автоматического распространения на подобные концепты и, таким образом, прекрасно вписывается в закон об ассоциации по сходству. А если допустить, что все части мышления устроены как подобного рода сеть, то мы получим реализацию идеи чистой доски. Итак, коннекционизм открывает перед нами прекрасные возможности. Увидев, что могут и чего не могут делать модели нейронных сетей, мы можем подвергнуть серьезному испытанию многовековую доктрину ассоциации идей.
Прежде чем начать, необходимо сразу отмести несколько ложных аргументов. Коннекционизм – не альтернатива вычислительной теории сознания, а ее разновидность, которая утверждает, что основной вид обработки информации, выполняемый мозгом, – это многомерный статистический анализ. Коннекционизм не является необходимой коррективой теории о том, что мозг подобен серийному компьютеру с действующим быстро и безошибочно центральным процессором, – никто этого и не утверждает. В реальной жизни нет Ахилла, который заявлял бы, что всякая форма мышления заключается в прокручивании в голове тысячи правил из учебника по логике. Наконец, сети связей не являются особенно реалистичными моделями мозга, невзирая на приклеившееся к ним оптимистичное название «нейронные сети». К примеру, так называемый «синапс» (вес связи) может переходить из возбужденного состояния в заторможенное, а по «аксону» (соединению) информация может поступать в обоих направлениях. С анатомической точки зрения и то и другое невозможно. Когда стоит выбор между тем, чтобы поскорее решить задачу, и тем, чтобы как можно точнее воспроизвести работу мозга, коннекционисты нередко выбирают первое; это говорит о том, что сети используются как форма искусственного интеллекта, лишь косвенно основанная на сравнении с нейронами, и не являются формой моделирования нейронной активности. Вопрос в том, действительно ли они осуществляют такие вычисления, которые можно считать моделью человеческого мышления?
Грубая коннектоплазма не способна воспроизвести пять особенностей повседневного мышления. Эти особенности на первый взгляд кажутся малозаметными, о их существовании даже не подозревали до тех пор, пока логики, лингвисты и специалисты по информатике не начали разглядывать под микроскопом значение предложений. Тем не менее именно они дают человеческой мысли ее неповторимую точность и силу, являясь, как мне кажется, важным элементом ответа на вопрос «Как работает мышление?».
Первая особенность – это способность работать с индивидным объектом. Давайте вернемся к первому отличию нейронных сетей от их компьютероподобных моделей. Вместо того, чтобы символически представлять объект в виде произвольного шаблона из последовательности битов, мы представляли его в виде шаблона из узлов одного уровня, каждый из которых соответствовал одному из свойств объекта. Перед нами тут же встает проблема: мы уже не можем отличить друг от друга два отдельных объекта с идентичными свойствами. Они представлены совершенно одинаковым образом, и система не обращает внимания на то, что перед ней – не один и тот же кусок физической материи. Мы потеряли индивидуальность объекта: мы можем создать репрезентацию овоща или лошади как понятия, но не конкретного овоща и не конкретной лошади. Все, что система узнает об одной лошади, будет сливаться с тем, что она знает о другой лошади, идентичной первой. Естественного способа представить двух разных лошадей нет. Если увеличить активность узлов, представляющих свойства лошади, вдвое, это не поможет, потому что система может решить, что это двойная степень уверенности в том, что присутствуют свойства лошади или что свойства лошади присутствуют в двойной степени.
Легко спутать отношение между классом и подклассом (например, между классом «животное» и подклассом «лошадь», с которыми сеть легко справляется) с отношением между подклассом и отдельным объектом (например, подклассом «лошадь» и отдельной особью по кличке «Мистер Эд»). У этих двух примеров отношений, естественно, есть кое-что общее. В обоих случаях свойства высшего порядка передаются и объектам низшего порядка. Если животные дышат, а лошади – это животные, то лошади дышат. Если у лошадей есть копыта, а Мистер Эд – лошадь, то у Мистера Эда есть копыта. Следуя этой логике, разработчик может соблазниться тем, чтобы рассматривать индивидуализированный объект как очень-очень узкий подкласс, используя при этом некое едва заметное различие между этими двойниками – например, крапинку, которая присутствует у одного объекта и отсутствует у другого.
Как и многие постулаты коннекционизма, эта идея уходит корнями в британский ассоциационизм. Как писал Беркли, «уберите ощущение мягкости, влажности, красноты, кислоты и вы уберете вишню, потому что она не существует отдельно от ощущений. Вишня, заявляю я, не что иное, как множество ощущаемых чувствами впечатлений»107. Тем не менее предположение Беркли себя не оправдало. Можно иметь совершенно идентичные знания о свойствах двух объектов и при этом все равно знать, что они разные. Представьте комнату с двумя одинаковыми стульями. В комнату входит человек и меняет стулья местами. Осталась ли комната прежней или стала другой? Всем ясно, что комната изменилась. Но нам не известны признаки, которые бы отличали один стул от другого – кроме того, что можно говорить об одном из них как о стуле № 1, а о втором – как о стуле № 2. Мы снова вернулись к произвольным ярлыкам, присваиваемым слотам памяти, как в презренном цифровом компьютере! Та же идея лежит в основе шутки комика Стивена Райта: «Пока меня не было дома, кто-то вытащил все вещи из моей квартиры и заменил их точными копиями. Когда я сказал об этом соседу по комнате, он спросил: “Мы с вами знакомы?”»
Есть, правда, одна характеристика, позволяющая отличить один индивидный объект от другого: они не могут находиться в одном и том же месте одновременно. Вероятно, мозг способен запечатлеть в памяти время и место нахождения каждого объекта и постоянно обновлять эти координаты, что позволяет ему различать индивидные объекты с идентичными свойствами. Тем не менее даже это не объясняет нашу способность отделять индивидные объекты друг от друга в мысленном восприятии. Предположим, что перед нами бесконечная белая плоскость, на которой нет ничего кроме двух идентичных друг другу кругов. Один из них, двигаясь, постепенно находит на второй и остается поверх него в течение несколько секунд, а затем продолжает двигаться дальше. Думаю, ни у кого не возникнет затруднений в том, чтобы воспринимать круги как отдельные сущности даже в те моменты, когда они находятся в одном и том же месте в одно и то же время. Это доказывает, что нахождения в определенном месте в определенное время тоже недостаточно для нашего ментального определения «индивидного объекта»108.
Мораль из всего сказанного заключается не в том, что индивидные объекты нельзя представить в нейронной сети. Это довольно просто: нужно лишь выделить несколько узлов для установления тождества каждого индивидного объекта вне зависимости от свойств данного объекта. Можно присвоить каждому индивиду собственный узел, а можно присвоить каждому индивиду что-то вроде серийного номера, закодированного в форме паттерна из возбужденных узлов. Мораль в том, что сети, моделирующие мышление, должны быть сделаны таким образом, чтобы воплощать абстрактное логическое представление об отдельном объекте, аналогично роли, которую играет произвольно маркированная ячейка памяти компьютера. Единственное, что не получается, – это ассоциатор паттернов, ограниченный наблюдаемыми свойствами объекта, современная реализация аристотелевской сентенции «нет ничего в уме, чего бы не было прежде в чувствах».
Можно ли сказать, что все эти рассуждения – всего лишь казуистика? Вовсе нет: понятие индивидного объекта – это один из ключевых элементов нашей способности рассуждать о жизни. Позвольте привести два примера из реальной жизни, включающих в себя две грандиозные сферы человеческого взаимодействия: любовь и правосудие.
Монозиготные близнецы схожи в большей части своих характеристик. Они не только выглядят одинаково, но и думают, чувствуют и действуют схожим образом. Но не совершенно идентично, конечно; это и есть лазейка, с помощью которой можно попытаться представить их как очень узкие подклассы. Вместе с тем любое живое существо, представляющее их как подклассы, должно по крайней мере тяготеть к тому, чтобы воспринимать идентичных близнецов одинаково. Живое существо должно переносить свое мнение с одного близнеца на другого, по крайней мере, в вероятностном смысле или в какой-то мере; помните? это один из самых привлекательных моментов ассоциационизма и его воплощения в форме коннектоплазмы. Например, если что-то привлекает вас в одном из близнецов (то, как он ходит, говорит, выглядит и т. д.), оно должно привлекать вас и в другом. А это подразумевает, что идентичные близнецы должны вечно фигурировать в историях, замешанных на ревности и предательстве поистине готического масштаба. На деле же ничего подобного не происходит. Супруга одного из идентичных близнецов не испытывает романтического влечения к другому. Любовь привязывает нас к человеку как к данному человеку, а не как к типу людей – сколь бы малочисленным ни был этот тип людей109.
10 марта 1988 года кто-то откусил половину уха офицеру полиции Дэвиду Дж. Стортону. Ни у кого не было сомнений относительно того, кто это сделал: это был либо Шон Блик, молодой человек (21 год), живущий в Пало-Альто (Калифорния), либо Джонатан Блик, его идентичный близнец. Оба брата оказались вовлечены в потасовку с полицейским, и один из них откусил офицеру часть уха. Обоим братьям были предъявлены обвинения в нанесении увечья, попытке ограбления, нападении на офицера полиции и нанесении увечья при отягчающих обстоятельствах. Последнее правонарушение (укушенное ухо) карается пожизненным заключением. Офицер Стортон, давая показания, сообщил, что у одного из близнецов были длинные волосы, а у другого – короткие, и укусил его длинноволосый. К сожалению, через три дня, когда близнецы сдались полиции, у них были одинаковые короткие стрижки, и от дачи показаний они отказались. Их адвокаты утверждали, что ни одному из них нельзя назначить суровое наказание, предполагаемое обвинением в нанесении тяжкого увечья. В отношении каждого из братьев есть разумные основания для сомнения по поводу того, действительно ли преступление совершил он, потому что это вполне мог быть и второй брат. Аргумент представляется весомым потому, что наше чувство справедливости велит нам выбрать индивида, который совершил поступок, а не какие-либо характеристики этого индивида110.
Наша одержимость индивидуальностью человека – это не необъяснимая причуда; вероятно, она развилась у нас из-за того, что каждый человек, которого мы встречаем, независимо от каких-либо наблюдаемых его свойств, непременно имеет неповторимый багаж воспоминаний и желаний, что обусловлено уникальной эмбриологической и биографической историей. В главе 6, когда мы перейдем к обратному проектированию чувства справедливости и романтической любви, мы увидим, что в их основе – ментальный акт регистрирования отдельного индивида.
Люди – не единственный класс схожих между собой индивидуальных объектов, которые нам приходится различать; еще один пример из реальной жизни – игра в «угадайку» в животном мире. Многим животным приходится играть в «угадайку» и таким образом следить за местонахождением отдельных объектов. Один из примеров – мать, следящая за своим потомством, которое может выглядеть точно также, как все остальные детеныши этого вида, но при этом обладать ее генетическим набором. Другой пример – хищник, охотящийся на стадных животных, который отслеживает одного представителя стада, следуя стратегии игры в салочки: если ты водишь, то не переключайся с намеченной жертвы на другую; не давай отдохнуть никому, кроме себя. Когда кенийские зоологи, желая упростить сбор данных об антилопах гну, решили пометить краской рога усыпленных с помощью транквилизатора особей, они обнаружили, что, как бы они ни старались восстановить силы и энергию помеченного животного перед его возвращением в стадо, в первый же день или чуть позже его убивали гиены. Одно из возможных объяснений состоит в том, что цветная метка позволяет гиенам выделить именно эту антилопу и загнать ее до изнеможения. Одна из последних версий того, зачем нужны полоски зебрам, – не для того, чтобы сливаться с высокой травой (это объяснение всегда представлялось сомнительным), а для того, чтобы превратить стадо зебр в живые «наперстки», сбить с толку льва или другого хищника, который пытается сосредоточить внимание на одной особи. Конечно, мы не можем быть уверены, что у гиен или львов есть понятие индивидного объекта; может быть, им просто кажется более аппетитным животное, не похожее на собратьев по стаду. Тем не менее эти примеры хорошо иллюстрируют стоящую перед вычислительной техникой проблему отличия индивидных объектов от классов и акцентируют важность присущей человеку способности решать эту задачу111.
Вторая проблема ассоциационизма известна как композициональность: способность репрезентации состоять из частей и обладать значением, которое исходит из значений составляющих и из того, каким образом они соединяются между собой. Композициональность – типичная черта всех естественных языков. Значение предложения The baby ate the slug («Ребенок съел слизняка») можно вывести из значений слов baby, ate, the и slug и из их положения в предложении. Целое не является простой суммой компонентов: если мы переставим слова в предложении, получив The slug ate the baby («Слизняк съел ребенка»), оно будет выражать совсем другую идею. Поскольку вы не слышали раньше ни то предложение, ни другое, вы наверняка интерпретировали их, применив к последовательности слов совокупность алгоритмов (включающих в себя правила синтаксиса). Конечный продукт в каждом случае – это совершенно новая мысль, которую вы собрали на ходу. Имея в своем распоряжении такие концепты, как «ребенок», «слизняк» и «есть», плюс способность располагать соответствующие им символы на мысленной доске объявлений в соответствии со схемой, которую могут прочитать демоны, вы можете впервые в жизни получить именно такую мысль.
Журналисты говорят, что когда собака кусает человека, это не новость, а вот когда человек кусает собаку— это новость. Композициональность ментальных репрезентаций – вот что позволяет нам воспринимать новости. Мы готовы принять любые нелепые и удивительные новые идеи, какими бы невообразимыми они ни казались. Корова перепрыгнула через луну; Гринч украл Рождество; Вселенная началась с Большого Взрыва; пришельцы высадились в Гарварде; Майкл Джексон женился на дочери Элвиса Пресли. Благодаря математике комбинаторики у нас никогда не будет недостатка в новостях; в мире есть сотни миллионов триллионов мыслей, которые еще никогда и никому не приходили в голову.
Вы, вероятно, подумали, что композициональность легко воспроизвести в модели нейронной сети: просто включить узлы «ребенок», «есть» и «слизняк». Но если бы процессы, происходящие в нашем мозге, ограничивались этим, мы бы не могли знать наверняка, что произошло: ребенок съел слизняка, слизняк съел ребенка или ребенок и слизняк поели. Концепты должны быть привязаны к ролям (в логике их называют «аргументами»): кто является едоком, а кто съеденным.
Тогда, может быть, можно прикрепить отдельный узел к каждой комбинации концептов и ролей? У нас получится узел «ребенок-ест-слизняка» и узел «слизняк-ест-ребенка». Ведь в мозге огромное количество нейронов, скажете вы, почему бы не поступить так? Одна из причин, почему так поступить нельзя, – в том, что для этого нужно не просто огромное, а огромное-преогромное количество. Количество комбинаций растет пропорционально допустимому размеру, приводя к комбинаторному взрыву, в результате которого количество комбинаций превысит возможности мозга даже по самым оптимистичным оценкам. Легенда гласит, что визирь Сисса Бен Дахир попросил у короля Инди Ширхама скромную награду за изобретение шахмат. Он просил всего лишь положить на первую клетку шахматной доски одно зернышко пшеницы, на вторую – два зернышка пшеницы, на третью – четыре, и так далее. Они не успели даже дойти до последней, шестьдесят четвертой клетки, когда король обнаружил, что, сам того не зная, потратил все запасы зерна в королевстве. Награда составила четыре триллиона бушелей – это количество зерна, произведенного во всем мире за две тысячи лет. Точно так же комбинаторные способности мыслей могут легко превзойти количество нейронов в мозге. Сотню миллионов триллионов значений предложений нельзя впихнуть в мозг, в котором всего сто миллиардов нейронов, отводя для каждого значения собственный нейрон.
Впрочем, даже если бы это и было возможно, сложные мысли все равно не хранились бы в мозге в готовом виде, по одной на каждый нейрон. На это указывает то, что наши мысли связаны между собой. Представим, что у каждой мысли есть собственный узел. Тогда нужно было бы иметь отдельные узлы для случаев, когда ребенок съел слизняка, слизняк съел ребенка, курица съела слизняка, слизняк съел курицу, ребенок увидел слизняка, слизняк увидел ребенка, курица увидела слизняка и т. д. Отдельные узлы пришлось бы выделить для каждой из этих мыслей и для многих других мыслей; ведь любой человек, способный подумать о том, что ребенок увидел курицу, также способен подумать о том, что курица увидела ребенка. И все же в этом арсенале мыслеблоков есть кое-что подозрительное: в нем сплошь и рядом встречаются совпадения. То ребенок что-то увидел, то слизняк что-то увидел, то слизняк что-то съел, то ребенок что-то съел, и т. д. Мысли сами собой выстраиваются в ячейки, образующие ряды, колонны, уровни, гиперряды, гиперколонны и надуровни обширной матрицы. Но эта замечательная система может показаться сложной для понимания, только если допустить, что мысли – это очень большой набор отдельных узлов, а эти узлы – совокупность изолированных фактов, никак не связанных друг с другом. Когда природа представляет нашему вниманию объекты, идеально подходящие для заполнения такого прямоугольного модуля ячеек, она как бы подсказывает нам, что эти объекты наверняка состоят из меньших компонентов, соответствующих рядам и колоннам. Именно так периодическая система химических элементов привела к пониманию структуры атома. По аналогичным причинам мы можем сделать вывод, что канву всех наших мыслей составляют образующие их концепты. Мысли состоят из концептов; они не хранятся в мозге в готовом виде112.
Композициональность, как ни странно, представляет большие сложности для коннектоплазмы. Все напрашивающиеся для решения проблемы методы оказываются недостаточными. Предположим, что мы отвели по одному узлу для каждого сочетания одного концепта и одной роли. Допустим, один узел будет означать «ребенок ест», а другой – «слизняк съеден», или, допустим, один узел будет означать «ребенок выполняет действие», а другой – «слизняк является объектом действия». Это позволит значительно сократить число комбинаций – но лишь за счет новой неопределенности относительно того, кто совершил какое действие и над кем. Мысль «Ребенок съел курицу, когда пудель съел слизняка» будет невозможно отличить от мысли «Ребенок съел слизняка, когда пудель съел курицу». Проблема в том, что блок «ребенок ест» не содержит информации о том, что ребенок съел, а блок «слизняк съеден» не содержит информации о том, кто его съел.
Шагом в правильном направлении будет встроить в систему способность различать концепты (ребенок, слизняк и др.) и роли, которые они выполняют (деятель, объект действия и т. д.). Допустим, мы создадим отдельные фонды узлов – один для роли деятеля, а другой для роли объекта действия. Чтобы представить суждение, каждый фонд узлов дополняется шаблоном для выполняющего роль в данный момент концепта, поступающим из отдельного раздела памяти. Если бы мы соединили каждый узел с соседними узлами, мы бы получили автоассоциатор для суждений, способный немного работать с комбинаторными мыслями. Мы бы могли хранить в готовом виде суждение «ребенок съел слизняка»; в этом случае, получая любые два компонента в форме вопроса (скажем, «ребенок» и «слизняк» в форме вопроса «Каково отношение между ребенком и слизняком?»), система дополняла бы шаблон, включив узлы, соответствующие третьему компоненту (в данном случае «съел»).
Ведь так? Увы, нет. Рассмотрим такие мысли:
Baby same-as baby. (Ребенок то-же-самое-что ребенок.)
Baby different-from slug. (Ребенок отличное-от слизняк.)
Slug different-from baby. (Слизняк отличное-от ребенок.)
Slug same-as slug. (Слизняк то-же-самое-что слизняк.)
Никакое сочетание весов связей, при котором элемент «ребенок» в первой ячейке и элемент «то-же-самое-что» в средней ячейке активизируют элемент «ребенок» в третьей ячейке, а элемент «ребенок» и «отличное-от» активизируют элемент «слизняк», а элемент «слизняк» и элемент «отличное от» включают элемент «ребенок», не позволит элементам «слизняк» и «то-же-самое-что» активизировать элемент «слизняк». Это все та же самая проблема «исключающего ИЛИ», только в другом обличье. Если связи, соединяющие элементы «ребенок» и «ребенок» и элементы «то-же-самое-что» и «ребенок» сильны, они активизируют элемент «ребенок» в ответ на «ребенок то-же-самое-что____» (что хорошо), однако они включат элемент «ребенок» и в ответ на «ребенок отличное-от – ____» (что плохо), и в ответ на «слизняк то-же-самое-что____» (что тоже плохо). Можно как угодно жонглировать весами связей, но вы никогда не найдете такой вариант, который будет работать для всех четырех предложений. Любой человек безошибочно поймет все четыре предложения, следовательно, человеческий мозг представляет суждения в более замысловатой форме, чем совокупность связей концепта с концептом или концепта с ролью. Мозгу нужна репрезентация для самого суждения. В нашем примере модели нужен дополнительный уровень – более конкретно, уровень, на котором суждение было бы представлено полностью, независимо от концептов и их ролей в суждении113.
Рисунок внизу показывает в упрощенной форме разработанную Джеффри Хинтоном модель, которая позволяет справиться с предложениями.
Узлы в модуле «суждений» активизируются произвольным образом, получается что-то вроде серийных номеров, которыми помечаются полноценные мысли. Этот модуль функционирует как сверхструктура, благодаря которой концепты в каждом суждении остаются каждый в своей ячейке. Обратите внимание, как точно архитектура этой сети воспроизводит стандартный, напоминающий естественный язык, мыслекод! Выдвигались и другие версии композициональных сетей, которые не так очевидно имитируют естественный язык, но все они непременно включали в себя специальные компоненты, которые задуманы для того, чтобы отделять концепты от их ролей, и для того, чтобы правильно увязывать каждый концепт с его ролью. Чтобы сеть могла выполнять функции, свойственные мышлению, нужно вернуть в нее такие компоненты логики, как предикат, аргумент и суждение; одних только ассоциаций явно недостаточно114.
Еще одна замечательная способность мышления, которую вы, возможно, даже никогда не осознавали, называется квантификацией или присваиванием значения переменным. Она представляет собой сочетание первой проблемы – различения индивидных объектов – и второй – композициональности. Ведь предметом наших композициональных мыслей, в конце концов, часто бывают индивидные объекты, и очень важно, каким образом эти индивидные объекты связаны с разными элементами мысли. Мысль о том, что какой-то определенный ребенок съел какого-то определенного слизняка, отличается от мысли о том, что какой-то определенный ребенок ест слизняков в принципе, или о том, что все дети вообще едят слизняков. Существует целая плеяда анекдотов, основанных на том, что слушатель не распознает это различие. «В США каждые сорок пять секунд кто-то получает травму головы» – «О, боже! Не повезло этому кому-то!» Когда мы слышим фразу «Хильдегард хочет выйти замуж за мускулистого мужчину», мы не можем знать наверняка, есть ли у нее уже кто-то подобный на примете или она просто регулярно ходит в спортзал в надежде найти кого-нибудь. Авраам Линкольн сказал: «Можно некоторое время дурачить всех людей; можно даже дурачить некоторых людей все время; но нельзя дурачить все время всех людей». Без способности квантификации мы едва бы поняли, что он сказал.
В этих примерах у нас есть несколько предложений или несколько прочтений двусмысленного предложения, в которых одни и те же концепты играют одни и те же роли, однако в результате получаются очень разные идеи. Привязать концепты к их ролям недостаточно. Специалисты по логике фиксируют эти различия с помощью переменных и кванторов. Переменная – это символ-заполнитель вроде х или у, который обозначает одну и ту же сущность в разных суждениях или в разных частях одного суждения. Квантор – это символ, который может выражать отношения «Существует определенный х, который…» и «Несмотря на х, справедливо утверждение, что…». Мысль может быть выражена суждением, состоящим из символов, которые обозначают концепты, роли, кванторы и переменные, расположенные в строго определенном порядке с использованием скобок. Сравним, к примеру: «Каждые сорок пять секунд {существует X [который получает травму]}» и «Существует X {который каждые сорок пять секунд [получает травму]}». Наш мыслекод должен иметь механизм, который делал бы что-то вроде этого, но пока у нас нет ни малейшего понятия, как это можно осуществить в рамках ассоциативной сети.
Мало того, что суждение может быть об индивидном объекте, оно само должно интерпретироваться как нечто вроде индивидного объекта, а отсюда вытекает еще одна проблема. Сила коннектоплазмы заключается в наложении разных шаблонов в пределах одной и той же совокупности узлов. К сожалению, результатом может стать причудливая химера или вообще сбой в работе сети. Это одно из проявлений вечной проблемы коннектоплазмы, которая известна как интерференция или перекрестные помехи.
Возьмем два примера. Психологи Нил Коэн и Майкл Мак-Клоски научили сеть складывать две цифры. Сначала ее обучили прибавлять единицу к другим числам: получая на входе «1» и «3», сеть научилась выдавать на выходе «4», и т. д. Далее ее научили прибавлять 2 к любому другому числу. Увы, для решения задачи с прибавлением двойки веса связей переросли в значения, оптимальные для прибавления 2, а поскольку у сети не было специально выделенных средств, чтобы закрепить знание о том, как прибавить 1, она попросту забыла, как это делается! Этот эффект известен как «катастрофическое забывание», потому что он отличается от постепенного забывания, с которым мы имеем дело в повседневной жизни. Еще один пример – сеть, разработанная Мак-Клелландом и его коллегой Аланом Кавамото для присваивания значений двусмысленным предложениям. Например, предложение A bat broke the window (предложение может быть переведено с английского как «Бита разбила окно» или «Летучая мышь разбила окно». – Прим. пер.) может означать либо что в окно бросили бейсбольную биту, либо что через него пролетело крылатое млекопитающее. Сеть выдала единственное толкование, к которому не мог прийти человек: крылатое млекопитающее разбило окно с помощью бейсбольной биты115!
Как и в случае с любым другим инструментом, свойства, которые делают коннектоплазму пригодной для одних вещей, делают ее же непригодной для других вещей. Способность сети к обобщению обусловлена плотной взаимосвязанностью ее элементов и наложением входных данных. Но представьте, что вы – один из узлов сети; вам покажется не таким уж приятным то, что вам в ухо постоянно что-то орут тысячи других узлов и вас то и дело захлестывают волны входных данных. Нередко разные куски информации требуется хранить отдельно, чтобы они не смешивались. Один из способов сделать это – предоставить каждому суждению собственную ячейку памяти и адрес (что, опять же, указывает на то, что не все особенности компьютера оказываются всего лишь странностями кремниевого разума). Компьютеры, в конце концов, придумали не для обогрева, а для того, чтобы обрабатывать информацию таким образом, который имел бы значение для пользователей.
Психологи Дэвид Шерри и Дэн Шактер продолжили эту цепь рассуждений. Они отметили, что разные технические требования к системе памяти зачастую противоречат друг другу. Естественный отбор, утверждают они, отреагировал на эту проблему тем, что наделил организмы специализированными системами памяти. Каждая из таких систем имеет вычислительную структуру, оптимизированную для выполнения одной из задач, стоящей перед мышлением животного. Например, у птиц, запасающих зерно впрок на черный день, сформировалась отличная память на тайники (в случае североамериканской ореховки их количество составляет до десяти тысяч). Птицы, самцы которых поют, чтобы впечатлить самок или внушить страх другим самцам, хранят в памяти большое количество песен (двести в случае соловья). Память на тайники и память на песни располагаются в разных структурах мозга и имеют разные схемы нервных соединений. Мы, люди, одновременно предъявляем к своей системе памяти два очень различных требования. Мы должны помнить отдельные эпизоды: кто сделал что, кому, где, когда, почему, – а для этого необходимо каждый эпизод пометить временем, датой и серийным номером. Вместе с тем мы должны извлекать из информации обобщенное знание о том, как устроены люди и мир вокруг них. Шерри и Шактер предполагают, что природа дала нам по одной системе памяти для каждого из этих требований: «эпизодическую», или автобиографическую, память и «семантическую» память, то есть память общего знания (впервые это разграничение было проведено психологом Энделем Тулвингом)116.
Тонкость, благодаря которой количество доступных человеку мыслей увеличивается до поистине астрономического, заключается не в разделении концептов на три или четыре роли, а в своеобразной плодовитости нашего мышления, носящей название «рекурсивность». Фиксированной совокупности узлов для каждой роли недостаточно. Мы, люди, можем взять любое суждение целиком и отвести ему роль в более длинном суждении, а потом взять это длинное суждение и встроить его в еще большее, тем самым создав иерархическую структуру из суждений внутри суждений. Мы можем подумать не только о том, что ребенок съел слизняка, но и о том, что отец видел, как ребенок съел слизняка, и о том, что мне интересно, видел ли отец, что ребенок съел слизняка, и о том, что отец знает, что мне интересно, видел ли он, что ребенок съел слизняка, и о том, что я догадываюсь, что отец знает, что мне интересно, видел ли он, что ребенок съел слизняка, и т. д. Точно также, как способность прибавить единицу к любому числу влечет за собой способность генерировать бесконечное количество чисел, способность встроить суждение в другое суждение влечет за собой способность помыслить бесконечное число мыслей.
Чтобы получить суждения внутри суждений от сети, изображенной на предыдущей схеме, можно добавить еще один уровень связей в верхней части схемы, соединив модуль узлов, соответствующий целому суждению, с ячейкой роли в некотором более крупном суждении; эта роль может быть чем-то вроде «событие – наблюдаемое». Если мы продолжим добавлять всё новые уровни, мы можем получить многоуровневое суждение, запечатлев в кон-нектоплазме целую иерархическую структуру, соответствующую ему. Но это решение слишком громоздко и вызывает подозрения. Для каждого типа рекурсивной структуры придется предусмотреть отдельную сеть: одну сеть для человека, который думает о суждении, вторую – для человека, думающего о суждении о человеке, думающем о суждении, третью – для человека, сообщающего суждение о некоем человеке другому человеку, и т. д.
В вычислительной технике и психолингвистике используется более мощный и гибкий механизм. Каждая простая структура (соответствующая человеку, действию, суждению и т. д.) представляется в долгосрочной памяти один раз, и процессор переключает внимание от одной структуры к другой, сохраняя маршрут своих перемещений в краткосрочной памяти, чтобы связать суждение воедино. Этот динамический процессор, называемый рекурсивной сетью переходов, особенно хорошо воспроизводит понимание предложений, потому что мы слышим и читаем слова по одному, а не впитываем целое предложение целиком. И наши сложные мысли мы, по-видимому, жуем по кусочку, а не заглатываем или отрыгиваем целиком, а это означает, что наш мозг оснащен рекурсивным обрабатывателем суждений для мыслей, а не только для предложений. Психологи Майкл Джордан и Джефф Элман создали сети, в которых исходящие из узлов выхода соединения возвращаются обратно на совокупность узлов краткосрочной памяти, тем самым запуская новый цикл. Такая циклическая структура позволяет представить, как может протекать в нейронных сетях процесс обработки итеративной информации, однако и этого недостаточно, чтобы интерпретировать или строить структурированные суждения. В последнее время были предприняты попытки соединить циклическую сеть с сетью суждений и получить нечто вроде рекурсивной сети переходов, состоящей из кусочков коннектоплазмы. Эти попытки показывают, что нейронным сетям будет не по плечу наше рекурсивное мышление, если они не будут специально организованы в рекурсивный процессор117.
Нужно отдать должное человеческому мышлению: у него есть и еще одна когнитивная способность, которую очень сложно выжать из коннектоплазмы, а следовательно – сложно объяснить с помощью ассоциационизма. Нейронные сети с легкостью реализуют нечеткую логику, в которой все представляет собой что-то вроде чего-то в той или иной степени. Нужно признать, многие понятия из сферы здравого смысла довольно размыты и им сложно дать четкое определение. Философ Людвиг Виттгенштейн предлагал в качестве примера понятие «игра», образцы которого (паззлы, роллер-дерби, керлинг, «Подземелья и драконы», петушиные бои и т. д.) не имеют между собой ничего общего. Ранее я приводил еще два примера – «холостяк» и «овощ». Членам нечетко определяемой категории недостает одной определяющей черты; они во многих отношениях пересекаются – почти как члены одной семьи или как нити веревки, из которых ни одна не проходит по всей длине. В комиксе «Bloom County» пингвин по имени Опус, временно потерявший память, возражает, когда ему говорят, что он – птица. Птицы изящные и обтекаемые, отмечает Опус, а он – нет. Птицы умеют летать, а он – нет. Птицы умеют петь, а от его исполнения песни Yesterday слушатели давятся от хохота. Опус начинает подозревать, что на самом деле он – лось Буллвинкль. Итак, даже такие концепты, как «птица», оказываются построенными не на необходимых и достаточных условиях, а на прототипических представителях категории. Если вы найдете слово «птица» в словаре, то на картинке увидите не пингвина, а какую-нибудь маленькую птичку, например, воробья.
Эксперименты в области когнитивной психологии показали, что люди демонстрируют крайнюю узколобость в определении птиц, других животных, овощей, инструментов. У людей есть общий стереотип, который они распространяют на всех членов категории; этот стереотип они узнают быстрее, чем не соответствующие ему экземпляры, и даже заявляют, что видят стереотип, в тех случаях, когда на самом деле они видели образцы, похожие на него. Подобные ответы можно прогнозировать, подведя итог свойствам, которые у данного члена категории являются общими с другими ее членами: например, чем больше у него свойств, характерных для птицы, тем в большей степени он является птицей. Автоматический ассоциатор, получив образцы данной категории, сделает примерно то же самое, потому что он вычислит корреляции свойств. Это заставляет думать, что некоторые части человеческой памяти устроены наподобие автоассоциатора118.
Но ведь не может же наше мышление ограничиваться этим! Люди не всегда мыслят нечеткими категориями. Мы смеемся над Опусом, потому что часть нашего сознания понимает, что на самом деле он – птица. Может быть, мы сходимся в определении прототипа бабушки – это добрая седоволосая женщина лет семидесяти, которая потчует внуков кексами с черникой или куриным бульоном (зависит от того, чей это стереотип), но в то же самое время без труда понимаем, что и Тина Тернер и Элизабет Тейлор – тоже бабушки (более того, Тейлор – еще и еврейская бабушка). Если говорить о холостяках, многие люди – например, представители иммиграционных властей, мировые судьи, чиновники сферы здравоохранения – печально известны тем, что очень четко определяют эту категорию; мы все знаем, как много может зависеть от клочка бумаги. Примеры четкого мышления мы находим всюду. Судья может освободить явно виновного подозреваемого из-за формальности. Бармен может не налить пива взрослому человеку за день до того, как ему исполнится двадцать один год. Мы шутим, что нельзя быть немножко беременной или слегка женатым, но после того, как исследование канадских ученых показало, что замужние женщины занимаются сексом 1,57 раз в неделю, карикатурист Терри Мошер изобразил женщину, которая сидит в постели рядом с храпящим мужем и говорит: «Что ж, уже 0,57».
На самом деле нечеткие и четкие версии одной и той же категории могут мирно сосуществовать в одной и той же голове. Психологи Шэрон Армстронг, Генри Глейтман и Лайла Глейтман провели коварный эксперимент: они дали студентам университета стандартные тесты для нечетких категорий, но определить предложили очень четко определяемые категории – такие, как «нечетное число» и «лицо женского пола». Испытуемые с готовностью согласились с такими абсурдными утверждениями, как то, что 13 – более удачный пример нечетного числа, чем 23, и что мать – более удачный пример лица женского пола, чем комедийная актриса. Уже через несколько минут испытуемые заявляли, что число может быть либо четным, либо нечетным, а человек либо женского пола, либо мужского, без переходных вариантов.
У людей есть два режима мысли. Они могут формировать размытые стереотипы, автоматически усваивая корреляции свойств и опираясь на утверждение о том, что все явления в мире склонны делиться на группы (тот, кто лает, также должен кусаться и мочиться на пожарный гидрант). В то же время люди могут создавать системы правил – интуитивные теории, которые определяют категории с точки зрения применимых к ним правил и которые оценивают все члены категории одинаково. Во всех культурах есть системы формального родства – такие точные, что по ним можно доказывать теоремы. И в нашей собственной системе родства есть совершенно четкое определение того, что такое «бабушка»: это мать одного из родителей, и наплевать, печет она кексы или нет. Законодательство, арифметика, народные традиции, социальные условности (которые включают в себя и обряды перехода, четко отграничивающие взрослых от детей и холостяков от женатых мужчин) – все это примеры систем правил, в которые включены все люди на планете. Грамматика языка – это тоже одна из таких систем119.
Системы правил позволяют нам подняться над банальным сходством и сделать выводы, основанные на трактовке явлений. Как пишут Хинтон, Румельхарт и Мак-Клелланд, «людям хорошо дается обобщение только что полученных знаний. Если, к примеру, вы узнаете, что шимпанзе любят лук, вы, вероятно повысите свою оценку вероятности того, что гориллы тоже любят лук. В сети, которая использует распределенные репрезентации, такого рода обобщения производятся автоматически»120. Это смелое заявление – современный отголосок замечания Юма о том, что от тела, схожего с хлебом по цвету и консистенции, мы ожидаем аналогичной степени питательности. Тем не менее их предположение рушится в любом случае, когда речь идет о реальных знаниях человека. Конечно, любящие лук гориллы были взяты только ради примера, но интересно отметить, что авторы этого простого примера недооценивают наши способности. Даже зная немного о зоологии и совсем немного о гориллах, я уж точно не увеличил бы свою оценку вероятности того, что гориллы любят лук. Животных можно классифицировать по нескольким признакам. Их можно сгруппировать по генеалогии и сходству в одну таксономическую категорию, например, «человекообразные», но их также можно объединить в группы, которые отличаются друг от друга способом добычи пищи: всеядные, травоядные и плотоядные. Исходя из этого принципа, я могу рассуждать следующим образом. Шимпанзе – всеядные, поэтому неудивительно, что они едят лук; в конце концов, мы, будучи всеядными, тоже его едим. А вот гориллы – травоядные; они всю жизнь жуют дикий сельдерей, чертополох и другие растения. Травоядные могут быть очень привередливы в отношении видов, которыми они питаются, потому что их пищеварительный тракт оптимально приспособлен для того, чтобы устранять влияние ядов, содержащихся только в определенных видах растений (наиболее яркий пример – это коалы, которые специализируются на поедании листьев эвкалипта). Поэтому я бы не удивился, если бы гориллы не стали есть едкий лук, что бы там ни ели шимпанзе. В зависимости от того, какую систему классификации я имею в виду, шимпанзе и гориллы будут либо очень похожими соседями по таксономической категории, либо видами столь же разными, как люди и коровы121.
В рамках ассоциационизма и его реализации в форме коннектоплаз-мы то, как представлен объект (а именно в виде совокупности характеристик), автоматически заставляет систему делать определенные обобщения (если только она не была научена избегать подобного обобщения, намеренно предъявляя примеры обратного). Альтернатива, к которой я пытаюсь подвести, – это то, что человек может мысленно представить в символической форме виды объектов, причем используемые символы могут иметь отношение к целому ряду систем правил, которые мы все время держим в голове. (В теории искусственного интеллекта этот метод называется «обобщение, основанное на объяснении», а коннекционистские модели – это образец метода, называемого «обобщение, основанное на сходстве».) Наши системы правил выражают знание в форме композиционных, выраженных количественно рекурсивных суждений, и совокупности этих суждений смыкаются, образуя модули или интуитивные теории, касающиеся конкретных областей человеческого опыта: таких, как родство, интуитивная наука, интуитивная психология, числа, законы и язык. Некоторые из этих областей более подробно освещаются в главе 5122.
Что толку в четких категориях и системах правил? В социальном мире они могут послужить для разрешения спора между враждующими сторонами, каждая из которых ссылается на нечеткую границу категории: одна сторона заявляет, что тот или иной объект входит в категорию, а другая – что не входит. Обряды посвящения, достижение совершеннолетия, выдача дипломов, лицензий и других юридических документов – все эти события проводят четкие линии, благодаря которым каждый член общества может точно знать статус любого другого его члена. Подобным образом правила, не допускающие отступлений, являются хорошей защитой против тактики поэтапных мероприятий, когда кто-то пытается, пользуясь нечеткостью категории, постепенно отвоевать «территорию», выигрывая одно спорное дело за другим.
Правила и абстрактные категории помогают разобраться и в природе вещей. Обходя вопрос сходства, они позволяют нам проникнуть под внешний слой явлений и выяснить скрытые закономерности, в соответствии с которыми функционирует окружающий нас мир. А поскольку эти закономерности в определенном смысле слова цифровые, они придают репрезентациям точность и стабильность. Если сделать копию с аналоговой записи на магнитной пленке, а потом с копии сделать еще одну копию и так далее, качество записи будет ухудшаться с каждым «поколением». Но если сделать такую же цепочку копий в цифровом формате, качество последней будет нисколько не хуже первой. Подобным образом четкие символические репрезентации позволяют составлять логические цепочки, в которых символы дословно копируются в каждую из последующих мыслей, образуя то, что в логике называют термином «сорит»123:
Все во́роны – врановые.
Все врановые – птицы.
Все птицы – животные.
Всем животным нужен кислород.
Сорит позволяет мыслителю уверенно делать выводы, несмотря на ограниченный опыт. Так, мыслитель может сделать вывод, что воронам нужен кислород, даже если никто никогда не пытался лишить ворона кислорода и посмотреть, что произойдет. Мыслитель может прийти к этому выводу, даже если он никогда не наблюдал эксперимента, в котором какое бы то ни было животное было лишено кислорода, а только слышал об этом от заслуживающего доверия специалиста. Однако если каждый логический шаг в этом рассуждении будет нечетким, или вероятностным, или осложненным частными характеристиками представителей категории предыдущего логического шага, коэффициент ухудшения будет постепенно расти. Последнее утверждение будет таким же зашумленным, как энная пиратская копия видеокассеты или последняя произнесенная шепотом фраза в игре «сломанный телефон». Представители всех цивилизаций могут выстраивать длинные цепочки рассуждений из звеньев, истинность которых они не наблюдали непосредственно. Философы неоднократно указывали на то, что именно эта способность сделала возможным существование науки123.
Как и многие другие проблемные вопросы, связанные с мышлением, полемику по поводу коннекционизма нередко сводят к полемике между врожденностью и обучением. И, как всегда в таких случаях, это затрудняет способность четко мыслить. Несомненно, обучение играет огромную роль в моделировании коннекционных сетей. Часто разработчик сетей, вынужденный вернуться к чертежной доске из-за проблем, о которых я говорил выше, решает воспользоваться способностью сети со скрытыми уровнями запоминать совокупности входов и выходов и распространять их на новые подобные им данные. Иногда можно даже заставить типовую сеть со скрытыми уровнями делать то, что вам нужно, предварительно заучив ее «до смерти». Тем не менее обучение в авральном режиме само по себе не может быть спасением для коннектоплазмы. И не потому, что у сетей слишком мало «врожденной» структуры и слишком много информации на входе из окружения, а потому что у грубой коннектоплазмы так мало мощности, что иногда приходится создавать сети, используя самую худшую комбинацию: слишком малое количество врожденной структуры в сочетании со слишком большим количеством информации на входе из окружения.
Так, Хинтон разработал трехуровневую сеть для вычисления родственных отношений. (По его замыслу, она должна была служить примером того, как работают сети, однако другие коннекционисты восприняли ее как реальную психологическую теорию.) Уровень ввода включал в себя узлы, соответствующие имени, и узлы, соответствующие типу родственных отношений, например, «Колин» и «мать». Уровень вывода включал в себя узлы, соответствующие имени человека, который находится в таких отношениях с заданным человеком, например, «Виктория». Поскольку узлы и связи составляют врожденную структуру сети, а усваивать в процессе обучения ей приходится только веса связей, эта сеть, если ее воспринимать буквально, соответствует врожденному модулю мозга, предназначенному для выдачи ответов на вопросы о том, кто состоит с указанным человеком в родственном отношении указанного типа. Эта система не пригодна для анализа родственных отношений в общем, потому что знания в ней как бы размазаны по всем весам связей, соединяющим уровень вопросов с уровнем ответов, а не хранятся в базе данных, к которой могут иметь доступ разнообразные процессы поиска информации. Следовательно, это знание окажется бесполезным, если хотя бы немного изменить вопрос: например, спросить, в каком родственном отношении состоят между собой два человека, или запросить имена членов семьи человека и родственные отношения, в которых он с ними состоит. В этом смысле модель имеет слишком большой процент врожденной структуры; она создана специально для конкретного типа вопросов124.
Научив модель воспроизводить отношения в маленькой вымышленной семье, Хинтон обратил внимание на способность системы переносить сделанные выводы на другие пары родственников. Тем не менее при этом очень мало говорилось о том, что для того, чтобы сеть могла распространить выводы на 4 возможные пары из 104, ее нужно было сначала обучить работать с первой сотней. И каждую из ста пар в режиме обучения нужно было подать в сеть 1500 раз (это в общей сложности 150000 уроков!). Здесь явно не было ничего общего с тем, как усваивают систему семейных отношений маленькие дети. Эти цифры типичны для коннекционных сетей, потому что они приходят к решению не через правила; в них просто нужно «вдолбить» большинство примеров, и тогда они смогут просто переносить знания с одного примера на другой. Любой существенно отличающийся от прочих пример обязательно должен входить в набор для обучения, иначе сеть будет делать сомнительные выводы, как в анекдоте про статистиков на утиной охоте: один стреляет на метр выше, чем нужно, второй стреляет на метр ниже, а третий кричит: «Попали!»
Почему я уделяю столь пристальное внимание коннектоплазме? Уж конечно, не потому, что я считаю моделирование нейронных сетей бессмысленным занятием – как раз наоборот! Без него все мое величественное строение рассуждений о том, как работает мозг, осталось бы парить в воздухе. И уж конечно, я не считаю, что моделирование сетей заключается всего лишь в распределении подрядов между строителями-демонами и структурами данных нейронной «аппаратуры». Многие коннекционные модели поражают тем, чего можно добиться с помощью простейших операций ментального вычисления. С другой стороны, я считаю, что достоинства коннекционизма сильно преувеличивают. Благодаря тому, что сети много рекламировали, называя их функционирование мягким, параллельным, аналогичным, биологичным, бесперебойным, они приобрели привлекательные коннотации и обширную армию поклонников. Но ведь нейронные сети не способны творить чудеса, они только выполняют определенные логические и статистические операции. Решения по таким вопросам, как представление вводных данных, количество сетей, выбранная для каждой из них схема соединений, пути данных, управляющие структуры, соединяющие их между собой, – все это может рассказать гораздо больше о том, что делает систему по-настоящему интеллектуальной, чем общие способности составляющей ее коннектоплазмы.
И все же моя главная цель – не показать, на что неспособна та или иная модель, а показать, на что способен мозг. Смысл этой главы в том, чтобы познакомить вас с материей, из которой состоит наш разум. Мысли и мышление в наше время – уже не призрачные тайны, а механические процессы, которые мы можем изучить, рассматривая и оспаривая сильные и слабые стороны разных теорий. Мне представляется особенно показательным рассмотрение недостатков освященной веками доктрины об ассоциации идей, поскольку они позволяют лучше оценить точность, тонкость, сложность и открытость нашего повседневного мышления. Вычислительные возможности разума позволяют человеку достигать вполне реальных результатов. Они находят прекрасное применение в любви, правосудии, творчестве, музыке, родственных отношениях, законодательстве, науке и других сферах человеческой деятельности, которые мы рассмотрим в следующих главах. Но прежде чем перейти к этому, нам необходимо вернуться к другому вопросу, с которого начиналась эта глава.
Лампа Аладдина
А как же сознание? Что вообще позволяет нам страдать от зубной боли или воспринимать синеву неба как синеву? Вычислительная теория сознания, даже с учетом всех ее нейронных основ, не дает однозначного ответа. Сделана запись символа синий, изменилось состояние раздела «цели», пришли в возбуждение определенные нейроны; а дальше-то что? Многим мыслителям сознание представлялось не просто проблемой, а почти чудом:
Материя может отличаться от материи только по форме, объему, плотности, движению и направлению движения; к которому из этих свойств, какими бы разнообразными они ни были и в каких бы сочетаниях ни рассматривались, можно приложить сознание? Круглая или квадратная, твердая или жидкая, движущаяся медленно или быстро, одним способом или другим – все это разные способы существования материи, и все они одинаково чужды сущности мышления.
То, что нечто столь замечательное, как состояние сознания, является результатом раздражения нервной ткани, точно так же необъяснимо, как появление Джинна, когда Аладдин потер волшебную лампу.
Мы чувствуем, что каким-то образом вода биологических тканей мозга превращается в вино сознания, но мы ровным счетом ничего не можем сказать о природе этого превращения. Кажется, что нейронные передачи просто не тот материал, который способен принести в этот мир сознание.
Сознание предлагает нам одну загадку за другой. Как может сознание быть результатом процессов в нервных тканях? Что толку в сознании? Ну, например, что может добавить наше чувственное восприятие красного цвета к цепочке причинно-следственных связей, разворачивающейся в нашем нейронном компьютере? Любое следствие восприятия красного цвета (допустим, человек заметил красный цвет на фоне зеленого, сказал вслух «Это красный», вспомнил про Санта-Клауса или пожарную машину, забеспокоился) может быть достигнуто в результате обработки информации, запущенной датчиком длинноволнового света. Так может быть, сознание – это ничего не значащий побочный эффект, возникающий при обработке символов, – как лампочки, мигающие во время работы компьютера, или гром, который всегда сопровождает молнию? А если сознание бесполезно – если существо, обладающее им, могло бы с таким же успехом справиться с окружающим миром, как и существо без него, – зачем тогда естественный отбор предпочел все же первое?
В последнее время сознание стало чем-то вроде квадратуры круга, которую все вокруг так жаждут найти. Что ни месяц, то появляется новая статья в журнале с заявлением о том, что сознание наконец удалось объяснить (при этом очень часто автор высказывает свое пренебрежение теологам и гуманистам, которые так и норовят ограничить возможности науки, или ученым и философам, которые списывают со счетов эту тему как слишком субъективную или запутанную для научного исследования)126.
Увы, многое из того, что пишут о сознании, вызывает не меньшее недоумение, чем сама проблема сознания. Стивен Джей Гулд писал: «Гомо сапи-енс – всего одна маленькая веточка [на дереве жизни]… И все же у нашей веточки, будь то к лучшему или к худшему, развилось самое необыкновенное новое качество за всю историю многоклеточных форм жизни со времени кембрийского взрыва. Мы изобрели сознание со всеми его следствиями – от Гамлета до Хиросимы»127. Гулд отрицает существование сознания у других животных, кроме человека; другие ученые допускают его существование у некоторых животных, но не у всех. Многие проверяют на сознание, наблюдая за тем, узнает ли животное, что его отражение в зеркале – это оно само, а не другое животное. Если судить по этому критерию, обезьяны, молодые шимпанзе, старые шимпанзе, слоны и маленькие дети сознанием не обладают. Единственные сознательные животные – это гориллы, орангутанги, шимпанзе в зрелом возрасте и, если верить Скиннеру и его ученику Роберту Эпштейну, специально обученные голуби. Другие ученые подходят к этому вопросу еще строже, чем Гулд: они утверждают, что даже не все люди обладают сознанием. Джулиан Джейнс заявляет, что сознание было изобретено людьми не так давно. Люди древних цивилизаций, в том числе греки времен Гомера или евреи времен Ветхого Завета, сознанием не обладали. Деннетт поддерживает это заявление; он считает, что сознание – «во многом продукт культурной эволюции, который сообщается мозгу в результате обучения в раннем возрасте» и что это «огромный комплекс мемов» («мем» – термин Докинза, обозначающий некую вызывающую подражание черту культуры – например, запоминающийся рекламный слоган или супермодную новинку).
Есть что-то такое в теме сознания, что заставляет людей, подобно Белой Королеве из книги «Алиса в Зазеркалье», поверить в шесть невозможных вещей натощак. Неужели большинство животных и впрямь могут быть бессознательными – значит, они зомби, лунатики, ходячие автоматы? Разве у собаки нет чувств, привязанностей, страстей? Если ее уколоть, разве она не чувствует боли? А Моисей – неужто он и впрямь не чувствовал вкуса соли, не видел красный цвет и не получал удовольствия от секса? Неужели дети учатся сознанию точно так же, как они учатся носить бейсболку козырьком назад?128
Люди, которые пишут о сознании, – не сумасшедшие; значит, они наверняка имеют в виду что-то другое, когда используют это слово. Одно из лучших высказываний о понятии «сознание» мы встречаем у Вуди Аллена в его вымышленном перечне дисциплин, изучаемых в колледже:
Введение в психологию: Теория человеческого поведения… Действительно ли существует непроходимая пропасть между духом и телом,
и если действительно, которым из них лучше обладать?
…Особое внимание уделяется изучению сознательного как противоположности бессознательного, причем студенты получают множество полезных советов относительно того, как легче всего не лишиться сознания[13].
Юмор слов основывается на том, чтобы предоставить читателю одно значение двусмысленного слова, а потом внезапно поразить его другим. Теоретики тоже пользуются многозначностью слова «сознание», но не ради шутки, а с тем, чтобы использовать рекламную тактику «замани и подмени»: читателя заставляют поверить, что ему сейчас предложат теорию, связанную с одним из значений этого слова – тем, которое сложнее всего интерпретировать, – а дают теорию для другого значения, которое интерпретировать проще всего. Я не люблю говорить о словарных определениях, но в случае с сознанием у нас нет иного выбора: придется для начала развести разные его значения.
Иногда слово «сознание» (англ, consciousness) используется просто как возвышенный по стилю синоним к слову «разум» (англ, intelligence). В этом значении, по-видимому, использует его и Гулд. Однако существуют еще три более узких значения, различие между которыми очень точно описывают лингвист Рэй Джекендофф и философ Нед Блок129.
Первое – это самосознание. В число разнообразных людей и объектов, информацией о которых может владеть разумное существо, входит и само это существо. Я не только могу чувствовать боль и видеть красный цвет, я еще могу подумать о себе: «Слушайте, а это ведь я, Стив Линкер, чувствую боль и вижу красный цвет!» Как ни странно, именно это не слишком распространенное значение слова чаще всего имеют в виду в научных дискуссиях. Сознание обычно определяют как «создание внутренней модели мира, включающей самого себя», «отражение своего собственного способа понимания» или как какую-нибудь другую разновидность самокопания, не имеющую ничего общего с сознанием в самом привычном его понимании: с состоянием, когда ты жив, бодрствуешь и осознаешь происходящее.
Самосознание, включая способность узнавать себя в зеркале, не более загадочно, чем любой другой вопрос, связанный с восприятием и памятью. Если у меня есть ментальная база данных на всех людей, почему в ней не может быть отдельной ячейки для самого себя? Если я могу научиться поднимать руку и изгибать шею так, чтобы увидеть какое-то труднодоступное место у себя на спине, почему же я не могу научиться поднимать зеркало так, чтобы увидеть труднодоступное место у себя на лбу? Смоделировать доступ к информации о самом себе тоже не составит совершенно никакого труда. Любой начинающий программист способен написать небольшую программу, которая может анализировать саму себя, составлять отчет и даже вносить в себя изменения. Сконструировать робота, который узнает себя в зеркале, ничуть не сложнее, чем сконструировать робота, который узнает что-либо другое. Конечно, остается ряд хороших вопросов об эволюции самосознания, о его развитии у детей, о его преимуществах (и, что еще более интересно, недостатках, как будет показано в главе 6). И все-таки самопознание – это повседневная тема для обсуждения в рамках когнитивистики, а не загадка, аналогичная превращению воды в вино. А если так легко говорить о самосознании, писатели могут сколько угодно бахвалиться своими «теориями сознания».
Второе значение – это доступ к информации. Если я спрошу: «О чем вы думаете?», вы в ответ расскажете мне, о чем мечтаете, какие у вас планы на день, что вас беспокоит, что болит, какие вокруг вас цвета, формы и звуки. Но вы не сможете рассказать, какие энзимы вырабатывает ваш желудок, какая у вас сейчас частота пульса и дыхания, какие вычисления сейчас производит ваш мозг, чтобы восстановить трехмерное изображение по двухмерному изображению на сетчатке, какие правила синтаксиса лежат в основе произносимых вами предложений, какую последовательность сокращения мышц вы используете, чтобы взять со стола стакан. Это говорит о том, что всю массу информации, обрабатываемой нашей нервной системой, можно разделить на две части. К первому разделу, включающему в себя продукты зрительного восприятия и содержимое краткосрочной памяти, открыт доступ для систем, лежащих в основе передачи речи, рационального мышления и принятия решений. Ко второму разделу, включающему в себя автономные (интуитивные) реакции, внутренние вычислительные процессы, лежащие в основе зрения, говорения, движения, а также вытесненные желания или воспоминания (если таковые имеются), доступ для этих систем закрыт. Иногда информация может перемещаться из одного раздела в другой и наоборот. Когда человек учится использовать ручную коробку передач, ему приходится продумывать каждое свое движение, но со временем этот навык переходит в разряд автоматических. С помощью усиленной концентрации внимания и биологической обратной связи мы можем сосредоточиться и на неявном ощущении вроде биения собственного сердца.
Сознание в этом смысле, конечно же, включает в себя и описанное Фрейдом разграничение между сознательным и бессознательным. Как и в случае самосознания, в нем нет ничего чудесного или даже таинственного. Более того, явные аналоги имеются и в сфере вычислительной техники. Любой компьютер имеет доступ к информации о том, работает принтер или не работает (то есть компьютер это «осознает», если употреблять данное слово в данном конкретном смысле), и может вывести на печать сообщение об ошибке: «Принтер не отвечает». Но у него нет доступа к информации о том, почему принтер не работает; сигнал, поступающий по кабелю от принтера к компьютеру, этой информации не содержит. Микросхема внутри принтера, напротив, имеет доступ к этой информации («осознает» ее в данном смысле слова); датчики в разных частях принтера подают информацию к микропроцессору, а он может включить желтую лампочку, если в картридже закончился тонер, или красную лампочку, если замялась бумага.
Наконец, мы добрались до самого интересного из всех значений этого слова. Это сознание как чувственность (англ, sentience): субъективный опыт; ощущение мира; тонкое восприятие; мир от первого лица и в настоящем времени; понимание того, «что значит» быть кем-то или делать что-то; то, что невозможно объяснить словами. В шутке Вуди Аллена актуализируется различие между сознанием в этом смысле и фрейдистским значением сознания как доступа к информации, осуществляемого созерцательной, оперирующей языком частью мышления. И именно в этом смысле – как чувственное восприятие – сознание кажется чудом.
Оставшаяся часть этой главы будет посвящена сознанию в двух последних значениях. Сначала я уделю внимание доступу к информации и тому, какие типы информации предоставляют друг другу разные части мышления. В этом смысле слова мы уже фактически подошли к пониманию того, что такое сознание. Можно рассказать много интересного о том, как оно реализуется в мозге, какую роль оно играет в производимых мозгом вычислительных операциях, о том, каким техническим требованиям оно соответствует (и, исходя из этого, какие эволюционные факторы привели к его формированию), и каким образом этими техническими требованиями объясняются основные особенности сознания: способность сенсорного восприятия, фокусное внимание, эмоциональная окраска и воля. В последнюю очередь я обращусь к проблеме чувственного восприятия.
Когда-нибудь – может быть, даже довольно скоро – у нас будет четкое понимание того, что конкретно в мозге отвечает за сознание-доступ. Фрэнсис Крик и Кристоф Кох, к примеру, составили список критериев, точно определяющих, что мы ищем. Во-первых, очевидно, что информация об ощущениях и воспоминаниях определяет поведение только у бодрствующего животного, но не у животного под действием наркоза. Следовательно, некоторые из нервных центров сознания как доступа к информации располагаются в неких структурах мозга, которые функционируют по-разному в состоянии бодрствования и в состоянии сна без сновидений или без сознания. Один из кандидатов на эту роль – нижние слои коры головного мозга. Кроме того, мы знаем, что информация о воспринимаемом объекте рассеяна по разным частям коры больших полушарий. Следовательно, для доступа к информации нужен организм, который бы связывал воедино географически разделенные данные. Крик и Кох предполагают, что одним из таких механизмов является синхронизация возбуждения нейронов, вероятно, достигаемая за счет замыкания в единый контур коры больших полушарий и таламуса – этакого центрального вокзала головного мозга. Авторы также отмечают, что намеренное, спланированное поведение требует активности передних долей мозга. Таким образом, сознание-доступ может определяться анатомией нейронных проводящих путей, ведущих из других частей мозга к передним долям. Правы авторы или нет, они показали, что решение проблемы можно вполне найти в лабораторных условиях130.
Сознание-доступ – тоже всего лишь проблема, а не тайна, учитывая то, как много мы уже знаем о вычислительных процессах, происходящих в мозге. Вспомним нашу с вами продукционную систему, находившую дядю. Она наделена общей краткосрочной памятью: рабочим пространством или доской объявлений, видимой всем демонам в системе. В отдельной части системы располагается более объемное хранилище информации – долгосрочная память, которую демоны не могут видеть, если какой-то ее элемент не будет скопирован в краткосрочную память. Многие психологи-когнитивисты указывают на тот факт, что в таких моделях краткосрочная память (общая доска объявлений, рабочее пространство общего пользования) действует в точности, как сознание. Когда мы осознаем тот или иной фрагмент информации, с ним могут работать многие компоненты мышления. Если мы видим перед собой линейку, то мы можем описать ее, протянуть за ней руку, прийти к выводу, что ею можно подпереть оконную раму, сосчитать деления на ней. По словам философа Стивена Стича, сознаваемая информация неразборчива в логических связях; она делает себя доступной для огромного количества механизмов обработки информации вместо того, чтобы быть верной всего одному. Ньюэлл и Саймон добились замечательных результатов в понимании процесса решения задач, всего лишь попросив человека размышлять вслух, работая над паззлом. Им удалось очень точно сымитировать умственную деятельность с помощью продукционной системы, в которой содержание доски объявлений пошагово соответствовало сообщениям человека о том, что он сознательно обдумывал131.
Мы многое узнали и о технических требованиях к сознанию как доступу к информации и эволюционных факторах, которые, по-видимому, привели к его появлению. Основной принцип заключается в том, что любой процессор данных должен иметь ограниченный доступ к информации, потому что у информации есть не только плюсы, но и издержки132.
Первый вид издержек – это пространство: для хранения информации требуются достаточные ресурсы. Эта закономерность очевидна любому владельцу персонального компьютера, размышляющему над тем, стоит ли ему потратиться на покупку дополнительной оперативной памяти. Конечно, мозг в отличие от компьютера оснащен огромным количеством параллельных ресурсов для хранения. Иногда теоретики выдвигают предположения, что мозг может хранить все возможные непредвиденные ситуации в готовом виде, а мышление может быть сведено к пошаговому распознаванию шаблонов данных. Вместе с тем математика комбинаторного взрыва напоминает старый лозунг канала «Эм-Ти-Ви»: много не бывает. Элементарные вычисления показывают, что количество доступных человеческому восприятию предложений, значений предложений, шахматных партий, мелодий, видимых объектов и т. д. может превосходить количество частиц во Вселенной. Например, в игре в шахматы на каждом ходу существует от 30 до 35 вариантов следующего хода, и на каждый из этих вариантов может быть от 30 до 35 реакций, что уже составляет около тысячи возможных ходов. В среднем шахматная партия состоит из сорока ходов, что дает 10120 разных шахматных партий. Для сравнения, в обозримой части Вселенной насчитывается около 1070 частиц. Именно поэтому невозможно играть в шахматы, запоминая все партии и узнавая каждую последовательность ходов. То же самое справедливо для предложений, историй, мелодий и т. д. Конечно, некоторые комбинации могут храниться в памяти, но очень скоро у вас либо закончатся ресурсы мозга, либо шаблоны начнут накладываться один на другой, создавая бесполезные гибриды и смеси. Вместо того, чтобы хранить астрономические количества входов и выходов или вопросов и ответов, процессор информации должен иметь правила или алгоритмы, которые позволяют обрабатывать за один раз одно подмножество данных и рассчитывать ответ как раз тогда, когда он нужен.
Второй тип издержек информации – это время. Точно так же, как невозможно хранить в мозге размером меньше Вселенной все возможные шахматные партии, невозможно и мысленно разыграть все шахматные партии за всю жизнь, если она не равняется возрасту Вселенной (1018 секунд). Решить задачу за сто лет с практической точки зрения ничуть не лучше, чем не решить ее вовсе. Вообще к обладателю интеллекта предъявляются даже более жесткие требования. Жизнь – это сплошная череда конечных сроков. Восприятие и поведение совершаются в реальном времени – будь то охота на животное или поддержание разговора. А поскольку сами вычислительные процессы тоже занимают время, обработка информации может стать не путем к решению проблемы, а наоборот, частью самой проблемы. Представьте туриста, который планирует вернуться в лагерь до темноты по кратчайшему пути, и тратит двадцать минут на выбор пути, который позволит ему сэкономить десять минут.
Третья статья издержек – это ресурсы. Обработка информации требует энергии. Это очевидно для любого, кто пытался растянуть заряд аккумулятора ноутбука, снизив скорость работы процессора и ограничив его доступ к информации на диске. Мышление тоже обходится нам дорого. Методы функциональной визуализации мозговой деятельности (позитронно-эмиссионная томография и магнитно-резонансная томография) основаны на том, что работающие ткани мозга вызывают прилив к ним крови и потребляют больше глюкозы.
Любой интеллектуальный агент, воплощенный в материальной форме, функционирующий в реальном времени и подчиняющийся законам термодинамики, неизбежно должен быть ограничен в своем доступе к информации. Допускать к нему следует только информацию, релевантную для решаемой в данный момент проблемы. Это не означает, что агент должен носить шоры на глазах или страдать амнезией. Информация, нерелевантная в данный момент и для данной цели, может оказаться релевантной в другое время и для другой цели. Следовательно, необходимо распределение информации. Информация, которая всегда нерелевантна для того или иного вычислительного процесса, должна быть постоянно изолирована от него. Информация, которая иногда релевантна, а иногда нерелевантна, должна быть доступна для вычислительного процесса, когда она релевантна – в той мере, в которой это можно спрогнозировать заранее. Это техническое требование объясняет, почему сознание как доступ к информации существует в человеческом мышлении, а также позволяет нам понять некоторые его особенности.
Сознание-доступ имеет четыре явные отличительные черты. Во-первых, мы в той или иной степени осознаем огромное разнообразие чувственных ощущений: цвета и формы окружающих нас объектов, звуки и запахи, в которых мы купаемся, давление и боль в тканях кожи, костей и мышц. Во-вторых, отдельные фрагменты этой информации могут оказываться в центре внимания, попадать в краткосрочную память и исчезать из нее, давая пищу для размышлений. В-третьих, ощущения и мысли не существуют без эмоциональной окраски: они могут быть приятными или неприятными, интересными или отвратительными, волнующими или успокаивающими. Наконец, существует некий исполнительный элемент, «Я», который делает выбор и нажимает на рычаги поведения. У каждой из этих особенностей есть четкая роль в адаптивной организации мысли и восприятия в целях принятия рациональных решений и осуществления рациональных действий.
Давайте начнем со сферы восприятия. Джекендофф, проанализировав разные уровни ментальных репрезентаций, используемые разными модулями, задался вопросом о том, какой из уровней соответствует осознанию настоящего времени. Например, обработка зрительной информации начинается с колбочек и палочек на сетчатке и, проходя через промежуточные уровни репрезентации контуров, глубины, поверхности, заканчивается распознаванием объектов, находящихся у нас перед глазами. Понимание языка начинается с непосредственно воспринимаемого звука и через репрезентации слогов, слов и словосочетаний идет к пониманию смысла высказывания.
Джекендофф заметил, что сознание-доступ использует промежуточные уровни. Люди не осознают нижние уровни чувственного восприятия. Мы ведь не проводим всю жизнь, размышляя, как герой Пруста, над каждой крошкой пирожного «мадлен» и каждым оттенком настойки из липового цвета. Мы в буквальном смысле не видим «светлоту» угля при солнечном свете и «темноту» снежка в помещении, не видим бледного серо-зеленого оттенка «черных» точек на телеэкране или «резиновых» параллелограммов, которые проецирует на нашу сетчатку движущийся квадрат. Мы «видим» продукт тщательной обработки: поверхности объектов, их цвета и фактуру поверхности, их глубину и наклон. Звуковая волна, которую улавливают наши ушные раковины, состоит из искаженных и смешанных в одну кучу слогов и слов, но мы не слышим этой непрерывной акустической ленты, мы «слышим» цепочку из четко отделенных друг от друга слов. Вместе с тем непосредственно осознаваемое нами не представляет собой и исключительно верхний уровень представления данных. Высшие уровни – содержимое окружающего мира или суть сообщения – обычно остаются в долгосрочной памяти целые дни и годы спустя, но в самом процессе восприятия мы осознаем только изображение и звуки. Ведь когда мы видим лицо, мы не думаем отвлеченно «Лицо!»; мы воспринимаем его полутона и изгибы133.
Преимущества осознания промежуточного уровня заметить несложно. Наше неизменное восприятие формы и освещения независимо от условий наблюдения позволяет выявить присущие объекту свойства: кусок угля всегда остается твердым и черным, даже если мы передвигаем его или усиливаем освещение, и поэтому в нашем восприятии он всегда выглядит одинаково. Нижние уровни восприятия нам не нужны, а одних только высших уровней недостаточно. Необработанные данные и этапы вычислительного процесса, лежащие в основе этого постоянства, изолированы от нашего восприятия: несомненно, потому что они, будучи основаны на извечных законах оптики, не имеют нужды в обмене информацией с остальными компонентами когнитивной деятельности. Продукты вычисления становятся доступны для общего потребления задолго до установления тождества объекта, потому что для того, чтобы идти по жизни, нам нужно нечто большее, чем краткие сведения об окружающей обстановке. Поведение – это игра в дюймы, в которой геометрия и структура каждой поверхности должна быть доступна механизмам принятия решений, планирующим наш каждый следующий шаг. Аналогичным образом в процессе понимания предложения нам ничего не даст вслушивание в каждый шум и свист звуковой волны; звуки должны быть декодированы в слоги прежде, чем они будут соотнесены с чем-то значимым в нашем ментальном словаре. Декодер речи использует специальный ключ, неограниченный по сроку действия, поэтому ему не должны мешать в этом ответственном деле непрошеные советчики – остальные компоненты мышления. Однако, как и в случае зрения, остальные компоненты мышления не может удовлетворить один только конечный продукт – в данном случае, общий смысл сказанных слов. Подбор слов и интонация тоже несут информацию, которая позволяет нам слышать дополнительный смысл между строк.
Следующая примечательная характеристика сознания как доступа к информации – это фокусировка внимания. Она служит наиболее ярким доказательством того, что неосознаваемая параллельная обработка данных (при которой несколько входов обрабатываются одновременно, каждый – отдельным мини-процессором) имеет ограниченные возможности. На начальном этапе параллельная обработка выдает максимально возможный результат и передает дальше представление данных, из которого более стесненный в средствах и перегруженный работой процессор должен выбрать нужную ему информацию. Психолог Энн Трисман придумала несколько простых и теперь уже ставших классическими опытов, показывающих, где заканчивается неосознаваемая и начинается осознаваемая обработка данных134. Людям показывали на экране цветные формы – например, крестики и нолики, и просили нажать кнопку, когда они увидят указанную цель. Если целью поиска был нолик, и на экране появлялся один нолик среди целого моря крестиков, испытуемый реагировал быстро. Неважно, сколько вокруг крестиков, люди все равно утверждают, что нолик прямо-таки бросается в глаза (этот феномен, известный теперь как «эффект выскакивания», прекрасно иллюстрирует процесс неосознаваемой параллельной обработки). Аналогичным образом зеленый нолик «выскакивает» из огромного количества красных ноликов. В то же время, если экспериментатор просит человека найти зеленый нолик, и при этом он будет располагаться среди множества перемешанных между собой зеленых крестиков и красных ноликов, человеку приходится сознательно искать нужный символ по всему экрану, символ за символом, и проверять каждый из них на соответствие этим двум критериям одновременно. Задание превращается в аналог детского комикса «Где Уолдо?», в котором главный герой, одетый в полосатую бело-красную кофту, прячется среди толпы людей, одетых в красную, белую или полосатую одежду.
Что же происходит на самом деле? Представьте, что поле зрения усеяно тысячами крохотных процессоров, каждый из которых различает один цвет или простую форму – кривую, угол или линию – каждый раз, когда этот элемент появляется в месте расположения процессора. Результат работы совокупности таких процессоров выглядит следующим образом: красный красный красный красный зеленый красный красный красный и т. д. Результат работы другой совокупности процессоров выглядит следующим образом: прямая прямая прямая кривая прямая прямая прямая и т. д. На эти процессоры накладывается уровень детекторов лишнего элемента. Каждый из них охватывает группу детекторов цвета или линий и «маркирует» любой участок в поле зрения, который отличается от соседних по цвету или очертаниям. Зеленый в окружении красного получает маленький дополнительный флажок. Все, что нужно, чтобы увидеть зеленый среди красного, – это заметить флажок, а эта задача под силу даже самому примитивному демону. Нолик среди крестиков можно обнаружить точно так же. С другой стороны, тысячи процессоров, выстроившихся рядами по всему полю зрения, слишком глупы, чтобы обнаружить конъюнкцию двух условий: например, участок, который одновременно зеленый и кривой или красный и прямой. Конъюнкцию может обнаружить только машина с программируемой логикой, которая смотрит на каждую часть поля зрения поочередно через узкое подвижное окошко и передает свой ответ остальным элементам системы восприятия.
Почему визуальное вычисление делится на стадию неосознанной параллельной обработки данных и осознанной серийной обработки данных? Конъюнкция – элемент комбинационной логики. Было бы невозможно расположить детекторы конъюнкций на каждом участке поля зрения, потому что существует слишком много видов конъюнкций. Участков поля зрения миллион, поэтому количество требуемых процессоров составило бы миллион, помноженный на количество логически возможных конъюнкций: количество цветов, которые может различать человек, помноженное на количество фигур, помноженное на количество вариантов глубины, помноженное на количество направлений движения, помноженное на количество скоростей, и так далее. Цифра, полученная в результате, будет просто астрономической. Параллельное неосознанное вычисление прекращается после того, как присвоит каждому участку пометку с цветом, формой, глубиной, направлением движения. Затем начинается осознанное вычисление комбинаций, по одному участку за каждый момент времени.
Данная теория позволяет сделать поразительный вывод. Если процессор осознанного вычисления фокусируется на одном участке, характеристики других участков должны просто существовать не связанными между собой. Например, человек, не уделяющий намеренно внимания какой-либо области экрана, не должен знать, есть ли на ней красный крестик и зеленый нолик или зеленый крестик и красный нолик, – цвет и форма должны существовать независимо друг от друга в разных плоскостях до тех пор, пока процессор осознанной обработки не свяжет их воедино в определенной точке. Трисман обнаружила, что именно так и происходит. Если испытуемых отвлечь от некоторых цветных букв, они могут назвать буквы и могут назвать цвета, но ошибаются, говоря о том, какого цвета была какая буква. Эти ошибки – замечательное проявление ограничений неосознанной обработки визуальной информации, и в повседневной жизни они тоже встречаются нередко. Когда мы смотрим на слова мельком или уголком глаза, буквы иногда сами собой меняются местами. Один психолог начал изучать данное явление после того, как однажды, проходя мимо автомата для продажи кофе, с удивлением подумал, почему на нем написано «Худший кофе в мире» (англ. World's Worst Coffee). Конечно, на самом деле на автомате было написано «Лучший кофе в мире» (англ. World's Best Coffee). Как-то примерно то же самое случилось со мной, когда мне показалось, что на рекламном щите я увидел надпись «бордель» (англ, brothel); на самом деле, конечно, это был отель под названием Brothers’ Hotel. Однажды, просматривая журнал, я увидел заголовок об антисемитских фотоаппаратах (англ, anti-semitic), которые на самом деле были просто антикварными (англ, semi-antique)135.
Есть ряд препятствий, ограничивающих поток информации как извне, так и изнутри мозга. Когда мы пытаемся извлечь из памяти информацию, элементы воспоминаний всплывают в памяти по одному и очень часто – с мучительно длительными перерывами, если информация старая или редко встречающаяся. С тех самых пор, когда Платон впервые сравнил память с расплавленным воском, психологи считали, что нейронный носитель должен от природы быть резистентным к длительному хранению информации, и со временем информация будет стираться, если только ее не «вдолбить» в память накрепко. Вместе с тем отдельные воспоминания могут быть неизгладимо запечатлены в мозге – например, шокирующая новость и некоторые детали того, что происходило вокруг в тот момент, когда человек ее услышал136. Так что вполне возможно, что нейронный носитель информации тут ни при чем.
Психолог Джон Андерсон, осуществив обратное проектирование процесса извлечения воспоминаний из человеческой памяти, показал, что ограничения нашей памяти – это не побочный эффект того, что наш носитель информации слишком ненадежен. Как любят говорить программисты, «это не ошибка, а конструктивная особенность». В оптимально сконструированной системе поиска единица информации извлекается только в том случае, если его релевантность перевешивает затраты на ее поиск137. Любой, кто когда-либо использовал систему компьютеризированного поиска в библиотеке, быстро начинает проклинать поток названий, вываливающихся на экран при запросе. Живой библиотекарь, несмотря на наши якобы ограниченные возможности поиска информации, однозначно превосходит любой компьютер в способности найти в картотеке нужный элемент информации. Когда мне нужно найти статьи по какой-то теме в малознакомой мне сфере, я не использую библиотечную систему поиска, а посылаю электронное письмо знакомому специалисту по этой сфере.
Какой же должна быть оптимально спроектированная система поиска информации? Она должна выдавать информацию, которая с наибольшей вероятностью окажется наиболее полезной в момент запроса. Но как это можно знать заранее? Можно оценить вероятность, опираясь на общие законы касательно того, какого типа информация с наибольшей вероятностью может оказаться полезной. Если такие законы существуют, скорее всего, их следует искать в информационных системах в целом, а не только в человеческой памяти. Так, эти законы должны проявлять себя в статистике книг, на которые делаются запросы в библиотеке, или файлов, запрашиваемых в поисковой системе компьютера. Специалисты по информатике открыли несколько таких законов. Единица информации, которая в прошлом запрашивалась несколько раз, с большей степенью вероятности может понадобиться в данный момент, чем единица, которая в прошлом запрашивалась очень редко. Единица, которую запрашивали недавно, с большей степенью вероятности может понадобиться в данный момент, чем единица, которую не запрашивали в течение некоторого времени. Оптимальная система поиска информации, таким образом, должна быть предрасположена к тому, чтобы находить единицы информации, с которыми она недавно и часто имела дело. Андерсон отмечает, что именно так поступает поисковая система человеческой памяти: мы помним часто повторяющиеся и недавние события лучше, чем редкие и давно минувшие. В исследованиях, посвященных памяти, он нашел еще четыре хорошо известных явления, соответствующих недавно установленным требованиям к компьютерным системам обнаружения информации.
Третья примечательная черта сознания как доступа к информации – это эмоциональная окрашенность переживаемого. Мы не только замечаем события – мы отмечаем их для себя как приятные или болезненные. Это заставляет нас стремиться к первым и избегать последних – как в данный момент, так и в будущем. Все это ни для кого не секрет. На уровне вычислительных процессов репрезентации запускают целевые состояния, которые, в свою очередь, запускают демонов, ответственных за сбор информации, решение проблем и выбор поведения, и рассчитывающих, как достичь, избежать или модифицировать эмоционально заряженную ситуацию. С эволюционной точки зрения, нет ничего загадочного в том, почему мы стремимся к тем целям, к которым стремимся, – почему, к примеру, любой человек предпочтет заняться любовью с привлекательным партнером, а не получить удар по животу мокрой рыбой. Вещи, которые становятся объектом нашего желания, – это вещи, которые обычно приводили к увеличению шансов на выживание и продолжение рода в тех условиях, в которых нам приходилось эволюционировать: вода, еда, безопасность, секс, положение в обществе, превосходство над силами природы, благосостояние детей, друзей и родственников138.
Четвертая особенность сознания – это способность направлять свои силы на достижение цели: нечто ощущаемое нами, как самость, воля, собственное «я». Мышление, по словам пионера искусственного интеллекта Марвина Минского, – это сообщество агентов. Дэниел Деннетт пишет, что это огромное множество черновых набросков, добавляя: «искать президента в Овальном кабинете мозга – это ошибка».
Сообщество мышления – это чудесная метафора, и я с удовольствием воспользуюсь ею, когда буду подробнее писать об эмоциях. И все же будет слишком, если, руководствуясь этой теорией, мы будем отрицать существование какой бы то ни было системы в мозге, которая предоставляет «право голоса» то одному, то другому агенту поочередно. Агенты мозга вполне могут быть и организованы в иерархию вложенных подпрограмм, снабженную совокупностью основных правил принятия решений, вычислительным демоном, или агентом, или добрым гомункулом, сидящим на верхнем уровне цепочки управления. Это будет не призрак в машине, а всего лишь еще одна совокупность правил поиска решений или нейронная сеть, которая передает управление самому быстрому или сильному агенту из расположенных уровнем ниже.
Мы даже знаем кое-что о структурах мозга, в которых содержится схема принятия решений. Невролог Антонио Дамасио отметил, что повреждение переднего отдела поясной борозды, принимающей входную информацию от многих расположенных выше зон восприятия и соединенную с более высокими уровнями моторной системы, приводит к странному состоянию: кажется, что пациент воспринимает происходящее, но он не отвечает на внешние стимулы. Эти результаты заставили Фрэнсиса Крика провозгласить, хотя и отчасти в шутку, что обнаружено место расположения воли140. Неврологам уже много десятилетий известно, что за проявление воли – за выработку и выполнение планов – отвечают лобные доли мозга141. Мне известен очень характерный, хотя и печальный пример: один человек обратился ко мне по поводу своего пятнадцатилетнего сына, перенесшего травму лобных долей мозга в результате автокатастрофы. Мальчик часами оставался в душе, потому что не мог решить, когда ему нужно выходить; не мог выйти из дома, потому что все время возвращался в комнату, чтобы проверить, выключил ли он свет.
Зачем же сообществу ментальных агентов нужен руководитель? Причина столь же понятна, как и старая еврейская пословица: «Нельзя плясать на двух свадьбах сразу, если у тебя всего одна задница». Неважно, сколько у нас в мозге агентов, главное, что у каждого из нас всего одно тело – не больше и не меньше. Забота о каждой его части должна быть поручена управляющему устройству, которое будет выбирать план из гула конкурирующих между собой агентов. Глазам нужно в каждый момент времени фокусироваться на каком-то одном объекте; им нельзя сосредоточиваться на пустом пространстве посредине между двумя интересными объектами или колебаться от одного к другому, как в перетягивании каната. Движение конечностей нужно скоординировать так, чтобы переместить тело или объекты на его траектории таким образом, чтобы достичь цели только одного из агентов мышления. В противном случае сообщество мышления будет поистине эгалитарным; эта альтернатива представлена в изумительно глупом фильме «Весь я» (All of Me). Лили Томлин играет в нем мнительную миллионершу, которая заказывает ритуал реинкарнации, чтобы ее душу переселили в тело другой женщины. Во время ритуала горшок с ее душой падает из окна и попадает прямо в голову прохожего, которого играет Стив Мартин. Дух героини Томлин находит себе место в правой половине его тела, в то время как контроль над левой половиной остается за ним. Теперь он передвигается зигзагом: сначала его левая половина идет широким шагами в одну сторону, потом правая половина, жеманно отставив пальчик на руке, семенит в другую.
Итак, с сознанием-доступом все более или менее ясно. А как же сознание в значении «чувственность»? Вероятно, чувственность и доступ представляют собой две стороны одной монеты. Наше субъективное переживание необходимо в качестве материала для рассуждений, речи и действий. Мы ведь не просто переживаем зубную боль: мы жалуемся на нее и идем к зубному врачу.
Нед Блок попытался прояснить разграничение между доступом и чувственностью, придумав ситуации, в которых доступ может существовать без чувственности и наоборот. Примером доступа без чувственности может быть необычный синдром, известный как слепозрение. Если у человека обширное слепое пятно на сетчатке вследствие повреждения зрительной зоны коры мозга, он будет упорно отрицать, что что-либо видит, но если его заставить угадать, где находится объект, он справится гораздо лучше, чем если бы это была просто догадка. Одно из объяснений состоит в том, что «слеповидящий» имеет доступ к предметам, но не ощущает их чувственно. Правильно это объяснение или нет, оно показывает, что различие между доступом и способностью ощущать существенна. Способность ощущать без доступа может иметь место, когда вы поглощены разговором и вдруг замечаете, что за окном работает отбойный молоток и что вы уже в течение некоторого времени его слышите, но не замечаете. До своего прозрения вы чувственно ощущали шум, но не имели доступа к нему. Тем не менее Блок признает, что такие примеры немного неестественны, и полагает, что в реальной жизни доступ и чувственность идут рука об руку142.
Следовательно, нам, может быть, и не нужна отдельная теория относительно того, где в мозге возникает способность ощущать, как она вписывается в теорию мыслительных вычислений или в связи с чем она возникла в процессе эволюции. Вероятно, это дополнительное свойство некоторых типов доступа к информации. Что нам нужно – так это теория того, как из обычного доступа к информации возникают субъективные качества способности ощущать. Следовательно, чтобы покончить с этой историей, я должен представить теорию, которая ответила бы на следующие вопросы:
• Если мы когда-либо сможем воспроизвести процесс обработки информации в человеческом мышлении в форме огромной компьютерной программы, будет ли это означать, что компьютер, на котором выполняется эта программа, обладает сознанием?
• Что, если бы мы взяли эту программу и научили большое количество людей (скажем, все население Китая) держать в уме ее данные и выполнять выполняемые ею шаги? Можно ли сказать, что в этом случае над Китаем образовалось бы одно гигантское сознание, отличное от сознаний миллиарда отдельных людей? Если они будут воспроизводить состояние мозга, соответствующее состоянию организма, испытывающего мучительную боль, будет ли кто-то действительно испытывать боль, даже если каждый из участников программы будет весел и беззаботен?
• Предположим, что зона визуального восприятия в задней части мозга хирургическим путем отделена от остальной его части, но при этом продолжает функционировать внутри черепа и получать информацию от глаз. С точки зрения бихевиоризма, человек по всем параметрам слеп. Можно ли сказать, что в задней части черепа отдельно от всего остального мозга существует визуальное сознание – нечто немое, но полностью осознающее все происходящее? А что, если эту часть мозга удалить и поддерживать ее функционирование в лабораторной чашке?
• Может ли ваше восприятие красного быть таким же, как мое восприятие зеленого? Вероятно, вы называете траву «зеленой», а помидоры – «красными», как и я, но ведь вполне возможно, что на самом деле вы видите цвет травы таким, как я бы описал красный, будь я на вашем месте.
• Возможно ли существование зомби? То есть может ли существовать человекоподобное создание, которое действует так же разумно и эмоционально, как вы и я, но у которого «никого нет дома», кто мог бы по-настоящему что-либо чувствовать или видеть? Как я могу быть уверен в том, что вы – не зомби?
• Если бы кто-нибудь мог загрузить состояние моего мозга и воспроизвести его, используя другую совокупность молекул, обладал бы этот новый мозг моим сознанием? Если бы кто-нибудь уничтожил оригинал, а двойник продолжал бы жить моей жизнью, мыслить моими мыслями и чувствовать мои чувства – можно было бы сказать, что меня нет в живых? Можно ли сказать, что капитан Кирк прекращал свое существование и заменялся двойником всякий раз, как он входил в отсек телепортации?
• Каково это – быть летучей мышью? Получают ли жуки удовольствие от секса? Кричит ли червяк от боли, когда рыбак насаживает его на крючок?
• Хирурги заменяют один из нейронов в вашем мозге микрочипом, который в точности имитирует его функции ввода-вывода. Вы чувствуете себя и ведете себя в точности, как раньше. Потом они заменяют второй нейрон, третий, и так далее, и ваш мозг постепенно превращается в кремний. Поскольку каждый микрочип делает в точности то же, что делал нейрон, ваше поведение и память не изменяются. Но заметите ли вы разницу? Будет ли это похоже на смерть? Появится ли внутри вас другое сознательное существо? Этот вопрос просто сводит меня с ума! У меня есть кое-какие предрассудки относительно этого, но ни малейшего понятия даже о том, с чего начать искать аргументированный ответ. И никто не знает. Как только мы разберемся в вечной путанице между способностью ощущать, доступом и самосознанием, сразу становится ясно, что вычислительная теория сознания тоже не может дать вразумительный ответ – как и все открытия нейробиологии143.
Как же можно в книге с названием «Как работает мозг» избежать необходимости объяснения, откуда берется способность ощущать? Полагаю, я мог бы сослаться на доктрину логического позитивизма, утверждающую, что если суждение не может быть проверено, то оно бессмысленно. Неразрешимые вопросы в моем списке касаются вещей, которые по определению нельзя проверить. Многие мыслители (например, Деннетт) приходили к выводу, что рассуждать о них означает всего лишь бравировать своим замешательством: свойства чувственного опыта (или, как его называют философы, квалиа) – это когнитивная иллюзия. Стоит только отделить от него вычислительные и неврологические корреляты сознания-доступа, и нам нечего объяснять. Просто абсурдно настаивать на том, что чувственность остается необъясненной, когда мы объяснили все проявления чувственности, лишь на том основании, что в вычислительных процессах нет никакого элемента чувственных ощущений. Это все равно что утверждать, что влажность остается необъясненной даже тогда, когда все проявления влажности объяснены, ссылаясь на то, что движущиеся молекулы не являются влажными.
Большинство людей не принимают этот аргумент, но указать конкретные его недостатки не так уж легко. Философ Джордж Рей как-то сказал мне, что у него нет чувственных ощущений. Он утратил способность ощущать после того, как в возрасте 15 лет попал на велосипеде в аварию. С тех пор, как он утверждает, он стал зомби. Полагаю, что это ирония, но как я могу знать наверняка? Именно это он и хотел доказать своим заявлением.
У тех, кто старается развенчать идею квалиа, есть для этого основания. На данный момент у нас нет никакого научного подтверждения существования этого чудесного дополнительного ингредиента, благодаря которому возникает чувственность. Что касается научного объяснения, его может вообще не существовать. Дело даже не в том, что все утверждения относительно чувственности подозрительно недоказуемы. Дело в том, что даже если их можно было бы проверить, это все равно ничего не изменило бы. Наша неспособность понять чувственность совершенно не мешает нашему пониманию того, как работает мышление. Обычно бывает так, что отдельные части научной проблемы совмещаются друг с другом, как слова в кроссворде. Чтобы реконструировать процесс эволюции человека, антропология должна найти кости первобытных людей, археология – разобраться в том, какими были инструменты, молекулярная биология – установить время отделения людей от шимпанзе, палеоботаника – восстановить среду обитания по ископаемой пыльце. Если не хватает всего одного кусочка паззла – например, недостаточно останков шимпанзе или нет уверенности в том, был ли климат сухим или влажным, – этот пробел ощущается чрезвычайно остро, и все с нетерпением ждут того дня, когда он будет заполнен. Однако если говорить об изучении мышления, чувственность здесь существует как бы в отдельном измерении, парит над причинно-следственными связями психологии и нейробиологии. Если мы когда-нибудь сможем выстроить всю цепочку нейровычислительных процессов, ведущих от восприятия через рассуждение и эмоции к поведению, единственное, чего в этой цепочке будет недоставать из-за отсутствия теории чувственности – это понимания самой чувственности.
И все же сказать, что у нас нет научного объяснения чувственности, – не то же самое, что сказать, будто сознания не существует вовсе. Я точно также уверен в том, что обладаю сознанием, как в чем-либо другом, и готов поспорить, что вы чувствуете то же самое. Хотя я готов согласиться с тем, что мое любопытство относительно природы сознания, вероятно, никогда не будет удовлетворено, я отказываюсь верить, что пребываю в заблуждении, когда утверждаю, что обладаю сознанием! (Приводимая Деннеттом аналогия с необъяснимой влажностью неубедительна: влажность сама по себе является субъективным ощущением, поэтому неудовлетворенность наблюдателя опять сводится к проблеме сознания – чувственности). И мы не можем совершенно исключить сознание из своих рассуждений или свести его к понятию доступа к информации, потому что без него невозможно моральное суждение. Понятие сознания лежит в основе нашей уверенности, что применять пытки – плохо и что выведение из строя робота – это порча собственности, а выведение из строя человека – это убийство. Именно поэтому смерть любимого человека заставляет нас переживать не просто жалость к себе в связи с потерей, а необъяснимую боль от осознания того, что мысли и желания человека исчезли вместе с ним навеки.
Если вы доберетесь вместе со мной до конца книги, то узнаете о моих догадках касательно тайны сознания. Тем не менее тайна остается тайной, темой, больше подходящей не для ученых, а для философов, для многочасовых ночных бесед в комнате студенческого общежития – и, конечно же, еще для одной сферы:
На микроскопической песчинке, плывущей сквозь пространство, написан фрагмент человеческой жизни. Оставлено ржаветь то место, где он жил, и те машины, которые он использовал. Без применения они рассыплются от ветра и песка и от действия времени; все машины мистера Корри – включая ту, которая была создана по его образу и подобию и оживотворена любовью, а теперь покинута… в Сумеречной Зоне.144