Глава третья. В которой компьютеры учатся сотрудничеству
Дилемма заключенного
«Таким образом, я приучаюсь оказывать другому человеку услугу, даже не чувствуя к нему истинного расположения, ибо предвижу, что он ответит мне тем же, тоже ожидая ответной услуги и рассчитывая на поддержание взаимного обмена услугами со мной и с другими людьми. Следовательно, если я оказал ему услугу и он воспользовался выгодой, проистекающей из моего поступка, он вынужден внести и свою долю [в обмен услугами], так как предвидит последствия своего отказа».
В опере Пуччини «Тоска» главная героиня сталкивается с ужасной дилеммой. Ее возлюбленный Каварадосси приговорен к смерти Скарпиа, начальником полиции. Последний предлагает Тоске сделку. Если она подарит ему ночь, он спасет жизнь ее любимого, приказав расстрельной команде использовать холостые патроны. Тоска решает обмануть Скарпиа: она соглашается на его требование, но после того, как тот отдает соответствующий приказ, убивает его. Увы, слишком поздно выясняется, что Скарпиа тоже солгал: патроны настоящие, и Каварадосси погибает. Тоска заканчивает жизнь самоубийством. В итоге мертвы все трое.
Хотя прямо они об этом не говорили, но Тоска и Скарпиа играли в игру – самую известную во всей теории игр, мудреном разделе математики, представляющем собой необычный мост между биологией и экономикой. Игра эта явилась главным элементом одного из наиболее волнительных научных открытий последних лет: понимания причин доброго отношения людей друг к другу. Более того, и Тоска, и Скарпиа играли так, как, согласно теории игр, они и должны были это делать, несмотря на катастрофический исход для каждого. Как же это может быть?
Игра называется дилеммой заключенного и применима везде, где имеет место конфликт между личными интересами и общим благом. С одной стороны, и Тоска, и Скарпиа только выиграли бы, придерживаясь каждый своей части сделки: девушка выручила бы из беды любимого, а мужчина переспал бы с ней. С другой стороны, каждому в отдельности гораздо выгоднее было заставить другого выполнить свою часть сделки, а самому обмануть: Тоска спасла бы возлюбленного и свою честь, а Скарпия получил бы удовольствие и отделался от врага.
Дилемма заключенного представляет собой очевидный пример того, как добиться сотрудничества эгоистов – не зависящего ни от запретов, ни от моральных ограничений, ни от этического императива. Как личные интересы могут заставить человека служить общему благу? Свое название игра получила благодаря байке о двух арестантах, которой обычно и объясняют ее суть. Перед каждым стоит выбор: либо дать показания против другого и тем самым скостить себе срок, либо промолчать. Дилемма заключается в следующем: если не донесет никто, полиция приговорит обоих за меньшее преступление. Оба только выиграют, если будут хранить молчание, но каждый в отдельности выиграет больше, если донесет.
Почему? Выкиньте из головы заключенных и представьте себе простую математическую игру, в которую вы играете с другим человеком на очки. Если вы оба выбираете сотрудничество («храните молчание»), каждый получает три пункта (это называется «наградой»); если вы оба предаете, каждый получает по одному («наказание»). Но если один предает, а другой сотрудничает, последний получает ноль очков («штраф простофиле»), а первый – пять («искушение»). То есть, если ваш партнер предает, вам тоже лучше предать. Таким образом, вы получите одно очко – и это явно лучше, чем вообще ничего. Если же ваш партнер сотрудничает, вам все равно лучше предать: получите вместо трех баллов все пять. Вывод: что бы ни делал другой человек, вам всегда лучше предавать. Поскольку ваш партнер рассуждает точно так же, результат всегда один и тот же: обоюдное предательство. И по одному очку каждому, хотя можно было заработать по три.
Не позволяйте собственной нравственности ввести себя в заблуждение. Тот факт, что, сотрудничая, вы оба проявляете благородство, для данного вопроса совершенно неуместен. Мы ищем не «правильный» поступок, а логически «наилучшее» действие в моральном вакууме. А это предательство. Быть эгоистичным – рационально.
Дилемма заключенного стара как мир; Гоббс точно ее понимал. Как и Руссо, в своей короткой, но знаменитой истории об охоте на оленя мельком описавший более утонченную ее версию, известную под названием координационной игры. Изображая примитивных людей на охоте, он писал:
«Если охотились на оленя, то каждый понимал, что для этого он обязан оставаться на своем посту; но если вблизи кого-либо из охотников пробегал заяц, то не приходилось сомневаться: этот охотник без зазрения совести пустится за ним вдогонку и, настигнув его, весьма мало будет сокрушаться о том, что таким образом лишил добычи своих товарищей»54.
Дабы понять, что имел в виду Руссо, предположим, будто на охоту отправилось все племя. Как правило, охотники окружают чащу, в которой затаился олень, и начинают сходиться. Рано или поздно животное попытается прорваться сквозь оцепление. В этот момент, если все идет хорошо, его убивает ближайший к нему охотник. Но представьте, что один из них вдруг вспугнет зайца. Он точно его поймает – но только если выйдет из круга. В результате, образуется небольшой промежуток, через который олень и убегает. С охотником, поймавшим зайца, все в порядке – мясо у него есть. А вот остальные расплачиваются за его эгоизм пустыми желудками. Выходит, решение, правильное для индивида, оказалось неправильным для группы. Это лишний раз доказывает, каким бесперспективным и безнадежным проектом является социальная кооперация (холодно добавляет мизантроп Руссо).
Что бы ни делал другой человек, вам всегда лучше предавать. Поскольку ваш партнер рассуждает точно так же, результат всегда один и тот же: обоюдное предательство.
Современную версию охоты на оленя предложил Дуглас Хофштадтер[27]. Называется она «дилемма волка». 20 человек сидят каждый в своей кабинке, держа руку на кнопке. Каждый получает 1000 долларов, если в течение 10 минут ее никто не нажимает. Человек, который делает это, получает 100 долларов, а все остальные – ничего. Если вы умны, то не станете нажимать кнопку и заберете 1000 долларов. Если вы очень умны, то осознаете крошечную вероятность того, что кто-то окажется достаточно глуп и таки нажмет свою кнопку, – а значит, вам лучше нажать свою первым. А если вы очень-очень умны, то понимаете, что очень умные люди тоже это понимают и тоже нажмут свои кнопки. В этом случае вам опять-таки лучше нажать свою, причем как можно быстрее. Как и в дилемме заключенного, логика ведет к коллективной катастрофе55.
Несмотря на свой почтенный возраст, дилемма заключенного была впервые сформулирована в качестве игры лишь в 1950 году двумя – математиками корпорации RAND (Калифорния) Мерриллом Флудом и Мелвином Дрешером. Несколько месяцев спустя Альберт Такер из Принстонского университета представил ее в качестве истории о двух заключенных. Флуд и Дрешер понимали: дилеммы заключенного окружают нас повсюду. Грубо говоря, любая ситуация, в которой вы хотите сделать нечто, но знаете, что если так же поступят все остальные, то это будет ошибкой, скорее всего – дилемма заключенного. (Согласно формальному математическому определению, дилемма заключенного – везде, где искушение больше, чем награда, которая больше, чем наказание, которое больше, чем штраф простофиле, хотя если искушение огромно, игра меняется). Если бы на каждого можно было положиться в том, что он не угонит чужой автомобиль, машины не пришлось бы запирать и удалось бы сэкономить уйму времени и денег на страховку, сигнализацию и тому подобное. Все мы только выиграем от этого. Но в таком доверчивом мире каждый обретет еще больше, если отступит от общественного договора и таки украдет авто. Аналогичным образом, рыбаки только выиграют, если каждый проявит сдержанность и не станет ловить слишком много рыбы. Но если каждый ловит столько, сколько может, проявляющий сдержанность всего-навсего лишается своей доли в пользу более эгоистичного товарища. То есть все мы коллективно расплачиваемся за индивидуализм.
Тропические дождевые леса, как ни странно – результат дилемм заключенного. Деревья тратят огромное количество энергии на рост, а не на размножение. Если бы они могли прийти к соглашению с конкурентами, объявить стволы вне закона и соблюдать максимальную высоту в три метра, все бы от этого только выиграли. Но они не могут.
Таким вот вещам, сведению сложностей жизни к глупой игре, экономисты и обязаны своей дурной славой. Впрочем, суть не в том, чтобы запихнуть всякую проблему реальной жизни в коробку под названием «дилемма заключенного», а в том, чтобы создать идеализированную версию происходящего в условиях конфликта между коллективными и индивидуальными интересами. Затем можно спокойно экспериментировать с идеалом, пока не удастся открыть нечто, заслуживающее внимания, после чего вернуться к реальному миру и посмотреть, проливает ли оно свет на происходящее в действительности.
Именно так поступили с «дилеммой заключенного» (хотя некоторых теоретиков, брыкающихся и вопящих, пришлось втаскивать обратно в реальный мир насильно). Суровый безрадостный вывод, что предательство является единственным рациональным подходом, математиков, разумеется, не устраивал. Поэтому в 1960-х они чуть ли не с маниакальной настойчивостью принялись искать опровержение. И неоднократно заявляли, что нашли таковое, главным образом в 1966 году, когда Найджел Говард переформулировал игру в терминах намерений игроков, а не их действий. Однако предложенное решение наряду со всеми другими оказалось всего-навсего попыткой выдать желаемое за действительное, самообманом. Учитывая начальные условия игры, кооперация просто нелогична.
Этот вывод вызывал глубокую антипатию. Дело было не только в том, что он представлялся абсолютно безнравственным в своих последствиях. Он, казалось, существенно расходился с поведением живых людей. Сотрудничество – обычная черта человеческого общества, а доверие – фундамент социальной и экономической жизни. Разве они нерациональны? Неужели мы вынуждены подавлять свои инстинкты, чтобы быть милыми по отношению друг к другу? Оправдывает ли себя преступление? Честны ли люди только тогда, когда им это выгодно?
К концу 1970-х дилемма заключенного стала олицетворять собой все, что было не так с выпестованной экономистами личной выгодой. Если игра доказывала: с точки зрения индивида, единственным рациональным поступком был эгоистичный, значит, главное допущение являлось неадекватным. Поскольку люди эгоистичны не всегда, они должны руководствоваться не личной выгодой, а общим благом. Поскольку же вся классическая экономика построена на личной выгоде, выходит, все 200 лет ее существования экономисты лаяли не на то дерево.
Теория игр родилась в 1944 году в плодовитом, но «бесчеловечном» мозгу венгерского гения Джона фон Неймана[28], позже став отраслью математики, в особенности отвечающей потребностям «мрачной науки» экономики. Объяснение просто: эта теория касается той области, где правильность поступков одних определяется действиями других. Что бы ни творилось на свете, имеется всего одно правильное решение примера «2+2». Но вот намерение купить или продать ценные бумаги, например, целиком и полностью зависит от обстоятельств – в частности, от решений других людей. Даже в этом случае, однако, может существовать безопасная линия поведения, стратегия, работающая вне зависимости от действий окружающих. Найти ее в реальной ситуации – такой, как принятие решения об инвестиции – практически невозможно. Хотя это и не означает, что идеальной стратегии вообще не существует. Смысл теории игр в том, чтобы найти универсальный рецепт в упрощенных версиях реального мира. Это назвали «равновесием Нэша» – в честь принстонского математика Джона Нэша[29], выдвинувшего эту теорию в 1951 году, а в 1994-м, после долгой борьбы с шизофренией, получившего за нее Нобелевскую премию. Вот ее определение: равновесие возникает тогда, когда стратегия каждого игрока является оптимальной реакцией на стратегии, принятые другими игроками, и отклоняться от выбранной стратегии не выгодно никому.
В качестве примера рассмотрим игру, придуманную Питером Хаммерштайном и Рейнхардом Селтеном. Есть два человека, Конрад и Нико; их задача – поделить деньги друг с другом. Конрад делает первый ход и должен решить, как они разделят деньги: пополам (справедливо) или нет (несправедливо). Нико делает второй ход и должен решить, сколько денег они поделят: много или мало. Если Конрад выбирает «несправедливо», он получает в девять раз больше, чем Нико. Если Нико выбирает «много», каждый получает в десять раз больше, чем получил бы при выборе «мало». Конрад может потребовать в девять раз больше, чем Нико, и последний ничего не может с этим поделать: выбирая «мало», он наказывает не только оппонента, но и себя. Следовательно, несчастный Нико не может даже пригрозить наказать Конрада, ибо все его угрозы выбрать «мало» неубедительны. Равновесие Нэша: один выбирает «несправедливо», а другой – «много». Это не идеальный исход для Нико, но это лучшее, что можно сделать в данной ситуации56.
Равновесие возникает тогда, когда стратегия каждого игрока является оптимальной реакцией на стратегии, принятые другими игроками, и отклоняться от выбранной стратегии не выгодно никому.
Заметьте, в равновесии Нэша наилучший результат достигается не всегда. Далеко не всегда. Часто оно устанавливается между двумя стратегиями, приводящими к неудаче одного или обоих партнеров, однако ни один из них не сумеет добиться лучших результатов, даже если поступит иначе. Дилемма заключенного – как раз такая игра. В случае, когда партнеры играют в игру впервые и только один раз, существует только одно равновесие Нэша: оба партнера предают – то есть отказываются от сотрудничества.
Ястребы и Голуби
А потом один эксперимент поставил этот вывод с ног на голову. Выяснилось, что на протяжении целых 30 лет из дилеммы заключенного извлекали неверный урок. Эгоизм не является рациональным решением, если…. Если игра повторяется неоднократно.
По иронии судьбы, на решение головоломки наткнулись в сам момент ее изобретения, но впоследствии просто забыли о нем. Флуд и Дрешер сразу обнаружили весьма странный феномен. Когда они попросили двух коллег – Армена Алчия-на и Джона Уильямса – сыграть на небольшие суммы денег 100 раз, «подопытные кролики» оказались на удивление расположены к кооперации: в 60 из 100 попыток оба сотрудничали и извлекали выгоду из взаимной помощи. На протяжении всей игры каждый вел записи. В них оба отметили, что старались быть благодушными по отношению к партнеру, чтобы тот был таким же в ответ – вплоть до самого конца игры, когда каждый решил воспользоваться шансом быстренько нажиться за счет другого. Когда два человека играют многократно, в течение неопределенного периода времени явно превалирует добропорядочность, а не низость57.
О турнире Алчияна – Уильямса скоро позабыли. Впрочем, когда бы людей ни просили сыграть в «дилемму заключенного», они неизменно склонялись к сотрудничеству – тактике, с точки зрения логики, неверной. Подобную неуместную готовность к сотрудничеству снисходительно приписали их нерациональности и, в основном, не поддающейся объяснению любезности. «Очевидно, – писала одна пара теоретиков, – заурядные игроки недостаточно сведущи в стратегических вопросах и, как следствие, не понимают, что единственная рационально оправданная стратегия – это ОП (оба предают)». Мы были слишком тупы, чтобы это сообразить58.
В начале 1970-х годов один биолог снова пришел к выводам, вытекавшим из турнира Алчияна – Уильямса, только уже в своей области. Инженер-генетик Джон Мейнард Смит[30] никогда не слышал о дилемме заключенного, но полагал, что биология может использовать теорию игр не менее эффективно, чем экономика. Как рациональные индивиды должны выбирать стратегии, согласно теории игр, являющиеся «наименьшими из двух зол» в любых обстоятельствах, утверждал он, так и естественный отбор должен вырабатывать у животных инстинктивное поведение, в основе которого лежат схожие стратегии. Другими словами, к мысли о выборе равновесия Нэша можно прийти как сознательной, рациональной дедукцией, так и размышляя об эволюционной истории. Решение может принимать не только индивид, оно может быть определено отбором. Мейнард Смит назвал развитый инстинкт, отвечающий равновесию Нэша, «эволюционно стабильной стратегией»: ни одно животное, принявшее ее, не окажется в более затруднительном положении, чем то, которое выбрало другую стратегию.
Первый пример Мейнарда Смита являл собой попытку пролить свет на то, почему звери обычно не дерутся до смерти. Он представил ситуацию в виде борьбы Ястреба и Голубя. Первый, выступающий грубым эквивалентом «предательства» в дилемме заключенного, легко побеждает второго, но получает страшные раны в сражении с другим Ястребом. Голубь, выступающий эквивалентом «сотрудничества», извлекает выгоду из встречи с другим Голубем, но не может противостоять Ястребу. Если игра повторяется много раз, более мягкие качества Голубя приносят большую пользу. В частности, весьма успешной оказывается стратегия «Отпорщик» – когда он, встречаясь с Ястребом, тоже превращается в него. Более подробно мы остановимся на ней чуть позже59.
Поскольку игры Мейнарда Смита относились к сфере биологии, экономисты их проигнорировали. Но вот в конце 1970-х происходит нечто странное и, я бы сказал, тревожное. В дилемму заключенного начинают играть компьютеры. Несмотря на свои холодные, безжалостные, рациональные мозги, машины, в сущности, делают то же самое, что и глупые, наивные людишки – вопреки всякой рациональности, они стремятся к сотрудничеству. Математики забили тревогу. В 1979 году, задавшись целью изучить логику взаимодействия, молодой политолог Роберт Аксельрод организовал турнир. Он призвал коллег по всему миру разработать компьютерные программы, которые играли бы в эту игру 200 раз – против всех представленных программ, против себя и против случайной программы. В ходе соревнования каждая должна была набрать определенное количество очков.
«Разработки различного уровня сложности прислали 14 человек. Ко всеобщему изумлению, «добрые» программы оказались весьма успешны. Ни одна из восьми лучших из них не инициировала предательство. Более того, победила самая «добрая» из всех – и самая простая. Анатоль Рапопорт[31], канадский политолог и бывший пианист, интересующийся ядерной конфронтацией и, вероятно, знающий о дилемме заключенного больше кого бы то ни было, прислал программу под названием «Око за око». Ее стратегия заключалась в следующем: начинать с сотрудничества, а затем делать то, что делал оппонент на предыдущем ходу. «Око за око» – просто другое название «Отпорщика» Мейнарда Смита»60.
Аксельрод провел новый турнир. Теперь перед участниками стояла задача победить «Око за око». Были испробованы 62 программы, и самой успешной оказалась… сама «Око за око», снова вышедшая на первое место.
В своей книге Аксельрод пишет:
«Стойкий успех «Око за око» объясняется присущей ей комбинацией добропорядочности, мстительности, незлопамятности и ясности. Добропорядочность препятствует попаданию в ненужные неприятности. Мстительность отбивает охоту у другой стороны настаивать на предательстве. Незлопамятность помогает восстановить взаимное сотрудничество. А ясность делает ее доступной пониманию оппонента, что обеспечивает длительное сотрудничество»61.
В ходе следующего турнира Аксельрод устроил настоящую войну между стратегиями по типу «выживает сильнейший» – один из первых примеров того, что позже получило название «искусственной жизни». Естественный отбор, движущую силу эволюции, довольно легко сымитировать на компьютере: программы борются за пространство на мониторе так же, как настоящие живые существа размножаются и борются за пространство в реальном мире. В версии Аксельрода – неуспешные стратегии постепенно исчезали, оставляя все поле в распоряжение наиболее сильной программы. При этом наблюдалась целая серия увлекательных событий. Сначала «непорядочные» стратегии преуспевали за счет «добрых» и наивных. Не отставали от них только такие «отпорщики», как «Око за око». Постепенно, однако, у «непорядочных» стратегий закончились легкие жертвы. Тогда они начали сталкиваться друг с другом, и их количество стало быстро уменьшаться, в результате чего вперед вышла «Око за око». Именно она, отвоевав все поле, в итоге и стала победительницей. Опять.
Братья по крови
Полагая, что полученные результаты должны представлять немалый интерес для биологов, Аксельрод связался со своим коллегой по Мичиганскому университету – не кем иным, как Уильямом Гамильтоном. Тот был потрясен одним совпадением.
Более 10 лет назад молоденький аспирант-биолог из Гарварда Роберт Триверс показал Гамильтону написанное им эссе, в котором отметил, что животные и люди, как правило, руководствуются личной выгодой, но при этом часто сотрудничают. Одной из причин взаимодействия эгоистичных индивидов, по его мнению, являлась «реципрокность»: по сути, рука руку моет. Услуга, оказанная одним животным другому, может быть позже вознаграждена ответной, к выгоде обоих – при условии, что затраты на ее оказание меньше, чем прибыль от ее получения. Таким образом, далекие от альтруизма общественные животные могут просто-напросто эгоистично обмениваться желаемыми одолжениями. Получив поддержку от Гамильтона, Триверс опубликовал свою статью, содержавшую аргументы в пользу реципрокного (взаимного) альтруизма в мире животных, а также ряд предполагаемых примеров. Более того, как способ проверки своей идеи он даже описал повторяющуюся дилемму заключенного. И на ее основе сделал вывод: чем длительнее взаимоотношения двух индивидов, тем выше должна быть вероятность их сотрудничества. Фактически он предсказал «Око за око»62.
И тут вдруг, 10 лет спустя, в руках Гамильтона оказывается математическое доказательство реального потенциала идей Триверса. Для привлечения внимания биологов к проблеме «Око за око» Аксельрод и Гамильтон опубликовали совместную статью под названием «Эволюция сотрудничества»[32]. Результат: взрыв интереса и поиск реальных примеров среди животных63.
Последние не заставили себя долго ждать. В 1983 году биолог Джеральд Уилкинсон вернулся в Калифорнию с Коста-Рики с несколько непривлекательным примером сотрудничества. Ученый изучал летучих мышей-вампиров. Последние проводят дни в полых стволах деревьев, а ночью вылетают на поиски крупных животных, чтобы преспокойно напиться их крови через маленькие ранки в шкуре. Такая жизнь полна риска, ибо периодически летучая мышь возвращается домой голодной. Причин тому может быть две: либо она не нашла подходящий объект, либо что-то помешало трапезе. У старых особей конфуз случается в одну ночь из 10, тогда как молодые терпят неудачи в три раза чаще, и две голодные ночи подряд отнюдь не редкость. Спустя какие-то 60 часов без кровавой пищи мышь оказывается под угрозой смерти.
К счастью для летучих мышей, они могут выпить крови больше, чем им требуется в данный момент, а излишек отрыгнуть и отдать другой мыши. Акт сам по себе великодушный, щедрый. Возникает дилемма заключенного: летучим мышам, которые кормят друг друга, намного лучше, чем тем, которые этого не делают. Правда, мышам, которые принимают еду от других, но сами не делятся, лучше всех, а мышам, которые еду отдают, но не получают, – хуже всех.
Поскольку эти звери, как правило, устраиваются на ночлег в одних и тех же местах и живут достаточно долго – до 18 лет они знакомятся друг с другом и, как и компьютерные программы Аксельрода, имеют возможность играть в дилемму заключенного многократно. Соседи по ночлегу, кстати, зачастую не являются близкими родственниками. Следовательно, их щедрость нельзя объяснить непотизмом. Уилкинсон обнаружил, что летучие мыши, судя по всему, используют стратегию «Око за око». Поделившись кровью в прошлом, в будущем они получат кровь от бывшего реципиента. А отказав в крови, в будущем тоже получат отказ. Каждая летучая мышь, похоже, отлично ведет счет – возможно, это и является целью социального грумминга, которым они часто занимаются. Дело в том, что летучие мыши чистят мех друг друга, уделяя особое внимание как раз областям вокруг желудка. Мыши с раздувшимся от обильной пищи животом не так-то просто скрыть это от осматривающей ее шерсть. Обманщицу очень быстро выводят на чистую воду. Реципрокность торжествует64.
Реципрокность свойственна и африканским верветкам. Проигрывая магнитофонную запись с призывами о помощи в драке, ученые установили: обезьяны реагируют на призыв охотнее, если зовущие помогали им в прошлом. Если же две обезьяны являются близкими родственниками, реакция второй из них не так сильно зависит от того, помогала ли ей раньше первая. Таким образом, как и предсказывает теория, стратегия «Око за око» представляет собой механизм генерирования сотрудничества между неродственными особями. Детеныши принимают доброжелательность матери как должное, им не приходится заслуживать ее собственными щедрыми поступками. Братья и сестры не испытывают потребности отвечать услугой на каждую услугу. Зато особи, в родстве не состоящие, социальные долги осознают четко65.
Главное условие, необходимое для работы стратегии «Око за око» – стабильные, повторяющиеся взаимоотношения. Чем случайнее и нерегулярнее встречи двух особей, тем маловероятнее, что они приведут к сотрудничеству. Эта идея, заметил Триверс, подтверждается одной удивительной особенностью коралловых рифов – своеобразных станций очистки, где местная крупная рыба (включая хищников) избавляется от паразитов с помощью мелких рыбешек и креветок.
Чистка является неотъемлемой и важной частью жизни тропической рыбы. Свои услуги предлагают более 45 ее видов и минимум шесть видов креветок – причем для некоторых она является единственным источником пищи. Большинство чистильщиков выделяются особыми раскраской и поведением. На чистку приплывают рыбы всевозможных видов: кто-то из открытого океана, кто-то специально выбирается из своих убежищ под рифом. Некоторые даже меняют цвет, тем самым сигнализируя о потребности в чистке. Особенно важен этот процесс для крупной рыбы. Многие тратят на него столько же времени, сколько на кормление, и чистятся по нескольку раз в день – особенно если они ранены или больны. Если с рифа убрать чистильщиков, эффект будет мгновенен: общая численность рыб резко снизится, а количество больных по мере распространения паразитов резко повысится.
Детеныши принимают доброжелательность матери как должное, им не приходится заслуживать ее собственными щедрыми поступками.
Более мелкая рыба получает пищу, а более крупная – чистку: взаимная выгода налицо. Что любопытно, многие чистильщики имеют те же размер и форму, что и добыча рыб, которых они чистят, но бесстрашно шныряют туда-сюда в пасти своих клиентов, проплывают между жабрами и, по сути, играют со смертью. При этом они не только остаются целым и невредимыми. «Клиенты» даже подают осторожные и хорошо понимаемые сигналы – мол, с меня хватит, я поплыл дальше. И чистильщики тут же бросаются прочь. Инстинкты, управляющие связанным с чисткой поведением, чрезвычайно сильны. Триверс приводит в пример одного крупного морского окуня, который в течение шести лет жил в аквариуме, пока не вырос до метровой длины и не привык кидаться на любую рыбу, которую ему бросали. Как ни странно, встретив первого в своей жизни чистильщика, он тут же разинул пасть и растопырил жабры, хотя никаких паразитов у него в помине не было.
Загадка в том, почему клиенты никогда не гонятся за двумя зайцами: казалось бы, почистись, а потом возьми да и слопай чистильщика (эквивалент предательства в дилемме заключенного). Но этого не происходит – по той же самой причине, по которой редки предательства. Что вам ответит аморальный ньюйоркец, если вы спросите его, зачем он платит своей домработнице – нелегальной иммигрантке? Ведь он может просто уволить ее, а на следующей неделе нанять другую? Рыбы рассуждают аналогичным образом: хороших чистильщиков трудно найти. Клиенты берегут их не из общего чувства долга перед будущими клиентами, а потому что хороший чистильщик представляет большую ценность в виде чистильщика, чем в виде корма. Чистильщика можно найти в одном и том же месте на одном и том же рифе. День за днем. Год за годом. Перманентность и продолжительность взаимоотношений – в данном случае ключевые факторы.
Одноразовые встречи способствуют предательству; частое повторение – сотрудничеству. В открытом-то океане станций чистки нет66.
Другой пример, который изучал Аксельрод, касался Западного фронта в Первой мировой войне. Поскольку в результате создалась патовая ситуация, война превратилась в одну нескончаемую битву, которая велась на одном и том же месте, и встречи между двумя армиями повторялись снова и снова. Это повторение, равно как и повторение игр в дилемме заключенного, изменили разумную тактику с враждебности на сотрудничество. Западный фронт и в самом деле был буквально «зачумлен» неофициальными перемириями между союзниками и немецкими частями, достаточно долгое время стоявшими друг против друга. С помощью искусных систем коммуникации согласовывались условия, извинялись за случайные нарушения и гарантировали относительный мир. И все это – без ведома командования с обеих сторон. Исполнение соглашения о перемирии обеспечивалось простой местью. Для наказания противника за предательство использовались рейды и артиллерийские удары – причем ситуация нередко выходила из-под контроля, как обыкновенная кровная вражда. Следовательно, происходящее здорово смахивало на стратегию «Око за око»: стороны стремились ко взаимному сотрудничеству, но отвечали предательством на предательство. Когда соглашения о перемирии наконец обнаружились, генералы обеих сторон применили простое и эффективное «лекарство»: части стали регулярно перемещать. Отныне ни один полк не находился против другого достаточно долгое время, чтобы между ними успели установиться взаимоотношения сотрудничества.
Впрочем, пример из Первой мировой войны четко показывает: у стратегии «Око за око» есть и темная сторона. Если два игрока встречают друг друга и начинают свои взаимоотношения должным образом, они сотрудничают. Но если один из них случайно предает, следует продолжительная серия обоюдных укоров, от которой в буквальном смысле нет спасения. В этом-то и заключается смысл фразы «око за око» для тех, кто склонен (или был склонен) к кровной мести и фракционной вражде – например на Сицилии, в шотландских границах в XVI веке, в Древней Греции и в современной Амазонии. Далее мы убедимся, что стратегия «Око за око» – отнюдь не универсальная панацея.
А вывод, между тем, напрашивается следующий: частое использование реципрокности в обществе, возможно, есть неотъемлемая часть самой человеческой природы. Это инстинкт. Мы без всяких рассуждений понимаем, что долг платежом красен – нас не надо этому учить. Это знание появляется само собой по мере того, как мы взрослеем. Это неистребимая предрасположенность, подпитываемая или не подпитываемая обучением – как получится. А почему? Потому что естественному отбору вздумалось дать нам возможность извлекать из социального образа жизни максимум.