Глава 2. Навыки новых машин: технологии набирают обороты
Любая достаточно развитая технология неотличима от магии.
Летом 2012 года мы ездили на автомобиле без водителя.
Во время своего исследовательского визита в штаб-квартиру Google в Кремниевой долине нам довелось прокатиться на одном из автомобилей компании, созданных в рамках проекта Chauffeur. Поначалу мы думали, что сядем на заднее сиденье автомобиля, а на водительском месте не будет никого, однако Google по вполне понятным причинам осторожничал и не хотел выпускать на дорогу автомобили, за рулем которых никого нет. Это могло напугать пешеходов и других водителей или даже привлечь внимание полиции. Поэтому мы сидели сзади, а два представителя команды Chauffeur ехали впереди.
Когда мы ехали по шоссе 101, один из сотрудников компании нажал на кнопку и автомобиль переключился на полностью автоматический режим работы. Наше любопытство, а вместе с ним и инстинкт самосохранения включились на полную. Шоссе 101 – не самое предсказуемое или тихое. Конечно, это качественное и прямое шоссе, однако большую часть времени оно заполнено машинами, а в транспортном потоке нет ни очевидного ритма, ни мотивов. При высоких скоростях на этом шоссе ошибки вождения могут повлечь за собой крайне серьезные последствия. Поскольку мы не принадлежим к участникам проекта Chauffeur, эти последствия внезапно начали представлять для нас не только интеллектуальный интерес.
Автомобиль вел себя безукоризненно. Более того, порой в ходе поездки нам даже становилось скучно. Он не нарушал скоростных ограничений и не занимался слаломом среди других машин на шоссе; он ехал точно так, как нас всех учат в водительской школе. Раскрытый ноутбук в режиме реального времени показывал нам то, что «видит» автомобиль при движении по шоссе, – все расположенные неподалеку объекты, которые попадали в поле «зрения» его сенсоров. Автомобиль распознавал все другие машины вокруг, а не только ближайшие, и контролировал их местоположение вне зависимости от того, где они двигались. Это был автомобиль, не имевший «слепых» зон. Однако программа, отвечавшая за вождение, принимала во внимание, что такие «слепые» зоны могут быть у других автомобилей и грузовиков, находившихся под управлением людей. Экран ноутбука постоянно отображал предположения программы о том, где могут находиться эти «слепые» зоны и как их избежать.
Мы не могли оторвать взгляда от экрана и совершенно не обращали внимания на дорогу до тех пор, пока движение впереди полностью не остановилось. Наш автомобиль начал мягко тормозить, а затем остановился на безопасном расстоянии от ехавшей впереди машины, после чего начал понемногу двигаться вместе со всем остальным потоком. В течение всего этого процесса работники Google, сидевшие на переднем сиденье, не прекращали своего разговора, не демонстрировали никаких следов нервозности или интереса к происходившему на дороге. Сотни часов, проведенных в беспилотном автомобиле, убедили их в том, что он вполне в состоянии справиться с движением в пробке. К тому моменту, когда машина припарковалась, мы разделяли их уверенность.
Новое разделение труда
Наша поездка по шоссе 101 в тот день была для нас особенно странной, поскольку всего несколькими годами ранее мы были уверены, что компьютеры никогда не научатся управлять автомобилями. Великолепные исследования и анализы, проведенные нашими глубокоуважаемыми коллегами, убедительно показывали, что в обозримом будущем вождение автомобиля останется задачей, которая по силам лишь человеку. Несмотря на это заключение, такие технологии, как Chauffeur, активно развились в последующие несколько лет, что позволяет нам извлечь целый ряд важных уроков о цифровом прогрессе.
В 2004 году Фрэнк Леви и Ричард Марнейн опубликовали свою книгу The new division of labor («Новое разделение труда»).[19] В основном они концентрировались на различиях в специфике работы человека и работы компьютера. В любой разумной экономической системе люди должны фокусироваться на задачах и направлениях работы, в которых имеют сравнительное преимущество над компьютерами, оставляя компьютерам то, для чего последние лучше приспособлены. В своей книге Леви и Марнейн предложили способ распределения различных задач в ту или иную категорию.
Сто лет назад предыдущий абзац не имел бы никакого смысла. В те времена слово computer («вычислитель») было названием профессии, а не обозначением механизма. «Компьютерами» в начале XX века называли людей, обычно женщин, проводивших целые дни за арифметическими расчетами и заполнением таблиц. На протяжении десятилетий изобретатели проектировали машины, способные выполнять всё новые и новые элементы этой работы; поначалу эти устройства были механическими, затем электромеханическими и наконец стали цифровыми. В наши дни сложно встретить людей, которых нанимают лишь для арифметических расчетов и записи результатов. Даже в странах с самыми низкими ставками оплаты труда людей-компьютеров практически не осталось, поскольку автоматические устройства значительно дешевле, быстрее и точнее.
Если вы внимательно изучите внутреннее устройство компьютера, то поймете, что он работает не с цифрами, а с символами. Электронные схемы компьютеров могут интерпретироваться на языке нулей и единиц, однако точно таким же образом могут использоваться пары «истинно» и «ложно», «да» или «нет» или любая другая аналогичная система символов. В принципе, компьютеры способны решать с помощью символов любые виды задач, от математических до логических или лингвистических. Однако цифровые писатели пока еще не появились, и поэтому списки бестселлеров состоят из книг, написанных исключительно людьми. Пока что мы еще не компьютеризировали работу предпринимателей, директоров, ученых, медсестер, помощников официантов и многих других типов работников. Почему нет? Если проще оставить эти занятия людям, то каким именно алгоритмам в этой работе особенно трудно подобрать цифровой эквивалент?
Компьютеры хорошо умеют следовать правилам…
Именно этими вопросами задались авторы книги «Новое разделение труда» и дали на них в высшей степени осмысленные ответы. Авторы раскладывают процесс обработки информации – основу всей работы со знанием – на спектр задач. На одном конце спектра располагаются задачи типа арифметических – то есть такие, для решения которых требуется всего лишь применить хорошо понятые правила. А поскольку компьютеры отлично умеют следовать правилам, получается, что именно они должны заниматься арифметическими и другими сходными с ними задачами.
Леви и Марнейн выделяют и другие типы знания, которое может быть выражено в виде правил. К примеру, кредитная история – хороший предиктор того, сможет ли заемщик оплачивать ипотеку, как обещал, поскольку сумма ипотечного кредита зависит от состояния человека, от размера его доходов и наличия других кредитов. Поэтому решение о том, выдавать ли человеку ипотеку, может быть, в сущности, сведено к правилу.
Правило ипотеки, выраженное словами, может звучать следующим образом: «Если некто просит ипотеку на сумму M, и при этом его кредитный рейтинг равен V или больше, величина ежегодного дохода выше I или величина капитала выше W, а общая величина долговых обязательств не выше D, то заявка получает одобрение».
В случае если правило ипотеки такого рода выражено в форме компьютерной программы, мы называем его алгоритмом. Алгоритмы – это упрощения; они не могут и не должны учитывать все факторы (такие, к примеру, как наличие дядюшки-миллиардера, который когда-то включил нашего потенциального клиента в свое завещание, а сам увлекается скалолазанием без страховки). Тем не менее алгоритмы включают в себя самые распространенные и важные параметры, поэтому в целом вполне хорошо работают в решении ряда задач, в том числе и таких, как предсказание вероятности правильной выплаты ипотеки. Таким образом, компьютеры могут и должны использоваться для подобных операций.[20]
…Но довольно плохо распознают закономерности
На другом конце спектра, предложенного Леви и Марнейном, располагаются задачи по обработке информации, которые не могут быть сведены к правилам или алгоритмам. По мнению авторов, решение задач такого рода основано на умении человека распознавать закономерности. Наш мозг отлично воспринимает информацию через органы чувств и изучает ее в поисках закономерностей, однако нам очень плохо удается описать или вычислить, каким образом мы это делаем, особенно когда большой объем быстро меняющейся информации поступает к нам в достаточно быстром темпе. Как точно заметил философ Майкл Полани, «мы знаем больше, чем можем сказать».[21] С такими задачами, по мнению Леви и Марнейна, компьютеры не могут справиться, и следовательно, решать их по-прежнему будут люди. Авторы приводят в качестве примера такой задачи как раз управление автомобилем:
Поворачивая влево от основного потока, водитель вынужден противостоять огромному объему образов и звуков, которые создаются другими автомобилями, сигналами светофоров, витринами, рекламными плакатами, деревьями и дорожной полицией. Основываясь на своих знаниях, он должен рассчитать размер и положение каждого из этих объектов и вероятность того, представляют ли они угрозу. Водитель грузовика имеет в голове определенную схему, которая позволяет ему понять, с чем он имеет дело. Однако выразить эти знания и внедрить их в программу для применения в крайне разнообразных ситуациях на данный момент невероятно сложно… компьютеры не смогут легко заменить людей в таких заданиях, как вождение автомобиля.
Различие не настолько велико
Прочитав в 2004 году книгу «Новое разделение труда», мы были полностью убеждены аргументами Леви и Марнейна. Не менее убедительно выглядели и первоначальные результаты проведенного в том же году эксперимента с беспилотными автобилями.
DARPA, Управление перспективных исследовательских проектов Министерства обороны США, было основано в 1958 году (в ответ на запуск Советским Союзом первого спутника). Его основная задача состояла в стимулировании технологического прогресса, достижения которого могли бы найти применение в военной области. В 2002 году агентство сообщило о проведении первого конкурса, участники которого должны были создать полностью автономный автомобиль-робот, способный проехать расстояние в 150 миль через калифорнийскую пустыню Мохаве. Основной заезд должен был состояться 13 марта 2004 года, и квалификационный отбор для него прошли пятнадцать участников.
Результаты были печальны. Два автомобиля не смогли доехать до места старта, еще один перевернулся прямо на старте, а через три часа после начала гонки на трассе осталось всего четыре автомобиля. Условный «победитель», автомобиль Sandstorm, созданный в университете Карнеги – Меллон, проехал 7,4 мили (то есть менее 5 процентов от общей дистанции), а затем сошел с трассы во время резкого поворота и застрял на обочине. Заявленный приз в миллион долларов не достался никому, а журнал Popular Science назвал это событие «ниспровержением DARPA в пустыне».[22]
Однако всего за несколько лет фиаско превратилось в успех, и мы увидели это своими собственными глазами. В октябре 2010 года в своем официальном блоге компания Google заявила о том, что ее полностью автономные автомобили уже в течение некоторого времени успешно проходят тестирование в реальных условиях на американских дорогах и шоссе. Ко времени нашей поездки летом 2012 года проект Chauffeur уже включал в себя небольшой парк автомобилей, которые в совокупности проехали сотни тысяч миль без какого-либо вмешательства человека и всего с двумя авариями. Одна авария произошла, когда за рулем автомобиля Google был человек; вторая случилась, когда в автомобиль Google, стоявший на перекрестке на красный свет, врезался сзади другой автомобиль (которым также управлял человек).[23] Разумеется, всегда можно найти ситуации, с которыми не могут справиться автомобили Google, – это и особенно сильные пробки, и езда по бездорожью, и движение в районах, для которых Google еще не разработала детальные карты. Однако пережитое на шоссе убедило нас в том, что этот подход вполне эффективен в решении огромного количества повседневных задач в вождении.
Всего за несколько лет самоуправляемые машины сошли со страниц научно-фантастических книг и превратились в реальность. Достаточно передовое для своего времени исследование, объяснявшее, почему такие автомобили не появятся в ближайшее время, устарело всего лишь через несколько лет благодаря передовой научной и инженерной мысли. Наука и инженерия начали развиваться все более быстрыми темпами, и менее чем за половину десятилетия провал обернулся торжеством.
Усовершенствование автономно управляемого автомобиля напомнило нам высказывание Хемингуэя о том, как человек становится банкротом: «Сначала постепенно, а затем сразу».[24] И самоуправляемые автомобили – это не аномалия, а фрагмент более широкой и потрясающей закономерности. Прогресс в решении самых старых и сложных задач, связанных с компьютерами, роботами и другими цифровыми приспособлениями, в течение долгого времени разворачивался постепенно. Затем, в последние несколько лет, изменения стали происходить стремительно и внезапно; развитие цифровых технологий невероятно ускорилось. Вдруг начали решаться задачи, казавшиеся нерешаемыми. У устройств возникли новые и совершенно неожиданные свойства. Давайте рассмотрим еще несколько примеров удивительного технологического прогресса недавних лет.
Внимательные собеседники
Помимо сложностей с распознаванием закономерностей, Леви и Марнейн упоминают еще одну область, которая в новом разделении труда останется за человеком. Они пишут: «Общение, особенно важное для эффективного обучения, менеджмента, продаж и многих других занятий, требует передачи и интерпретации большого объема информации. В этих случаях возможность обмена информацией с компьютером, а не с другим человеком если и возникнет, то лишь в отдаленном будущем».[25]
Осенью 2011 года компания Apple представила смартфон iPhone 4S с функцией Siri, своеобразного персонального ассистента, интерфейс которого был основан на обычной человеческой речи. Иными словами, люди говорили со своим смартфоном точно так же, как могли бы разговаривать с другим человеком. Программа, лежащая в основе Siri, была разработана в калифорнийском исследовательском институте SRI International, а затем куплена Apple в 2010 году. Она слушала все, что говорят пользователи iPhone своему гаджету, пыталась понять, чего они хотят, затем предпринимала определенное действие и отвечала пользователям синтезированным голосом.
Примерно через восемь месяцев после появления Siri на рынке Кайл Вагнер, один из авторов технологического блога Gizmodo, перечислил некоторые из ее самых полезных возможностей:
Вы можете узнать счет текущих спортивных соревнований – «Сколько очков сейчас у команды „Джайентс“?» – или получить статистику по индивидуальным игрокам. Вы также можете заказать столик в ресторане через программу OpenTable, найти поставщиков тех или иных услуг в своем округе с помощью системы Yelp, узнать о том, какие фильмы идут в кинотеатре по соседству, а затем посмотреть интересующий вас трейлер. Если вы заняты и не можете принять звонок, то вы можете попросить Siri напомнить вам о том, чтобы перезвонить звонящему попозже. Голосовые команды могут оказаться невероятно полезными для решения подобных повседневных задач.[26]
Однако его сообщение в блоге Gizmodo завершалось предостережением: «Все это звучит довольно круто. Однако в случае Siri нужно помнить одно важное слово – „если“ это работает как надо».[27] После выпуска этой программы многие пользователи обнаружили, что этот вроде бы разумный личный ассистент работал недостаточно хорошо. Он не понимал, что они говорят, постоянно просил уточнений, давал странные или неточные ответы или отделывался фразами вроде: «Прошу прощения, но прямо сейчас я не могу обрабатывать новые запросы. Попробуйте связаться со мной чуть позже». Аналитик Джин Мюнстер смог составить целый список вопросов, с ответами на которые у Siri возникали проблемы:
• На вопрос «Где Элвис похоронен? (Where is Elvis buried?)» программа отвечала: «Я не могу ответить на этот вопрос», поскольку посчитала, что речь идет о человеке с именем Элвис Похоронен (Elvis Buried).
• «Когда вышел фильм „Белоснежка“?» Вместо ответа программа предложила осуществить поиск кинотеатров через Yelp.
• «Когда в следующий раз комета Галлея? (When is the next Halley’s Comet?)» Программа ответила: «У вас нет встреч с человеком по имени Галлей» (You have no meetings matching Halley’s).
• «Я хочу отправиться на озеро Супериор (Lake Superior)». Программа выдала инструкции по проезду к офису компании Lake Superior X-ray.[28]
О странных и неудовлетворительных ответах Siri стало известно довольно быстро, однако сила технологий все же неоспорима. Технологии приходят вам на помощь именно тогда, когда нужно. Мы убедились в этом на своем собственном примере во время поездки на беспилотном автомобиле Google. После встречи в Сан-Франциско мы сели в арендованный автомобиль, чтобы доехать до штаб-квартиры Google в городе Маунтин-Вью. У нас был с собой портативный GPS-навигатор, однако мы его не включили, поскольку посчитали, что и так знаем, как добраться до следующей точки путешествия.
На самом деле мы, конечно, не знали. Столкнувшись с эшеровским лабиринтом шоссе, съездов и улиц, мы начали плутать, раздражаясь все больше и больше от неспособности найти нужную дорогу. В тот момент, когда наша встреча в Google, весь проект по созданию этой книги и наши профессиональные отношения были уже на грани краха, Эрик достал свой телефон и попросил Siri показать, как добраться до шоссе 101 в направлении на юг. Телефон ответил моментально и безошибочно: экран превратился в карту, на которой были показаны наше местоположение и стрелки, направлявшие на нужную нам развилку.
Конечно, мы могли бы включить наш портативный GPS-навигатор и подождать, пока он создаст план нашего маршрута, но нам не хотелось обмениваться информацией таким образом. Мы хотели задать вопрос, а затем услышать и увидеть ответ (в форме карты). Siri смогла пообщаться с нами именно на том языке, на котором мы хотели. Созданный в 2004 году обзор всех исследований в области автоматического распознавания речи (важнейшей части обработки естественного языка) за последнюю половину столетия начинался с признания о том, что «распознавание машинами речи на том же уровне, на котором это делают люди, представляется нам труднодостижимой целью», однако менее чем через 10 лет все основные элементы этой цели уже были достигнуты. Apple и другие компании сделали технологию обработки естественного языка доступной для сотен миллионов людей через их мобильные телефоны.[29] По замечанию Тома Митчелла, возглавляющего кафедру машинного обучения в университете Карнеги – Меллон, «мы находимся в начале десятилетнего периода, в течение которого перейдем от компьютеров, которые неспособны понимать наш язык, к компьютерам, которые понимают его почти на том же уровне, что и мы».[30]
Цифровая беглость: за дело берется Вавилонская рыбка
Программы по обработке естественного языка еще далеки от совершенства, а компьютеры не так хороши в сложной коммуникации, как люди, однако дело стабильно идет на лад. А в таких областях, как перевод с одного языка на другой, уже были достигнуты серьезные достижения: хотя коммуникационные способности компьютеров не настолько глубоки, как у обычного человека, они намного шире.
Человек, говорящий более чем на одном языке, обычно способен перевести фразу с одного на другой с достаточно высокой точностью. С другой стороны, автоматические сервисы, хотя и производят некоторое впечатление, редко делают свою работу без ошибок. Даже если вы плохо владеете французским языком, то не исключено, что вы можете лучше справиться с переводом фразы Monty Python’s „Dirty Hungarian Phrasebook“ sketch is one of their funniest ones (Скетч „Монти Пайтон“ под названием „Сборник венгерских ругательств“ – один из самых смешных), чем Google Translate. Программа предложила вариант Sketch des Monty Python ‘Phrasebook sale hongrois’ est l’un desplus drôles les leurs. Хотя эта фраза и передает общий смысл, в ней имеются серьезные проблемы с грамматикой.
Скорее всего, вам не удастся столь же успешно перевести это (или любое другое) предложение на венгерский, арабский, китайский, русский, норвежский, малайский, идиш, суахили, эсперанто или любой другой из 63 языков, помимо французского, с которыми работает сервис Google Translate. Однако Google при этом все же попытается перевести текст с любого из этих языков на любой другой непосредственно в веб-интерфейсе, мгновенно и без каких-либо затрат.[31] Приложение Translate для смартфонов позволяет пользователям общаться с телефоном более чем на 15 из этих языков. В ответ они получают устный перевод на паре десятков других языков. Мы почти с полной уверенностью можем сказать, что на такое неспособен даже самый многоязычный человек в мире.
На протяжении многих лет различные способы моментального перевода обычно описывались только в научной фантастике (один из самых замечательных примеров – Вавилонская рыбка из книги «Автостопом по Галактике», странное создание, которое человек может запихнуть себе в ухо, после чего начинает понимать речь на любом языке).[32] Google Translate и другие аналогичные сервисы осуществляют эти мечты. Как минимум один из таких сервисов уже сейчас используется для обслуживания международных клиентов. Компания Lionbridge, предоставляющая переводческие услуги, разработала вместе с IBM онлайн-приложение GeoFluent, способное мгновенно переводить чаты между клиентами и специалистами по решению различных проблем, которые говорят на разных языках. В ходе первичных испытаний около 90 процентов пользователей GeoFluent сообщили, что качество перевода было достаточно хорошим для решения их задач.[33]
Преимущества человека в «Своей игре»!
Компьютеры настолько хорошо научились совмещать анализ закономерностей со сложной коммуникацией, что порой побеждают людей на их собственном поле. В 2011 году одним из участников игрового шоу Jeopardy! был не человек, а суперкомпьютер по имени Watson. Он был разработан компанией IBM специально для участия в этой игре (и получил свое имя в честь легендарного руководителя компании IBM Томаса Уотсона-старшего). Игра Jeopardy! (ее российский лицензионный аналог называется «Своя игра») дебютировала в 1964 году, а к 2012-му стала пятой по популярности синдицированной (то есть переданной для трансляции сразу нескольким вещателям) телепрограммой в Америке.[34]
Обычно каждый выпуск программы, в ходе которой ведущий Алекс Требек задает простые вопросы на различные темы, а участники стараются опередить других, дав правильный ответ, смотрит почти семь миллионов человек.[35]
Долговечность и популярность шоу связаны с тем, что его легко понять, но в него невероятно сложно играть. Почти каждый человек знает ответы на некоторые вопросы в каждом отдельно взятом эпизоде, однако мало кто знает ответы на почти все из них. Вопросы охватывают широкий диапазон тем, и участники заранее не знают, какие темы им достанутся. Им нужно быть одновременно быстрыми, дерзкими и точными: быстрыми – поскольку они соревнуются друг с другом за шанс ответить на каждый вопрос; дерзкими – поскольку им приходится отвечать на множество вопросов, причем довольно сложных, для того чтобы собрать достаточно денег для победы; и точными – поскольку у них вычитаются деньги за каждый неверный ответ.
Продюсеры Jeopardy! усложняют задачи участникам, используя шутки, стишки и другие виды словесных игр. К примеру, загадка может звучать так: «Выраженное в виде рифмы напоминание о прошлом родного города команды НБА „Кингз“».[36] Чтобы ответить на этот вопрос правильно, игрок должен знать, что означает аббревиатура НБА (в данном случае речь идет о Национальной баскетбольной ассоциации США, а не о Национальном законе о банках (National Bank Act) и не о химическом веществе н-бутиламин), в каком городе играет команда «Кингз» (Сакраменто) и что ответ должен выглядеть как рифма к названию города. Правильный вопрос будет звучать как «Что такое Sacramento memento?», а не «сувенир из Сакраменто» или любой другой фактически правильный ответ. Правильный ответ в таких случаях требует подлинного мастерства в поиске закономерностей и сложной коммуникации. А победа в Jeopardy! требует, чтобы обе эти связи находились неоднократно, точно и почти мгновенно.
Во время сезона 2011 года Watson выступал против Кена Дженнингса и Брэда Раттера, двух самых известных персонажей этой эзотерической индустрии. Дженнингс в 2004 году выиграл рекордное количество игр подряд – а именно 72, – заработал на этом более 3 170 000 долларов призовых денег и стал настоящим народным героем.[37] По сути, можно считать, что сам Watson отчасти возник благодаря Дженнингсу.[38] Согласно легенде, которая ходит по компании IBM, Чарльз Ликел, менеджер по исследовательским вопросам компании, интересовавшийся расширением границ искусственного интеллекта, как-то вечером осенью 2004 года ужинал в стейк-хаусе в Фишкилле, штат Нью-Йорк. В 7 часов вечера он заметил, что многие посетители оставили свой ужин, встали из-за столов и перешли в соседний бар. Он заинтересовался, что происходит, и последовал за ними. Оказалось, что все столпились у телевизора и принялись наблюдать за тем, как Дженнингс, выигравший уже 50 игр подряд, продолжает бить свой рекорд. Ликел подумал, что матч между Дженнингсом и суперкомпьютером, умеющим играть в Jeopardy!, может оказаться невероятно популярным, а кроме того, послужит отличным тестом способностей компьютера выявлять закономерности и участвовать в сложной коммуникации.
Поскольку Jeopardy! представляет собой соревнование между тремя участниками, идеальным третьим участником мог бы стать Брэд Раттер, который победил Дженнингса в 2005 году по итогам турнира чемпионов и выиграл более 3 400 000 долларов.[39] Оба участника обладали огромной эрудицией, были отлично знакомы с игрой и всеми ее тонкостями, а также хорошо знали, как противостоять давлению.
Выиграть у них было непросто, и первые версии Watson были совершенно к этому не готовы. Программисты могли настроить Watson так, чтобы он, отвечая на вопросы, вел себя более агрессивно (а, следовательно, чаще ошибался) или был более осторожным и точным. В декабре 2006 года, вскоре после начала проекта, когда Watson пытался отвечать на вопросы в течение 70 % времени передачи (сравнительно агрессивный подход), он давал правильные ответы лишь в течение 15 % времени. Дженнингс, напротив, правильно отвечал на 90 % вопросов в тех случаях, когда ему удавалось добиться права на ответ (также в течение примерно 70 % времени передачи).[40]
Однако оказалось, что Watson способен быстро учиться. Соотношение агрессивности и точности быстро улучшалось, и, к ноябрю 2010 года (когда машина стала достаточно агрессивной, чтобы добиться в ходе имитации турнира права на ответ в 70 % случаев), примерно 85 % ее ответов оказались верными. Это было впечатляющее достижение, однако компьютер все еще не играл в той же лиге, что и лучшие игроки-люди. Команда Watson продолжала свою работу до середины января 2011 года, когда должны были начаться съемки турнира для будущей трансляции, однако никто до конца не знал, насколько хорошо их создание сможет противостоять Дженнингсу и Раттеру.
Watson побил их обоих. Он правильно отвечал на вопросы на самые разные темы, от «Необычных происшествий на Олимпийских играх» до «Церкви и государства». И хотя суперкомпьютер не продемонстрировал полного совершенства – к примеру, он предложил слово chic, а не class как синоним выражения «стильная элегантность или же группа учеников, заканчивающих обучение в один и тот же год» (категория «Альтернативные значения»), – его результаты все равно были очень хорошими.
Кроме того, Watson действовал с невероятной быстротой, постоянно отбирая у Дженнингса и Раттера право на ответ. К примеру, в первой из двух сыгранных игр Watson первым нажимал на кнопку 43 раза, а затем дал правильные ответы в 38 случаях. А Дженнингс и Раттер в сумме смогли нажать на кнопку всего 33 раза за всю игру.[41]
К концу двухдневного турнира Watson заработал 77 147 долларов – примерно в три раза больше, чем каждый из его оппонентов-людей. Дженнингс, занявший второе место, после ответа на последний вопрос соревнования добавил: «Приветствую наших новых компьютерных повелителей». Позднее он размышлял о происшедшем:
Подобно тому как в XX веке множество людей-работников на фабриках было заменено роботами на сборочных линиях, мы с Брэдом оказались первыми работниками сферы интеллектуальных услуг, замененных новым поколением «думающих» машин. Возможно, что «участник интеллектуальных шоу» – это первая из профессий, которая исчезнет благодаря Watson, однако я уверен, что она не последняя.[42]
Парадокс «прогресса» в области роботизации
Последняя важная область, в которой мы замечаем в настоящее время быстрое ускорение, связанное с цифровыми технологиями, – это роботизация, то есть создание машин, способных ориентироваться и взаимодействовать с физическим миром фабрик, складов, полей боя и офисов. Прогресс в этой области также шел довольно медленно, а потом сделал резкий скачок вперед.
Слово «робот» вошло в наш язык благодаря пьесе «Р.У.Р.» («Россумские универсальные роботы»), написанной в 1921 году чешским писателем Карелом Чапеком. И любовь к подобного рода автоматам сохраняется у человечества до сих пор.[43] Во времена Великой депрессии в газетах и журналах публиковалось немало историй о том, как роботы могли бы вести войны, совершать преступления, заменять рабочих на производстве и даже побить боксера Джека Дэмпси.[44] В 1941 году Айзек Азимов придумал термин «робототехника» и сформулировал основополагающие правила для молодой научной дисциплины в виде знаменитых «Трех законов робототехника»:
Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинен вред.
Робот должен повиноваться всем приказам, которые дает человек, кроме тех случаев, когда эти приказы противоречат Первому Закону.
Робот должен заботиться о своей безопасности в той мере, в которой это не противоречит Первому или Второму Законам.[45]
Азимов продолжает оказывать огромное влияние на научную фантастику и создание настоящих роботов уже более 70 лет. Однако одно из этих двух сообществ смогло значительно обогнать в своем развитии другое. Научная фантастика подарила нам болтливых и верных роботов R 2-D 2 и C-3PO, кибернетическую цивилизацию Сайлонов из сериала «Звездный крейсер „Галактика“», ужасного Терминатора и массу бесконечных вариаций андроидов, киборгов и репликантов. А десятилетия исследований в области роботехники подарили нам ASIMO, робота-гуманоида производства компании Honda, провалившего собственную демонстрацию, поскольку он не смог исполнить третий закон Азимова. На проведенной в 2006 году в Токио презентации ASIMO попытался пройти по узкой лестнице, выстроенной на сцене. На третьем шаге колени робота подогнулись, и он упал, полностью разбив свою лицевую панель.[46]
С тех пор ASIMO починили и научили новым навыкам – теперь он умеет подниматься и спускаться по лестнице, пинать футбольный мяч и танцевать. Однако его недостатки заставляют нас понять неприятную истину: многое из того, что просто и привычно для людей в нашем мире, невероятно сложно для роботов. Как отмечает известный футуролог и специалист по роботехнике Ханс Моравек, «сравнительно легко настроить компьютер так, чтобы он отвечал на вопросы тестов интеллектуальных способностей или играл в шашки на уровне нормального взрослого человека, но почти невозможно наделить его навыками годовалого младенца, когда дело касается восприятия и мобильности».[47]
Эта ситуация стала широко известна под названием парадокса Моравека, который в «Википедии» описан следующим изящным образом: «Принцип в областях искусственного интеллекта и робототехники, согласно которому, вопреки распространенному мнению, высококогнитивные процессы требуют относительно небольших вычислений, в то время как низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов»[48].[49] Глубокое наблюдение Моравека очень точно и важно. По словам ученого-когнитивиста Стивена Пинкера,
главный урок 35 лет исследований искусственного интеллекта состоит в том, что сложные проблемы просты, а простые проблемы сложны… При появлении нового поколения разумных устройств с угрозой потерять свою работу из-за машин столкнутся фондовые аналитики, инженеры-нефтехимики и члены комиссий по условно-досрочному освобождению. А садовникам, портье и поварам удастся сохранить свои рабочие места еще несколько десятилетий.[50]
Пинкер хочет сказать, что для экспертов в области робототехники задача по созданию машин, навыки которых находятся на уровне, хотя бы немного сопоставимом с уровнем неквалифицированных рабочих, занимающихся ручным трудом, оказалась ужасно сложной. К примеру, пылесос Roomba iRobot не способен делать все то же, что делают горничные, – он просто пылесосит пол. В мире уже продано более 10 миллионов пылесосов Roomba, однако ни один из них не умеет выравнивать кипу журналов на кофейном столике.
Когда дело касается работы в физическом мире, люди имеют огромное преимущество над машинами с точки зрения гибкости. Автоматизировать отдельное действие, такое как припайка провода к печатной плате или скрепление двух деталей с помощью шурупов, довольно просто, однако эта задача не должна меняться с течением времени и должна выполняться в «регулярной» среде. К примеру, печатная плата должна все время быть ориентирована в определенную сторону. Для решения таких задач компании покупают специальное оборудование, инженеры программируют и тестируют его, а затем добавляют в имеющиеся производственные конвейерные линии. Каждый раз, когда задача меняется – к примеру, при каждом изменении местоположения отверстий для шурупов, – производство должно остановиться до тех пор, пока программисты не заменят программу. На современных фабриках, особенно крупных и расположенных в странах с высоким уровнем оплаты труда, высокий уровень автоматизации высок, однако даже там невозможно встретить роботов широкого профиля. Напротив, на этих фабриках стоит специализированное и весьма дорогое оборудование, которое довольно сложно настраивать и перенастраивать.
Переосмысление процесса автоматизации фабрик
Родни Брукс, сооснователь компании iRobot, заметил еще одну важную вещь, присущую современным автоматизированным фабрикам, – людей там редко встретишь, но они все равно там есть. И значительная часть их работы заключается в повторяющихся и довольно бездумных действиях. К примеру, на конвейере, где происходит заполнение банок вареньем, машины заливают точный объем варенья в каждую банку, закручивают крышку и прилепляют этикетку, однако весь этот процесс инициирует человек, который вручную ставит пустые банки на ленту конвейера. Почему этот шаг не автоматизирован? Дело в том, что банки поступают на конвейер упакованными в картонные коробки по 12 штук, и эти коробки просто не позволяют им оставаться в жестко заданной позиции. Подобная степень неточности не представляет никакой проблемы для человека (он просто видит банки в коробке, достает их и ставит на конвейерную ленту), однако у традиционных промышленных автоматов возникают огромные проблемы при работе с банками, которые не оказываются в точно заданном месте каждый раз.
В 2008 году Брукс основал новую компанию, Rethink Robotics, для изучения и строительства нетрадиционного типа промышленных автоматов – роботов, способных справиться с банками и решать множество других задач, которые на сегодняшних фабриках выполняются людьми. По сути, он хочет сделать что-то, противоречащее парадоксу Моравека. Более того, Брукс рисует в своем воображении роботов, которых не будут программировать дорогостоящие инженеры; напротив, в качестве учителей для машин, помогающих им выполнить задание (или освоить новое), могут выступать обычные рабочие, на обучение каждого из которых потребуется меньше часа. Кроме того, машины Брукса сравнительно недороги. Каждая из них стоит около 20 000 долларов, что в разы меньше цены нынешних промышленных роботов. Мы смогли познакомиться с этими потенциальными разрушителями парадокса незадолго до того, как Rethink публично заявила о запуске своей первой линейки роботов под названием Baxter. Брукс пригласил нас в штаб-квартиру компании в Бостоне, чтобы показать эти устройства и то, на что они способны.
При первом же взгляде на Baxter понятно, что это робот-гуманоид. У него имеются две довольно толстые сочлененные «руки» с захватами, напоминающими клешни; у него есть туловище; а голова оснащена жидкокристаллическим экраном, позволяющим «смотреть» на человека, который стоит рядом. Впрочем, у него нет ног; Rethink отказалась от решения довольно сложных задач, связанных с автоматическим движением. Она просто поставила Baxter на колеса, а для его перемещения на большие расстояния используются люди-грузчики. Проведенный компанией анализ показал, что робот все равно может сделать немало полезной работы, даже не имея возможности самостоятельно перемещаться.
Чтобы научить Baxter чему-нибудь, вы берете его за запястье и управляете его руками, совершая именно те действия, которым хотите его научить. Кажется, что рука робота вообще не имеет веса; у нее довольно мощные моторы, поэтому вам не нужно прилагать значительных усилий. Робот умеет следить за безопасностью; его две руки не могут столкнуться (а даже если вы пытаетесь это сделать, моторы начинают вам противостоять), и они автоматически замедляются, если Baxter чувствует в диапазоне своего охвата человека. Робот сконструирован так, чтобы работа с ним была достаточно естественна, интуитивна и безопасна. Впервые приблизившись к нему, мы нервничали, когда он подносил руку к нашим лицам, но беспокойство быстро исчезло, уступив любопытству.
Брукс показал нам несколько роботов за работой в демонстрационном зале. Роботы прямо на наших глазах нарушали парадокс Моравека – они находили и манипулировали множеством различных объектов с помощью «рук», на месте которых были захваты или присоски. Роботы совсем не так быстры, как хорошо обученный рабочий, действующий с полной скоростью, однако этого и не нужно. Большинство конвейеров и сборочных линий не работает на максимальной скорости, на которую способен человек; это приводило бы к слишком быстрому утомлению. У Baxter имеется несколько очевидных преимуществ над людьми. Он может работать весь день, и ему не нужно прерываться на сон, обед или кофе. Он не будет просить у работодателя медицинскую страховку или зарплату. А кроме того, он способен одновременно заниматься двумя не связанными между собой задачами; его руки могут работать независимо друг от друга.
Совсем скоро на сборочных линиях, складах и в офисах рядом с вами
После посещения Rethink и изучения работы Baxter в действии мы поняли, почему в начале 2012 года вице-президент компании Texas Instruments Реми Эль-Казан сказал: «Мы твердо убеждены в том, что рынок робототехники находится на поворотном пункте». И его слова находят немало подтверждений. Объем и разнообразие роботов, использующихся в компаниях, быстро расширяются, а ряд инноваторов и предпринимателей в последние годы сделали немало набегов на парадокс Моравека.[51]
Kiva, еще одна молодая компания из Бостона, научила свои автоматы быстро, безопасно и эффективно перемещаться по складам. Роботы Kiva похожи на оранжевые металлические пуфики или на роботов R 2-D 2 из «Звездных войн», только расплющенных. Они носятся по складским помещениям примерно на высоте человеческого колена, уступая дорогу людям и друг другу. Поскольку они располагаются близко к земле, им не составляет труда пролезть под стеллажи, поднять их и отвезти работникам-людям. После того как рабочие забирают с полок стеллажей нужное, робот увозит полку, а его место занимает другой. Программа отслеживает местоположение продуктов, полок, роботов и сотрудников и дирижирует постоянным танцем автоматов Kiva. В марте 2012 года Kiva была куплена компанией Amazon – лидером в области развитой складской логистики – более чем за $750 миллионов.[52]
Boston Dynamics, еще один стартап из Новой Англии, сражается с парадоксом Моравека лицом к лицу. Эта компания строит роботов для поддержки американских войск в ходе полевых операций. Помимо прочего, это роботы умеют переносить тяжелые грузы по местности со сложным рельефом. Робот BigDog, напоминающий гигантского металлического мастифа с длинными тонкими ногами, способен взбираться на крутые склоны, удерживаться на скользком льду и делать массу других вещей, привычных для собак. Удержание равновесия на четырех опорных точках при движении по сложному ландшафту представляет собой непростую инженерную задачу, однако Boston Dynamics удалось добиться в этом неплохих результатов.
В качестве последнего примера прорыва в области роботехники можно рассмотреть Double – устройство, совершенно не похожее на BigDog. Double не бегает рысью по вражеской территории, а катается по ковровому покрытию офисов и больничным коридорам, держа на себе iPad. По существу, это перевернутый вверх ногами маятник с моторизированными колесами внизу и планшетом, прикрепленным к палке высотой около полутора метров. Double обеспечивает телеприсутствие – он позволяет оператору «обходить» отдаленные участки зданий, при этом видеть и слышать, что там происходит. Камера, микрофон и экран iPad служат глазами, ушами и лицом оператора, который видит и слышит все, что видит и слышит iPad. Сам по себе Double выполняет функцию ног, перенося всю конструкцию по зданию в ответ на команды оператора. Компания Double Robotics называет это «наиболее простым и элегантным способом оказаться в другой точке мира без необходимости туда лететь». Первая партия роботов Double по цене $2499 за единицу была распродана почти сразу после объявления об их выпуске осенью 2012 года.[53]
Следующий этап инноваций в области роботехники может нанести парадоксу Моравека серьезнейший удар, от которого тот больше не сможет оправиться. В 2012 году DARPA объявила о проведении еще одного конкурса; однако на этот раз должны были соревноваться не автомобили без водителя, а роботы. Конкурс DARPA Robotics Challenge (DRC) позволял оценить навыки в области умелого владения инструментами, мобильности, чувствительности сенсоров, телеприсутствия и многих других вопросов в этой области. Согласно информации на сайте департамента DARPA, занимающегося тактическими вопросами технологий,
первостепенная техническая цель DRC состоит в разработке наземных роботов, способных выполнять сложные задачи в опасных и неопределенных условиях среды, созданной человеком. Ожидается, что участники конкурса DRC сконцентрируют свою работу на роботах, способных использовать стандартные инструменты и оборудование, которые доступны в человеческой среде, начиная от ручных инструментов и заканчивая средствами передвижения, причем особое внимание уделят развитию адаптации к инструментам с широкими спецификациями.[54]
DARPA совместно с DRC обратилась к сообществу специалистов по роботехнике с просьбой построить и продемонстрировать функционирующие прототипы роботов-гуманоидов к концу 2014 года. Согласно изначальной спецификации, представленной агентством, роботы должны уметь управлять внедорожником, убирать завалы, блокирующие проезд, карабкаться по лестнице, закрывать вентиль и менять насос.[55] Может показаться, что эти требования недостижимы, однако хорошо осведомленные коллеги (которые участвуют в конкурсе) уверили нас в том, что это вполне возможно. Для многих конкурс Grand Challenge 2004 был важнейшим элементом развития в постоянно ускоряющемся процессе разработки автономных автомобилей. Есть большая вероятность, что DRC позволит нам наконец-то забыть о парадоксе Моравека.
Дополнительные свидетельства того, что мы находимся в точке перелома
Самоуправляемые машины, суперкомпьютеры – чемпионы Jeopardy! и самые разные полезные роботы возникли в нашем мире всего за последние несколько лет. И эти инновации – не просто лабораторные образцы; они демонстрируют свои навыки и способности в хаосе реального мира. Именно это создает у нас ощущение, что мы находимся в точке перегиба – изменения формы кривой, при котором множество технологий, которые раньше существовали лишь в научной фантастике, становятся элементами повседневной реальности. И, как доказывает множество других примеров, это ощущение имеет под собой почву.
В телесериале «Звездный путь» можно было увидеть устройства под названием «трикордеры», которые использовались для сканирования и записи трех типов данных: геологических, метеорологических и медицинских. Обычные современные смартфоны могут служить всем этим целям; они могут использоваться в качестве сейсмографов, радиолокационных карт погоды в режиме реального времени, а также измерять пульс и частоту дыхания.[56] И конечно же, всем этим дело не ограничивается. Они также выполняют роль медиаплееров, игровых платформ, справочников, камер и устройств GPS. Если в «Звездном пути» трикордеры и средства коммуникации были отдельными устройствами, то в реальном мире они соединились в одном смартфоне, который позволяет пользователю одновременно создавать и получать доступ к огромным массивам информации. И это открывает дорогу к инновациям, которые венчурный капиталист Джон Доэрр называет SoLoMo – социальными, локальными и мобильными.[57]
На протяжении истории своего существования компьютеры не умели создавать настоящую прозу. Недавно они научились создавать грамматически правильные, но бессмысленные предложения, чем не раз безжалостно пользовались шутники. К примеру, в 2008 году Международная конференция по вопросам компьютерных наук и программирования одобрила работу «К развитию электронной коммерции» и пригласила ее автора возглавить заседание. На самом деле эта работа была «написана» SCIgen, программой, разработанной лабораторией компьютерных наук и искусственного интеллекта МТИ для того, чтобы «генерировать произвольные исследования в области информатики». Авторы SCIgen писали, что «наша цель состоит в том, чтобы повеселиться, а не в том, чтобы выдать связный текст», и после прочтения куска из работы «Towards the Simulation of E-commerce» с ними сложно спорить:[58]
Недавние достижения в области кооперативной технологии и классической коммуникации полностью основаны на предположении о том, что интернет и активные сети не конфликтуют с языками объектно-ориентированного программирования. На самом деле лишь немногие теоретики информатики не согласятся с тем, что визуализация DhT превратила в реальность имитацию 8-битной архитектуры, что полностью воплощает в себе самые убедительные принципы электротехники.[59]
Впрочем, недавние достижения в этой области дали ясно понять, что компьютеры не всегда создают бессмысленные тексты. Так, сайт Forbes.com заключил контракт с компанией Narrative Science по написанию кратких отчетов о корпоративных доходах, которые появляются на сайте Forbes. Все эти истории созданы алгоритмами без человеческого вмешательства. Но их результат совершенно неотличим от того, что мог бы создать человек:
Forbes – оценка корпоративных результатов компании
H. J. HeinzРезультаты заявления о доходах в первом квартале способны подтолкнуть цену акций H. J. Heinz (HNZ) до уровня 52-недельного максимума, поскольку текущая цена всего на 49 центов отличается от показателя в отчете компании о доходах, готовящемся к публикации в среду 29 августа 2012 года.
Уровень консенсуса на Уолл-стрит составляет 80 центов за акцию, что на 2,6 процента выше относительно показателя предыдущего года, когда компания заявила о доходах на уровне 78 центов за акцию.
Уровень консенсуса не изменился с прошлого месяца, однако снизился относительно уровня 82 центов, имевшегося три месяца назад. Аналитики ожидают доходов по итогам года на уровне $3,52 на акцию. Также аналитики прогнозируют падение общей выручки компании в последнем квартале на 0,3 процента относительно уровня прошлого года – до $2,84 миллиарда (по сравнению с $2,85 миллиарда год назад). По результатам года общий объем выручки ожидается на уровне $11,82 миллиарда.[60]
В действие вступают даже периферийные компьютерные устройства типа принтеров. Они начинают демонстрировать массу полезных умений, которые, как кажется, взяты прямо из научной фантастики. Они уже не просто переносят чернила на бумагу, а создают сложные трехмерные детали, сделанные из пластика, металла и других материалов. Трехмерная печать, которую также иногда называют «аддитивным наращиванием», основана на важном преимуществе работы обычных компьютерных принтеров: они наносят очень тонкий слой материала (обычно чернил) на основу (бумагу), следуя закономерности, заданной компьютером.
Инноваторы предположили, что ничто не мешает принтерам помещать один слой материала над другим. А вместо чернил принтеры могли бы использовать другие материалы типа жидкого пластика, затвердевающего под воздействием ультрафиолета. Каждый отдельный слой очень тонок – где-то около одной десятой миллиметра, – однако постепенно трехмерный объект начинает обретать форму. Технология изготовления позволяет делать конструкции сложной формы – с пустотами, и туннелями, и даже частями, способными двигаться независимо друг от друга. В Сан-Франциско, в штаб-квартире Autodesk, ведущей компании по производству программ для дизайна, нам подарили действующий разводной гаечный ключ, напечатанный на трехмерном принтере за один проход и без дальнейшей сборки.[61]
Этот гаечный ключ представлял собой демонстрационный продукт из пластика, однако технологии трехмерной печати могут работать и с металлами. Генеральный директор Autodesk Карл Басс участвует в деятельности крупного и постоянно растущего сообщества изобретателей и любителей 3D-печати. В ходе экскурсии по залу, где демонстрируются различные продукты и проекты, ставшие возможными благодаря программам Autodesk, он показал нам прекрасную металлическую чашу, которую он лично сначала спроектировал на компьютере, а затем распечатал. На края чаши нанесен сложный решетчатый узор. По словам Басса, он попросил своих друзей, имевших опыт работы с металлом – скульпторов, металлистов, сварщиков и так далее, – предположить, как была изготовлена эта чаша. Никто из них не смог ответить на вопрос, как была сделана решетка. На самом же деле она была создана с помощью лазера, добавлявшего каждый последующий слой с помощью напыления порошкообразного металла.
Трехмерная печать в наши дни используется не только для художественных проектов, таких как чаша Басса. Она применяется каждый день в бесчисленном количестве компаний для изготовления прототипов и элементов моделей, используется для изготовления ряда готовых продуктов, начиная от пластиковых клапанов и корпусов для следующего поколения луноходов НАСА и заканчивая металлическим челюстным протезом для 83-летней женщины. В ближайшем будущем эту технологию можно будет применять для изготовления запасных частей неисправных двигателей прямо на месте, что позволит избавиться от складских запасов. Ряд демонстрационных проектов уже показал, что способом трехмерной печати можно строить дома из монолитного бетона.[62]
Большинство технологий, описанных в этой главе, возникли в последние несколько лет, причем в областях, где темп развития в течение долгого времени был чрезвычайно медленным и даже лучшие умы склонялись к тому, что ускорение невозможно. Однако затем после многих лет постепенных мелких усовершенствований цифровой прогресс стал скачкообразным. Это происходило во множестве областей – от искусственного интеллекта и беспилотных автомобилей до робототехники.
Каким образом это стало возможно? Было ли это счастливой случайностью – результатом накопления некоторого количества удачных улучшений? Нет, не было. Цифровой прогресс, свидетелями которого мы стали в последнее время, не может не впечатлять, однако это лишь малая часть того, что ждет нас в будущем. Чтобы понять, что происходит на наших глазах прямо сейчас, нам нужно понять суть трех ключевых характеристик прогресса во второй эре машин: он развивается по экспоненте, имеет цифровую форму и является комбинаторным. Следующие три главы посвящены каждой из этих характеристик.