Обучение машины

Обучение машины

Здесь мы будем, в частности, говорить об обучении машин играм, которые улучшают стратегию и тактику своего поведения на основе приобретаемого опыта.

Существует общепризнанная теория игр, созданная фон Нейманом.

В играх, подобных игре «тик-так», вся стратегия известна, и поэтому возможно разрабатывать тактику игры с начала до конца. Теория позволяет вести игру наилучшим образом. Однако во многих играх, вроде шахмат и шашек, наших знаний недостаточно для того, чтобы разработать полную стратегию, и мы можем это сделать только приблизительно. Приблизительный вариант теории фон Неймана стимулирует игрока действовать с максимальной осторожностью, предполагая, что его противник является первоклассным мастером.

Однако это предположение не всегда оправданно. На войне, которая также представляет собой разновидность игры, это может привести к нерешительным действиям, которые часто не лучше, чем поражение. Всякое прямое использование теории игр фон Неймана в этих случаях может оказаться фатальным.

Книги по теории шахматной игры написаны не с позиций фон Неймана. Они представляют собой сборники правил, почерпнутых из практического опыта игры в шахматы против игроков высокой квалификации и глубоких знаний. Они устанавливают некоторую стоимость, или вес, который нужно приписать потере фигуры, мобильности, развитию фигур и другим факторам, изменяющимся от этапа к этапу.

Нетрудно сделать машину, которая как-то будет играть в шахматы.

Представьте себя играющим в шахматы с такой машиной. Для того чтобы ситуация была справедливой, предположим, что вы играете в шахматы по переписке, не зная, что игра ведется против машины, и что у вас в связи с этим не будет возникать никаких предрассудков. Естественно, как это всегда бывает при игре в шахматы, вы придете к некоторому заключению о личных качествах вашего противника. Вы обнаружите, что, когда на шахматной доске дважды возникает одно и то же положение, реакция вашего противника будет одной и той же. Вы

придете к заключению, что ваш противник — личность весьма консервативных правил. Если вам удался какой-либо трюк, он будет всегда удаваться при той же ситуации. Поэтому для опытного игрока будет нетрудно разгадать стратегию машины и побеждать ее в каждой партии.

Однако существуют машины, которые нельзя победить таким простым образом. Предположим, что после нескольких партий машина делает перерыв и использует свои возможности совсем для другой цели. В то время, когда она не играет со своим противником, она изучает все предыдущие партии, записанные в ее памяти, производит оценку фигур в зависимости от их положения, мобильности и т. д., анализирует наиболее выигрышные ситуации. Таким путем она изучает не только свои собственные ошибки, но и удачи своего противника. Теперь она заменяет свои предыдущие ходы новыми и продолжает игру как новая, улучшенная машина. Такая машина больше не будет проявлять прежнего упорства, и комбинации, которые раньше против нее удавались, потеряют свою ценность. Более того, со временем машина может изучить манеру игры своего противника.

Многие формы борьбы, которые мы обычно не рассматриваем как игру, тем не менее можно изучать с точки зрения теории игр. Один из интересных примеров — это борьба между мангустой и коброй. Как пишет Киплинг в рассказе «Рикки-тикки-тави», укус змеи для мангусты смертелен, несмотря на то что ее тело покрыто жесткой шерстью, которую кобра прокусывает с трудом. Киплинг называет эту борьбу своего рода пляской смерти, в которой проявляется мускульная сила и сообразительность.

Нет никаких оснований предполагать, что движения мангусты более быстрые и точные, чем у кобры. Тем не менее в подавляющем большинстве случаев мангуста побеждает кобру. Как она этого добивается?

Я рассказываю об этом на основании того, что видел сам и что можно видеть в кино. Я не гарантирую безукоризненности своей интерпретации. Малгуста начинает с ложного выпада, который заставляет змею подняться. Мангуста отскакивает и делает второй такой же выпад, так что получается серия ритмических движений, выполняемых обоими животными. Однако этот танец не монотонен, он постепенно развивается; по мере того как идет борьба, выпады мангусты все больше и больше опережают выпады кобры, и так продолжается до тех пор, пока наконец мангуста не совершает смертельное нападение в тот момент, когда кобра „вытянута„ настолько, что больше не может достаточно быстро реагировать на выпады. В это мгновение атака мангусты уже не ложная, она смертельно точна, и зубы прокусывают череп змеи.

Во время боя мангуста действует, как обучающаяся машина, и успех ее атаки определяется более высокоорганизованной нервной системой.

Бой быков представляет собой второй пример такого же типа. Необходимо помнить, что бой быков — это не спорт, а такая же пляска смерти, сущность которой состоит в координированной взаимосвязи между поведением быка и человека.

Все, что я сказал относительно борьбы мангусты и кобры, тореадора и быка, относится также к любым физическим соревнованиям человека с человеком. Дуэль на шпагах представляет собой последовательность ложных выпадов, парре, ударов, при которых каждая сторона пытается вывести шпагу противника в такое положение, чтобы достичь успеха при помощи своей шпаги. То же самое происходит при игре в теннис. Нужно не только уметь возвратить мяч на сторону противника; стратегия заключается в том, чтобы путем ряда посылок вынудить противника занять на поле такое положение, при котором он будет не в состоянии ответить тем же. Физические соревнования и игры, в которые могут играть машины, имеют тот общий элемент, что для их успешного проведения необходимо длительное изучение опыта своего противника, а также своего собственного.

То, что справедливо для физических соревнований, относится и к играм, в которых элементы интеллекта проявляются в большей степени, например к военным играм, в которых штабные офицеры приобретают навыки военного искусства. Некоторая степень машинизации, подобная той, которую используют для игры в шашки с помощью машины, возможна и здесь.

Нет ничего более опасного, чем планировать третью мировую войну. Интересно рассмотреть, может ли какая-то часть этой опасности возникнуть из-за бесконтрольного использования обучающихся машин. Слова я снова

приходится слышать утверждение, что обучающаяся машина не может подвергнуть нас никакой опасности, потому что в решительный момент, когда мы это почувствуем, мы ее просто выключим. Можем ли мы это сделать? Для того чтобы своевременно выключить машину, мы должны обладать информацией, что опасный момент действительно наступил.

Уже тот факт, что машину изготовили люди, доказывает: нет никакой гарантии, что у нас будет достаточно информации для того, чтобы это сделать. Теперь уже известно, что играющая в шашки машина может обыграть человека, который ее. изготовил, после сравнительно короткого промежутка времени. Более того, сама скорость работы современных вычислительных машин препятствует тому, чтобы мы, люди, были в состоянии своевременно почувствовать и осознать признаки надвигающейся опасности.

Идея устройства, обладающего большим могуществом и выдающимися способностями осуществлять какую-либо стратегию, а также опасность таких устройств, не новы. Новым является то, что мы фактически уже обладаем этими устройствами. В прошлом подобные возможности преподносились в форме чародейства и это стало темой многих легенд и народных сказок. В этих легендах тщательно исследована моральная сторона колдовства. Я уже обсуждал некоторые этические аспекты чародейства в одной из своих ранних книг («Человеческое использование человеческого ума»). Здесь я повторю часть материала, чтобы более точно вскрыть содержание понятия «обучающаяся машина».

Одно из наиболее известных сказочных произведений Готе называется «Ученик чародея». В этой сказке колдун оставляет своего ученика на кухне и приказывает ему натаскать бочку воды. Мальчишка ленив, но довольно изобретателен: он заставляет метлу выполнить эту работу, произнося над ней магические заклинания, подслушанные у своего хозяина. Метла покорно выполняет эту работу, но остановить ее он не может. Мальчик почти тонет, он обнаруживает, что не выучил или забыл другое заклинание, которое остановило бы метлу. В отчаянии он хватает метлу, ломает ее пополам, но, к своему ужасу, обнаруживает, что из каждой половинки продолжает течь вода.
К счастью, ой не погиб, потому что появился хозяин, произнес магические слова, остановил метлу и хорошенько наказал ученика.

Более страшным является рассказ английского писателя начала XX столетия У. Джакобса об обезьяньей лапе.

Ушедший на пенсию английский рабочий сидит за столом с женой и приятелем, английским сержантом, вернувшимся из Индии. Сержант показывает хозяевам амулет в виде высохшей, сморщенной обезьяньей лапы. Этот амулет, подаренный ему индийским священником, обладает силой выполнить любые три желания любых трех людей.

Сержант говорит, что он ничего не знает о первых двух желаниях прежнего владельца, но что третье его желание было — смерть. Он рассказывает своим друзьям, что является вторым владельцем амулета, но не хочет говорить об ужасах, которые он из-за него пережил. Он бросает обезьянью лапу в камин, однако его друг выхватывает ее и заявляет, что хочет испытать могущество амулета.

Первым его желанием было получить 200 фунтов стерлингов. Вскоре после этого раздается стук в дверь и появляется представитель компании, в которой работал сын хозяина. Отец узнает, что его сын погиб на заводе и что компания, не считая себя виновной в его гибели и не связанная юридическими обязательствами, решила выплатить отцу погибшего 200 фунтов стерлингов. Убитый горем отец произносит свое второе желание, чтобы его сын вернулся. Снова слышится стук в дверь, и она открывается. Появляется нечто, о чем мы узнаем из очень скупых слов,— призрак сына. Последним желанием отца было, чтобы призрак исчез.

Общим для всех этих историй является то, что магические действия выполняются буквально. И если мы ждем от магии какого-либо благодеяния, мы должны просить именно то, что мы хотим, а не то, что мы думаем, что хотим.

Новым, реальным качеством обучающихся машин является то, что они выполняют наши требования буквально. Если мы программируем машине выиграть войну, мы должны хорошенько подумать над тем, что мы понимаем под выигрышем в войне.

Обучающаяся машина программируется на основе опыта. Опыт атомной войны, которая не приведет к катастрофе, можно почерпнуть только из военных игр. Если мы будем использовать этот опыт для разработки машинной стратегии на случай реальной опасности, смысл победы, которую мы имели в виду, программируя военную игру, должен быть точно таким же, какой мы чувствуем сердцем в действительной войне. Нельзя думать, что машина будет, подобно нам, способной к различного рода предрассудкам и эмоциональным компромиссам, позволяющим нам называть гибель победой. Если мы просим от машины победу, не зная, что мы под этим подразумеваем, мы можем обнаружить, что в дверь постучится призрак.

содержание .. 10 11 12 13 14 15 16 17 18 19 20 ..