Некоторые результаты моделирования сетевого интеллекта
Некоторые результаты моделирования сетевого интеллекта
В 1963—1964 гг. мною был сформулирован первый вариант гипотезы о механизмах мышления в обобщенном виде. В 1965 г. эта гипотеза была опубликована в книге «Моделирование мышления и психики». Два года спустя книгу переиздали в США. Последующее развитие идей нашло отражение в монографии «Искусственный разум», напечатанной в 1969 г.
Модели, реализованные на ЦВМ. В 1963 г. мы начали серию работ по созданию моделей интеллекта, построенных на принципе семантических сетей с СУТ. Такие сети были названы термином «М-сети», а модели, построенные на них,— «М-автоматами». В последующие годы создавались новые варианты моделей, однако все они основывались на использовании сетевого интеллекта с СУТ. Принцип его действия уже был описан: М-сеть представляет собой систему элементарных моделей (i-модели), каждой придано определенное значение, например модель — объект среды, модель действия, чувства, отношения и др. Модели имеют статические и динамические характеристики, в которых отражена величина уровня активности и зависимости от времении «входных» раздражителей — то есть от величины некоей энергии, поступающей по связям с других моделей или от рецепторов. У первых моделей связи задавались жестко, у последующих проходимость связей менялась в зависимости от использования — тренировки. Это же относится к характеристикам возбуждения i-моделей. Исследование модели состоит в пересчете на ЦВМ уровня активности всех элементарных моделей за условный такт времени. СУТ выбирает одну, самую активную модель и еще дополнительно ее усиливает согласно своим характеристикам, а все остальные тормозит. «Входами» М-автомата являются внешние объекты, «выходами» — его действия, направленные на среду. Все это типично для СИ.
Первая модель — РЭМ отображала условный сюжет путешествия некоего «искусственного субъекта» в среде, которая содержала полезные и опасные для него объекты. Мотивы поведения субъекта определялись ощущениями усталости, голода и стремлением к самосохранению. Субъект изучал среду, выбирал цель движения, строил план достижения этой цели и затем реализовал его, выполняя действия-шаги, сравнивая результаты, получаемые в ходе движения, с запланированными, дополняя и корректируя план в зависимости от складывающихся ситуаций.
М-сеть РЭМа содержала 90 i-моделей, около 400 связей и была способна воспринимать три типа объектов (входных параметров). Среда могла содержать до 400 объектов, произвольно расположенных на плоскости. РЭМ выполнял восемь действий и был построен как неполный М-автомат, иными словами, кроме М-сети с заданной на ней СУТ, он содержал функционирующие сопряженно с М-сетью алгоритмические структуры. Большинство из них осуществляло функции планирования. РЭМ был реализован в виде комплекса программ для ЦВМ М-220. Программы содержали свыше 3000 рабочих команд. Время просчета одного такта функционирования М-сети (единицы автоматного времени) — 1,5 мин. В течение каждого такта производился расчет величин возбуждений и параметров характеристик всех i-моделей, а также параметров всех связей М-сети (эта процедура названа пересчетом). Последовательность операций, производимых за один такт, такова: восприятие информации из внешней среды, пересчет, выбор СУТ наиболее возбужденной i-модели, принятие на основании полученной информации решения о взаимодействии со средой, выполнение этого решения. Эксперименты с РЭМом включали просчеты его состояний и регистрацию решений на протяжении 10—20 тактов.
Результаты исследования РЭМа показали перспективность использования М-сетей как при построении моделей процессов мышления, так и при разработке систем типа «искусственный разум», способных к самостоятельному эффективному функционированию в сложных условиях. Выяснилась также целесообразность дальнейшего проведения работ по изучению возможностей аппарата при построении более мощных моделей, а также исследования весьма важного в практическом и теоретическом отношениях вопроса об адаптивных возможностях М-автоматов.
Затем была построена и исследована новая модель — МОД. При его создании сохранялись как общая схема постановки задачи, так и принципиальная структура выбранного ранее условного сюжета моделирования. МОД также был разработан в виде неполного М-автомата. При этом его алгоритмическая часть отображала процессы планирования, связанные с предварительной организацией движения, а структурная — процессы принятия решений в ходе непосредственного взаимодействия со средой. Обе части целесообразно рассматривать как независимые модели мыслительных процессов, между которыми может быть организовано постоянное взаимодействие. Эти модели названы соответственно МОД-1 и МОД-2.
МОД-1 вырабатывал план деятельности М-автомата в среде в виде совокупности подцелей движения, основной цели и ожидаемых (предвидимых) состояний автомата в ходе движения. Алгоритмы восприятия внешней информации в МОД-1 моделировали процессы зрительного восприятия человека, построения возможных вариантов плана, их оценки, синтеза окончательного варианта, его разбиения на отдельные этапы, выбора объектов-ориентиров для каждого из этапов, моделировали процессы принятия решения человеком в условиях отсутствия полной информации о среде.
МОД-1 являлся неполным М-автоматом, основной объем его функций реализовался алгоритмическими структурами. М-сеть здесь содержала 62 i-модели, около 1000 связей и использовалась в основном для представления мотивационной сферы модели. МОД-1 был реализован в виде комплекса программ для ЦВМ М-220. Программы включали до 15 000 команд, их просчет занимал 20—30 мин машинного времени. Среда модели могла содержать до 625 объектов (это максимальное число). Каждый из объектов задавался упорядоченным набором из 8—10 признаков (входных воздействий). Выходом модели являлся оптимальный план передвижений в среде. В среднем такой план мог состоять из 30 элементов (целей, подцелей и ожидаемых отклонений внутренних состояний).
М-автомат МОД-2 вырабатывал конкретные реализации планов, построенных МОД-1. Его основная особенность связана с реализацией на М-сети программ самообучения. Последнее осуществлялось путем изменения веса первоначально заданных связей, установления новых связей и порождения новых узлов М-сети. Протекание процессов изменения структуры сети определялось особенностями среды, в которой действовал автомат, соотнесенными с поставленными перед ним задачами. Задачи могли формулироваться, например, в следующем виде: действовать так, чтобы обеспечить максимальное значение оценки «собственного комфорта», максимальное соответствие внешних и внутренних реакций автомата реакциям моделируемого объекта или быстрейшее достижение цели. Возможны были и комбинированные задачи.
Автомат может рассматриваться как модель деятельности человека по принятию решений в задачах движения в лабиринте. Кроме того, МОД-2 может быть использован в качестве устройства, управляющего передвижением технических систем, предназначенных для сбора информации, транспортировки и т.п. В зависимости от цели использования автомата изменяется и критерий оценки эффективности его функционирования.
МОД-2 — полный М-автомат. Его М-сеть может содержать до 400 i-моделей и до 2000 связей. На М-сети задана двухуровневая СУТ. МОД-2 был реализован в виде программы для ЦВМ БЭСМ-6. Программа содержала около 6000 команд. Время просчета одного такта 30—50 сек. Экспериментально были исследованы реакции автомата на протяжении до 300 тактов. На входы автомата подавалась информация о плане движения и об объектах среды, каждый из которых относится к одному из шести возможных типов. Всего среда могла содержать до 400 расположенных произвольным образом объектов. Предварительная информация о некоторых характеристиках среды и структуре оценочных функций задавалась в процессе начальной организации М-сети автомата. Количество выполняемых МОД-2 действий (выходных параметров или решений) — 22. Из них 17 — различного рода действия — шаги, перемещающие автомат в среде, а 5 — «активные» действия, изменяющие состояние среды или автомата («есть», «спать», «нести объект», «бросить объект», «создать убежище»). Поведение автомата состояло в формировании последовательностей решений о выполнении тех или иных действий и соответственно их фактическим выполнением. Были разработаны оценки поведения и предложены процедуры оптимизации автомата. Оптимизация выполнялась варьированием значений шести параметров обучения.
В ходе исследования МОД-2 был решен ряд вспомогательных задач-тестов. Представляет самостоятельный интерес результат одной из таких задач, связанной с моделированием процессов формирования понятий человеком. Здесь показана приводимость М-автомата к формам, моделирующим как индивидуальное, так и обобщенное групповое поведение. Были продемонстрированы методы такого приведения.
Модель механизмов речи. Одновременно с разработкой МОДа проводилось исследование, цель которого состояла в том, чтобы изучить возможности М-сетей в области нейрофизиологии и нейропсихологии, а также оценить практическую и познавательную важность таких моделей. Был разработан и исследован М-автомат, моделирующий механизмы речи. В модели представлены такие аспекты устной речи, как восприятие, осмысливание, словесное выражение. Преимущественное внимание уделялось содержательной стороне процессов переработки словесной информации. Модель предназначена для воспроизведения относительно простых речевых функций — ответов на вопросы ограниченного типа, повторения, называния. Она содержит следующие блоки: слуховых восприятий, сенсорный речевой, проприоцептивный речевой, понятийный, эмоций, мотивационный, двигательный речевой, артикуляторный и блок СУТ. Блоки модели соотнесены с определенными мозговыми образованиями. При задании организации М-сети использовались данные нейроморфологии, нейрофизиологии и клинической неврологии.
Модель представлена в виде необучающегося полного М-автомата. Его М-сеть содержит более 1000 i-моделей и 8000 связей между ними. М-автомат реализован в виде программы для ЦВМ БЭСМ-6, содержащей около 500 команд. Время просчета одного такта — 2 сек. В экспериментах наблюдалось поведение модели на протяжении до 100 тактов. На вход модели подавались буквы русского алфавита, объединенные в слова и фразы, а также специальные объекты, соответствующие образам предметов. На выходе модели, в зависимости от режима ее работы, наблюдались последовательности букв русского алфавита, которые были либо ответами на входные вопросы, либо повторением входных слов, либо названиями предметов. То обстоятельство, что при создании модели широко использовались данные нейрофизиологии, позволило в экспериментах имитировать ряд поражений мозга органического и функционального характера, приводящих к нарушениям функций речи. В частности, получены модельные отображения синдромов сенсорной, моторной, проводниковой и транскортикальной афазий.
Описанные М-автоматы составляют основной фонд «больших» моделей, разработанных и исследованных в процессе изучения возможностей и практических методов использования М-сетей.
Нами были выполнены и некоторые модельные разработки, в которых аппарат М-сетей использовался эпизодически или в модифицированном виде. Анализ результатов, полученных в разработках такого рода, может представлять серьезный интерес при оценке возможностей и свойств обсуждаемого нами аппарата.
Весь опыт моделирования поведения «разумного субъекта» в некоей среде — «лабиринте» — с использованием М-сети и расчетами на ЦВМ подытожен в монографии [4]. В качестве примера на рис. 3 приведены результаты одного из экспериментов по исследованию поведения такого «субъекта».
Семь-восемь лет мы занимались созданием сетевых моделей на ЦВМ, пока не убедились, что возможности таких моделей ограничены. Объем расчетов оказался слишком большим даже для компьютера: за один такт нужно пересчитать циркуляцию «энергии» по всем связям и изменения в их проходимости, подсчитать активность всех элементарных моделей, пересчитать изменение их тренированности для следующего такта. Если же предусмотреть и возможность образования новых связей и новых моделей, иными словами, воспроизвести принцип самоорганизации, то количество счетной работы будет расти подобно снежному кому. Затраты машинного времени увеличиваются приблизительно пропорционально кубу числа моделей в сети. Но дело не только в расчетах — так же трудно оказалось отладить громоздкие программы. Так или иначе, выйти за предел 1000 моделей и 8000 связей нам не удалось. Формально мы воспроизвели в МОД самые простые программы психики, такие, как сознание и подсознание, оптимизация действий по многим критериям — чувствам с предвидением и планированием. Была продемонстрирована разная обобщенность или иерархия моделей, обучение, забывание и даже различия характера. Но в целом этот «субъект», путешествующий среди врагов и препятствий в поисках пищи, соответствовал лишь довольно примитивному животному.
Рис. 3. Схема движений и действий МОДа по карте.
Аналоговые модели. Роботы. Тем не менее существует много задач, для которых вполне достаточен и такой ограниченный интеллект. В частности — для роботов, предназначенных для специализированной деятельности. Важнейшим требованием для них должна быть автономность, независимость от ЦВМ, что привело к реализации сетевого интеллекта на физических элементах. Идея сама по себе проста: представить каждую элементарную модель в виде усилителя, на вход которого поступает потенциал от других моделей, а на выходе формируется усиленный потенциал, который тоже передается по связям и гасится пропорционально их сопротивлению. Из таких элементов-усилителей можно создать любую сеть, если каждому придать определенное значение — семантику. Одни элементы — модели предметов, другие — чувств и т.д., как в сетевых моделях РЭМ и МОД. Разные характеристики усилителей и разные сопротивления связей позволяют создать структуры любого назначения. Модель интеллекта на физических элементах в наибольшей мере приближается к имитации мозга. К сожалению, есть разница: несоизмеримо мало число элементов и связей. Однако сложность такого интеллекта целиком определяется технологией. Можно создать довольно большие сети, во всяком случае достаточные для робота.
В 1972 г. были начаты работы по созданию модели ИИ в виде сети из физических элементов. Цель их — построить систему управления в виде М-сети с системой усиления-торможения (СУТ) и разместить ее на тележке.
Прежде чем приступить к разработке макета, были проверены возможности сети из физических элементов с СУТ. Первая сеть содержала 26 узлов и около 300 связей и управляла перемещением писчика по условной среде, изображенной на карте. Результаты экпериментальных исследований этой системы оказались обнадеживающими. Тогда приступили к созданию транспортного робота — ТАИРа.
Конструктивно разрабатываемый макет робота представляет собой трехколесное шасси, на котором смонтированы комплект рецепторов (органов чувств), блок управления, энергосистема и прочие устройства. Размер шасси 1600x1100x600 мм. Все три колеса являются ведущими и имеют автономный привод от электродвигателей мощностью по 30 Вт. Переднее колесо поворотное. Питание электродвигателей осуществляется от аккумуляторных батарей. Скорость движения по ровной поверхности составляет 10—12 м/мин.
Датчики-рецепторы можно разбить на несколько групп.
1. Датчики, определяющие положение робота в пространстве:
а) навигационная система с компасом и двумя радиомаяками;
б) датчики углов наклона тележки в двух плоскостях.
2. Датчики информации об окружающей среде:
а) дистантные. Активный оптический дальномер с радиусом действия до 10 м. Система оптических датчиков близости с диапазоном расстояний до 30 см;
б) контактные датчики — система микровыключателей, установленных на гибком чехле, в который заключена тележка.
3. Датчики состояний робота:
а) термодатчики на электродвигателях;
б) датчики крутящего момента на приводах к колесам;
в) датчики напряжения на аккумуляторных батареях;
г) вибродатчик.
4. Датчик времени.
Основу системы управления представляет физически реализованная М-сеть. Специфическая СУТ в М-сети задает положительную обратную связь по возбуждениям узлов и обеспечивает тем самым доминирование в каждый момент времени одного или нескольких узлов над всеми другими. Ввод и вывод информации в М-сети соответствуют возбуждению определенных ее узлов (входных и выходных).
В настоящее время система управления роботом предполагает осуществление целенаправленного движения с обеспечением собственной безопасности (объезд препятствий, избегание опасных мест, поддержание внутренних параметров в заданных пределах) и минимизацию временных и энергетических затрат. Вся сеть, состоящая из 100 узлов, разбита на шесть сфер.
Сферы оценок и распознавания ситуаций являются входными. Аналогично сенсорным системам мозга человека здесь осуществляется анализ воспринятой датчиками информации, на основе которого выполняется интегральная оценка среды, условий задачи и собственных состояний.
Выбор характера поведения в текущей ситуации производится в сфере решений. При этом может быть принято решение, определяющее направление движения, осуществление какого-то сложного маневра или даже выполнение некоторого элементарного действия.
Организация самого двигательного поведения осуществляется тремя сферами, являющимися выходными для сети,— сферами маневров высшего уровня, маневров нижнего уровня и элементарных действий. Здесь формируется последовательность команд, поступающих к эффекторной системе — системе управления поворотным и тяговыми электродвигателями.
Все узлы сети (i-модели) представляют собой усилители постоянного тока со специальными характеристиками. Узлы каждой из выделенных сфер имеют свои определенные характеристики. Точно так же в каждой сфере действует своя СУТ. Связи между узлами выполнены из резистивных элементов в устройстве матричного типа. Для ввода информации от датчиков в сетевое устройство управления используется 60 каналов.
Внешний вид ТАИРа представлен на рис. 4. В настоящее время мы продолжаем работы по созданию новых систем управления роботами. Эти системы пока не претендуют на достижение высокого уровня интеллекта. Правда, для ограниченных целей нейроноподобная семантическая сеть на физических элементах с СУТ хорошо себя зарекомендовала и привлекла внимание исследователей и конструкторов, которые думают об автономных роботах. Планы отдела биокибернетики по совершенствованию автоматов предполагают реализовать обучение, создать ансамблевую организацию из элементов, позволяющую резко увеличить количество моделей при том же числе элементов, улучшить зрительное восприятие среды и даже дойти до человеческой речи. Я не уверен, что эти планы воплотятся в металл достаточно скоро, не потому, что идеи несостоятельны, а исключительно вследствие трудностей их технической реализации. Почти пятнадцать лет попыток моделирования разума человека привели меня лишь к ответу на вопрос «Что такое интеллект.», но существенно не приблизили к созданию его модели. Нейроноподобная семантическая сеть с переменной активностью элементов связей и с СУТ кажется наилучшим аналогом коры мозга, но размеры ее жестко ограничены сложностью воспроизведения, элементарные поведенческие реакции, полученные на описанных моделях, весьма далеки от человеческих и ничего не могут доказать. В самом деле, разве несколько сот элементов нашей сети могут заменить 10 миллиардов нейронов мозга. Если к этому прибавить, что каждая нервная клетка представляет собой функциональную систему из многих тысяч макромолекул, что она имеет несколько сот «входов» и может участвовать в работе различных клеточных ансамблей, давая почти астрономическое число моделей, то разве можно все это воспроизвести. К этому нужно добавить самоорганизацию в виде избирательной тренировки «входов» — синапсов, обеспечивающих память, и тренировку «выхода», резко повышающую активность нейрона. Нервная система — не просто сеть из одинаковых элементов. В ней имеется начальная структура связей и клеток с разной активностью, обеспечивающих врожденные рефлексы, чувства, программу доминирования. Тренируемость клеток и связей позволяет развивать и адаптировать врожденные реакции и наслаивать на них иерархию функциональных актов различных уровней обобщения и содержания. Все это, вместе взятое, дает человеческий разум — изумительное произведение природы, которое, раз возникнув, открыло в мозге новые возможности.
Рис. 4. Внешний вид ТАИРа.
После такой характеристики сложности и возможностей мозга задача его воспроизведения в модели кажется безнадежной. Трудно представить себе искусственную сеть из десятка миллиардов элементарных усилителей, каждый из которых может иметь сотни входов, обладает способностью к тренировке — то есть изменению характеристик. Трудно, но не безнадежно. В отличие от длительной естественной эволюции прогресс науки и техники стремителен и все более ускоряется. Поэтому в перспективе возможна и аналоговая сеть, сравнимая по мощности с мозгом. Важно правильно поставить задачу — в данном случае сказать, какими должны быть элементы и как их соединять друг с другом. Пожалуй, еще важнее представить алгоритм интеллекта в достаточно обобщенном виде, позволяющем реализовать его различными средствами.
Велики технологические трудности на пути до аналогового интеллекта. Поэтому так заманчивы универсальные цифровые машины, которые уже теперь достигли большой мощности. Совершенствуется их внешняя память и растет объем оперативной памяти. Быстродействие исчисляется миллионами операций в секунду. Разделение времени и создание параллельных программ позволяют повысить эффективность компьютеров. Создается впечатление, что возможности ЦВМ еще не достаточно использованы для реализации алгоритма интеллекта. То обстоятельство, что до сих пор наши попытки создания СИ не увенчались успехом, еще не означает, что исследования закончены. Нужно сохранить обобщенный алгоритм, но отказаться от сети с тем, чтобы уменьшить объем расчетов. Однако при этом следует лишь в минимальной мере поступиться принципами. Мы решили предпринять такую попытку — создать алгоритмическую модель интеллекта. Соображения к ее проекту будут представлены в заключительной части книги. А пока перейдем к изложению идей, положенных в основу этой модели.