Другие журналы

научное издание МГТУ им. Н.Э. Баумана

НАУКА и ОБРАЗОВАНИЕ

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211.  ISSN 1994-0408

Основы построения распределенных систем управления коллективами роботов

#1 январь 2005

И

И. А. Каляев, д-р техн. наук, С. Г. Капустин, канд. техн. наук, Л. Ж. Усачев, канд. техн. наук, НИИ многопроцессорных вычислительных систем при ТРТУ (г. Таганрог)

 

Основы построения распределенных систем управления коллективами роботов

 

Рассматривается проблема построения многопроцессорных систем управления коллективом роботов на базе высокоскоростных бортовых комплексов с параллельной обработкой информации. Дается формализация задачи планирования действий каждого робота коллектива и обсуждается реализация централизованной и распределенной систем управления коллективом роботов.

 

В настоящее время средства робототехники и, в первую очередь, мобильные роботы могут быть использованы для решения различных задач в экстремальных условиях, в частности, в военной области: для установки, поиска и обезвреживания мин; поиска, обнаружения целей и наблюдения за ними; транспортировки боеприпасов и других средств боевого обеспечения; доставки оружия на огневой рубеж и уничтожения целей; для проведения спасательных и аварийных работ в зонах экологических катастроф и т. д. — без непосредственного участия человека. Исследования в данном направлении активно ведутся в развитых странах Запада и Японии и прежде всего в интересах вооруженных сил. В США в рамках стратегической оборонной инициативы создается целый ряд роботов военного назначения, способных автономно перемещаться по полю боя со скоростями до 50км/ч [1, 2]. Например, разрабатывается проект по созданию армейского автономного транспортного средства (ААТС) [3]. Примером может служить также проект Министерства обороны Германии ARTES в рамках экспериментальной программы "Роботы на поле боя" [1].

Следует отметить, что в настоящее время накоплен большой опыт как за рубежом, так и в России по созданию дистанционно управляемых роботов специального назначения, предназначенных для экстремальных условий. Однако возникают трудности в управлении такими роботами при отсутствии прямой видимости между оператором и роботом, кроме того требования по обеспечению помехоустойчивости и надежности к каналам передачи информации в таких системах весьма жесткие. Возникает проблема создания роботов, способных функционировать автономно или под контролем оператора. Контроль со стороны оператора позволяет оперативно вмешиваться в действия робота при возникновении критической ситуации.

Во многих случаях для эффективного выполнения поставленной задачи представляется целесообразным использование группы автономных роботов, причем действия каждого отдельного робота в этой группе должны быть направлены на решение единой задачи (или нескольких взаимосвязанных задач).

Группу роботов, в которой действия каждого отдельного робота направлены на достижение некоторой общей, групповой цели будем называть коллективом роботов.

Основные преимущества коллектива роботов заключаются в следующем: во-первых, выход из строя отдельных роботов, функционирующих в экстремальных условиях, в малой степени влияет на выполнение поставленной перед коллективом задачи; во-вторых, коллективные действия роботов позволяют перераспределять цели отдельных роботов в зависимости от текущей ситуации для наилучшего достижения коллективной цели.

Например, при выполнении спасательных работ один или несколько роботов-разведчиков обнаруживают цели (очаги пожаров, разрушенные здания и т. д.), а затем по информации, передаваемой ими спасательным роботам, последние будут двигаться к целям для выполнения необходимых работ. При этом могут потребоваться несколько роботов. Если для выполнения конкретной целевой задачи требуется меньшее число роботов, остальные из выделенных для решения этой задачи роботов могут оперативно перенацеливаться на другие объекты. Кроме того, учитывая экстремальные условия, необходимо оперативно изменять задачи отдельным роботам и (или) группам роботов.

Таким образом, возникает проблема оперативного перераспределения целей между роботами коллектива в зависимости от текущей ситуации, т. е. от текущего расположения роботов в пространстве, а также их текущей боеспособности. В свою очередь данная проблема порождает такие проблемы, как оперативное планирование траектории движения роботов к выбранным целям и управление их движением по данным траекториям. Эти задачи не могут быть решены заранее, поскольку цели движения роботов могут постоянно изменяться, а должны решаться в темпе с изменением ситуации в среде, т. е. в реальном времени.

Очевидно, что перечисленные выше задачи не могут решаться с помощью централизованного вычислительного устройства, поскольку возможность устойчивой связи такого устройства с роботами, которые могут находиться на значительном расстоянии от него, очень проблематична, особенно в экстремальных условиях. В связи с этим возникает необходимость создания децентрализованной системы управления коллективом роботов, состоящей из отдельных узлов, располагаемых непосредственно на борту отдельных роботов коллектива, и обеспечивающей оптимальное поведение всего коллектива в целом. Такая система будет обладать двумя важными преимуществами: во-первых, за счет оперативного перераспределения целей будет достигаться высокая эффективность при выполнении целевой задачи и, во-вторых, за счет децентрализации системы будет обеспечиваться ее высокая живучесть, поскольку вывод из строя отдельного робота не будет приводить к уничтожению всей системы управления коллективом роботов.

Очевидно, что применение традиционных методов и подходов не позволяет создавать подобные системы управления коллективами роботов. Необходимо построение многопроцессорных систем управления на базе высокоскоростных бортовых комплексов с параллельной обработкой сигналов.

Исследования в данном направлении в настоящее время активно ведутся в развитых странах Запада в рамках закрытых, стратегически важных программ. В нашей стране теоретическая и практическая база для проведения научно-исследовательских работ в области распределенных систем управления коллективами роботов создана в Научно-исследовательском институте многопроцессорных вычислительных систем при Таганрогском государственном радиотехническом университете и в Научно-исследовательском центре супер - ЭВМ и нейрокомпьютеров Академии наук высшей школы (г. Таганрог).

В частности, здесь разработаны теоретические и практические основы построения интеллектуальных систем управления роботов на базе многопроцессорных и нейропроцессорных систем, созданы экспериментальные образцы таких систем. Имеются наработки (программные модели, теоретические результаты) по планированию и управлению деятельностью коллективов роботов, материалы о которых опубликованы в отечественной и зарубежной печати [4, 5].

Задача планирования действий коллектива ро­ботов может быть сформулирована следующим образом.

Пусть имеется некоторый коллектив роботов (j = 0,1, ..., n - 1), функционирующих в общем пространстве состояний {S}, в котором выделяется подмножество целей, или целевых состояний {S}m.

Под текущей ситуацией в системе "роботы - внешняя среда" будем понимать некоторый обобщенный вектор состояния , есть вектор состояния j-го робота.

Под начальной ситуацией будем понимать обобщенный вектор состояния , есть вектор начального состояния j-го робота.

Под некоторой "общей" целью коллектива роботов будем понимать обобщенный вектор конечного состояния  есть вектор конечного состояния j-го робота.

Введем понятие обобщенного вектора-функции действия  есть вектор-функция действия j-го робота.

Тогда для решения задачи планирования действий коллектива роботов на первом этапе необходимо из множества целевых ситуаций {S}m сформировать обобщенный вектор конечного состояния системы  в соответствии с некоторой коллективной стратегией выбора :

               (1)

Из соотношения (1) следует, что выбор конечного состояния для каждого j-го робота коллектива из всего множества целевых состояний {S}m в данной постановке будет зависеть от номера робота в системе, обобщенного вектора начального состояния системы  и подмножества целевых состояний , выбранных другими роботами коллектива.

В случае, если вектор  сформирован, необходимо на интервале времени [t0, tk] определить обобщенный вектор-функцию действия , реализующую экстремум функционала

Функционал  является коллективным критерием оптимальности функционирования рассматриваемой системы при граничных условиях

и системе дифференциальных связей

При этом значения Sj, Dj должны удовлетворять системе ограничений

где {S}u — подмножество разрешенных состояний системы; {D}u — подмножество разрешенных действий.

Подмножества разрешенных и запрещенных состояний в данном случае определяются следующим образом:

                     (2)

где j — номер робота в коллективе;  - подмножество запрещенных состояний для j-го робота; {S}z — подмножество запрещенных состояний для всей системы; {S}u — подмножество разрешенных состояний.

В соотношении (2) оператор  учитывает тот факт, что отдельные роботы в процессе функционирования могут создавать дополнительные запрещенные ситуации для других роботов коллектива.

Если проанализировать данную выше формальную постановку задачи планирования действий каждого робота коллектива, то можно заметить, что эта задача может быть отнесена к классу задач вариационного исчисления.

Проведенный анализ позволяет сделать вывод о высокой вычислительной сложности рассматриваемой задачи уже в случае одного робота. Понятно, что при управлении коллективом роботов вычислительная сложность многократно возрастает.

Существуют два основных подхода к организации процедуры управления коллективом роботов — это реализация системы управления в виде централизованной либо в виде распределенной системы.

В случае централизованной системы (рис. 1) решение всех сформулированных выше задач, обеспечивающих планирование действий коллектива роботов, возлагается на некоторый центральный управляющий блок СУ (ЦКП).

Рис. 1. Централизованная система управления коллективом роботов:

СУ — система управления; ЦКП — центральный командный пункт; МР — мобильный робот

 

В распределенной системе управления (рис. 2) для обеспече­ния эквивалентного уровня оптимальности функционирования система управления j-го робота в принципе должна решать те же задачи, что и управляющий блок в централизованной системе, т. е. формировать обобщенный вектор-функцию действия , после чего выбирать вектор-функцию Dj, соответствующую номеру робота в системе. Характеризуя данные подходы, необходимо отметить следующее.

Рис. 2. Распределенная система управления коллективом роботов

 

Одним из преимуществ централизованной системы является простота бортового вычислительного устройства, которое в данном случае должно лишь обеспечивать связь с центральным управляющим блоком и реализацию соответствующих команд. В то же время данная организация системы управления имеет ряд серьезных недостатков, которые делают ее применение проблематичным.

Принципиальным недостатком централизованной системы является низкая живучесть, поскольку выход из строя центрального управляющего блока полностью парализует действия коллектива роботов и выводит систему из строя. В распределенной системе управления ситуация качественно иная, поскольку выход из строя отдельных роботов приводит лишь к снижению функциональных возможностей коллектива роботов и некоторой потере оптимальности функционирования при сохранении работоспособности системы.

Понятно, что для повышения надежности и живучести в централизованной системе могут быть использованы различные классические способы, например резервирование, однако возможности в данном направлении ограничены (дублирование, троирование).

Другим серьезным недостатком является то, что в централизованной системе все роботы коллектива нуждаются в непрерывных обменах большими объемами информации с центральным управляющим блоком и в этом смысле жестко "привязаны" к центральному блоку, мобильность которого неизбежно (в силу его высокой сложности) будет значительно ниже. В результате сокращается радиус действия, снижается скорость перемещения роботов и соответственно функциональные возможности системы. В распределенной системе данный недостаток сводится к минимуму.

При этом необходимо отметить, что какой бы "умной" не была подобная робототехническая система, в ней всегда должна быть предусмотрена связь с некоторым центральным командным пунктом (ЦКП). Однако в распределенной системе роботы будут получать от ЦКП лишь минимально необходимый набор команд и данных, например начальные координаты целей, и смогут длительное время совместно функционировать без непосредственного участия ЦКП на значительном удалении от последнего. Понятно также, что в данном случае структура и функции ЦКП по сравнению с централизованной системой значительно упрощаются.

Таким образом, обобщая приведенные выше соображения, можно сделать вывод, что распределенная система управления коллективом роботов имеет ряд неоспоримых преимуществ.

В то же время вычислительная сложность задачи планирования действий коллектива роботов в рассмотренной выше постановке такова, что для ее решения в реальном масштабе времени требуется вычислительная система сверхвысокой производительности. Понятно, что применение подобной системы на борту автономно функционирующего мобильного робота, энергетические и прочие ресурсы которого ограничены, вряд ли возможно. Кроме того, серьезную проблему будет представлять организация обмена информацией между роботами коллектива. Действительно, при таком подходе каждый робот коллектива должен располагать информацией о подмножестве запрещенных состояний  и векторах  всех остальных роботов. Понятно, что уже при относительно невысокой размерности векторов и массивов данных возникнут затруднения, которые при увеличении размерности или числа роботов станут принципиальными.

Таким образом, для того чтобы воспользоваться преимуществами распределенной системы управления, исходная постановка задачи планирования действий коллектива роботов должна быть изменена.

Суть предлагаемого подхода заключается в следующем. В процессе функционирования системы каждый j-й робот коллектива выбирает себе цель (вектор конечного состояния  из подмножества целевых состояний) в соответствии с принятой коллективной стратегией (оператор ). Далее каждый робот, независимо от других, решает задачу планирования своих действий (вектор-функция Dj) по достижению конечного состояния  в разрешенном пространстве состояний , которое в отличие от одиночного робота формируется с учетом текущих векторов состояний Sj других роботов коллектива (оператор ).

Задача планирования действий j-го робота коллектива в распределенной системе в значительной степени сводится к аналогичной задаче для одиночного робота. Отличие заключается в процедуре выбора конечного состояния и подмножества запрещенных состояний (учитывается текущее состояние других роботов коллектива).

В результате оптимальность функционирования системы по сравнению с исходным вариантом несколько снижается, однако организация информационных обменов и вычислительная сложность процедуры планирования действий робота по достижению цели резко упрощается, что делает возможным ее реализацию в распределенной системе управления коллективом роботов.

С учетом изложенного систему планирования действий произвольного робота коллектива можно

представить в виде, показанном на рис. 3.

Рис. 3. Структура системы планирования действий отдельного робота коллектива

 

Система содержит вычислительный блок (ВБ), реализующий рассмотренные выше процедуры, блоки приема (БПрИ) и передачи (БПИ) информации, а также навигационный блок (НБ) и сенсорный блок (СБ), от которых поступает информация о текущем состоянии робота и внешней среды.

Таким образом, если каждый робот коллектива оснастить подобной системой планирования действий, то в результате мы получим распределенную систему управления, в которой каждая отдельная система вырабатывает решение исходя из общей цели, поставленной перед всем коллективом. При этом, поскольку очередное решение вырабатывается с учетом информации о текущей ситуации (текущих состояниях других роботов и текущем состоянии среды), то коллектив роботов будет постоянно адаптироваться к текущей ситуации и оптимизировать свои действия с ее учетом.

 

Список литературы

1. Comand and control structure and perception system of the German McD experimental program "Robotics on the battlefield". Zapp A. "Proc.  1992 IEEE Inter. Conf. Rob. and Auton., Nice, France, May 12-14, 1992, Vol. 3", 2785-2791.

2. Батурин Ю. М. Стратегическая компьютерная инициатива // Вычислительная техника и ее применение. 1988. № 12. С. 5-27.

3. Строев В. Системы с искусственным  интеллектом  в сухопутных войсках // Зарубежное военное обозрение. 1997. № 3. С. 27—30.

4. Каляев И. А. Однородные нейроподобные структуры в системах выбора действий интеллектуальных роботов // Известия вузов. Электроника. 1997. № 3—4. С. 99—105.

5. Kaliaev I. A., Kapustian S. G. Multiprocessor distributed control system of intelligent mobile robot. — 14 th Workshop on Distributed Control Systems, — Seoul, Korea, July 1997.

 

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, № 5, 1998

ОПТИМИЗАЦИЯ ТЕХНИЧЕСКИХ ОБЪЕКТОВ

 

Ключевые слова: Системы управления, распределённые системы, многопроцессорные системы, роботы, коллективы роботов, коллективная стратегия, интеллектуальные системы, планирование, экстремум функционала, оптимизация.

Поделиться:
 
ПОИСК
 
elibrary crossref ulrichsweb neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)
  RSS
© 2003-2020 «Наука и образование»
Перепечатка материалов журнала без согласования с редакцией запрещена
 Тел.: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)