Наука и Образование: научно-техническое издание: 77-30569/282904 Алгоритмы управления гамильтоновыми системами в условиях параметрической неопределенности

УДК 62.59

КФ МГТУ им. Н.Э. Баумана

Введение.

Задача приближения к заданному энергетическому уровню в условиях полной априорной информации рассмотрена, например, в работах [1, 2]. ,Для решения этой задачи использовался метод скоростного градиента.

Большинство известных алгоритмов синтеза адаптивного управления подходят для решения таких задач, как стабилизация и слежение, когда траектории системы сходятся к точке или кривой. В этих случаях целевая функция обладает свойством радиальной неограниченности по отношению к вектору состояния управляемой системы. Однако в ряде приложений требуется только стабилизация по отношению к части переменных. Например, такие задачи возникают при синхронизации, стабилизации желаемого уровня энергии физических или механических систем [6].

Особенностью решения задачи приближения к заданному энергетическому уровню в условиях параметрической неопределенности объекта управления (ОУ) является вхождение в целевую функцию неизвестных параметров. Это предполагает идентификацию параметров объекта. Например, в работе [3] для однопараметрической модели маятника, введённой в [4].предложено параметрическое управление. Система состоит из объекта, подсистемы адаптации параметра маятника, синусоидального задающего воздействия с желаемой частотой колебаний и наблюдателя (эталонной модели).

В данной работе рассматривается синтез координатного управления методом бискоростного градиента [5]. Алгоритмы синтезируется в два этапа. На первом этапе в условиях полной априорной информации об объекте методом скоростного градиента формируется «идеальное» управление, обеспечивающее системе заданный уровень энергии. На втором этапе неизвестные параметры «идеального» управления и энергетического показателя заменяются настраиваемыми и синтезируется алгоритм идентификации. Устойчивость расширенной системы, состоящей из ОУ и подсистемы адаптации, обосновывается методом функции Ляпунова.

Постановка задачи.

Рассмотрим объект управления в гамильтоновой форме:

, (1)

где – вектор состояния, , – обобщенная координата и обобщенный импульс, , где – множество возможных значений , – гамильтониан, – гамильтониан (энергия) свободной системы, – гамильтониан взаимодействия.

Целью управления (ЦУ) является ограниченность всех траекторий замкнутой системы и достижение заданного уровня энергии

. (2)

Предполагается измеримость вектора состояния.

Синтез алгоритма управления.

Синтезируем алгоритм управления методом бискоростного градиента [4] по двухэтапной схеме.

Предположение 1. Слагаемые гамильтониана , линейно зависят от , т.е. представимы в виде .

Этап 1. Синтез «идеального» управления , обеспечивающего достижение цели управления (2) в условиях полной априорной информации о параметрах объекта управления.

Введем в соответствие с (2) целевую функцию , например, в форме:

, (3)

где , , – локальный целевой функционал; – отклонение от целевого многообразия.

Условие Q(условие роста ). Функция неотрицательная, равномерно-непрерывная в любой области вида и удовлетворяет соотношению при .

Условие D1 (условие достижимости). Для любого существует и скалярная, непрерывная, строго возрастающая функция такая, что и выполняется неравенство , где – полная производная по времени функционала (3) в силу траектории системы (1); – скобка Пуассона.

Синтезируем алгоритм «идеального» управления методом скоростного градиента в конечной форме

где – априорное управление (может быть выбрано нулевым), – коэффициент усиления; – функция, удовлетворяющая условию усиленной псевдоградиентности.

Условие Ф (усиленной псевдоградиентности). Вектор-функция удовлетворяет условию

где – некоторые числа.

Условие Ф, выполнено, например, при для и . В дальнейшем ограничимся рассмотрением лишь релейных алгоритмов вида

. (4)

Этап 2. Синтез алгоритма идентификации.

Введем в рассмотрение настраиваемую модель вида

, (5)

где – вектор состояния настраиваемой модели, – вектор входа настраиваемой модели.

Сформулируем дополнительные цели управления (ДЦУ)

, (6)

(7)

где – локальный целевой функционал, .

Условие QE(условие роста). Функция неотрицательная, равномерно-непрерывная в любой области вида и удовлетворяет соотношению при .

Условие D2 (условие достижимости). Существует функция , скалярная, непрерывная, строго возрастающая функция такая, что и выполняется неравенство , где – полная производная по времени функционала (6) в силу траекторий системы (1); (5).

Заменим в «идеальном» входном воздействии неизвестные параметры на настраиваемые

(8)

Синтезируем алгоритм адаптации методом скоростного градиента

, (9)

где – матрица; удовлетворяет приведенному ниже условию G; – внешний вход для модели ошибки.

Условие G (условие разрешимости и псевдоградиентности). Гладкая вектор-функция удовлетворяет условию псевдоградиентности , и для любых , , , существует единственное решение уравнения .

Определение 1 [2]. Вектор-функция называется постоянно возбуждающей (ПВ) на , если она измерима и ограничена на и существуют , такие, что .

Условие I. – ПВ вектор-функция.

Заменим в целевом функционале (3) и в «идеальном» управлении параметры на настраиваемые

, (10)

где ,

. (11)

Теорема 1. Пусть выполнены условия Q, D1, Ф, D2, G, I. Тогда в системе (1), (5), (8), (9), (11) все траектории ограничены и , , при . Для системы (1) существует функция Ляпунова:

(12)

Введем в рассмотрение частный случай модели (5)

, (13)

где .

ДЦУ имеет вид (6) относительно , .

Следствие 1. Пусть для системы (1), (8), (9), (11), (13) выполнены условия теоремы 1. Тогда утверждения теоремы 1 сохраняют свою силу с точностью до замены вектор-функции на скалярную функцию .

Рассмотрим частный случай модели (5)

, (14)

где – обобщенный импульс эталонной модели, – гамильтониан (энергия) свободного движения эталонной модели, – параметры эталонной модели.

Обозначим вместо вход гамильтоновой системы (1) за и представим вход в виде суммы входных воздействий

, (15)

где – составляющая управления, обеспечивающая достижение ЦУ (2), – составляющая управления, обеспечивающая достижение ДЦУ (7) для модели ошибки .

Следствие 2. Пусть для системы, состоящей из ОУ (1) со входом (15), эталонной модели (14), составляющих управления (8), (11), подсистемы адаптации (9), выполнены условия теоремы 1. Тогда утверждения теоремы сохраняют свою силу с точностью до замены вектор-функции на скалярную функцию .

Замечание. Условия достижимости D1, D2 гарантируют достижение целей управления в условиях полной априорной информации о параметрах ОУ. Условия роста требуются для установления глобальных свойств системы.

Синтез алгоритмов при квадратичных целевых функционалах

Рассмотрим применение приведенной методики синтеза применительно к квадратичным целевым функционалам вида:

(16)

(17)

Очевидно, что условия роста Q, QE выполнены.

Этап 1. Синтезируем алгоритм «идеального» управления вида (4). Для этого вычислим градиент от скорости изменения целевого функционала

(18)

вдоль траектории системы (1) и, используя условие усиленной псевдоградиентности, получим [1, 2]

, (19)

где .

Проверим выполнение условия достижимости D1.

Для этого вычислим скорость изменения целевой функции (18) в силу траекторий системы (1) с управлением (19)

(20)

в силу выполнения условия псевдоградиентности функции .

Заметим, что условие нарушается в точках равновесия для некоторых . Однако исследования, проведенные в работе [1, 2], показывают, что цель , достигается при почти всех (по мере Лебега) начальных условиях.

Этап 2.

Введем в рассмотрение настраиваемую модель вида (5).

Выберем в качестве входного воздействия настраиваемой модели компенсирующий алгоритм вида

, (21)

где – гурвицева матрица.

Тогда производная целевой функции (17) в силу траектории системы (1), (5), (21)

(22)

где – минимальное и максимальное собственные числа матриц , , удовлетворяющих уравнению Ляпунова .

Следовательно, условие достижимости D2 выполнено.

Заменяя в (21) вектор неизвестных параметров вектор-функцией настраиваемых параметров , получаем алгоритм управления для настраиваемой модели в виде

. (23)

Определим в силу траектории системы (1), (5), (23)

. (24)

Вычисляя градиент по и выбирая алгоритм адаптации (9) в дифференциальной форме, получаем

. (25)

Тогда из (24) с учетом (22) получаем . Откуда в силу леммы Барбалата следует ограниченность траекторий системы (1), (5), (9), (23) и достижение ДЦУ (17).

Замечание. Для эталонной модели (13) управление (23) и алгоритм адаптации будут иметь вид

, (26)

Условие идентифицируемости I будет выполнено, если движение замкнутой системы обладает достаточным спектром собственных частот, например, когда в системе наблюдаются нелинейные колебания, что может быть обеспечено соответствующим выбором значения желаемого энергетического уровня .

Используя результаты первого этапа синтеза и целевую функцию (16), выберем из семейства алгоритмов релейный алгоритм (19) при , при котором управление будет постоянно возбуждающим,

. (27)

Пример.

Рассмотрим уравнение маятника в гамильтоновой форме.

(28)

где , – параметры, , , – физические характеристики объекта: момент инерции, масса и длина маятника, значения которых по условию считаются неизвестными, – вектор параметров. Гамильтониан маятника , где – гамильтониан (энергия) свободной системы, – гамильтониан взаимодействия.

ЦУ (2) будет соответствовать раскачке маятника до амплитуды при или приведение маятника во вращение с угловой скоростью при .

Проведем синтез алгоритма управления согласно описанной методике.

Этап 1.

Алгоритм «идеального» управления вида (19) при имеет вид

, (29)

Этап 2.

Для настраиваемой модели (13) алгоритм управления имеет вид

. (30)

Алгоритм адаптации

, (31)

или

, (32)

Условие идентифицируемости I выполнено для параметра и не выполнено для параметра , т.к. Для идентифицируемости по параметру можно, например, добавить в управление слагаемое вида , – частота задающего воздействия, не совпадающая с собственной частотой колебания маятника. Заметим, что целевая функция (16) для маятника не зависит от . Более того «идеальное» значение . При этом алгоритм управления (27) можно использовать в виде

(33)

с подсистемой адаптации (32).

Для оценки определим

(34)

Тогда с учетом (33) при ,. Результаты моделирования системы приведены на рис. 1-3.

Условия моделирования: ; ; ; ; ; ; ; ; ; ; ; .

Рис. 1. Гамильтониан свободной системы, оценка гамильтониана и желаемый уровень энергии

Рис. 2. Неизвестные и настраиваемые параметры

Рис. 3. Обобщенный импульс объекта и модели

Литература

1. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. – СПб.: Наука, 2000. – 548 с.

2. А.Л.Фрадков. Кибернитеская физика: принципы и примеры. СПб.: Наука, 2003. – 208 с., 47 ил

3. D.V. Efimov, A.L. Fradkov (2006). Adaptive tuning to bifurcation for time-varying nonlinear systems. Automatica 42 (2006) 417 – 425.

4. Babitsky, V. I., & Shipilov, A. (2003). Resonant robotic systems. Berlin: Springer.

5. Мышляев Ю.И. Схема бискоростного градиента. // Сборник трудов междун. техн. конф. «Приборостроение – 2002», Винница-Алушта. - С. 180-184.

6. A. L. Fradkov and P. A. Yu, Introduction to Control of Oscillations and Chaos, Singapore: World Scientific, 1998.

научное издание МГТУ им. Н.Э. Баумана

НАУКА и ОБРАЗОВАНИЕ

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211. ISSN 1994-0408