Применение метода эллипсоидов в задачах управления и наблюдения для ансамблей динамических систем тема автореферата и диссертации по механике, 01.02.01 ВАК РФ
Шматков, Антон Михайлович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1995
ГОД ЗАЩИТЫ
|
|
01.02.01
КОД ВАК РФ
|
||
|
РОССИЙСКАЯ АКАДЕМИЯ НАУК
0^НСТИТУТ ПРОБЛЕМ МЕХАНИКИ
г ~ —
На правах рукописи
ШМАТКОВ Антон Михайлович
ПРИМЕНЕНИЕ МЕТОДА ЭЛЛИПСОИДОВ В ЗАДАЧАХ УПРАВЛЕНИЯ И НАБЛЮДЕНИЯ ДЛЯ АНСАМБЛЕЙ ДИНАМИЧЕСКИХ СИСТЕМ
01.02.01 - теоретическая механика
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
Москва - 1995
Работа выполнена в Институте проблем механики РАН
Научный руководитель:
академик РАН Ф.Л.Черноусько
Официальные оппоненты:
доктор физико-математических наук, профессор А. И. Кибзун, доктор физико-математических наук, профессор Н. А. Парусников,
Ведущая организация:
Институт математики и механики УрО РАН, г.'Екатеринбург.
'Защита диссертации состоится "23" ноября 1995 г. в 15 часов на заседании диссертационного совета Д 002.87.01 при Институте проблем механики РАН по адресу: 117526, Москва, проспект Вернадского, 101, ИПМ РАН.
С диссертацией можно ознакомиться в библиотеке Института проблем механики РАН.
Автореферат разослан "21" октября 1995 г.
Учёный секретарь диссертационного совета Д002.87.01 кандидат физико-математических наук
А.И.Меняйлов
Диссертация посвящена вопросам управления ансамблями динамических систем с неопределенными параметрами и моделированию процесса гарантированной фильтрации данных, полученных в результате наблюдений за такими системами.
Актуальность работы. Как известно, многие из представляющих практический интерес динамических систем не могут быть удовлетворительно описаны в рамках строго детерминированных моделей. Системы часто подвержены влиянию различных неопределенных факторов: внешним возмущающим силам, неконтролируемым вариациям параметров, погрешностям в определении начальных условий. Внешне другое, но математически аналогичное положение вещей возникает при определении возможностей управления детерминированной системой. Роль неопределенного фактора здесь играет управление, и представляется важным определить множество возможных движений системы при заданных ограничениях на управление. Эти проблемы могут быть сведены к оцениванию возможных фазовых состояний динамических систем. Во всех случаях ключевым является моделирование реального недетерминированного процесса некоторым математическим методом.
Основными подходами к описанию неопределенных величин являются вероятностный и гарантированный. Вероятностный (стохастический) подход сопоставляет каждому неопределенному вектору некоторое распределение вероятностей с заданной плотностью. Соответствующим этому подходу математическим аппаратом является теория случайных процессов. Отметим, что вероятностный подход требует знания статистических характеристик исходных неопределенных факторов, что далеко не всегда доступно на практике. Кроме того, неопределенные факторы могут носить характер направленного противодействия.
Гарантированный (минимаксный) подход оперирует с множествами, в которых лежат неопределенные векторы. При этом предполага-
ется, что неизвестные помехи локализованы в известных множествах, а в остальном произвольны. При гарантированном подходе требуется осуществлять сложные операции с множествами, что приводит к катастрофическому росту необходимых вычислительных ресурсов с ростом размерности. Поэтому целесообразно применять оценки множеств, фигурирующих в данном подходе. В частности, такие оценки предоставляет метод эллипсоидов, развитый в [2], [7]. В диссертации используются глобально оптимальные эллипсоидальные оценки, предложенные в [6], [1].
Во многих практических задачах с неопределенными параметрами возникает проблема управления всей совокупностью возможных реализаций, т. е. требуется управлять всем ансамблем траекторий. Задача управления ансамблем траекторий при гарантированном подходе к описанию неопределенности рассматривается в данной диссертации. Другой важной проблемой, исследуемой в работе, является задача фильтрации (обработки данных наблюдений) для динамической системы при ограниченных погрешностях измерений.
Актуальность исследуемых задач обусловлена тем, что гарантированный подход обладает рядом важных достоинств, и его развитие позволит применить построенные алгоритмы к проблемам управления и наблюдения для летательных аппаратов, роботов и других динамических объектов.
Цель работы. Постановка, исследование частных случаев и конкретных примеров задачи управления ансамблем траекторий с помощью гарантированных эллипсоидальных оценок сверху множеств достижимости динамических систем при наличии зависимости от ограниченного неопределенного параметра; численное исследование возможности гарантированного различения движений таких систем в задаче гарантированной фильтрации методом эллипсоидов.
Методы исследования. В диссертации использовались методы
теории оптимального управления, теории возмущений и компьютерное моделирование.
Научная новизна. Использованы эллипсоидальные оценки для постановки задачи оптимального управления ансамблем траекторий. Рассмотрен случай неточной реализации управления, решена модельная задача. Указан способ построения приближенного управления ансамблем траекторий при наличии слабой зависимости матрицы системы от управления, приведен пример. Численно показана возможность гарантированного разделения движений при фильтрации методом эллипсоидов данных наблюдений за механическими системами при наличии ограниченной недетерминированной помехи в канале данных и воздействия такого же типа в наблюдаемой системе.
Практическая ценность работы. Полученные в диссертации результаты могут быть использованы при постановке и решении задач управления ансамблями динамических систем с целью уменьшения меры множеств достижимости в конечный момент времени за счет выбора управления при любой реализации помехи. Созданное программное обеспечение может применяться при гарантированной фильтрации данных наблюдений за механическими системами, а также для дальнейшего исследования и развития самого метода эллипсоидальной фильтрации.
Достоверность полученных результатов. Полученные результаты основываются на корректности постановок исследуемых задач, строгом использовании математических методов, наглядности решений модельных задач, а также на сравнении результатов компьютерного моделирования с теоретическими выводами.
Публикации. Имеется 4 публикации [3, 4, 5, 8].
Апробация работы. Основные результаты диссертации докладывались на V Всероссийской школе-семинаре "Математические методы навигации и управления движущимися объектами" (Таруса, сентябрь
1994 г.), на семинаре ИПМех РАН "Теория управления и динамика систем" (руководитель семинара — академик Ф. Л. Черноусько), на научной конференции МФТИ (1991 г.),
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения, содержит 74 страницы машинописного текста, 14 иллюстраций.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Введение посвящено описанию основных подходов, применяемых при рассмотрении систем с неопределенными параметрами. Более подробно рассматривается развитие гарантированного подхода, обосновывается целесообразность применения оценок, освещается значительная часть результатов развития метода эллипсоидов, формулируется цель работы и в сжатом виде излагается содержание всех глав и параграфов.
Первая глава содержит постановку проблемы управления ансамблями траекторий с использованием глобально оптимальных эллипсоидов. Эта постановка в дальнейшем используется в главах 2 и 3 для рассмотрения частных случаев. Пусть исследуемая система описывается уравнением
¿ = ^(<,щ)г+Я((,ф + з(<,и), (1)
д,х е и", ле!1пхп, ьект, иен*.
Под и будем понимать управление, а под V - помеху. Ограничим помеху V £ и)), В{г) е 11тхт. Здесь введено обозначение
Е(а, <2) = {х е Б,"; (С?-1 (г - а), г - а) < 1}
для эллипсоида, задаваемого п-мерными вектором своего центра а и симметрической положительно определенной п X п-матрицей С^. Матрица В является симметрической и неотрицательно определенной. Тогда,
обозначив G(t, и) = КВКТ, можно записать уравнение (1) в виде
х = Ax + w; w £ Е(д, G).
В дальнейшем будем полагать, что начальное состояние принадлежит заданному начальному эллипсоиду ж(0) € Е(а(0), Q(0)). Пусть L(Q) = F(E(a,Q)) - некоторая гладкая (класса С1) функция, зависящая только от элементов матрицы Q. L(Q) должна быть монотонно неубывающей, то есть из включения E(Q,Q\) Э Е(0, Q?) должно следовать неравенство L{Q\) > ¿(<5г)- В качестве примера такой функции можно указать след матрицы CQ, где С — симметрическая положительно определенная матрица. Кроме того, применяются также объем и некоторые другие критерии. Эллипсоиды супердостижимости (они дают внешнюю аппроксимацию), обеспечивающие для указанной управляемой системы в фиксированный момент Т
L(Q(T)) min
будем называть глобально оптимальными. В [1] показано, что параметры эллипсоидов, удовлетворяющих этому определению, могут быть найдены из следующих уравнений в случае L(Q) = Тг(С<3),
à = Аа -f g, a(0) = o° (2)
Q = {A,Q} + \Q + \-^G, Q(0) = Q° (3)
P = -{AT,P}, P(T) = C; (4)
где введены обозначения
Л = [Tr (PG)/ Tr {PQ)]1!2-, {A,Q} = AQ + QAT .
Здесь P(i) - матричная функция времени, являющаяся решением задачи Коши (4).
Требуется найти такое u(t), которое будет доставлять минимум функционалу
J = Tr[CQ(T)] + < Са(Т),а(Т) >,
определенному на траекториях системы (1). Этот функционал является суммой квадратов длин всех проекций на оси координат эллипсоида, аппроксимирующего множество достижимости снаружи в последний момент времени.
Вторая глава описывает случай, когда имеется погрешность в исполнении управляющего воздействия, зависящая от величины управления. Пусть исследуемая система описывается уравнением
х = A(t)x + K(t,u)v + ug(t). (5)
Здесь х S Я" , g(t) - n-мерный вектор, A(t) - матрица п х п, K(t,u) -матрица п х т, и - скалярное управление, v 6 Rm - помеха, возникающая из-за наличия ошибки исполнительного устройства.
Предположим, что v € Е(О, B(t, и)). Тогда, введя обозначение
G{t, и) = КВКТ , можно записать уравнение (5) в виде
х = A(t)x 4- w ; w€ E(ug(t),G(t,u)), причем х(0) € E(ao,Qo). Введем еще одно обозначение
Ф = [ТгР(<)ОД1/2 . (6)
Из (1) и (6) вытекает, что Ф2(Т) = Tr CQ(T), и, следовательно, Ф2(Т) является значением функционала, соответствующим глобально оптимальным эллипсоидам. Рассмотрим функционал
I = 7Т + Ф2(Г), (7)
где 7 > О - постоянная. Пусть матрица G(t,u) такова, что в любой момент t выполняется соотношение
{IV [P(t)G(t, и)}}1'2 = М{ Tr [P(t)G.(г)]}1/2 , (8)
где G,(t) - некоторая матрица, не зависящая от и.
Задача 1. Найти все и, для которых функционал (7) достигает минимума в фиксированный момент времени Т для системы (2)-(4), соответствующей исходной системе (1) с ограничением (8) при краевом условии а(Т) = 0 и при ограничении на управление |и| < 1.
Задача 2. Найти все и, для которых функционал (7) достигает минимума при свободном (нефиксированном) Т и при тех же ограничениях и краевых условиях, что и в задаче 1.
Доказана
Теорема 1. В оптимальном для задачи 1 управлении «(<) существуют только такие точки переключения, в которых управление изменяется с ±1 на 0 и обратно, с 0 на ±1.
Рассмотрим следующий пример.
Пусть движение материальной точки по прямой описывается уравнением
х = (1 + ер)и, е>0, Н < 1, М < 1,
где V - помеха (погрешность реализации управления) в промежутке |г>| < 1; и - искомое управление. Для этого примера задача 2 рассматривалась при 7 = 0. Фазовое пространство задачи определяется переменными ах, а2 и тремя компонентами симметрической матрицы (2. На рисунке 1 показаны типичные проекции траекторий в фазовом пространстве на плоскость, задаваемую компонентами 01, а о центра аппроксимирующего эллипсоида. Доказано, что при ф(0) = 0 оптимальное управление для начальных точек, лежащих выше кривой, состоящей из дуги параболы «1 = — О.ба^ при ах < 0, аг > 0 и дуги параболы ах = 0.5а2 при ах > О, Д2 < 0 (кривая АО В на рисунке 1), следует сначала применять и = — 1, потом и = 0, а в конце — и = 1. В таблице 1 представлены соответствующие рисунку 1 данные: а 1.(0) и аг(0) —
начальные абсцисса и ордината центра аппроксимирующего эллипсоида; g&2# — скорость движения с и = 0; — момент включения и = 0; ¿2 — момент включения и = 1; Т — момент окончания движения. Колонка TL содержит относительную потерю времени при реализации полученного управления по сравнению с управлением, оптимальным по быстродействию для задачи без учета возмущений, колонка AG -относительный выигрыш по функционалу (7) по сравнению с тем же случаем, а колонка STR - оптимальную структуру управления.
При £?(0) ф 0, кроме описанной выше, оптимальной может быть структура {0; 1; 0}. Другими словами, существуют такие начальные аппроксимирующие эллипсоиды, что после прибытия центра эллипсоида в начало координат для получения минимального значения функционала следует подождать некоторое время, применяя нулевое управление.
Третья глава рассматривает случай управляемой матрицы системы.
х = (A0(t) + eA1(t,u))z + g(t, и) + K(t)v , A>(tMi(<) GRnxn; A'(i)eR"m; g{t,u),x eBT v G £"(0, B(t)); B(t) G Rmxm; «еГ.
Здесь и £ U G Rfc, £ - скаляр, a B(t) - симметрическая неотрицательно определенная матрица помехи.
Требуется найти такое u£(t), что непрерывно зависящий от х функционал J(x(T)) в фиксированный момент времени Т достигнет минимума Jt.
В общем случае в процессе поиска с использованием принципа максимума Понтрягина потребуется решить краевую задачу порядка п(п + 3) (2п скалярных уравнений для центра оценки и соответствующей сопряженной переменной и п(п + 1) скалярных уравнений для эллипсоида оценки и соответствующей ему сопряженной переменной).
Доказано, что если пренебречь членами порядка 0(е2) в функционале, то порядок краевой задачи можно снизить до 2п. Остальные уравнения сведутся к совокупности задач Коши. Выведены все необходимые для такой редукции формулы, приведен пример их использования.
Четвертая глава содержит рассмотрение некоторых результатов численного моделирования непрерывной гарантированной фильтрации. Пусть наблюдаемая система имеет вид
i: = A{t)x + и, t > s, х G Rn,x(s) G E(a0t Q0)
u € E(g(t),G(t)), и £ Rn; A(t) G Rnxn; G(t) G Rnxn. Будем считать, что измерения описываются следующими уравнениями
y(t)=H{t)x{t) + v{t);
v{t) €E{0,B{t))-, y(t) еЯг; r < n; H(t) G iîrxn; v G Rr.
Здесь B(t) G Rrxr - симметрическая положительно определенная матрица ошибок измерений. Система уравнений гарантированной фильтрации имеет вид
à = Za -f kZia, Q = Zq+kZiQ, где
Za = Aa+g-, ZQ = AQ + QAT+Qq-l+Gq; g = у/Ъ {CQ)/Tr(CG)
{О, если x > 0 и Л < 0 или
если ||£? - Q||2 + ||у - a||2/(||Q||2 + ||а||2) < е2; Л, в любом другом случае.
* = -(Xt+xïZa+K(xlZQ))/(x'ÏZla + Tr(x73Z1Q)y, х= Tr(CZlQy,
xt = Тг {СZ1Q) + Ti {CQRyQ + 0Ti (CQ))-,
Ха=2гТх{СЯ)НтВ-Ч-, 6 = На-у,
Хд = СдЛу + ЯуЯС + (/? - 1)С; ¡3 = (В~15)т6; Ду = ЯТБ~1Я;
/? = 2(В~15)Т(На -у)- (В-1ВВ~16)т6-> = (ЗНТВ~18-
= НТВ~1Н- НГВ-1ВВ~1Н + ЯГЯ~1Я; £1<? = <2^(3 + (/? - 1)0;
е - относительная точность интегрирования; а и (3 - компоненты искомой оценки.
Для каждого данного множества можно построить несколько эллипсоидов, содержащих его, в зависимости от того, минимум какого функционала требуется получить. Указанный метод стремится обеспечить
-г—2— -> шт.
сИ
С(^) £ Д"х" - произвольная положительно определенная матрица. Было проведено численное моделирование нескольких динамических систем. Приведем два примера. Первая система имеет вид
гпхХ! = /<1 + - Хг)
ГП-2Х2 = Р2 + - Х2)
и описывает движение двух масс с координатами Х\ и х-2, связанных пружиной жесткости к, по прямой под воздействием ограниченных возмущений и^2, причем первое из них действует на первую, а второе — на вторую массу соответственно. В начальный момент с некоторой ограниченной точностью известны координаты и скорости обеих масс, а в дальнейшем наблюдения с той же точностью проводятся лишь за второй массой. Ни координата, ни скорость первой массы не наблюдаются. На рисунке 2 представлены результаты моделирования двух процессов, причем для обоих в течение всего времени движения возмущение, действующее только на первую массу, постоянно как по абсолютной
величине, так и по направлению: для верхней кривой оно принимает максимально допустимое положительное значение, а для нижней — максимально допустимое отрицательное. Наблюдения зашумлены ограниченной помехой, которая моделировалась синусоидальной зависимостью от времени.
Вторая система имеет вид
х = -кх + и>у + кшу + кЦ> + у = -ку -д + Ру
и описывает плоское движение материальной точки в гравитационном поле д при наличии сопротивления среды, линейно зависящего от скорости с коэффициентом к. Среда движется горизонтально относительно системы координат, описываемой переменными х VI у (т.е. вдоль х) со скоростью, линейно зависящей от значения высоты (т.е. у) с коэффициентом ы, причем скорость на нулевой высоте равна Уо- Кроме того, на систему действует некоторая неизвестная, но ограниченная по величине сила с проекциями Рх и .Ру. Наблюдения ведутся только за координатами точки, а скорости определяются фильтром. Реализация помехи, действующей на систему наблюдения, предполагалась той же, что и для предыдущей системы. На рисунке 3 в течение всего времени движения возмущение действует только по вертикали и принимает постоянное (максимально возможное) абсолютное значение: для верхней кривой оно принимает максимально допустимое положительное значение, а для нижней — максимально допустимое отрицательное.
Результаты показывают, что фильтр может успешно гарантированно различать движения и может быть использован для фильтрации данных наблюдений.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ
В результате выполнения диссертационной работы была изучена возможность учета ансамбля траекторий при построении управления динамическими системами в условиях наличия недетерминированных воздействий с неизвестными статистическими характеристиками. Из-за больших трудностей, возникающих при применении поточечного описания множеств достижимости, обычно применяются аппроксимирующие множества. В работе предлагается учитывать глобально оптимальные эллипсоидальные приближения множеств достижимости для создания алгоритмов управления.
Рассмотрены с теоретических позиций частный случай неточной реализации управления исполнительными устройствами, а также случай управляемой матрицы системы. Получены общие теоремы, позволяющие эффективно учитывать всю совокупность возможных траекторий ансамбля. Приведены конкретные примеры применения полученных алгоритмов.
Проведено численное моделирование непрерывной гарантированной эллипсоидальной фильтрации. Предполагается, что система подвержена действию неконтролируемых ограниченных внешних возмущений и аналогичных помех в канале наблюдения. Показано, что для рассмотренных примеров метод позволяет гарантированно различать движения, имеющие общие начальные условия, но отличающиеся реализациями недетерминированных внешних возмущений.
Литература
[1] Овсеевин А. И., Решетняк Ю. II. Асимптотическое поведение эллипсоидальных оценок областей достижимости. // Изв. РАН. Техн. кибернетика. 1992. №1.
[2] Черноусько Ф.Л. Оценивание фазового состояния динамических систем.-М.: Наука, 1988.
[3] Шматков А. М. Об управлении системами с помехой, ограниченной по величине // Изв. РАН Техн. кибернетика. 1994. №4.
[4] Шматков А. М. Об управлении ансамблем траекторий при наличии ограниченной помехи // Изв. РАН. Теория и системы управления. 1995. №4.
[5] Шматков А. М. Непрерывная гарантированная фильтрация с помощью эллипсоидов // Тезисы V Всероссийской школы-семинара "Математические методы навигации и управления движущимися объектами" (Таруса, сентябрь 1994 г.); Препринт механико-математического факультета МГУ, 1994, №5.
[6] Ovseevich A.I. Asymptotic behavior of attainable and superattainable sets // Proc. of the Conf. on Modeling, Estimation and Filtering of Systems with Uncertainty. Sopron, Hungary, 1990. Basel, Switzerland: Birkhaiiser, 1991.
[7] Chernousko F.L. State estimation for dynamic systems, CRC Press, Florida, 1994.
[8] Chernousko F.L., Ovseevich A.I., Shmatkov A.M. Optimal two-sided ellipsoidal state estimation in dynamical systems // Proc. of 3rd European Control Conf., 1995.
Таблица 1.
№ ад (0) а2(0) Я2* <1 ¿2 Т ТЬ АО БТ]
1 -0.184 0.920 -0.262 1.182 1.830 2.092 23% 11% -1;0
2 0.478 0.653 -0.407 1.061 2.350 2.758 36% 18% -1;0
3 0.856 0.300 -0.356 0.656 2.832 3.188 53% 31% -1;0
4 0.506 -0.567 -0.567 0.000 0.608 1.176 46% 51% 0;]
N. Л а< \ 1 \\ УУ> Я/
0 0.5 I
V-к
\В
Рис. 1
Случай с постоянной помехой
20 15 10 5 О -5 -10 -15
О 2 4 6 8 10
Время
Рис. 2
в
_û
н о о
CL О
О
CR
0
1
XI <
о н
Q_
CD
m
15 10 5 0 -5 -10 -15 -20 -25
О
2 3
Время
Рис. 3
4