Синтез управлений при двойных и разнотипных ограничениях тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Дарьин, Александр Николаевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2004
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
Московский государственный университет им. М.В. Ломоносова
На правах рукописи
Дарьин Александр Николаевич
Синтез управлений при двойных и неоднотипных ограничениях
01.01.02 — дифференциальные уравнения
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва 2004 г.
обг;:/
¡.'.г',1 1:
Работа выполнена в Московском государственном университете им. М. В. Ломоносова на кафедре системного анализа факультета Вычислительной математики и кибернетики.
Научный руководитель — доктор физико-математических наук, академик РАН А. Б. Куржанский.
Официальные оппоненты — доктор физико-математических наук,
профессор М. С. Никольский; доктор физико-математических наук, профессор Н. X. Розов.
Ведущая организация — ИММ УрО РАН.
Защита состоится 20 мая 2004 года в 14 часов на заседании специализированного Совета Д 002.022.02 при Математическом институте РАН им. В. А. Стеклова по адресу: 117966, Москва, ГСП-1, ул. Губкина, д. 8, конференц-зал.
С диссертацией можно ознакомиться в научной библиотеке Математического института РАН.
Автореферат разослан " " апреля 2004 г.
Ученый секретарь спецсовета,
доктор физ.-мат. наук
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Диссертация посвящена задачам нелинейного синтеза гарантирующих управлений в системах с исходно линейной структурой при неопределенности. Подобные проблемы актуальны в математических моделях высоких технологий. От гарантирующего управления требуется привести систему на заранее заданное целевое множество, невзирая па воздействие неизвестных помех. Составляющими частями решения задачи при этом являются множество разрешимости, состоящее из всех точек, из которых цель действительно может быть достигнута; функция цены, равная минимальному гарантированному расстоянию до целевого множества в конечный момент; синтез управлений, указывающий управляющие воздействия в каждом из возможных положений системы.
Альтернированный интеграл Л. С. Понтрягина [17, 18] позволяет свести вычисление множества разрешимости к интегрированию многозначных отображений; ему посвящены работы Е. Ф. Мищенко, М. С. Никольского, Е. С. Половинкина, Н. X. Розова.
В теории, разработанной Н. Н. Красовским и его сотрудниками [4-6, 21, 28] указывается способ построения синтезирующей стратегии, удерживающей траекторию системы внутри "стабильного моста" и обеспечивающую таким образом попадание на целевое множество.
Метод динамического программирования, разработанный Р. Беллманом [2] и примененный к игровым задачам Р. Айзексом [1], позволяет представить функцию цены как решение уравнения в частных производных (т.н. уравнение Гамильтона-Якоби-Белл-мана-Айзекса, HJBI), а синтезирующую стратегию — как множество управлений, на которых достигается экстремум в этом уравнении. Поскольку функция цены очень часто бывает не всюду гладкой, используются различные понятия обобщенного решения уравнения Беллмана, например, вязкостные решения, введенные М. Г. Крэндаллом и П.-Л. Лионсом [27], или минимаксные решения, введенные А. И. Субботиным [19]; см. также [22].
Использование соединения перечисленных подходов позволяет расширить рассматриваемый круг задач и построить конструктивную теорию, направленную на решение задач до конца, то есть до практически реализуемого алгоритма, чему посвящены работы А. Б. Куржанского [8,9,29-33]. При этом аппарат эллипсоидального исчисления [29] позволяет свести задачу синтеза к интегрированию системы обыкновенных дифференциальных уравнений для параметров эллипсоидальной аппроксимации множества разрешимости, то есть к эффективному численному алгоритму.
Игровым задачам механики посвящена монография Ф. Л. Черноусько и А. А. Мели-кяна [24].
В принятой теории предполагается, что управление и возмущения принадлежат однотипным классам. В упомянутых выше работах об альтернированном интеграле управление и помеха стеснены геометрическими ограничениями. Системы с интегральными ограничениями рассматривались в работах [13, 20, 23, 26].
Однако на практике возникают ситуации, когда необходимо налагать на управление одновременно несколько ограничений различных типов, а также выбирать для управления и помехи различные классы ограничений. Постановка задачи с двойным (геометрическим и интегральным) ограничением на управление рассматривалась в статье [11], однако решение было получено только для случая регулярной дифференциальной игры, когда задача сводится к чисто программным конструкциям. Несколько другая постановка рассматривалось в работе [3].
Цель работы состоит в получении теоретического обоснования решения задач синтез а гарантирующих управлений при двойш неод ы в
БИБЛИОТЕКА 1
3 ОЬ^ПЖ
дальнейшем можно было перейти к эффективным численным алгоритмам решения этих задач.
Основные результаты работы.
1. Решена задача синтеза для системы с двойным ограничением на управление. В частности, получено явное выражение для функции цены.
2. Для системы с нелинейной зависимостью геометрического ограничения от интегрального доказаны теоремы о существовании и единственности оптимального управления. Получено явное выражение для функции цены.
3. Решена задача синтеза для системы с двойным ограничением на управление при наличии помех, стесненных геометрическим ограничением. В частности, построен аналог схемы альтернированного интеграла Л. С. Понтряпша; получена верхняя оценка для функции цены; указана синтезирующая стратегия, разрешающая задачу.
4. Решена задача синтеза для системы, в которой управление и помеха выбираются в различных классах (геометрические и интегральные ограничения, соответственно). В частности, построен аналог схемы альтернированного интеграла Л. С. Понтряги-на; получена верхняя оценка для функции цены; указана синтезирующая стратегия, разрешающая задачу.
Научная новизна работы. Полученные результаты являются новыми.
В работе рассмотрены ранее мало изученные задачи синтеза гарантирующих управлений: задачи с двойным ограничением на управление и задача с геометрическим ограничением на управление и интегральным — на помеху. Для задачи с двойным ограничением при неопределенности в отличие от [11] рассмотрен общий случай.
В задачах с неопределенностью построен аналог альтернированного интеграла Л. С. Понтрягина, записано уравнение Гамильтона-Якоби-Беллмана-Айзекса, получена оценка для функции цены, указана разрешающая синтезирующая стратегия.
Теоретическая и практическая ценность работы. Работа носит в основном теоретический характер. Полученные результаты могут служить основой для дальнейших исследований и позволят далее перейти к практически реализуемым численным алгоритмам, то есть решить задачи до конца. В частных случаях (одномерный случай для задачи с разнотипными ограничениями и случай автономной системы для задачи с зависимостью геометрического ограничения от интегрального) решение получено в явном виде.
Методы исследования. Решение рассматриваемых в диссертации задач было получено в рамках упомянутого выше подхода, основанного на сочетании динамического программирования, альтернированного интеграла и теории Н. Н. Красовского. При этом использовались методы выпуклого анализа, теория негладких экстремальных задач, принцип максимума Л. С. Понтрягина.
Апробация работы. Результаты работы были представлены в виде докладов на семинаре кафедры системного анализа факультета ВМиК МГУ (рук. академик РАН А. Б. Кур-жанский), на семинаре отдела дифференциальных уравнений МИРАН (рук. академик РАН Д. В. Аносов), а также на следующих конференциях:
• международная конференция студентов и аспирантов по фундаментальным наукам "Ломоносов-2001", Москва, МГУ, апрель 2001;
• 5th IFAC Symposium on Nonlinear Control Systems (NOLCOS-01), Санкт-Петербург, июль 2001;
• совместный французско-русский семинар «Control under Uncertainty and Differential Games», Москва, МГУ, январь 2003;
• 4-я международная конференция «Tools for Mathematical Modelling» (MathTools-03), Санкт-Петербург, июнь 2003.
Публикации. По теме диссертации опубликовано 4 работы.
Структура и объём диссертации. Диссертация состоит из введения, трёх глав, заключения и библиографии. Общий объём диссертации 141 страница. Библиография включает 80 наименований.
Краткое содержание работы. Во введении раскрываются цели работы, ее актуальность, а также кратко описаны основные результаты, полученные в диссертации.
В первой главе диссертации рассматривается задача синтеза управлений для линейной системы без неопределенности при наличии двух ограничений на управление — геометрического и интегрального. Ограничения могут задаваться как независимо друг от друга (раздел 1.2), так и с зависимостью геометрического ограничения от резерва управления по интегральному ограничению (раздел 1.3).
В разделе 1.1 описывается в общем виде задача, которой посвящены последующие два раздела.
Управляемая система задается дифференциальными уравнениями
Здесь е К" — положение системы, « 6 И"» — управление, &(<) 6 К1— текущий запас энергии управления. Матрицы A(t), B(t) и R(t) > 0 считаются известными.
Предполагается, что управление стеснено двумя ограничениями. Во-первых, оно может принимать значения только из заранее определенного множества:
Такое ограничение называется геометрическим, или «жестким». В зависимости от способа выбора числа 0 можно рассматривать различные задачи. В данной работе анализируются два случая: когда ц — постоянное число (тогда считается fi = 1), и когда оно зависит от текущего резерва
Во-вторых, управление обязано следить за значением резерва k(t) и не допускать его падения ниже определенного уровня. Это «мягкое», или интегральное ограничение. Сочетание геометрического и интегрального ограничений будем называть двойным ограничением. Чтобы обеспечить существование управлений, удовлетворяющих двойному ограничению, предполагается выполненным включение 0 е "P(t).
Используются два класса управлений: программные управления Ыоь (измеримые функции u(t)) и позиционные стратегии (многозначные отображения полу-
непрерывные сверху по фазовым переменным). Величина класса допустимых программных управлений зависит от начального резерва к, поэтому используется обозначение
В данной главе преследуются следующие цели: вычислить функцию цены и построить с ее помощью синтез управлений, гарантирующий попадание на заданное целевое множество; получить необходимые и достаточные условия для программных управлений, приводящих на грапицу множества достижимости; указать способ вычисления множества достижимости.
О)
и е tiV{t).
(2)
WoL(fc).
В разделе 1.2 рассматривается случай /i = 1. От управления требуется соблюдать фазовое ограничение k(t) ^ 0, эквивалентного интегральному ограничению для программных управлений
Г МОИадЛ <*(*,)■ (3)
Jto
Для соблюдения этого требования в определение позиционных стратегий добавляется условие U(t, х, к) = {0} при к < 0.
Пункт 1.2.2 посвящен исследованию множества достижимости. Основной задачей здесь является следующая:
Задача 1.1. Найти область достижимости Ak/fo] С Rn, то есть множество точек х, достижимых системой в конечный момент времени при данном резерве fco из начала координат или произвольного множества Мо С R", а также для произвольного направления t Е R" указать и(-)упрАвлевиеобеспечивающее вывод системы в
конечный момент времени на границу множества достижимости в этом направлении, то есть выполнение равенства
Множество достижимости при двойном ограничении является выпуклым компактом и содержится в пересечении множеств достижимости при геометрическом ограничении Хс и при интегральном ограничении Хх, свойства которых приведены в теореме 1.1. При этом указанное вложение может быть строгим (примеры 1.1 и 1.3 в пункте 1.2.6).
Теорема 1.3 дает необходимое и достаточное условие в форме принципа максимума для управлений, приводящих на границу множества достижимости в фиксированном опорном направлении. Поскольку множество достижимости является выпуклым компактом, то этого достаточло, чтобы найти все его точки. Важно отметить, что в отличие от задачи с чисто геометрическим ограничением управление здесь может принимать произвольные значения из
В пункте 1.2.3 рассматривается задача 11 в обратном времени, то есть задача разрешимости:
Задача 1.2. Найти область разрешимости Wc/[£o] С R", то есть множество точек х 6 R", стартуя из которых система может достигнуть в конечный момент заданное целевое множество Mi С R" при данном резерве fco, а также указать управление, обеспечивающее включениеx(t1) £ Mi.
Решение задачи 12 дается теоремой 1.5 в виде необходимого и достаточного условия оптимальности управления. При этом множество разрешимости может быть найдено по
Применению к рассматриваемым задачам метода динамического программирования посвящен пункт 1.2.4. Для этого задачи 1.1 и 1.2 переформулируются в терминах оптимизации расстояния до начального или целевого множества и вводится соответствующая функция цены, которая является решением уравнения Гамильтона-Якоби-Беллмана (теоремы 1.8 для задачи достижимости и 1.9 для разрешимости). Для задачи разрешимости 1
оно имеет вид
'Уравнение не содержат матрицы -4(i): линейным преобразованием специального вида можно привести исходную систему к такому ввду, что X(t) = 0 (см. пункт 1.1.1). То же самое относится и к другим рассматриваемым задачам.
с начальным условием х, к) = &{х,М\). Вследствие того, что имеется фазовое ограничение к(1) ^ 0, помимо начального условия у этого уравнения есть также и краевое условие вида
dV dt
= 0,
к=0
означающее, что при нулевом резерве управление уже не может влиять на траекторию системы.
Множество разрешимости легко найти, зная функцию цены: это ее множество уровня [29]. Если же множество разрешимости найдено, например из (5), то можно не решая уравнение Гамильтона-Якоби-Беллмана вычислить функцию цены: она равна квадрату расстояния до множества разрешимости (теорема 1.9). То же самое относится и ко множеству достижимости и соответствующей функции цены (теорема 1.6).
В пункте 1.2.5 описывается способ вычисления множества достижимости при двойном ограничении, основанный на методах эллипсоидальной аппроксимации [29]. Построено параметризованное семейство эллипсоидов, дающее в пересечении в точности множество достижимости.
В разделе 1.3 рассматривается задача, в которой управление стеснено геометрическим ограничением, нелинейно зависящим от текущего резерва:
Интегральное ограничение при этом задается неявно. А именно, если существует конечная точка к* = зир{& | ц(к) ^ 0, к < к^о)}, то автоматически выполнено фазовое ограничение эквивалентное, в свою очередь, интегральному. (Добавление явного интегрального ограничения ничего существенно не изменяет, приводя лишь к появлению дополнительного условия трансверсальности).
При ограничении (6) система (1) фактически становится нелинейной, поскольку после замены принимает вид
' x(i) = A{t)x{t) + ß{k(t))B(t)u,
.*M = V(fc(t)) «"Над,
t е Г = [io.ii].
(7)
В связи с возможностью такой замены удобно кроме классов управлений ZVol и Ucl с ограничением (6) использовать классы управлений U'oli и Wq^, заданные с геометрическим ограничением вида и G Vit).
Задача 1.7 о нахождении множества достижимости A5s(i)[ii] дословно повторяет задачу 1.1 (с той лишь разницей, что множество допустимых программных управлений Wql{к) теперь определено с учетом ограничения (6)). Впрочем, более удобным оказывается вместо нее рассматривать задачу о максимизации произвольного линейного непрерывного функционала:
Задача 1.8. Найти допустимое управление u(-) £ Uol> доставляющее максимум интегральному функционалу
J(u(.)) = {/»(•).«(•)>= [tl(h(t)Mt))àt. Jtt
(8)
Для решения этой задачи вначале применяется принцип максимума Л. С. Понтрягина (теорема 1.15). Далее в теореме 1.17 полученные соотношения конкретизируются для случая эллипсоидального множества V(t).
В пункте 1.3.3 доказывается существование решения задачи 1.8 (теорема 1.23). Доказательство основывается на трех леммах, в которых утверждается соответственно выпуклость, ограниченность и замкнутость множества допустимых управлений иаъ(к).
Если в случае выполнения теоремы о существовании решения принципу максимума удовлетворяет только одно управление, то это управление очевидно является оптимальным. Таким образом, в условиях этой теоремы принцип максимума в совокупности с единственностью решения прямой и двойственной системы является достаточным условием оптимальности. Если существует несколько пар удовлетворяющих принци-
пу максимума, то в силу существования решения и необходимости принципа максимума среди этих пар будет оптимальпое управление. Следовательно, при выполнении условий теоремы о существовании решения для нахождения оптимального управления достаточно перебрать все решения системы из принципа максимума.
В пункте 1.3.4 доказана теорема о единственности решения задачи 1.8 при некоторых предположениях нафункцию ц(-) и при выполнении условия общности положения, заключающегося в том, что для всех чисел 0 выполнено
Пункт 1.3.5 посвящен отысканию оптимального управления. Для этого отрезок времени Г— [io.il] разделяется на два подмножества: в первом геометрическое ограничение неактивно, и соответствующий множитель Лагранжа Л = 0; во втором, напротив, геометрическое ограничение активно, и Л > 0.
В случае автономной управляемой системы с монотонной функцией в начале траектории Л = 0, а затем, начиная с некоторого момента в и до конечного момента А > 0. Для эллипсоидального геометрического ограничения V можно аналитически найти момент следовательно, оптимальную траекторию управления.
В общем случае таких моментов переключения может быть сколь угодно много, и найти их аналитически не представляется возможным, однако задачу нахождения оптимальной траектории можно свести к решению одномерного нелинейного уравнения для начального значения сопряженной переменной V- После решения этого уравнения каким-либо численным методом мы получаем полные начальные условия задачи Коши для прямой и двойственной системы, и, следовательно, можем найти оптимальную траекторию.
В пункте 1.3.6 решается задача 1.9 о синтезе управлений, в которой требуется указать позиционную стратегию при которой решения дифференциального включения
выпущенные из произвольной точки (х(1;0),к(1;0)) = (х^к,,), оказываются в конечный момент на минимально возможном расстоянии от целевого множества -М(Ь((1)), а также найти это расстояние У^, х, к) для каждой точки ((, x, А) £ Г X К" X Н.
Функция цены У^,х,к) является вязкостным решением уравнения Гамиль-тона-Якоби-Беллмана
с начальным условием и равна расстоянию от текущей позиции
до множества разрешимости.
Во второй главе диссертации рассматривается задача синтеза гарантирующих управлений при двойном ограничении в случае наличия в системе неопределенности, стесненной геометрическим ограничением.
Рассматривается линейная управляемая система
В отличие от (1), здесь присутствует заранее неизвестная помеха V, на которую наложено геометрическое ограничение Управление, как и раньше, стеснено двойным ограничением: геометрическим (2) и интегральным (3). Здесь матрицу A(t) также можно считать нулевой, а матрицу C(t) — единичной (заменив множество
Как и в первой главе, рассматриваются два класса управлений: программные управления и позиционные стратегии Поскольку в системе есть неизвестная помеха, то использование позиционных стратегий дает существенно больше возможностей, чем применение программных управлений.
Состояние системы (9) описывается парой (х, к) G Rn+1, что позволяет сформулировать принцип оптимальности [2] для данной задачи. Следовательно, целевое множество
Rn + 1
; однако по
ряду причин удобнее работать со множествами в пространстве Rn, для чего вводится понятие сечения.
Пусть в пространстве Hn+1 переменных (х, к) задано множество N. Будем называть сечениями множества N значения следующего многозначного отображения: ЛГ(к) = Само множество N однозначно восстанавливается по своим сечениям, поскольку является графиком многозначного отображения ftf(k). При этом выпуклость всех множеств Щ(к) не означает выпуклости множества ЛЛ Этот факт позволяет в некоторых случаях ослабить требование выпуклости целевого множества (и, следовательно, множества разрешимости) до требования выпуклости всех его сечений.
Пусть задано такое непустое целевое множество М. С R™, что 1) M(ki) С M(hi), если k\ < k2\ 2) A4(fc) = 0 при < 0; 3) М(к) непрерывно при тех к, где М(к) ф 0; 4) множества М(к) являются выпуклыми компактами. Класс отображений R -+ convR", обладающих свойствами 1)—4), обозначим через £И. Часть результатов будет приведена для более узкого класса множеств получаемого заменой свойства 4) на более сильное: 4') множество М является выпуклым!
В разделе 2.2 ставится основная задача второй главы: Задача 2.1. Указать множество разрешимости W[to] Я. Rn+1, а также позиционную стратегию управления U(t, x, к) €.Ucu такие, что все траектории дифференциального включения
начинающиеся в точке (1,х(1),к(0), ¿о ^ ' ^ (!(£),£(£)) € Н'ЭД, в конечный момент удовлетворяют включению х[Ь) £ Л!(&(41)).
Взятие выпуклой оболочки в (10) не увеличивает возможностей управлению, поскольку оно добавляет исключительно точки, неэффективные с точки зрения управления (в них расходуется большее количество ресурсов). Отметим, что, в отличие от исходной системы (9), дифференциальное включение (10) нелинейно из-за наличия функции Ы{1,х,к). Таким образом, рассматривается задача нелинейного синтеза для системы с исходно лилейной структурой.
(9)
Раздел 2.3 показывает, как в случае выпуклого множества М можно получить одно из возможных решений задачи 2.1, вообще не учитывая интегрального ограничения. В самом деле, если конечная точка траектории принадлежит целевому множеству М 6 37С, то ограничение Щ) ^ 0 выполнено автоматически в силу свойства 2) класса £Ш. Это позволяет рассматривать задачу 2.1 как задачу о синтезе управлений в условиях неопределенности при геометрических ограничениях [29,9]. Если Ы'{1,х,к) — синтез управлений, построенный таким способом, то управление
является решением задачи 2.1.
Однако у такого подхода есть существенные недостатки. В частности, если синтез и'(1,х,к) обладает экстремальными свойствами, например, минимизирует расстояние до целевого множества, то синтез 1А{$,х,к) уже не будет экстремальным в таком смысле. Кроме того, при этом предполагается выпуклость целевого множества М, а не только его сечений Поэтому последующие разделы посвящены решению задачи 2.1 с учетом
ее специфики, то есть наличия интегрального ограничения.
Раздел 2-4 посвящен построению аналога альтернированного интеграла Л. С. Понтря-гина для данной задачи. Для этой цели вначале определяются множества программной разрешимое! и —максиминное XV+ и минимаксное Эти множества представляют собой грубые оценки множества разрешимости решаемой задачи сверху и снизу соответственно, поскольку они состоят из тех состояний систему, из которых целевое множество достижимо при заранее известной или, соответственно, неизвестной помехе.
Лемма 2.3 дает явные выражения для множеств программной разрешимости через сечения целевого множества и множество достижимости при двойном ограничении, изученное, в разделе 1.2. Используя эти формулы, строятся альтернированные интегральные суммы. Для этого на отрезке ^, 11) вводится разбиение Т = {т,}"0. Точки этого разбиения можно интерпретировать как моменты коррекции. В конечный момент интегральные суммы совпадают с целевым множеством. На каждом шаге выбирается ближайший слева момент коррекции и строятся для него программные множества разрешимости. Затем каждое из этих мпожеств принимается за новое целевое множество, выбирается предыдущий момент коррекции, снова строятся программные множества разрешимости, и так продолжается до тех пор, пока мы не оказываемся в самой левой точке разбиения со множествами, обозначаемыми [А:, — это интегральные суммы, соответствующие разбиению Т. (Отметим, что это подмножества Н", то есть их можно рассматривать как сечения множеств ££[4] и
Если при стремлении диаметраразбиения Т к нулю существуют хаусдорфовы пределы интегральных сумм то последние называются соответственно верхним
и нижним альтернированным интегралом. Если они к тому же совпадают между собой и равны то это множество называется альтернированным интегралом и совпадает
со множеством разрешимости.
В случае выпуклого целевого множества (пункт 2.4.3) классические теоремы о существовании альтернированного интеграла гарантируют существование при определенных предположениях о непустоте внутренности сечений интегральных сумм (теорема 2.6).
В рассматривается задача синтеза гарантирующих управлений. Вначале
исследуется вопрос о построении такого управления, которое минимизировало бы в конечный момент расстояние от конца траектории до сечения целевого множества, то есть
В связи с этим вводится соответствующая функция цепы, которая является вязкостным решением уравнения Гамильтона-Якоби-Беллмана-Айзекса
Как и в первой главе, помимо начального условия ,х,к) = ¿(х,.М(к)) у этого уравнения имеется также и краевое условие
дУ. /ау
дь
+ тах { »ев(0 \ ах
= 0, *0 1£!
«=(1
означающее невозможность для управления принимать какие-либо действия при исчерпании резерва. Если найдена функция цены, то управление может быть найдено как множество элементов, на которых достигается минимум в уравнении ШВ1. Однако в отличие от задачи без неопределенности, здесь функция цены не обязательно равна расстоянию до сечения множества разрешимости, а только лишь не превосходит последнее (теорема 2.7).
Чтобы избежать необходимости вычислять функцию цены, применена модифицированная экстремальная конструкция. В теореме 2.9 доказано, что множество достижимости при двойном ограничении отличается от пересечения множеств достижимости при интегральном и при геометрическом ограничениях на величину второго порядка малости относительно длины отрезка времени, поэтому многозначное отображение сла-
бо инвариантное относительно дифференциального включения (10), будет удовлетворять уравнению эволюционного типа [25, 10]
+ и г[7,< + <7]-а7'(4)П£(01(А:-7)(гД-1(0)^ =0,
в которое не входит операция вычисления множества достижимости при двойном ограничении.
Теорема 2.12 утверждает, что если слабо инвариантное отображение достаточно гладкое, то квадрат расстояния до него удовлетворяет дифференциальному неравенству
Стратегией Ыг^, х, к), экстремальной к^^^ы в а е т с я позиционная стратегия, состоящая из элементов, на которых здесь достигается минимум. Из (11) следует, что если начальная точка принадлежит ], то и все траектории системы останутся в этом
слабо инвариантном множестве. Поскольку множество разрешимости является слабо инвариантным, то стратегия 1{уу(Ь,х,к) представляет собой решение задачи 2.1.
Третья глава диссертации посвящена задаче об управлении системой с неоднотипными ограничениями: управление здесь стеснено геометрическим, а помеха — интегральным ограничением.
Рассматривается линейная управляемая система вида
1,2 ' € Л = Ро,!»]. (Ь!;
На управление наложено только геометрическое ограничение и Е*Р({), а помеха должна обеспечивать выполнение фазового ограничения к(^ ^ 0, эквивалентного интегральному ограничению
гч
(13)
ГиОИзд^Ь-
В разделе 3.1 показывается, что, если управлению недоступна информация о текущем значении к(1), то система может быть преобразована так, что ее вид аналогичен (12), но при этом уже известно значения к^), а матрица С(<) = I. Кроме того, как и в 1федыдущих главах, матрицу А({) можно считать нулевой.
В разделе 3.2 приводится постановка основной задачи: Задача 3.1. Дня данного целевого множества М С К" х найти множество разрешимости [4] и позиционную стратегию управления и(>х, к) ЕХЛсп., такую, что все его траектории дифференциального включения
(14)
выпущенные из любой начальной позиции £), 1 € Г, [х,к) Е достигали бы
целевое множество М. в момент времени t1, какова бы ни была измеримая помеха у((), удовлетворяющая ограничению (13).
Поскольку множество разрешимости ЗДРГЬ КЯК правило является невыпуклым, то как и в предыдущей главе мы будем работать с его сечениями, обозначаемыми и
сечениями целевого множества
Решение задачи 3.1 ведется по той же схеме, что и во второй главе. В разделе 3.3 производится построение альтернированного интеграла. Непосредственному применению стандартной схемы мешает то, что помеха не содержится ни в каком множестве и, соответственно, непонятно, какое множество должно участвовать в операции геометрической разности, входящей в выражение для программных множеств разрешимости. В диссертации указанная трудность преодолевается, вычислив множество разрешимости при каждом возможном значении переменной к в конечный момент (при этом множество возможных значений интеграла от помехи является эллипсоидом ч/К^уЗ^Ь, <1)) и взяв затем пересечение этих множеств (поскольку помеха имеет возможность выбрать наихудшее для управления значение 1с(й)):
В разделе~3-4 вводится функция цены для экстремальной переформулировки задачи 3.1 и доказывается, что при предположении о ее гладкости она является решением уравнения Гамильтона-Якоби- Беллмана-Айзекса
с граничным условием дУ/Ы + та^ерц,) {дУ/дх,и) = 0 и начальным условием , и не превосходит квадрата расстояния до сечения множества разрешимости (теорема 3.17).
Если 2[к,{\ — слабо инвариантов многозначное отображение, то экстремальной стратегией к нему будет
1, и и А • /д<Р(х,21к,® \ «6Р(0 \ ох /
Эта стратегия гарантирует, что траектории системы, начинающиеся в трубке 2, в последующие моменты не выходят за ее пределы (теорема 3.19).
В разделе 3.5 подробно рассматривается случай одномерного пространства переменной х (фазовое пространство системы (12) при этом двухмерное, потому что кроме х имеется переменная к). Получены явное выражение для альтернированного интеграла (теорема 3.22). Доказано, что функция цены принадлежит классу функций вида (¿(х, [а,6]) + Л)2, т.е. определяется всего тремя параметрами (при этом [а,Ь] = если /г = 0).
В разделах 1.2.6, 1.3.7, 2.6, 3.6 собраны примеры, иллюстрирующие полученные теоретические результаты.
В заключении сформулированы основные результаты, полученные в диссертации.
Автор приносит искреннюю благодарность своему научному руководителю Александру Борисовичу Куржанскому за постановку задач, постоянное внимание к работе и ценные советы.
Работа выполнена при частичной финансовой поддержке программы «Университеты России — Фундаментальные исследования» (грант № УР.3.3.07), РФФИ (грант № 03-01-00663) и гранта Президента России по поддержке ведущих научных школ (№ НШ-1889.2003.1).
Литература
1. Айзеке Р. Дифференциальные игры. М.: Мир, 1967.
2. Беллман Р. Динамическое программирование. М.: ИЛ, 1960.
3. Бондаренко В. И., Красовский Н. Н., Филимонов Ю. М. К задаче об успокоении линейной системы // ПММ. 1965. Т. 29. № 5. с. 828-834.
4. Красовский Н. Н. Теория управления движением. М.: Наука, 1968.
5. Красовский Н. Н. Игровые задачи о встрече движений. М.: Наука, 1970.
6. Красовский Н. Н. Дифференциальная игра сближения-уклонения I, II // Известия АН СССР. Техническая кибернетика. 1973. № 2, 3.
7. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
8. Куржанский А. Б. Альтернированный интеграл Понтрягина в теории синтеза управлений // Труды МИАН. 1999. Т. 224. с. 234-248.
9. Куржанский А, Б., Мельников Н. Б. О задаче синтеза управлений: альтернированный интеграл Понтрягина и уравнение Гамильтона-Якоби // Математический сборник. 2000. Т. 191. № 6. с. 69-100.
10. Куржанский А. Б., Никонов О. И. Эволюционные уравнения для пучков траекторий синтезированных систем управления // Доклады РАН. 1993. Т. 333. № 4. с. 578-581.
11. Ледяев Ю. С. Регулярные дифференциальные игры со смешанными ограничениями на управления // Труды МИАН. 1985. Т. 167. с. 207-215.
12. Мищенко Е. Ф., Понтрягин Л. С. Линейные дифференциальные игры // Доклады АН СССР. 1967. Т. 174. № 1. с. 27-29.
13. Никольский М. С. Прямой метод в линейных дифференциальных играх с общими интегральными ограничениями // Дифференциальные уравнения. 1972. Т. 8. № 6. с. 964-971.
14. Никольский М. С. Об альтернированном интеграле Л. С. Понтрягина // Математический сборник. 1981. Т. 126 (158). № 1 (9). с. 136-144.
15. Половинкин Е. С. Неавтономные дифференциальные игры // Дифференциальные уравнения. 1979. Т. 15. № 6. с. 1007-1017.
16. Пономарев А. П., Розов Н. X. Устойчивость и сходимость альтернированных сумм Понтрягина // Вестник МГУ. Сер. вычисл. матем. и киберн. 1978. Т. 1. с. 82-90.
17. Понтрягин Л. С. О линейных дифференциальных играх II // Доклады АН СССР. 1967. Т. 175. К» 4. с. 910-912.
18. Понтрягин Л. С. Линейные дифференциалыше игры преследования // Математический сборник. 1980. Т. 112 (154). № 3 (7). с. 307-330.
19. Субботин А. И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. М., И.: Институт компьютерных исследований, 2003.
20. Субботин А. И., Ушаков В. Н. Альтернатива для дифференциальной игры сближения-уклонения при интегральных ограничениях на управления игроков // ПММ. 1975. Т. 39. № 3. с. 387-396.
21. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.
22. Субботина Н. Н. Метод динамического программирования для класса локально-лип-шицевых систем // Доклады РАН. 2003. Т. 389. № 2. с. 1-4.
23. Ушаков В. Н. Экстремальные стратегии в дифференциальных играх с интегральными ограничениями // ПММ. 1972. Т. 36. № 1. с. 15-23.
24. Черноусько Ф. Л., Меликян А. А. Игровые задачи управления и поиска. М.: Наука, 1978.
25. АиЫп J.-P., Frankowska Я. Set-valued Analysis. Boston: Birkhauser, 1990.
26. Ba§ar Т., Bernhard P. H00 Optimal Control and Related Minimax Design Problems. SCFA. Boston: Birkhauser, 2nd edition, 1995.
27. Crandall M. G., Lions P.-L. Viscosity solutions of Hamilton-Jacobi equations // Transactions of American Mathematical Society. 1983. V. 277. p. 1-41.
28. Krasovski N. N., Subbotin A. I. Positional Differential Games. Springer Verlag, 1988.
29. Kurzhanski А. В., Vdlyi I. Ellipsoidal Calculus for Estimation and Control. SCFA. Boston: Birkhauser, 1997.
30. Kurzhanski А. В., Varaiya P. Ellipsoidal techniques for reachability analysis. Internal approximation // Systems and Control Letters. 2000. V. 41. p. 201-211.
31. Kurzhanski А. В., Varaiya P. Dynamic optimization for reachability problems // Journal of Optimization Theory and Applications. 2001. V. 108. N. 2. p. 227-251.
32. Kurzhanski А. В., Varaiya P. Ellipsoidal techniques for reachability analysis. Part I: External approximations. Part II: Internal approximations. Box-valued constraints // Optimization methods and software. 2002. V. 17. p. 177-237.
33. Kurzhanski А. В., Varaiya P. On reachability under uncertainty // SIAM Journal on Control. 2002. V. 41. N. 1. p. 181-216.
34. Varaiya P., Lin J. Existence of saddle points in differential games // SIAM Journal on Control an Optimization. 1969. V. 7. N. 1. p. 142-157.
Публикации по теме диссертации
35. Даръин А. Н. Об управлении при двойном ограничении с зависимостью геометрического ограничения от интегрального // Известия РАН. Теория и системы управления. 2003. № 4. с. 21-29.
36. Дарьин А. Н., Куржанский А. Б. Управление в условиях неопределенности при двойных ограничениях // Дифференциальные уравнения. 2003. Т. 39. № 11. с. 1474-1486.
37. Дарьин А. Н., Куржанский А. Б. Нелинейный синтез управления при двойных ограничениях // Дифференциальные уравнения. 2001. Т. 37. №11. с. 1476-1484.
38. Daryin A. Nonlinear synthesis lor uncertain systems with diverse types of constraints // Proc. NOLCOS-01. V. 2. IFAC, Elsevier Science, St. Petersburg, 2001.
»-6745
Издательство ООО "МАКС Пресс". Лицензия ИД № 00510 от 01.12.99 г. Подписано к печати 09.03.2004 г. Формат 60x90 1/16. Усл.печ.л. 1,0. Тираж 100 экз. Заказ 254. Тел. 939-3890,939-3891,928-1042. Тел./факс 939-3891. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В.Ломоносова.