Накопление точек контакта с границей в задачах с фазовыми ограничениями

Гаель, Владимир Владимирович

Накопление точек контакта с границей в задачах с фазовыми ограничениями тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Гаель, Владимир Владимирович АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Москва МЕСТО ЗАЩИТЫ

2011 ГОД ЗАЩИТЫ

01.01.02 КОД ВАК РФ

Диссертация по математике на тему «Накопление точек контакта с границей в задачах с фазовыми ограничениями»

Автореферат диссертации на тему "Накопление точек контакта с границей в задачах с фазовыми ограничениями"

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В. ЛОМОНОСОВА

Механико-математический факультет

На правах рукописи УДК 517.977

4854904

Гаель Владимир Владимирович

НАКОПЛЕНИЕ ТОЧЕК КОНТАКТА С ГРАНИЦЕЙ В ЗАДАЧАХ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ

01.01.02 - дифференциальные уравнения, динамические системы и оптимальное управление

Автореферат диссертации на соискание ученой степени кандидата физико-математических наук

2 9 СЕН 2011

Москва 2011

4854904

Работа выполнена на кафедре Общих проблем управления Механико-математического факультета Московского государственного университета имени М.В. Ломоносова

Научный руководитель доктор физико-математических наук,

профессор Зеликин Михаил Ильич

Официальные опноненты член-корр. РАН,

доктор физико-математических наук Асеев Сергей Миронович

кандидат физико-математических наук, Карамзин Дмитрий Юрьевич

Ведущая организация Российский университет дружбы народов

Защита состоится 14 октября в 16 час. 40 мин. на заседании Диссертационного совета Д 501.001.85 при Московском государственном университете имени М.В. Ломоносова по адресу: 119991, ГСП-1, Москва, Ленинские горы, Главное здание МГУ, Механико-математический факультет, аудитория 16-24.

С диссертацией можно ознакомиться в научной библиотеке Механико-математического факультета МГУ по адресу: 119991, Москва, Ленинские горы, Главное здание МГУ, 14 этаж.

Автореферат разослан 13 сентября 2011 года

Ученый секретарь Диссертационного совета Д 501.001.85 при МГУ доктор физико-математических наук профессор ' В.Н. Сорокин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Современная теория оптимального управления берет свое начало от работ Л.С. Понтрягина1 и его учеников выполненных в начале шестидесятых годов XX века. Основным результатом этих работ является всемирно известный принцип максимума Понтрягина, который задает необходимые условия оптималь^ ности для широкого класса задач оптимального управления.

Одним из направлений развития теории оптимального управления является теория принципа максимума Понтрягина для задач с фазовыми ограничениями. Первые результаты по данной тематике были получены JI.C. Понтрягиным и Р.В. Гамкрелидзе12 одновременно с открытием принципа максимума. Рассмотрен частный, но важный случай задач оптимального управления в которых на оптимальную траекторию накладывается следующее ограничение. Предполагается, что число участков оптимальной траектории на которых движение происходит по границе и строго внутри фазового ограничения конечно. В данных предположениях получены необходимые условия оптимальности для участков траектории, на которых она проходит по границе фазового ограничения. Вне границы, очевидно, выполнен классический принцип максимума. Также получены важные условия склейки участков оптимальной траектории лежащих на границе и внутри фазового ограничения. А именно, показано, что вектор функция сопряженных переменных может иметь разрыв первого рода в точках склейки, а направление разрыва должно быть ортогонально границе фазового ограничения.

Дальнейшее развитие теория принципа максимума при наличии фазовых ограничений получила в работах А.Я. Дубовицкого и A.A. Милютина,34. Данными авторами были получены необходимые условия оптимальности для достаточно широкого класса задач. Ограничения на оптимальную траекторию, которые предполагались в предыдущих работах уже

'JI.C. Поитрягип, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко. Математическая теория оптимальных процессов. М.: Физматгиз, 1961.

2Р.В. Гамкрелидзе. Оптимальные процессы управления при ограниченных фазовых координатах. Изв. АН СССР. Сер. матем., 1960, 24:3, с. 315-356.

3А.Я. Дубовицкий, A.A. Милютин. Теория принципа максимума. Сб. "Методы теории экстремальных задач в экономике". М.: Наука, 1981, с. 6-47.

■•А.П. Афанасьев, В.В. Дикусар, A.A. Милютин, C.B. Чуканов. Необходимое условие в оптимальном управлении. М.: Наука, 1990.

не накладываются. Основным изменением в принципе максимума Понт-рягина для задач е фазовыми ограничениями в форме Дубовицкого-Милютина, является форма сопряженных уравнений. А именно, из разряда обыкновенных дифференциальных уравнений они перешли в разряд уравнений связывающих меры на отрезке [to,tij. Необходимость использования уравнений более общего характера связана с тем, что в качестве множителей Лагранжа для задач с фазовыми ограничениями в принципе максимума выступают не функции, а меры с носителем в точках выхода оптимальной траектории на границу фазового ограничения.

Необходимые условия оптимальности для задач с фазовыми ограничениями полученные Л.С. Понтрягиным и Р.В. Гамкрелидзе являются частным случаем принципа максимума Понтрягина в форме Дубовицкого-Милютина. Чтобы осуществить необходимое сведение в принципе максимума в форме Дубовицкого-Милютина нужно взять меру, непрерывную по мере Лебега на интервалах времени, где оптимальная траектория проходит по границе фазового ограничения, и имеющую дискретную составляющую в точках выхода оптимальной траектории на границу.

Согласно теореме Лебега о разложении мер произвольную меру Лебе-га-Стилтьеса можно представить в виде суммы трех мер — непрерывной, дискретной и сингулярной. Большое значение с практической точки зрения имеют условия при которых мера, фигурирующая в принципе максимума, не будет содержать сингулярной составляющей. В этом случае уравнения принципа максимума существенно упрощаются. Такие условия были получены A.A. Милютиным5. В практических задачах условия отсутствия сингулярной составляющей меры выполняются. Дискретная же составляющая часто не равна нулю. Возникает вопрос: как устроен носитель дискретной составляющей меры?

Наличие и свойства дискретной составляющей тесно связаны с понятием глубины фазового ограничения. В соответствии с определением A.A. Милютина глубина фазового ограничения — это число дифференцирований функции, задающей фазовое ограничение, необходимое, чтобы получить функцию, явно зависящую от управления. В задачах с фазовым ограничением глубины 1 дискретная составляющая меры, как правило, отсутствует. В задачах с фазовым ограничением глубины 2 дис-

5А.А. Милютин. Принцип максимума в общей задаче оптимального управления. М.: Наука, 2001.

кретная составляющая, как правило, появляется, но на каждом конечном интервале времени имеет не более конечного числа скачков. Если фазовое ограничение имеет глубину 3 и более возникают ситуации, когда существуют конечные отрезки времени на которых дискретная составляющая меры имеет счетное число скачков и, следовательно, есть точки их накопления.

Первый пример такого явления был найден Г. Роббинсом6. Им была рассмотрена следующая задача с фазовыми ограничениями глубины 3:

и, У(и), у(и), у(и), » = 0,1 - фиксированы. Она имеет замечательное свойство — группу симметрий. А именно, если рассмотреть замену переменных

то задача, за исключением граничных условий, перейдет в себя. С использованием данного свойства задачи, Г. Роббинсом были найдены автомодельные решения, которые выходят на границу фазового ограничения посредством счетного числа учащающихся касаний границы. В точках касания дискретная составляющая меры отлична от нуля, а сопряженные переменные претерпевают разрыв. Таким образом мера в данной задаче имеет дискретную составляющую с предельной точкой.

A.A. Милютин7 исследовал некоторое обобщение предыдущей задачи. Он ввел дополнительные переменные

которые позволяют записать минимизируемый функционал в терминальной форме x(ti) +£(ti) inf. И далее исследовал экстремали, решения уравнений принципа максимума Понтрягина в форме Дубовицкого-Милютина, без учета граничных условий. В дополнение к функционалу

6Н. Robbins. Junction phenomena for optimal control with state-variable inequality constraints of third order. Journal of Optimization Theory and Applications. 31:1, 1980, p. 85-99.

7B.B. Дикусар, A.A. Милютин. Качественные и численные методы в принципе максимума. М.: Наука, 1989.

dt inf, У =и, у > 0,

(t, У, У, У, и) -* (t/X, \6у, А5г/, Л4у, AV),

рассмотренному Г. Роббинсом, результаты полученные A.A. Милютиным применимы и к другим функционалам зависящим только от граничных условий. Одним из результатов Милютина является описание автомодельных экстремалей в данной системе уравнений принципа максимума. Доказано, что кроме автомодельных экстремалей, найденных Г. Роббинсом, только одна экстремаль может выйти на фазовую границу, причем в отличие от автомодельных экстремалей она не имеет накопления точек касания с границей при подходе к точке выхода.

A.A. Милютиным также была рассмотрена еще одна задача с фазовым ограничением глубины 3:

/ у dt -> inf, y=u, |u| < 1, y>0,

Jta

U, y{ti), y{U), y(ti), г = 0,1 — фиксированы.

Примечательно, что качественные свойства экстремалей этой задачи аналогичны свойствам экстремалей предыдущей задачи. Отличия заключаются в форме ограничения на управление. В одной задаче ограничение носит интегральный характер, а в другой локальный.

Задачи с фазовыми ограничениями в которых наблюдается накопление точек контакта с границей имеют много общего с задачами оптимального управления с четтеринг режимами. Это широкий класс задач в которых оптимальное управление имеет счетное число переключений (разрывов первого рода) на конечном интервале времени. Впервые пример такой задачи в 1960 году привел А.Т. Фуллер8:

/ x2dt-+inf, х = и, [гг| < 1, J о

z(0) = хо, ¿(0) = ¿о, х(Т) = х(Т) = 0.

Благодаря наличию у задачи группы симметрии, А.Т. Фуллеру удалось найти ее автомодельные оптимальные траектории. Эти траектории приходят в начало координат за конечное время, но со счетным числом переключений управления накапливающихся к началу координат.

Несмотря на то, что пример А.Т. Фуллера вначале воспринимался как некая любопытная патология, через какое-то время интерес к нему вновь

8А.Т. Фуллер. Оптимизация релейных систем регулирования по различным критериям качества. Тр. I контр. ИФАК (Москва, 1960), М., 1961, т. 2, с. 584-605.

пробудился и к настоящему времени изучено большое количество классов задач с данной особенностью. Стоит отметить работы М.И. Зеликина и В.Ф. Борисова910 по данной тематике.

Цель исследования. Построить полный оптимальный синтез двух модельных задач с фазовыми ограничениями глубины 3; исследовать малые, относительно группы симметрия, возмущения модельных задач и найти их оптимальный синтез. Исследовать топологическую структуру оптимального синтеза задачи оптимального управления являющейся прямым произведением двух экземпляров модельной задачи.

Методы исследования. В диссертации используются методы оптимального управления, дифференциальной геометрии, дифференциальных уравнений, теории функций и теории четтеринг-режимов.

Научная новизна. Все полученные результаты являются новыми и состоят в следующем:

1.Для двух модельных задач оптимального управления с фазовыми ограничениями глубины 3 построен оптимальный синтез включающий траектории со счетным числом касаний границы на конечном интервале времени. Доказана оптимальность построенного синтеза.

2.Впервые построен полный оптимальный синтез для некоторого достаточно широкого класса многомерных нелинейных задач с фазовыми ограничениями. Построенный синтез содержит многообразия, состоящие из траекторий со счетным числом касаний границы фазового ограничения на конечном интервале времени.

Дано описание лагранжевых многообразий нового типа, отвечающих скачкам сопряженных переменных и содержащих "вертикальные"участки относительно проектирования на фазовое пространство.

3.Изучена топологическая структура оптимального синтеза задачи оптимального управления являющейся прямым произведением двух экземпляров модельной задачи. Показано, что после факторизации по действию группы симметрии оптимальный синтез представляет собой слоение Риба.

аМ.И. Зеликин, В.Ф. Борисов. Режимы учащающихся переключений в задачах оптимального управления. Труды МИАН СССР, т. 197, 1991, с. 85-167.

10M.I. Zelikin, V.F. Borisov. Theory of Chattering Control with Applications to Astronautics, Robotics, Economics, an4 Engineering. Boston, N.Y.: Birkhäuser, 1994.

Теоретическая и практическая ценность. Диссертация носит теоретический характер; результаты диссертации могут быть использованы специалистами по оптимальному управлению.

Апробация диссертации. Результаты диссертации докладывались автором неоднократно на семинаре проф. М.И. Зеликина по геометрической теории оптимального управления на механико-математическом факультете МГУ (2008-2011), на семинаре проф. A.B. Арутюнова на кафедре нелинейного анализа и оптимизации РУДН (2011) и на научной конференции "Ломоносовские чтения" механико-математического факультета МГУ (апрель, 2010).

Публикации. Основные результаты диссертации опубликованы в 3 работах, список которых приведен в конце автореферата [1-3]. Работы [1,2] опубликованы в журналах из действующего Перечня ВАК.

Структура И объем работы. Диссертация состоит из введения, четырех глав, разбитых на разделы, и списка литературы. Общий объем текста — 104 страницы. Список литературы содержит 47 наименований.

Во введении изложена краткая история вопроса, продемонстрирована актуальность темы настоящего исследования и сформулированы основные результаты диссертации.

В первой главе изложены вспомогательные теоремы: принцип максимума Понтрягина для задач с фазовыми ограничениями и теорема об инвариантном многообразии диффеоморфизма.

Во второй главе рассмотрена следующая задача оптимального управления и ее возмущения.

Задача 1:

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

у = z, z = w, w = и, uEI, У > 0,

?/(0) = уо, z(0) = zq, w{0) = w0, y(T) = z(T) = ЦТ) = 0.

Допустимыми считаются абсолютно непрерывные функции у(-), г(-), ги(-) и измеримая функция и(-) е ¿2[0,Т], удовлетворяющие дифференциальным уравнениям, фазовому ограничению у > 0 и граничным условиям. Конечный момент времени ^фиксирован.

Уравнения принципа максимума Понтрягина для задачи 1 имеют следующий вид:

■¡/>1 = 1- £ (£), тр2 = —-01, ^з = -^2,

+ = П = 1,2,..., г/(г„) = о,

= П.в. на[0,Т].

Здесь £(£) > 0 абсолютно интегрируемая функция, равная нулю вне множества {£ | = 0}. Сопряженные переменные являются абсолютно непрерывными функциями всюду, за исключением не более чем счетного множества точек, в которых функция может иметь разрывы первого рода.

Теорема (2.1). Пусть траектория у(-), £(•), й>(-) с управлением «(•) является допустимой в задаче 1 и удовлетворяет условиям принципа максимума Понтрягина для этой задачи, тогда она оптимальна.

Доказательство теоремы основано на кратном интегрировании условия принципа максимума и линейно-квадратичном характере задачи.

Для построения оптимального синтеза используется однопараметри-ческая группа симметрия д\ которой обладает задача 1.

дх : К3 -» К3, (у, г, н-» (Л6у, Х5г, А4«;), Л > 0.

Если траектория у(1), г^), и>(£) с управлением «(¿) является решением задачи 1 с начальными условиями (уд, го, гио), то для произвольного числа Л > 0 траектория д\(у^/Х),г(1/Х),ги(Ь/Х)) с управлением Х3и(Ь/Х) также является решением задачи 1 с начальными условиями д\(уо, го, и>о).

Определение (2.1). Решение у(Ь), г({), ги(£) задачи 1 называется автомодельным с параметром X, если

(у(* + т), г{Ь + т), Ц* + г)) = д-х(у(М А), *(«/А), Ц*/А)),

при некотором г > 0 и при любом £ > 0.

Задача 1 обладает однопараметрическим семейством автомодельных оптимальных траекторий. Приведем одну из них, а остальные автомодельные траектории могут быть получены из нее растяжением или сжатием с помощью отображения д\ при любом параметре Л > 0.

^ « -0.695476, « -0.217697, и -0.037860, го+ « 0.003292. Указанные соотношения задают автомодельную оптимальную траекторию на отрезке [0,1]. В момент времени 4 = 0 она выходит с касанием из точки (0,0, ги+) границы фазового ограничения, а в момент £ = 1 возвращается на границу в точке (0,0, \+ю+). Далее траектория продолжается исходя из условия автомодельпости на отрезок [1,1 + А+], затем на [1 + А+, 1 + А+ + (А+)2] и т.д. Коэффициент сжатия А+ и 0.319488. Через время At = 1/(1 - А+) автомодельная траектория приходит в начало координат и далее там остается.

Нужно отметить, что в моменты касания границы фазового ограничения пятая производная функции которая совпадает с "01 имеет разрыв первого рода.

Во второй главе построен полный синтез оптимальных траекторий задачи 1. Качественно он заключается в следующем. В трехмерном фазовом пространстве (у, л, ги) лежит двумерная поверхность К гомеоморф-ная конусу. Она состоит из орбит группы д\, полностью лежит в полупространстве у > 0 и касается плоскости у = 0 по лучу Оги+ = {у = г — 0, ш > 0}. Поверхность К заполняют автомодельные оптимальные траектории, которые прежде чем попасть в начало координат совершают за конечное время счетное число касаний плоскости у = 0. Точка О начала координат является единственной стационарной точкой в полупространстве у> 0.

Поверхность К делит фазовое пространство на две области, одна из которых целиком лежит в полупространстве у > 0. В области проходит одна выделенная траектория <5

Рис. 1: Оптимальный синтез задачи 1 на фактор пространстве

которая без касаний фазового ограничения приходит в начало координат. Область П+ за исключением указанной траектории заполняют неавтомодельные оптимальные траектории, которые за конечное время выходят на поверхность К в точках луча Оги+, а дальше продолжаются автомодельными оптимальными траекториями, которые заполняют поверхность К. В обратном времени неавтомодельные траектории в области Г2+ в метрике на пространстве орбит группы д\ стремятся к выделенной траектории <5.

Оптимальные траектории задачи 1 заполняют еще одну область О,", которая дополняет множество КиО+ до полупространства у > 0. Ее заполняют неавтомодельные оптимальные траектории, которые в прямом времени выходят на поверхность К в точках луча Ош+. Далее они продолжаются автомодельными траекториями (аналогично оптимальным траекториям из области Однако в обратном времени оптимальные траектории из области Г>~ пробивают фазовое ограничение у = 0 и, следовательно, дальше в обратном времени не продолжаются.

Оптимальный синтез задачи 1 инвариантен относительно действия группы д\. Поэтому можно рассмотреть оптимальный синтез на проф-акторизованном по действию этой группы фазовом пространстве. Поскольку орбитами группы д\ являются кривые

ОгЪд(у, г, ш) = {(Л6г/, А5*, А4«;) 6 К3| А > 0},

то после факторизации полупространства у > 0 по действию группы получим дизъюнктное объединение двумерного диска и одной точки отвечающей началу координат. Синтез оптимальных траекторий на фактор пространстве показан на рисунке 1.

Оптимальность построенного синтеза задачи 1 следует из теоремы 2.1. В дополнение к этой теореме оптимальность построенного синтеза доказана в работе еще одним способом с помощью техники лагранжевых многообразий и инвариантного интеграла Гильберта (теорема 2.5, следствие 2.1). Этот способ доказательства более универсален. Он был использован в возмущенной задаче которая рассмотрена далее.

Основные результаты второй главы относятся к возмущенной задаче. Задача 2:

Предположим, что условия принципа максимума Понтрягина для данной задачи вместе с дифференциальными уравнениями х = ¡р(х,и) и фазовым ограничением Ф(ж) < 0 можно привести к следующему виду

г = фт, У > О,

u{t) = i>3{t) п. в. на [О,Г],

i>i(tn + 0) - ^i(f„) = -6п < 0 при tn : y(tn) = 0.

Здесь переменные (у, z, w, ф\,ф2, Фз) £ R6, а r 6 R2n~6 — вектор, дополняющий их до базиса (2тг)-мерного расширенного пространства. Функции Фг — Фг(у, z, w, фи Ф2,Фз, г, и) — произвольные гладкие функции, удовлетворяющие следующим соотношениям. Существуют такие гладкие функции z, w, фг,ф2, Фз, г, и), что

lim Х~'нф^{Х6у, X6z, X4w, Ai/>i,A2i/>2, \3Фз,г, X3u) = А—»+0

x = ip{x,u), х £ К", и 6R, х(0) = х0, х{Т) = х\, Ф(а;(*)) <0, Ф : Rn —> R.

у = г + ф\, ¿ = ги + ф2, ти = и + фз,

Ф>1 = 1 + Фа, Ф2 = ~Ф\ + Фъ, Фз = —02 + Фб,

где веса Л; определяются числами

= 6, /)-2 = 5, Лз = 4, /ц = 1, /г5 = 2, ¡ц = 3, /17 = 0.

Таким образом, веса возмущающих добавок ф^ в смысле действия масштабной группы должны быть выше, чем веса слагаемых, стоящих в правой части невозмущенной системы (при фг = 0).

Теорема (2.7). При выполнении указанных условий через каждую точку

(у, г, и, 1ри $2, Фз, г) = (0,0,0,0,0,0, г0) = Во

проходит трехмерное интегральное подмногообразие 2ПГо указанной системы дифференциальных уравнений, поведение траекторий внутри которого удовлетворяет следующим условиям

A) Внутри 2ВГо имеется единственная траектория Г°0, приходящая в точку Во и не имеющая других точек пересечения с границей У = 0.

B) Имеется однопараметрическое семейство траекторий ЭЯГа С 23Г(» каждая из которых выходит на границу фазового ограничения у = 0 по счетному множеству точек, принадлежащих некоторой гладкой кривой Гг„, проходящей через точку Во. Точки касания границы у — 0 но, каждой кривой внутри ЗЛГ„ накапливаются к точке Во, при этом каждая траектория приходит в Во за конечное время. Все траектории семейства Ш1Го заполняют двумерную поверхность ШГо, гомеоморфную двумерному конусу с вершиной в точке Во.

C) Траектории 2НГ0) отличные от Г°о и 9ЯГо, в прямом времени попадают на кривую ГГо, а затем продолоюаются подходящей траекторией внутри ШГс.

Совокупность Ш7Го при всех Го имеет структуру стратифицированного гладкого многообразия Ш. В частности, внутри IV точки касания траекторий границы фазового ограничения у = 0 заполняют гладкое стратифицированное многообразие с границей (клетки максимальной размерности этого многообразия имеют размерность 2п — 5).

Во второй главе рассмотрена конструкция, которая позволяет включать отдельно взятую экстремаль в лагранжево многообразие, заполненное экстремалями задачи 2, и, тем самым, доказывать оптимальность исходной экстремали.

Пусть ОХ — произвольное (п - 3)-мерное подмногообразие в подпространстве у = г = и) = тр1 = Ф2 = Фз ~ 0- Пусть 91 является лежан-дровым, то есть ограничение формы ы = ф йх на (К тождественно равно нулю. Частный случай такого многообразия - поднятие произвольного (п - 3)-мерного многообразия цели х(Т) 6 N в задаче 2 на базу у^г = и: = ф\ — ф2 = фз — О расслоения Ш с помощью условия трансверсальности 1р{Т) ± Тх(т)М. Обозначим прообраз многообразия Ш в расслоении \У, то есть объединение всех трехмерных слоев 2ВГо по Го € через 2В. Из теоремы 2.7 следует, что 2В есть стратифицированное многообразие с краем. Предположим, что проекция М многообразия на пространство х регулярна.

Теорема (2.8). Многообразие 2И лагранжево, то есть ¿ф Л ^^ = О-

Следствие (2.2). В условиях теоремы 2.8 произвольная экстремаль, которая может быть включена в вышеописанное семейство 2Н, доставляет минимум в задаче 2 в классе всех допустимых траекторий, принадлеоюащих проекции М многообразия 2П на пространство х.

В третьей главе диссертации для следующей задачи с локальным ограничением на управление получены результаты аналогичные результатам второй главы для задачи 1.

Задача 3:

/ у <Ы. —» тш, о

у = г, ¿ = и], и) = и, |и| < 1, У> О,

2/(0) = уо, 2(0) = г0, и>{0) = ги0, у(Т) = г(Т) = т(Т) = 0.

Группа симметрии этой задачи имеет следующий вид

</д : К3 —> К3, (у, г, и>) !-»■ (Л3г/, Л2г, А го), А > 0.

Оптимальный синтез задачи 3, несмотря на другой характер ограничения на управление, качественно совпадает с таковым для задачи 1. В частности, он содержит оптимальные автомодельные траектории, которые приходят в начало координат с накоплением точек контакта с границей.

В третьей главе рассмотрен класс задач, которые являются малыми, относительно группы симметрий, возмущениями задачи 3. Для этого класса задач доказаны аналоги теорем 2.7, 2.8 и следствия 2.2.

В четвертой главе исследуется оптимальный синтез следующей задачи оптимального управления с двумя фазовыми ограничениями и двумерным управлением.

Задача 4:

Фазовые переменные У = (2/1,21,101,2/2,22,102) выбираются из класса абсолютно непрерывных функций, а управления щ и щ — из класса ¿^([О, Т]) суммируемых в квадрате функций на отрезке [0,Т]. Определим две функции проектирования

Несмотря на то, что функционал задачи 4 зависит как от так и от у2, справедливо следующее

Следствие (4.1). Если У*{Ь) есть решение задачи 4, то проекции Р1(У*(£)) ир2{У*(Ь)) являются решениями задачи 1.

В этом смысле задачу 4 можно считать декартовым произведением двух экземпляров модельной задачи 1.

Теорема (4.4). Синтез оптимальных траекторий в задаче 4 инвариантен относительно действия однопараметрической группы

: К6 К6, {уи 21, Ш1, У2,22, го2) ^ (А6уи А52Ь А4шь Х6у2, А522, А4го2), где А > 0.

Ш = 2г, ¿1 = Щ = Щ, Щ 6 К,

у*>0,

гл(0) = УгО, 2г(0) = 2г-о, №¿(0) = у4(Т) = = ш(Т), = 0 г = 1,2.

РГ-К6-^^3, (3/1,21,101,2/2,22,102) ^ (у»,2»,го1), г = 1,2.

Поэтому, можно рассмотреть оптимальный синтез задачи 4 на проф-акторизованном по действию группы д\ фазовом пространстве, которое представляет собой дизъюнктное объединение 5-мерной сферы Е и одной точки Л, отвечающей началу координат. Четвертая глава полностью посвящена изучению топологической структуры оптимального синтеза задачи 4 на профакторизованном фазовом пространстве.

Приведем здесь топологическую структуру оптимального синтеза на фактор поверхности 5 £ Е отвечающей прямому произведению двух конусов К\, автомодельных решений двух экземпляров задачи 1.

Поскольку прямое произведение К\ х гомеоморфно К4, то поверхность 5 гомеоморфна 3-мерной сфере.

Теорема (4.6). Оптимальный синтез задачи 4 на сфере 5 удовлетворяет следующим утверждениям.

1. Особыми экстремалями на 5 являются две окружности Ь\ и Ьъ, особые по управлениям и2 и щ соответственно.

2. В сферу Б вложен тор Т, который заполнен замкнутыми оптимальными траекториями.

3. Тор Т разбивает сферу 5 на два конгруэнтных полнотория Т\ и Гг-Полноторий Т\ (Т2) содержит в качестве центральной окружности особую экстремаль Ь\ (Ь^). В окрестности Ь\ (Ь2) определено слоение с двумерными слоями так, что в каждом слое оптимальные траектории выходят на Ь\ (£12) за конечное время со счетным числом касаний границы фазового ограничения у2 = 0 (у\ = 0). В обратном вре~мени траектории из Т\\Ь1 и Тг\Ьг стремятся к тоРУ Т.

В четвертой главе также изложены теоремы 4.8 и 4.9, которые, вместе с приведенной теоремой 4.6, дают полное описание оптимального синтеза на фактор пространстве Е.

Благодарности. Автор благодарит научного руководителя профес-

сора Михаила Ильича Зеликииа и профессора В.Ф. Борисова

за предло-

женную тему, постоянное внимание к работе, ценные замечания и многочисленные обсуждения, кандидата физико-математических наук Л.В. Ло-куциевского за ценные замечания и обсуждения.

Работы автора по теме диссертации.

[1] М.И. Зеликин, В.В. Гаель. Накопление точек контакта с границей и лагранжевы многообразия в задачах с фазовыми ограничениями. // Современная математикам ее приложения, Изд. Национальной Академии Наук Грузии, т. 69, 2011, стр. 73-103. Journal of Mathematical Sciences, Springer, Vol. 177, No. 2, August, 2011, p. 299-328.

[2] B.B. Гаель. Слоение Риба в задаче оптимального управления с фазовыми ограничениями. // Современная математика и ее приложения, Изд. Национальной Академии Наук Грузии, т. 69, 2011, стр. 3-17. Journal of Mathematical Sciences, Springer, Vol. 177, No. 2, August, 2011, p. 229-243.

[3] М.И. Зеликин, В.Ф. Борисов, B.B. Гаель. Режимы с учащающимися переключениями и лагранжевы многообразия в задачах с фазовыми ограничениями. // Деп. в ВИНИТИ 01.07.11, № 319-В2011.

В совместных работах [1] и [3] автором самостоятельно получены результаты относящиеся к исследованию задач с неограниченным управлением принадлежащим пространству Ьг- Результаты относящиеся к задачам с ограниченным управлением |u| < 1 получены совместно с профессором М.И. Зеликиным и профессором В.Ф. Борисовым.

Отпечатано в отделе оперативной печати Геологического ф-та МГУ Тираж ¡со экз. Заказ №

Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Гаель, Владимир Владимирович, Москва

1. В.Г. Болтянский, Р.В. Гамкрелидзе, J1.C. Понтрягин. К теории оптимальных процессов. // ДАН СССР. 110, № 1, 1956, с. 7-10.

2. Р.В. Гамкрелидзе. Теория оптимальных по быстродействию процессов в линейных системах. // Известия АН СССР. Серия математическая. 22, №4, 1958, с. 449-474.

3. В.Г. Болтянский, Р.В. Гамкрелидзе, JI.C. Понтрягин. Теория оптимальных процессов. Принцип максимума. // Известия АН СССР. Серия математическая. т. 24, № 1, 1960, с. 3-42.

4. JI.C. Понтрягин , В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко. Математическая теория оптимальных процессов. // М.: Физматгиз, 1961, М.: Наука, 1969.

5. H.H. Красовский. К теории оптимального регулирования. // Автоматика и телемеханика, т. 18, № 11, 1957, с. 960-970.

6. H.H. Красовский. Теория управления движением. // М.: Наука, 1968.

7. A.A. Аграчев, Р.В. Гамкрелидзе, Принцип оптимальности второго порядка для задачи быстродействия. // Математический сборник, 100(142):4(8), 1976, с. 610-643.

8. A.A. Аграчев. Необходимое условие оптимальности второго порядка в общем нелинейном случае. // Математический сборник, 102(144):4, 1977, с. 551-568.

9. A.A. Аграчев, С.А. Вахрамеев, Р.В. Гамкрелидзе. Дифференциально-геометрические и теоретико-групповые методы в теории оптимального управления. // Итоги науки и техники. Проблемы геометрии, 14, 1983, с. 3-56.

10. A.A. Аграчев, Р.В. Гамкрелидзе. Симплектическая геометрия и необходимые условия оптимальности. // Математический сборник, 182:1, 1991, с. 36-54.

11. H.J. Kelley, R.E. Kopp, H.G. Moyer. Singular extremals. // Topics in Optimization (ed. Leitmann G.) N.Y., 1967, p. 63-103.

12. B.A. Дыхта, O.H. Самсонюк. Оптимальное импульсное управление с приложениями. // М.: Физматлит, 2003.

13. А.И. Третьяк. О необходимых условиях оптимальности произвольного порядка в задаче быстродействия. // Математический сборник. 132(174):2, 1987, с. 261-274.

14. Р.В. Гамкрелидзе. Оптимальные по быстродействию процессы при ограниченных фазовых координатах. // ДАН СССР. 125, № 3, 1959, с. 475478.

15. Р.В. Гамкрелидзе. Оптимальные процессы управления при ограниченных фазовых координатах. // Известия АН СССР. Серия математическая. 1960, 24:3, с. 315-356.

16. А.Я. Дубовицкий, А.А. Милютин. Задачи на экстремум при наличии ограничений. // Журнал вычислительной математики и математической физики, т. 5, №3, 1965, с. 395-453.

17. А.Я. Дубовицкий, А.А. Милютин. Теория принципа максимума. // Сборник "Методы теории экстремальных задач в экономике". М.: Наука, 1981, с. 6-47.

18. А.П. Афанасьев, В.В. Дикусар, А.А. Милютин, С.В. Чуканов. Необходимое условие в оптимальном управлении. // М.: Наука, 1990.

19. А.А. Милютин. Принцип максимума в общей задаче оптимального управления. // М.: Наука, 2001.

20. А.В. Арутюнов, С.М. Асеев, В.И. Благодатских Необходимые условия первого порядка в задаче оптимального управления дифференциальным включением с фазовыми ограничениями // Математический сборник, т. 184, № 6 (1993), с. 3-32.

21. А.В. Арутюнов. Условия экстремума. Анормальные и вырожденные задачи // М.: Факториал, 1997.

22. А.Н. Колмогоров, С.В. Фомин. Элементы теории функций и функционального аналаза. // М.: Наука, 1976.

23. Н. Robbins. Junction phenomena for optimal control with state-variable inequality constraints of third order. // Journal of Optimization Theory and Applications. 31:1, 1980, p. 85-99.

24. B.B. Дикусар, A.A. Милютин. Качественные и численные методы в принципе максимума. // М.: Наука, 1989.

25. А.А. Милютин. Об одном семействе задач оптимального управления с фазовым ограничением. // Оптимальное управление, Итоги науки и техники. Серия Современная математика и ее приложения. Тематические обзоры, т. 60, ВИНИТИ, М., 1998, с. 176—186

26. А.Т. Фуллер. Оптимизация релейных систем регулирования по различным критериям качества. // Тр. I конгр. ИФАК (Москва, 1960), М., 1961, т. 2, с. 584-605.

27. В.Ф. Борисов, М.И. Зеликин. Режимы с учащающимися переключениями в задаче оптимального по быстродействию управления роботом. // ПММ, 1988, т. 52, Вып. 6, с. 934-946.

28. M.I. Zelikin, V.F. Borisov. Optimal synthesis containing chattering arcs and singular extremals of second order. // Nonlinear synthesis. Proc. HAS A Workshop Sopron. Hungary, 1989, In: Prog. Syst. Control Theory., 1991, v. 9, p. 283-296.

29. М.И. Зеликин, В.Ф. Борисов. Синтез в задачах оптимального управления, содержащий траектории с учащающимися переключениями и особые траектории второго порядка. // Мат. заметки, 1990, т. 47, N° 1, с. 62—73.

30. М.И. Зеликин, В.Ф. Борисов. Режимы учащающихся переключений в задачах оптимального управления. // Труды МИАН СССР, т. 197, 1991, с. 85-167.

31. M.I. Zelikin, V.F. Borisov. Theory of Chattering Control with Applications to Astronautics, Robotics, Economics, and Engineering. // Boston, N.Y.: Birkhauser, 1994.

32. В.Ф. Борисов. О числе предельных циклов фактор-системы n-мерной задачи Фуллера. // Матем. сб., 187:12, 1996, с. 3-20.

33. V.F. Borisov. Singular extremals of order 3 and chattering. // Proceedings of Symposia in Pure Mathematics. Differential Geometry and Control, 1998, v. 64, p. 135-147.

34. М.И. Зеликин. Структура оптимального синтеза в окрестности особых многообразий для аффинных по управлению задач. // Тр. МИАН, 236, М.: Наука, 2002, с. 174-196.

35. М.И. Зеликин. Синтез оптимальных траекторий, определяющий слоение Риба // Труды МИАН им. В.А. Стеклова, 2001, т. 233, с. 89-94.

36. М.И. Зеликин, В.Ф. Борисов, В.В. Гаель. Режимы с учащающимися переключениями и лагранжевы многообразия в задачах с фазовыми ограничениями. // Деп. в ВИНИТИ 01.07.11, №319-В2011. (Известия РАН, Серия математическая, т. 76, № 1, 2012, принята к печати).

37. H. Poincare. Memoire sur les courbes definies par une equation différentielle. // J. Math. Pures Appl., 1881, № 7 (3), p. 375-422.

38. H. Poincare. Les methodes nouvelles de la mecanique celeste. // Paris, 1899.

39. J. Hadamard. Sur l'itération et les solutions asymptotiques des equations différentielles. //Bull. Soc. Math. France., 1901, № 29, p. 224-228.

40. D.C. Lewis. Invariant manifolds near an invariant point of instable tye. // Amer. J. Math., 1938, v. 60, p. 577-587.

41. Д.В. Аносов. Многомерный аналог одной теоремы Адамара. //Науч. докл. высшей школы (физ.-мат. н.), 1959, № 1. с. 3-12.

42. В.А. Плисс. Принцип сведения в теории устойчивости движения. //Изв. АН СССР. Сер. матем., 1964, т. 28.

43. M.W. Hirsch, С.С. Pugh, М. Shub. Invariant manifolds. // Lect. Notes. Math., 583, Springer, Berlin — Heidelberg, 1977.