Экстремальные задачи для дифференциальных включений с фазовыми ограничениями тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Асеев, Сергей Миронович
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1997
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
>
РОССИЙСКАЯ АКАДЕМИЯ НАУК МАТЕМАТИЧЕСКИЙ ИНСТИТУТ ИМЕНИ В.А.СТЕКЛОВЛ
На правах рукописи УДК 517.977
АСЕЕВ Сергей Миронович
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ ДЛЯ ДИФФЕРЕНЦИАЛЬНЫХ ВКЛЮЧЕНИЙ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ
01.01.02 — дифференциальные уравнения
Автореферат диссертации на соискание ученой степени доктора физико-математических наук
Москва — 1997 г.
Работа выполнена в отделе обыкновенных дифференциальных уравнений Математического института им, В.А. Стеклова РАН.
Официальные оппоненты: академик РАН,
доктор физико-математических наук, профессор А.Б. Куржанский; доктор физико-математических наук профессор Е.С. Половинкин; доктор физико-математических наук профессор В.М. Тихомиров.
Ведущая организация: Институт математики и механики Уральского отделения РАН (г. Екатеринбург).
Защита состоится: года в^___час_00_мин. на за-
седают специализированного совета Д.002.38.01 в Математическом институте имени В.А. Стеклова РАН по адресу: Москва, ул.Губкина, д. 8, Математический институт имени В.А. Стеклова РАН
С диссертацией можно ознакомиться в библиотеке Математического института.
„ II ,
Автореферат разослан 1997г.
Ученый секретарь
специализированного совета, -¡л,_и,
доктор физико-математических наук Ю .Н. Дрожжинов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Теория дифференциальных включений представляет собой раздел теории обыкновенных дифференциальных уравнений.
Впервые дифференциальные включения, как уравнения в контин-генциях и паратингенциях, были введены в рассмотрение в 30-е годы нашего века в работах А. Маршо и С. Зарембы. В дальнейшем интерес к дифференциальным включениям возник снова в связи с развитием математической теории оптимального управления, созданной в середине 50-х годов Л. С. Понтрягиным, В. Г. Болтянским, Р. В. Гам-крелидзе, Е. Ф. Мищенко. Впервые на важную роль дифференциальных включений в различных задачах математической теории управления было обращено внимание в работах В. Г. Болтянского, Т. Ва-жевского, А. Ф. Филиппова.
В настоящее время теория дифференциальных включений представляет собой весьма продвинутый раздел теории обыкновенных дифференциальных уравнений, находящий многочисленные применения в теории дифференциальных уравнений с разрывной правой частью, в математической теории управления, в частности, в теории оптимального управления, теории управления в условиях неопределенности, в теории дифференциальных игр. Большой вклад в развитие теории дифференциальных включений был сделан в работах X. Антосевича, В. И. Благодатских, А. Брессана, Дж. Дэви, Ж. -П. Обэна, Ч. Олеха, Е. С. Половинкина, Г. В. Смирнова, А. А. Толстоногой а; В. В. Филиппова, А. Ф. Филиппова, X. Хермса, А. Челлины.
Важную роль в создании теории экстремальных задач для дифференциальных включений сыграли работы В. й. Благодатских, В. Г. Болтянского, Ф. Кларка, Ф. Лоуэна, С. Лоясевича, Б. Мордухопича, Е. С. Половинкина, Б. Н. Пшеничного, Р. Рокафеллара, Г. В. Смирнова.
Интерес к экстремальным задачам для дифференциальных включений во многом вызван тем обстоятельством, что задание дифференциальной связи в форме дифференциального включения позволяет единообразно охватить большое количество экстремальных задач для различных динамических систем, включая системы с обратной связью, управляемые системы с регулярными смешанными ограничениями, управляемые системы в условиях неопределенности, а также, динамические системы заданные семейством дифференциальных равенств и неравенств. Кроме того, задача оптимального управления для дифференциального включения является естественным инвариантным, относительно способа задания дифференциальной связи, обобщением классической задачи Больца вариационного исчисления.
Перенесение основных результатов теории оптимального управления на случай дифференциальных включений встретило серьезные трудности. Главным образом, эти трудности вызваны многозначностью и негладкостью правой части дифференциального включения. Преодоление этих трудностей стимулировало развитие методов негладкого анализа, теории многозначных отображений, качественных методов теории дифференциальных включений.
Фазовые ограничения естественно возникают при рассмотрении различных задач математической теории управления. Для задач оптимального управления с фазовыми ограничениями необходимые условия оптимальности в форме принципа максимума Вонтрягина впервые были получены Р. В. Гамкрелидзе. В наиболее общей постановке принцип максимума для таких задач был доказан А. Я. Дубовицким и А. А. Милютиным. Существенный вклад в изучение различных задач теории управления с фазовыми ограничениями был сделан в работах А. В. Арутюнова, А. Я. Дубовицкого и В. А. Дубовицкого, А. Б. Куржанского, X. Маурера, А. А. Милютина, Ю. С. Осипова.
Следует отметить, что фазовые ограничения делают рассматри-
ваемую задачу существенно негладкой и приводят к появлению качественно новых эффектов, которые необходимо учитывать при получении соответствующих необходимых условий оптимальности.
Цель работы состоит в изучении экстремальных задач для управляемых систем описываемых дифференциальными включениями при наличии фазовых ограничений, разработке математических средств исследования таких задач, в частности, методов регуляризации, получении содержательных необходимых условий, характеризующих оптимальные траектории, а также, исследовании свойств множителей Лагранжа, фигурирующих в полученных необходимых условиях оптимальности.
Научная новизна результатов. В данной работе разработан метод регуляризации негладких экстремальных задач для дифференциальных включений, а именно, метод гладких аппроксимаций для сведения таких задач к классическим гладким задачам оптимального управления. При помощи этого и других методов аппроксимаций осуществлено сведение задачи оптимального управления для дифференциального включения с фазовым ограничением к классической задаче оптимального управления без ограничений и получены новые необходимые условия оптимальности (принцип максимума), содержащие усиленное включение Эйлера-Лагранжа и дополнительное условие стационарности гамильтониана. Таким образом, развитый метод исследования экстремальных задач для дифференциальных включений позволяет получить новые необходимые условия оптимальности и устанавить их связь с классическим принципом максимума Понт-рягина. Отметим, что полученные необходимые условия оптимальности содержат более полную систему соотношений, по сравнению с известными, они более точно учитывают эффекты вызванные фазовыми ограничениями.
Показано, что эффект вырождения стандартных вариантов принципа максимума Понтрягина для задач с фазовыми ограничениями связан с их неполнотой. Для доказанных в работе необходимых условий оптимальности для дифференциальных включений полностью исследован данный эффект вырождения. Именно, получены необходимые и достаточные условия их невырожденности, а также условия поточечной нетривиальности. Отметим, что полученные условия управляемости, гарантирующие информативность принципа максимума для различных экстремальных задач с фазовыми ограничениями, являются более точными, по сравнению с известными достаточными условиями невырожденности для классических задач оптимального управления с фазовыми ограничениями. Они одновременно являются не только достаточными, но и необходимыми условиями невырожденности принципа максимума. Данные условия невырожденности являются условиями общего положения.
Выделены случаи, когда мера, фигурирующая в полученных необходимых условиях оптимальности, не имеет сингулярной составляющей. Основное отличие полученных условий от известных достаточных условий отсутствия сингулярной составляющей у меры в соотношениях принципа максимума для классической задачи оптимального управления с фазовыми ограничениями состоит в более естественных предположениях относительно геометрических ограничений накладываемых на допустимые управления.
При получении перечисленных выше результатов были развиты методы аппроксимаций, которые могут быть использованы при решении других задач математической теории управления.
Научная и практическая значимость. Полученные в диссертации результаты имеют теоретический характер. Предложенный в данной работе метод гладких аппроксимаций для сведения негладких
дифференциальных включений к случаю классических управляемых систем может быть использован для исследования различных задач теории дифференциальных включений и построения новых алгоритмов управления динамическими системами в условиях неопределенности. Полученные необходимые условия оптимальности для задач с фазовыми ограничениями могут быть использованы при исследовании конкретных задач теории оптимального управления.
Данная работа является составной частью исследований, ведущихся в отделе обыкновенных дифференциальных уравнений Математического института им. В. А. Стеклова РАН по теме "Оптимальное управление и дифференциальные игры."
Аппробация работы. Результаты диссертации докладывались на "IV Международной конференции по дифференциальным уравнениям и применениям КДУ-1У" (г, Русе, Болгария, 1989), на международной конференции "Многозначные отображения и дифференциальные включения" (г. Пампорово, Болгария, 1990), на международных конференциях "Нелинейный и теоретико-игровой синтез" и "Многозначные отображения и негладкий анализ" (Международный институт Эйлера, г. Санкт-Петербург, 1995), на конфереции "Обратные и некорректно поставленные задачи" (факультет ВМиК МГУ, 1995), на конференции "Чебышовские чтения" (Мех.-мат. факультет МГУ, 1996), на семинарах кафедры оптимального управления факультета ВМиК МГУ, кафедры дифференциальных уравнений и функционального анализа Российского Университета Дружбы Народов, отдела обыкновенных дифференциальных уравнений МИР АН, Математического института университета Вюрцбурга, Института прикладной математики университета Мюпстера, а также, на семинаре "Нелинейный анализ и оптимизация", работающем в МГУ под руководством профессоров М. И. Зеликина, В. М. Тихомирова, А. Б. Куржан-
ского, Ю. С. Осипова, А. В. Фурсикова.
Результаты диссертации опубликованы в 12 работах.
Структура и объем работы. Диссертация состоит из введения, двух глав и списка литературы. Объем диссертации составляет - 99 стр. текста набранного в текстовом редакторе ЬаТех, список литературы содержит 128 наименований.
СОДЕРЖАНИЕ РАБОТЫ
Во введении указываются источники экстремальных задач для дифференциальных включений, обсуждаются эффекты вызванные наличием фазовых ограничений и дается обзор содержания диссертации.
Первая глава дисертации посвящена методам регуляризации негладких экстремальных задач и доказательству необходимых условий оптимальности (принципа максимума) для дифференциальных включений с фазовыми ограничениями.
В параграфе 1 дается постановка задачи и приведены необходимые сведения из негладкого анализа.
Пусть А - непустое замкнутое подмножество из Л71. Обозначим через Н(А, ф) = Бир{{ж, ф) : х € Л} - опорную функцию множества А в направлении хр, а через р(х,А) —тт \\х — а]| - расстояние от точки х до множества А. Через Вп и Бп будем обозначать единичный шар и единичную сферу из В" с центром в нуле. Контингентным конусом к множеству А в точке х £Е А называется множество
КА{х) -{у^К1 : Зvi -» V За; +0 : х + сад 6 А, г -ч- оо}.
Касательным конусом Кларка к множеству А в точке х € А называется множество
Тл(х) = {V Е Яп : х -> +0 V : ж,- + сад € А, г оо}.
Субнормальным конусом к множеству А в точке х 6 А называется множество
Гд(з) - К\ = {и е пп : (и, v) < О Уг> 6 КА{х)}.
Аналогично, нормальный конус Кларка Na(x) к множеству А в точке х определяется равенством = Тд(ж). Наконец, конус обобщенных нормалей Na(x) определяется, как верхний топологический предел множеств Г^х,), взятый по всем возможным последовательностям Х{ —>■ х точек Xi £ А, при г оо, то есть
Na(x) =limsup Гд(а;г) = {v Е. Яп : Зх{ х 3€ Гл(жг) : ы и, г -> оо}
л
Si—
Пусть / - локально лшшшцевая функция на Я". Обозначим через = (У б Лп : (у,-1) € ^/(а,/(*))} и 3/(г) = {? е Л" : (г/, -1) € iVepi^(ж, /(ж))} субдифференциал Кларка функции / в точке х и множество обобщенных градиентов f в х, соответственно. Здесь epi / = {(х,у) : у > f{x)} - надграфик функции /.
Дифференциальным включением называют соотношение вида
xeF{x,t), (1)
где F(x,t) - многозначное отображение. Решением (траекторией) дифференциального включения (1) называется произвольная абсолютно непрерывная функция ж, удовлетворяющая почти всюду на интервале своего определения включению (1). Гамильтонианом Н системы (1) называют опорную функцию H(F(x,t),t{>) ее правой части.
Основным оъектом исследования в диссертации является следующая экстремальная задача:
xeF(x), tPl = [tut21; (2)
реР, Р = (хихг), х\ - x(t\), х2 = x(t2y, (3)
ее ш е Г;
J(p ) гшп.
(4)
(5)
Здесь х € -Йп; Ь' - многозначное отображение; Р, С - подмножества из Я2" и Д" соответственно; 7 - локально лишницевая функция. Минимум в задаче (2)-(5) ищется в классе липшицевых вектор-функций х, определенных каждая на своем отрезке времени I.
Относительно данных задачи (2)-(5) предполагаются выполненными следующие предположения:
(Н1) Многозначное отображение ^ принимает непустые выпуклые компактные значения и локально липшицево в смысле хаусдор-фовой метрики.
(Н2) Р,С - непустые замкнутые подмножества из В2п и Г{п соответственно.
(НЗ) Касательный конус Кларка Тс{х) имеет непустую внутренность для любого I £б.
Параграф 2 посвящен формулировке и обсуждению полученных в диссертации необходимых условий оптимальности (принципа максимума) для задачи (2)—(5).
Теорема 1 /Принцип максимума.) Пусть - решение задачи (2)-(5), ра - (^1,0)®2,о)} 3=1,0 = а;о(*1,о), ®2,о = ®о(*2,о), 1о = [^дъ^о]-Тогда существуют такие число А > 0, абсолютно непрерывная функция гр и ограниченная регулярная борелевска.я векторная .пера г] на Д, что выполняются следующие условия: а) условие стационарности:
b) мера ri неположительна на множестве непрерывных на /о функций у со значениями в Ta(xo(t)), то есть
¿2,0
/ v(t) dv< о У у е с {h) : y{t) € TG(®o(i)) Vi 6 70;
<1,0
c) усиленное включение Эйлера-Лагранжа:
ip(t) "б' conv {w : + Г drç) € ¿Vgraphi?(a;o(i),¿o(i))}-
Jti,a
d) условие трансверсальности:
<2,0
(i>(ti,o),-v(t2,d) - Jdrf) e XdJ(p0) + iVpn(GxG)(po);
e) условие нетривиально emu:
Здесь rj(t) обозначает атомарную составляющую меры rj в точке t, <2,0
||г/|| = sup / x(s) di].
Данная теорема усиливает в различных направлениях ряд известных необходимых условий оптимальности для дифференциальных включений с фазовыми ограничениями, полученных Ф. Кларком, Б. Мор-духовичем, Г. В. Смирновым, Ф. Лоуэном и Р. Рокафелларом. Основное ее отличие от упомянутых результатов состоит в условии а) стационарности гамильтониана, которое в некоторых задачах механики может быть интерпретировано, как условие выполнения закона сохранения энергии. В случае классической задачи оптимального
управления без фазовых и смешанных ограничений (как и в классическом вариационном исчислении) это условие следует из принципа максимума Понтрягина (в вариационном исчислении из системы уравнений Эйлера-Лагранжа).
В негладких задачах оптимального управления (даже в случае когда фазовые ограничения отсутствуют), условие стационарности гамильтониана не зависит от остальных соотношений принципа максимума и является дополнительным условием на сопряженную переменную ф (аналогичное явление в регулярных задачах оптимального управления со смешанными ограничениями отмечено А. А. Милютиным1).
Заметим, что в задачах без фазового ограничения условие стационарности гамильтониана обычно получают при помощи специальной вариации времени. Однако, при наличии фазовых ограничений, его доказательство в полной общности вызывает существенные трудности даже для классических гладких задач оптимального управления.
Следующий пример иллюстрирует дополнительность условия стационарности гамильтониана в негладких задачах оптимизации. Пример 1. Пусть К - нигде не плотное замкнутое подмножество отрезка [0,1] положительной меры. Положим
Тогда / - липшицевая на отрезке [0,1] функция.
Рассмотрим следующую задачу оптимального управления:
1 Афанасьев А.П., Дикуеар В.В., Милютин А.А., Чуколов С.А., Необходимое условие в оптимальном управлении. М.: Наука. 1990.
я е-Р(а) = {/(*) + и : М<1}; а(0) - 0, х(Т) = 1; Т пип.
Очевидно, u0(t) "== 1 - оптимальное управление. Пусть xq - соответствующая оптимальная траектория. Нетрудно видеть, что сопряженная функция ip(t) = 1 удовлетворяет усиленному включению Эйяера-Лагранжа. Тем не менее, для этой сопряженной функции вдоль оптимальной траектории H(F(xo(t)),i(>(t)) = /(ж0(t)) + 1 ф const. В данном примере ip(t) — щут^щу - единственная, с точностью до положительного множителя, сопряженная функция, удовлетворяющая условию H(F(xo(t)), i>{t)) = const > 0.
Для любого t £ [¿1,0, ¿2.0] из условия стационарности а) следует условие на атом rj(t) меры tj в точке £. Именно, оказывается, что скачки; меры 1] не могут выводить сопряженную функцию за множество уровня {ф : ff(F(a;o(i)),t/)) = 0} гамильтониана. Данное условие на атом меры в концевые моменты времени позволяет установить необходимые и достаточные условия невырожденности теоремы 1.
Следует отметить, что традиционные варианты принципа максимума Понтрягина для задач с фазовыми ограничениями2 содержат в себе лишь неполное условие стационарности
t
Jl(F(zo(t)), ф{£) + /drt- Ф)) =0 V* > ¿1,0,
¿1,0
откуда упомянутое выше условие на атом меры следует только для внутренних точек отрезка времени Jo- При этом, оказывается, что в теореме \ условие на атом меры rj в концевых точках получено вместе с нестандартным условием трансверсальности d), в котором правая часть содержит нормальный конус к множеству Р Г) (G X G), а не к множеству Р, как это обычно принято3.
Следующий пример показывает, что условие стационарности в концевые моменты времени в теореме 1 может не выполняться, если усло-
2см., например, Иоффе А.Д., Тихомиров В.М., Теория экстремальных задач. М.: Наука. 1974.
ъКларк Ф., Оптимизация и негладкий анализ. М.: Наука. 1988.
вие трансверсальности d) заменить традиционным.
Пример 2. Рассмотрим следующую задачу:
i е F(x) = {уе R1: \у\ < 1};
*(*i) G Сх = {у 6 Я1 : у < 0}, a(i2) € С2 = Л1;
s(t)>0 Vte I = [tht2}-,
J(x(-)) = x(ti) + x(t2) xnin.
Очевидно, ¡ко(t) = 0 - оптимальная траектория на /о = [0,1]. В данном
примере имеем: Н(Р(х),ф) = |т/>|, G = {г/ 6 ii1 : т/ > 0}. В силу
t
сопряженного включения с) |^>(i) +Jdrj\ = 0 п. в. на Jo- Следовательно,
= ф(0) = -7/(0) и г/ = 7,(0)50 + 4(1)6!. Рассмотрим условие трансверсальности d). Оно дает
(-77(0),-77(1))€A(1,1) + (£i,6),
где £ nc^g- Следовательно, & 6 Я1; 6 6 nc.,r,g и ^ < 0. В силу условия Ъ) имеем ?j(0) < 0 и т/(1) < 0. Следовательно, 77(0) = — А — £1 < 0, 77(1) = —Л - (2 0. Мы можем удовлетворить условие стационарности а) в концевых точках: ?7(0) = 0, 77(1) = 0, полагая
а = 1, ^ = е2 = -1.
Рассмотрим, теперь, стандартные условия трансверсальности:
1
(iH0W(l) - jdv) € Л0^(а;о(0),х0(1)) + ^Cl(®o(0)) х Nc2(xü(l)). о
Они дают
(-77(0), -77(1)) €A(l,l) + (£i,6),
где £1 6 Лге,(0). Отсюда получаем, £1 > 0; € NCl(0) и, следовательно, £2 = 0. Таким образом, мы можем удовлетворить условие
стационарности в концевых точках только полагая А = = £2 = 0. Но в этом случае Л = 0, ifi(t) = 0, г/ = 0, что противоречит условию нетривиалыюсти е).
Рассмотренный пример показывает, что, условие d) является "правильным" условием трансверсальности (заметим, что в достаточных условиях оптимальности для задач с фазовыми ограничениями, полученных В.И.Благодатских4, фигурирует условие трансверсальности аналогичное d)).
Нетрудно видеть, что условие Ь) на знак меры rj содержит включения
slippy С {t £ I : x(t) е ÖG}; 17(t) G NG{xQ{t)) Viel,,.
Здесь dG обозначает границу множества G.
Условие с) известно в теории необходимых условий оптимальности для дифференциальных включений, как усиленное включение Эйлера-Лагранжа. Для задач без фазовых ограничений впервые это включение (без условия стационарности гамильтониана) было получено Г.В.Смирновым5. Оно является наиболее сильной известной формой сопряженного включения в необходимых условий оптимальности для дифференциальных включений. Данное включение содержит гамиль-тоново включение Ф. Кларка
/ dq),
<1,0
включение Эйлера-Лагранжа
t
(4(t)Mt)+ / drj) ni' NSr,PhF(x0(t),xa(t)), ¿1,0
4см. Blagodatskikh V.l., Sufficient conditions for optimality in problems with state constraints, Appl. Math, and Optimization. 1981. V. 7. P. 149-157.
5см. Смирное Г.В., Дискретные аппроксимация и оптимальные решения дифференциальных включения, Кибернетика. 1991. Т. 10. С. 76-79.
а также, условие максимума
< t
(¿o(i),^(i)+/ dv) = Я№(<)),^(«)+/ л,).
<1,0 <1,0
Рассмотрим, теперь случай неавтономной задачи оптимального управления:
xeF{x,t),tEl = [tut& (6)
ре Р, р= (¿1,¿2,жг), = x(t\), х2 = a(i2); (7)
ac(t) € G Vi б I; (8)
J(p) min. (9)
Будем предполагать, что данные задачи (6)-(9) удовлетворяют тем же условиям, что и данные задачи (2)-(5), в частности, будем считать, что многозначное отображение F принимает выпуклые компактные значения из R71 и локально липшицево по совокупности переменных x,t\ P,G - непустые замкнутые подмножества из R2n+2 и Rn соответственно; J - локально лишлицевая функция; int Tq{x) ф 0 \/ж € G. Следующий результат непосредственно следует из Теоремы 1.
Теорема 2 Пусть xq -решение задачи (6) -(9), ро = (¿ю, ¿2,0 > ^1,0) ^г.о)» ®i,o = xo(ti,o)> х2,о — ®о(*2,оЬ /о = ¿2,0]- Тогда существуют такие число А > 0, абсолютно непрерывная функция ■ф и ограниченная регулярная борелевская секторная мера Т] на /о, что выполняются следующие условия: а) функция
t
h(t) = H{F{x0(t), t),if>(t) +J drf)
<1,0
- абсолютно непрерывна на Iq;
b) условие скачка:
t t ff(F(x„(t), *),№)+1 dr>) = E(F(x0{t),t),^{t) + Jd?j~7j{t)) Vi 6/0; ¿1,0 ¿1,0
c) мера 7f 71еположитпельпа на множестве непрерывных па Iq функций у со значениями е 7710 есшъ
¿2,0
J vit) dr) < о Vy е с (То) : y(t) G TG(x0(t)) Vt S I0;
il,о
d) усилетюе включение Эйлера-Лагранжа:
(^(t),-À(i)) ne'conv{(u,t;) : (u,v,i>(t)+f dr/) 6 iVgraphi.(x0(i),i, ¿q(£))}-
e) условие mp ait ce ер сальности:
4 •'(1,0
-lÎ(Î2,o) - /dr;) € Aâ/(po) + iVPG(p0); ¿1,0
f) условие нетривиальности;
Здесь PG = {|) e F : xj E G, x2 6 G).
В параграфе 3 доказан ряд вспомогательных результатов для гладких управляемых систем с негладкими концевыми ограничениями и негладким функционалом. Для получения этих результатов, в основном, используются методы негладкого анализа и развитый Б. Мор-духовичем метод метрических аппроксимаций.
Параграф 4 посвящен изложению основных конструкций метода гладких аппроксимаций для сведения диференциальных включений к случаю классических управляемых систем. Данный метод был впервые предложен автором диссертации в 1989 году [1] для простого получения гамильтоновых необходимых условий оптимальности Ф. Кларка в качестве следствия принципа максимума Понтрягина. Суть метода состоит в конструктивной аппроксимации дифференциального включения (1) последовательностью гладких управляемых систем вида х — Дж,£,и), и £ U, где векторная функция / и ее частная производная локально лилшицевы по совокупности переменных х, t, и, и дальнейшем предельном переходе в соотношениях принципа максимума Понтрягина для соответствующей задачи оптимального управления.
Рассмотрим дифференциальное включение
х е F(x, t), (10)
где многозначное отображение F принимает выпуклые компактные значения и локально лшшшцево по совокупности переменных x,t.
Определение 1 Будем гово-ритъ, что последовательность дифференциальных включений
xeFi(x,t);i= 1,2,... (11)
является гладкой аппроксимацией дифференциального включения (10) на открытом множестве Z С Rn+l, если
a) У(х, t) € Z множества Fi(x,t) - непустые выпуклые компакты;
b) V(x,i) € Z выполняются включения:
F{x,t) cFi+1(x,t) С Fi(x, t), i = 1,2,...;
c) последовательность {graph Fi] сходится к множеству graph F при г —» оо, то есть, Ve > 0 3N : Vi > N выполняется включение graphFj С graphF + eB2n+1;
d) Mi = 1,2,... опорная функция H{Fi(x, t), ф) бесконечно дифференцируема по х,ф при гр ф 0 и вместе со своими частными производными по х,ф до второго порядка включительно локально лип-шицева по х,Ь,ф на Z х Sn.
Гладкость опорной функции правой части дифференциального включения (И) по ф позволяет свести его изучение к случаю управляемой системы, описываемой обыкновенным дифференциальным уравнением вида:
х = fi(x, t,u), и € U,
где U - компакт в конечномерном евклидовом пространстве, а векторные функции /; и локально липишцевы по совокупности переменных х, и.
Для широкого класса полунепрерывных сверху дифференциальных включений гладкие аппроксимации существуют6, а в рассматриваемом случае дифференциального включения (10), зависящего от переменных х, t локально лшшшцевым образом, гладкая аппроксимация может быть построена в явном виде на любом открытом ограниченном множестве Z С Яп+1.
Действительно, пусть Z - открытое ограниченное подмножество Rn+1; L - константа Липшица многозначного отображения F(-, t) по х im Z + Bn+1 (в силу липшицевости F по совокупности переменных на Z 4- Вп+1 можно считать, что L не зависит от t); М - величина, ограничивающая модуль множеств F(x, t) на этом множестве. Тогда, можно определить последовательность дифференциальных я ключ е-
6Асеев С.М., Приближение полунепрерывных многозначных отображений непрерывными, Изв. АН СССР. Сер. матем. 1982. Т. 46. No 3. С. 460-476.
V « « 7
ний с опорной функцией правой части, заданной равенством
H{Ff{x,t),il>) = jR2nH(F{x + + U\\w)wi{z)ui(w)dzdw + ~\\Ф1
(12)
где ùJi - симметричная бесконечно дифференцируемая вероятностная плотность сконцентрированная на шаре ^Вп, к = 2(L + М)\ i — 1,2,....
В силу выбора константы к последовательность липшицевых на Z многозначных отображений {F¡}, г = 1,2,... с выпуклыми компактными значениями, определенными равенством (12), удовлетворяет условиям Ь) и с). Далее, при фиксированных t, г = 1,2,... функция H(Fi(-, t), •) бесконечно дифференцируема по х, ф, при ф ф 0, как свертка с гладкой функцией. Из формулы (12) и того факта, что при фиксированных t, i = 1,2,... производные любого порядка по х,ф функции H(Fi(x,t),ip) могут быть вычислены при помощи дифференцирования под знаком интеграла, непосредственно следует их локальная липшицевость по x,t, ф на Z х S".
Непосредственно проверяется, что для построенной указанным способом гладкой аппроксимации \/x,t,i — 1,2,... матрица вторых производных 9 (при ф ф 0) имеет ранг п — 1.
Заметим, что для любого г = 1,2,... в силу формулы (12) многозначное отображение F¿ удовлетворяет на Z условию Липшица с той же самой константой, что и F на Z + Bn+Í. Гладкость опорной функции H(Fi(x,t),ip) (по X, ф) и локальная липшицевость (по X) их производных (по х) позволяет использовать методы теории оптимального управления для получения соотношений принципа максимума Понтрягипа (сопряженной системы и условия максимума) в соответствующей задаче оптимального управления.
7Schneider Д., Smooth approximation of convex bodies, Rendiconti del Circ. Matem. di Palermo. Ser.
2. 1984. V. 33. F. 436-440.
Параграф 5 посвящен доказательству принципа максимума (теоремы 1) для задачи (2)-(5). Опишем основные этапы этого доказательства.
Пусть хо - решение задачи (2)-(5); 1о — [<1,о»^2,о]> Ро ~ (®1,о> ж2,о)-
Прежде всего строится вспомогательная экстремальная задача к которой будет применена описанная процедура сглаживания. Рассмотрение вспомогательной задачи вызвано необходимостью обеспечить сильную сходимость в ^[/о] производных оптимальных траекторий возмущенной задачи к производной траектории
Выберем такую последовательность векторных функций г, 6 С2 [/(,], г = 1,2,..что 2г =» Хо; г,- —> щ в ¡у1 (]()). При этом будем считать, что для любого г = 1,2,... производные ¿, продолжены вне отрезка /о константами по непрерывности. Рассматриваемые далее траектории дифференциальных включений также будем считать доопределенными константами по непрерывности вне отрезка их определения.
Определим многозначное отображение Ьг на Яп формулой:
Щх,1) = {(«,«) : иеГ(х), V = \\и - ¿{(Щ}; г = 1,2,.... (13)
Если Z - ограниченное подмножество из Л", Ь — константа Липшица для Р на 2 и М^ = тахгР1п\\ г{ (¿)||, то удовлетворяет условию Липшица по ж, ( на ^ х К1 с константой 2Ь + M¿ и для любого фиксированного г = 1,2,... многозначное отображение £](■, г) липшицево по х равномерно по Ь на Б с константой Липшица 2Ь. Кроме того, существует такое М > О, что V? — 1,2,... У(ж, € й1 имеем
Обозначим
Ф(-(ж,Ь) = сопуЩХ,¿); г = 1,2,.... (14)
Очевидно, что многозначное отображение Ф; обладает теми же свойствами липшицевости и ограниченности, что и Т^. Выберем после-
довательность ц +0 : у ¿Mi -> +0; i -> оо и рассмотрим последовательность вспомогательных задач оптимального управления, аппроксимирующих задачу (2)-(5):
£ = (i,y) е Ф{(«, t), tel = [il, i2]; (15)
P = (¿i, Ь,р,у(*1)ЖЬ)) = \tj - tjfi | < 1, j = 1,2;
||p-po||<l,peP,y(ii)=0>; (16)
®(t) e G, ||x - 350(011 < 1 V£ G I; (17)
Mp) = J{P) + l*i - ti,o|2 + - £2,a|2 + |b ~ Poil2 + ny(t2). (18)
Лемма 5 Для любого г = 1,2,... существует решение £i — (24, г/;) задачи (15)-(18). Далее, x^xq, yi=t0; ¿,- —> хо, yi —> 0 сильно в Ь1[1ц]; i оо.
При фиксированном г = 1,2,... построим гладкую аппроксимацию
à j = 1,2,... (19)
дифференциального включения (15) на некотором ограниченном открытом множестве Z С Rn+], содержащем единичную окрестность графика трактории t.q. В силу леммы 5 можно считать, что для любого i = 1,2,..., выполняется включение graphs^ С graphха + Bn+l. В силу (13), (14) можно считать, что многозначное отображение Фг липшицево по х равномерно по t на Z + Bn+l с некоторой константой Липшица не зависящей от номера г, и липшицево по x,t на этом множестве с константой L+Mi, где, как и выше, Mi — maxte/0|| (i)||. Кроме того, |Ф,-(х,£)| < M на Z + ВпН, где M > 0 - некоторая постоянная. Следовательно, гладкая аппроксимация (19) может быть определена формулой (12).
При фиксированном г = 1,2,... и .7 -»■ оо рассмотрим последовательность задач оптимального управления:
£ = (г,»)еФи(®,0> ¿еМг]; (20)
(21)
||«(0 - «о(*)|| <1 V* е 2; (22)
ь
/у(р,а) - ^(р) + ^ /р,"(а:(4)) сЙ -»■ шп. (23)
<1
Здесь последовательность Ф^; ^ = 1,2,... определена формулой (12), то есть
(24)
где 1/1 = (^,з/>п+1) € 2Г+1, - симметричные гладкие вероят-
ностные плотности, сконцентрированные на и , соответ-
ственно; к = 2(2/ +М). Функция здесь определена равенством (18), Рг(ж) = ¡пр(х + у)т(у) ¿у, Ра = {р € Р :х I е € С}, где множество Р определено равенством (16).
Лемма 6 Для любыхг,] = 1,2,... существует решение х^ = задачи (20)-(23). При фиксированном г = 1,2,..переходя, если нужно, к подпоследовательности, имеем: у^^у^; х^ —>■ х,, у^ —> у,- слабо в Ь1\1о\; з —» оо , где ж,- — (х,-,?/;) - некоторое решение задачи (15)—(18), определенное на /¿. Кроме того, 3—» 0; 3 —> оо при почти всех Ь £
Лемма 7 любого г = 1,2,... можно так выбрать номер ¿(г), что з(г) оо; у^М; 0; х^щ =* го, У;0-(2-) =1 0; ж^р) ¿0, У»,Л0 0
сильно в L1[Iq]; при г -> оо. Кроме того, при почти всех t € имеем ДО^мО^иС*)) 0; г оо.
Рассмотрим последовательность задач (20)-(23) при j = j(i) и г —> оо. В силу леммы 7 при достаточно больших номерах г неравенство в фазовом ограничении (22) вдоль оптимальной траектории Xij(i) выполняется со строгим знаком. Следовательно, при достаточно больших номерах г необходимые условия оптимальности первого порядка в задаче (20)-(23) совпадают с необходимыми условиями оптимальности в аналогичной задаче (20), (21), (24), но без фазового ограничения (22). При этом, в силу результатов § 4, последняя задача эквивалентна некоторой гладкой по х,и и липшицевой по x,t,u задаче оптимального управления.
(х,у) = fi(x,t,u), и € U, t el=[h,h]\ (25)
Р G Pg; (26)
h
Ji(p, x) = Ji{p) + j(i) J (x(t)) dt ->• min. (27)
h
Дальнейшее доказательство теоремы 1 состоит в анализе соотношений принципа максимума Понтрягина для траектории хг = (^¡,1/0 - решения задачи (25)-(27), при переходе к пределу при г —> оо. Этот анализ существенно использует описанный способ построения гладкой апрроксимации и предположение int tq(x) ф 0.
В параграфе 6 рассмотрены известные подходы к получению необходимых условий оптимальности для экстремальных задач для дифференциальных включений, и приведено обсуждение различных форм принципа максимума для таких задач.
Вторая глава диссертации посвящена изучению свойств множителей Лагранжа в доказанных в первой главе необходимых условиях
оптимальности для дифференциальных включений с фазовыми ограничениями. Следут отметить, что полученные в первой главе общие необходимые условия оптимальности, также как и в случае классической задачи оптимального управления с фазовыми ограничениями, содержат бесконечномерный объект сложной природы - ограниченную регулярную борелевскую меру, что приводит к необходимости изучения свойств этой меры и эффектов ею вызываемых.
В параграфе 7 обсуждается явление вырождения принципа максимума в задачах с фазовыми ограничениями. При этом, под вырождением необходимых условий оптимальности понимается ситуация, когда они не несут никакой содержательной информации, то есть им удовлетворяет произвольная допустимая траектория.
Большой вклад в исследование эффекта вырождения принципа максимума для различных задач оптимального управления с фазовыми ограничениями был сделан в работах А. В. Арутюнова8, А. Я. Ду-бовицкого и В. А. Дубовицкого9. Окончательные результаты в этом направлении были получены недавно в совместных работах автора диссертации и А. В. Арутюнова [4, 8, 12].
Поясним явление вырождения принципа максимума на примере следующей "простейшей" задачи оптимального управления:
x = f(x,t,u), и EU; (28)
*(*i) = (29)
9(x(t))<0 Vte[tht2}; (30)
J{u(-)) = kQ{x(t2)) min. (31)
8см.Арутюнов A.B., Условия экстремума. Анормальные и вырожденные задачи. М.: Факториал. 1997.
9см. Дубовицкий А.Я., Дубовицкий В.А.у Критерий существования содержательного принципа максимума в задаче оптимального управления с фазовыми ограничениями, Дифференциальные уравнения. 1995. Т. 31. No. 10. Р. 1611-1616.
Здесь х £ Rn] U С Rk] отрезок времени I = [tut2] предполагается фиксированным; хх - фиксированная начальная точка; правый конец x(t2) - свободен. Предполагается, что векторная функция / и скалярные функции д, ко - сколь угодно гладкие и ff (я) ф 0 для всех таких х, что д(х) = 0. Минимум в задаче (28) -(31) ищется в классе измеримых ограниченных функций и: и(t) £ U при почти всех t £ I.
Применим к данной задаче наиболее употребительный вариант принципа максимума, доказанный А. Я. Дубовицким и А. А. Милютиным.
Как обычно, определим функцию Гамильтона-Понтрягина Н и гамильтониан Н следующим образом:
Пусть ха, щ - оптимальная пара для задачи (28)-(31). Тогда принцип максимума Понтрягина для задач с фазовыми ограничениями в форме Дубовицкого-Милютина, утверждает, что существуют такие число А > 0, непрерывная слева функция ограниченной вариации г}> и неотрицательная ограниченная регулярная борелевская мера г/ на 1. что выполняются следующие условия:
T~L(x, t, и, ?/>) = (ip,f(x,t,u)}, H(x,t,i[>) — sup7{(a:,f,ii,?/>).
ueu
t
u(Mt),tMt)^(t)) =' ff(i0(i),t, (34)
supp77C{£: 5(xo(«)) = 0}; (35)
A + |M| + sup \\ip(t)\\^0. (36)
<i<(<i2
Предположим, теперь, что начальная точка asi принадлежит фазовой границе (30), то есть д{х\) = 0. Тогда принцип максимума (32)-(36) вырождается. Это означает, что его соотношения выполняются на таком наборе множителей Лагранжа А, ф, г), что А = 0 и 4>(t) — 0 Vi G (ti, ¿2). Действительно, можно положить А = 0; г/ = <5^ - мера Дирака сконцентрированная в точке £j; ip(t\) = —jfx(xi), ib(t) = 0 Vi £ (¿1,^2]- Очевидно, в этом случае любая допустимая траектория удовлетворяет сформулированному принципу максимума и он не содержит содержательной информации.
В общем случае, когда задача оптимального управления содержит функционал Больца, свободное время и полные концевые ограничения, принцип максимума может вырождаться если один из концов оптимальной траектории лежит на фазовой границе. При этом тривиальный набор множителей Лагранжа существует всегда, когда один из концов траектории зафиксирован на фазовой границе. Более того, может случиться, что только тривиальный набор множителей Лагранжа удовлетворяет принципу максимума10.
10см. Дубовицкий А.Я., Дубовицкий В.А,, Принцип максимума в регулярных задачах оптимального управления, у которых концы фазовой траектории лежат на фазовой границе, Автомат, и телемех. 1987. No. 12. С. 25-33.
Заметим, также, что сформулированный принцип максимума для задачи (32)—(36), в отличии от теорем 1 и 2, допускает разрывность гамильтониана в начальный момент времени
В следующем параграфе 8 исследуется явление вырождения полученных в первой главе необходимых условий оптимальности. Это исследование полностью основано на анализе соотношений принципа максимума и проводится, в целом, также, как и аналогичные исследования невырожденности других форм принципа максимума для задач с фазовыми ограничениями. Рассмотрим задачу (6)—(9). Будем считать, что данные задачи (6)-(9) удовлетворяют всем предположениям теоремы 2.
Следующее понятие управляемости дифференциального включения в концевых точках рассматриваемой траектории играет центральную роль в исследовании свойства невырожденности доказанного принципа максимума для дифференциального включения с фазовым ограничением.
Определение 2 Дифференциальное включение (6) называется управ ляемым в концевых точках точках ¿ = 1,2 траектории хц (относительно фазовых и концевых ограничений), если
Vд = (91,92) ф 0 : дх 6 ЛГсг(*1,о), 02 6 #<3(2:2,о), 9 & -#рв(р„)
выполняется условие
Я2(^(а;1,о,¿1,0)5-^1) + Я2№2,0,^0),92) > 0. (37)
Заметим, что аналогичное понятие управляемости (в качестве более сильного требования на управляемую систему) было впервые введено в рассмотрение А. Я. Дубовицким и В. А. Дубовицким11.
11см. Дубовицкий А.Я, Дубовицкий В.А., Необходимые условия сильного минимума в задачах оптимального управления с вырождением концевых и фазовых ограничений, УМН. 1985. Т. 40. Вып. 2. С. 175-176.
Условие управляемости (37) является весьма естественным. Действительно, его геометрический смысл состоит в том, что как в левом конце так и в правом концах траектории имеются ненулевые вектора скорости из F(a;li0,ii,o) и F{x2fi, ¿2,0), и направленные строго во внутрь и во вне фазового ограничения G, соответственно.
При естественных предположениях регулярности множества G, задающего фазовые ограничения, в концевых точках траектории x¡} условие (37), может быть заменено следующим эквивалентным в этом случае условием:
>о
V<7¿ ф 0 : g¡ £ Ng(xí,0)), 3д = (дид2) € -ÍVFg(po); i = 1,2.
Очевидно, что условие управляемости (37) является условием общего положения при фиксированных фазовом и концевых ограничениях. Это означает, что если существует хотя бы одна допустимая траектория Xq переводящая точку .Tío в точку 2:2,0, на отрезке времени [¿i.o, ¿2,о], т0 посредством малого возмущения F£(x,t) = F{x,t) + sBn, £ > 0 правой части системы можно удовлетворить условие (37) и, кроме того, это условие (если оно выполняется) устойчиво относительно любых достаточно малых возмущений правой части дифференциального включения (6).
Теорема 4 Пусть траектория xq удовлетворяет принципу максимума (теореме 2). Тогда для выполнения условия невырожденности принципа максимума
t
А + meas [í : 1p(t) + f dr¡ ф o| > 0. (38)
íl,0
необходимо и достаточно выполнения условия управляемости дифференциального включения (6) в концевых точках траектории xq.
Доказательство. Докажем необходимость условия (37) для выполнения условия невырожденности (38).
Предположим, что существует такой вектор д = {диЗг) Ф 0, что 91 € Мз(®1,о)> 92 е Ng(x2,о), д 6 -ÑFa(p0) и ff(F(xlfi,tli0), ~gi) = о, H{F(x2fl, Í2,o),№) = Тогда положим Л = 0, ф(£) = ~gi и 77 = pi5<li0 +
525Í20. Очевидно, выбранный набор множителей Лагранжа удовлетво-
t
ряет всем условиям теоремы 2 и А + meas \t : tp(t) + J dr¡ ф 0} = 0.
^1,0
Необходимость доказана.
Докажем, теперь, достаточность.
Предположим противное, то есть, что выполняется условие (37) и
t
А = 0 и 4¡>(t) + fdrj = 0 п.в. на Iq.
íl.o
Тогда в силу усиленного включения Эйлера-Лагранжа (условие d) теоремы 2) имеем:
i
llvKOÍl < + /dí7¡ на /0.
¿1,0
Здесь и далее К\,К2 обозначают положительные константы. Следовательно, ф{{) = ^(íi,o)) мера 7] - нулевая на (¿i,o5¿2,o) и h(t) = 0. Далее, в силу условия на знак меры с) имеем r?(íi,o) € Л'с(з:1о). Следовательно, 0(¿i,o) = — r/(¿i o). Откуда, в силу условия скачка Ь), получаем, что ff(F(xlto,ti,c),-tf(tlto)) — 0. Рассмотрим, теперь, правую концевую точку. Аналогично получаем, что 7/(12.0) Е о) и ,0) Í2,o),^(Í2,n)) = 0. Далее, в силу условия трансверсальности d) имеем: (—t?(íi,o)> ~T]{h,t)), Npg(po). Откуда,
в силу условия (37) получаем, что = 0, и
г/(í2) = 0. Получили противоречие с условием нетривиальности f) теоремы 2.
Следовательно, достаточность условия (37) для выполнения (38) доказана. Теорема доказана. □
Теорема 5 Пусть траектория ха удовлетворяет принципу максимума (теореме 1), дифференциальное включение (6) управляемо в концевых точках и
Н(Р(х0^),г),(-1Уд) > О Vд £ Мс(х^)) : д ф 0; (39)
V* € (£х,о,¿2,о), г = 1,2.
Тогда выполняется следующее условие поточечной нетривиальгнос-ти:
А + ||^(г) + ¡сЬ^фо V* е (¿1,о,о)- (40)
¿1,0
Доказательство данной теоремы основано на выполнении для сопряженной переменной и гамильтониана неравенств ||г/>|| < к.\\\ф(1) + г . ь
/ с?77|| и |/1(^)| < К2\[ф{^)-\- / £¿77(1, соответственно, неравенстве Беллмана-¿1,0 ¿1,0
Гронуолла и предположении т1 Тс(х) ф 0 £ С.
Параграф 9 посвящен выделению случаев, когда анализ соотношений принципа максимума позволяет гарантировать отсутствие у меры, фигурирующей в этих соотношениях, сингулярной составляющей.
Пусть ж о - траектория дифференциального включения (6) на отрезке времени Та — [¿ко,¿2,о] и (£', I") С /о- Будем предполагать, что правая часть дифференциального включения (6) вдоль рассматриваемой траектории на интервале времени (£', ¿") удовлетворяет следующим дополнительным предположениям:
(Н4) Производная _ локально липшицева по £ равно-
мерно по ф £ ¿У1,
(Н5) Вторая производная непрерывна по на (¿',4") х
£п и ранг этой матрицы вторых производных равен п — 1.
Заметим, что в силу результатов §4 любое локально липшицевое многозначное отображение £) с непустыми выпуклыми компактными значениями может быть с произвольной точностью е > 0 конструктивно аппроксимировано многозначным отображением Ре(х, ¿) со сколь угодно гладкой (по х,ф, при ф ф 0) опорной функцией, причем для ^ ранг матрицы вторых производных опорной функции по ф будет равен п — 1.
Теорема в Пусть хо - траектория дифференциального включения (6), удовлетворяющая соотношениям принципа максимума (теореме 2) с множителями Лагранжа А,ф,г] и /г(4) = Н(Р(ха(Ь),1),ф(Ь) + г
) ¿7]) ф 0. Предположим, что на интервале (£',£") выполняются <1,0
условия [И4), {НЪ) и, кроме того, производная ¿о(0 ~ абсолютно непрерывна. Тогда мера г) абсолютно непрерывна на интервале
В случае автономной задачи быстродействия для дифференциального включения с с гладким гамильтонианом и гладким фазовым ограничением, полученный результат позволяет полностью свести вопрос о наличии сингулярной составляющей к вопросу о структуре точек выхода оптимальной траектории на фазовую границу.
Рассмотрим следующую задачу быстродействия:
хЕР(Х); (41)
Р = («1,®») е Р, XI = ж(0), х2 = х(Т)- (42)
9Ш)<0 у*е/ = [о,Т]; (43)
7 = Т -ишп. (44)
Здесь предполагается, что данные задачи (41)-(44) удовлетворяют тем же условиям, что и данные задачи (6)-(7) и, кроме того, скалярная функция д - трижды непрерывно дифференцируема и ф О Чх : д{х) = 0.
Заметим, что с точки зрения задачи быстродействия, не ограничивая общности можно считать, что Уж выполняется условие 0 6 ^(ж), а в силу результатов главы 1, исходная задача (41)-(44) может быть с любой точностью аппроксимирована аналогичной задачей, у которой правая часть дифференциального включения (41) удовлетворяет данным предположениям.
Теорема 8 Пусть гамильтониан системы (41) трижды непрерывно дифференцируем по совокупности переменных х,ф при ф ф 0, ранг матрицы вторых производных гамильтониана по ф равен п — 1 и 0 € т<;Т(ж) Пусть - оптимальная траектория задачи (41)-(44) на отрезке времени /о = [0, То] у которой замыкание множества точек выхода на фазовую граниг^у не более чем счетно и Х,ф,г] - множители Лагранжа отвечающие х^ в силу принципа максимума (теоремы 2). Тогда сингулярная составляющая г]3 меры г] равна нулю.
Доказательство даного результата основано на предыдущей теореме 6 и том факте, что для систем с гладким гамильтонианом в задаче без фазовых ограничений оптимальная по быстродействию траектория также является гладкой.
В §10 дан краткий обзор необходимых условий оптимальности для задач с фазовыми ограничениями. Для случая классической гладкой управляемой системы с фазовым ограничением предложена новая формулировка принципа максимума, аналогичная теореме 1.
Основные результаты работы.
1. Разработан метод гладких аппроксимаций для сведения экстремальных задач для дифференциальных включений с фазовыми ограничениями к классическим задачам оптимального управления без ограничений.
2. Получены новые необходимые условия оптимальности для дифференциальных включений с фазовыми ограничениями, содержащие усиленное включение Эйлера-Лагранжа и дополнительное условие стационарности гамильтониана.
3. Исследован эффект вырождения полученных необходимых условий оптимальности. Получены необходимые и достаточные условия их невырожденности и достаточные условия поточечной нетривиальности.
4. Выделены случаи, когда мера, фигурирующая в полученных необходимых условиях оптимальности, не содержит сингулярной составляющей.
Результаты диссертации опубликованы в следующих
работах:
1. Aseev S.M., Smooth approximation of differential inclusions and timeoptimal problem, Report CRM-1610, Montreal (1989).
2. Асеев C.M., Гладкие аппроксимации дифференциальных включений и задача быстродействия, Труды МИАН. 1991. Т. 200. С. 27-34.
3. Арутюнов А.В., Асеев СМ., Благодатских В.И., Необходимые условия первого порядка в задаче оптимального управления дифференциальным включением с фазовыми ограничениями, Матем. сборник. 1993. Т. 184. No 6. С. 3-32.
4. Арутюнов А.В., Асеев С.М., Принцип максимума в задачах оптимального управления с фазовыми ограничениями. Невырожденность и устойчивость, Доклады РАН. 1994. Т.334. С. 134-137.
5. Асеев С.М., О задаче оптимального управления дифференциальным включением с фазовым ограничением, Современные методы теории функций и смежных проблем матем. и мех. Воронежская зимняя матем. школа 1995. Тезисы докладов. Воронеж. 1995. С. 19.
6. Асеев С.М., Метод гладких аппроксимаций и принцип максимума для дифференциальных включений, Методы оптимизации и их приложения. Тезисы докладов конференции. Иркутск. 1995. С. 155-156.
7. Асеев G.M., О необходимых условиях оптимальности для дифференциальных включений, Обратные и некорректно поставленные задачи. Тезисы докладов конференции. Москва. 1995. С. 5.
8. Arutyunov А. V., Aseev S.M., State constraints in optimal control. The degeneracy phenomenon, Systems & Control Letters. 1995, V. 26. P. 267273
9. Асеев C.M., Методы аппроксимаций в экстремальных задачах для дифференциальных включений. Современные методы в теории краевых задач "Понтрягинские чтения-YII". Тезисы докладов. Воронеж. 1996. С. 19.
10. Асеев С.М., О свойствах множителей Лагранжа в задачах оптимального управления с фазовыми ограничениями, Современные методы в теории краевых задач. "Понтрягинские чтения-YIII". Воронеж. 1997. С. 12.
11. Асеев С.М., Метод гладких аппроксимаций в теории необходимых условий оптимальности для дифференциальных включений, Известия РАН. Сер. матем. 1997. Т. 61. No. 2. С. 3-26.
12. Arutyunov А.V., Aseev S.M., Investigation of the dcgeneracy phenomer of the maximum principle for optimal control problems with state constrain SIAM J. on Control and Optimization. 1997, V. 35 P. 930-952.