Условия оптимальности и управляемости для вырожденных управляемых систем тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Павлова, Наталья Геннадьевна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2008
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
На правах рукописи
ПАВЛОВА НАТАЛЬЯ ГЕННАДЬЕВНА
УСЛОВИЯ ОПТИМАЛЬНОСТИ и УПРАВЛЯЕМОСТИ ДЛЯ ВЫРОЖДЕННЫХ УПРАВЛЯЕМЫХ СИСТЕМ
01 01 02 - дифференциальные уравнения
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
□ ОЗ 169953
Москва - 2008
003169953
Работа выполнена в Российском университете дружбы народов
Научный руководитель
доктор физико-математических наук, профессор Арутюнов Арам Владимирович
Официальные оппоненты
доктор физико-математических наук, профессор Васильев Федор Павлович
доктор физико-математических наук, профессор Никольский Михаил Сергеевич
Ведущая организация
Институт системного анализа РАН
Защита состоится ___ 2008 г в на, заседании
диссертационного совета Д 501 001 43 при Московском государственном университете имени M В Ломоносова по адресу 119899, ГСП, Москва, Воробьевы горы, МГУ, ВМиК, ауд 6S5
С диссертацией можно ознакомиться в библиотеке ВМиК МГУ
Автореферат разослан "___11_________ 2008 г
Ученый секретарь диссертационного совета, д ф -м н , профессор
Е В Захаров
Общая характеристика работы
Актуальность темы. В настоящее время математический аппарат теории оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями, разработан достаточно полно Фундаментальным результатом, полученным в этой области является принцип максимума Л С Понтрягина
Одним из важных разделов теории оптимального управления является исследование задач оптимального импульсного управления, где изучаются динамические процессы с разрывными траекториями и обобщенными управлениями импульсного типа - векторными мерами Это обусловлено в частности тем, что многие задачи оптимального управления, первоначально поставленные как классические, не имеют решения в традиционном классе абсолютно непрерывных траекторий и измеримых ограниченных управлений Если в классической задаче оптимального управления множество допустимых значений управления неограничено, то в общем случае задача может не иметь решения в классе обычных управлений
Первые прикладные задачи, имеющие подобные особенности, возникли в ракетодинамике Наиболее ярким примером является широко известная задача Лоудена о переводе космического корабля с одной орбиты на другую при минимальном расходе топлива
Наглядным примером импульсного воздействия в макроэкономике могут служить так называемые монетарные импульсы — резкие изменения денежной массы в обращении Они вызывают скачкообразное изменение ценовых уровней — важнейших показателей функционирования экономической системы При попытке описать динамику цен с учетом монетарных импульсов мы вновь сталкиваемся с необходимостью рассматривать разрывные траектории
Многочисленные примеры моделирования скачкообразных процессов возникают при решении технических задач. Например, реакция опоры при ударном столкновении с нею ног шагающего робота или лазерное излучение в квантовой электронике являются импульсными по своей природе Поэтому их моделирование также невозможно без введения обобщенных траекторий Траекторные компоненты минимизирующих последовательностей в таких задачах сводятся к разрывным функциям, а управляющие функции характеризуются наличием дельтообразных составляющих и сходятся в смысле распределений Поэтому возникает проблема расширения этого класса задач, направленная на включение предельных элементов в множество допустимых процессов. На этом пути и возникают задачи импульсного управления
В становление и развитие теории оптимального импульсного управления важнейший вклад внесли работы НН Красовского1, А Б Кур-жанского2, ЮС Осипова, ВФ Кротова, А Г Ченцова, А Брессана, Дж Варги, Р Винтера, В И Гурмана3, М И Гусева, В А Дыхты, ОН Самсонкж4, СТ Завалищина, АН Сесекина5, АД Иоффе, Г А Колокольниковой, Б М Миллера, Ю В Орлова, Ф Перейры, Ф Рампаццо, Р Ришела, Р Рокафеллара, В М Тихомирова и др Важнейшую роль при получении условий оптимальности и управляемости для вырожденных управляемых систем сыграли работы Е Р Авакова, А А Аграчева, А В Арутюнова, А А Милютина
Основным отличием этой диссертационной работы является получение условий оптимальности и управляемости без априорных предположений невырожденности (нормальности) исследуемых процессов
Цель работы Основными целями диссертационной работы являются
- изучение условий регулярности, 2-регулярности и 2- нормальности применительно к управляемым системам,
- получение необходимых и достаточных условий 2-регулярности и достаточных условий 2-нормальности для управляемых систем,
- исследование локальной управляемости динамических систем при наличии импульсных управлений,
- получение необходимых условий оптимальности второго порядка для управляемых систем с импульсными управлениями, содержательных и в анормальном случае
Методика исследований. Поставленные в диссертации вопросы решаются с применением методов функционального анализа, теории функций вещественной переменной, дифференциальных уравнений, теории экстремальных задач и теории возмущений
хКрасовский Н Н Теория управления движением Линейные системы - М Наука, 1968 -475 с
2Куржанский А Б Управление и наблюдение в условиях неопределенности - М Наука, 1977 - 392 с
3Гурман В И Вырожденные задачи оптимального управления -М Наука, 1977 -304 с
4Дыхта В А , Самсонюк О Н Оптимальное импульсное управление с приложениями -М Физматлит, 2000 -255 с
53авалищин С Т, Сесекин А Н Импульсные процессы Модели и приложения -М Наука, 1991 -256 с
Научная новизна. Все полученные результаты являются новыми Среди них можно выделить следующие наиболее важные
1 Исследованы условия регулярности, 2-регулярности и 2- нормальности применительно к управляемым системам, в том числе системам с импульсными управлениями Получены необходимые, а также достаточные условия 2-регулярности и достаточные условия 2-нормальности этих систем
2 Исследована локальная управляемость динамических систем с импульсными управлениями Показано, что 2-регулярный по некоторому направлению процесс локально управляем Получены достаточные условия локальной управляемости 2-нормальных процессов
3 Исследована близость необходимых и достаточных условий экстремума для 2-нормальных процессов с импульсными управлениями
4 Для управляемых динамических систем с импульсными управлениями получены необходимые условия оптимальности первого и второго порядка, содержательные и без априорных предположений нормальности
Теоретическая и практическая значимость. Диссертация имеет теоретический характер Полученные результаты применяются при исследовании управляемых систем Диссертационная работа может представлять интерес для специалистов в области оптимального и импульсного оптимального управления Результаты диссертации могут составить содержание специального курса для студентов физико-математических факультетов
Достоверность и обоснованность полученных в диссертационной работе результатов вытекает из проведенной проверки полученных решений, а также из совпадения ряда полученных результатов в частных случаях с известными в литературе
Аппробация работы. Основные результаты диссертации докладывались и обсуждались на
- Воронежских весенних математических школах "Понтрягинские чтения - XVI, XX"(Воронеж, 2005, 2008),
- ХЫ1, ХЫУ Всероссийских конференциях по проблемам математики, информатики, физики и химии (Москва, РУДН, 2006, 2008),
- семинаре кафедры нелинейных динамических систем факультета ВМиК МГУ (рук академик РАН, проф С К Коровин, 2008 ),
- семинаре кафедры оптимального управления факультета ВМиК МГУ (рук д ф.-м н , проф. Ф П Васильев, д ф -м н., проф А В Дмит рук, 2008 ),
- семинаре кафедры общих проблем управления механико-математического факультета МГУ (рук д ф -м н , проф М И Зеликин, 2008 ),
- семинаре кафедры нелинейного анализа и оптимизации Российского университета дружбы народов (рук. д ф.-м н , проф А В Арутюнов, к ф -м н , доц В Н Розова, 2004 - 2008 )
Публикации. Основные результаты диссертации изложены в работах [1-6] Из совместной работы [1] в диссертацию включены только те результаты, которые получены лично автором
Структура и объем диссертации. Диссертация объемом 139 страниц состоит из четырех глав, каждая из которых разделена на параграфы, и библиографического списка Нумерация теорем, предложений, лемм, определений, замечаний, а также ссылок на формулы сквозная в пределах каждой главы
Во введении обосновывается актуальность темы диссертационного исследования, сформулирована цель работы, описана структура и дан краткий обзор работы, изложены основные научные результаты, выносимые на защиту, раскрыта научная новизна и практическая значимость полученных результатов
В первой главе диссертации рассматривается управляемая динамическая система, содержащая импульсные управления
Здесь £ е [¿ь ¿2] — время, < заданы, х — фазовая переменная, принимающая значения в п-мерном арифметическом пространстве Е", и = (и1,и2,.. ,ит) е Ет - управление, / — п-мерная, б —п х к-мерная, а IV — го-мерная вектор-функции (п, т, ги -- натуральные числа) Функция У! предполагается дважды непрерывно дифференцируемой, а функция С — непрерывной п-мерная вектор-функция / удовлетворяет следующим предположениям при почти всех фиксированных I
Краткое содержание работы
йх{г) = + г е [Мг],
х{гх) = хх,х(12) = Х2, \¥(хих2) = о, ц е к
(1) (2) (3)
f(x,u,t) — дважды непрерывно дифференцируемая по (х,и) функция, для любых фиксированных (х, и) функции f(x,u,t), df(x, и, t)/d(x, и), d2f(x,u,t)/d(x,u)2 измеримы по t и на любом ограниченном множестве ограничены и непрерывны по (я, и) равномерно по t
К = j/i е С* ([ib t2], R*) V непрерывной функции <р <p(t) е К* V i,
J <p(t)dfi > О V борелевского множества В С [¿1,^2] j >
где К С Rk — заданный острый выпуклый замкнутый конус, К* — его сопряженный Другими словами, ц — ¿-мерная мера Бореля, такая, что д(В) С К для любого борелевского множества В
В качестве класса допустимых управлений рассматривается множество пар (и, ц) ц € К, и 6 L™ [ii, ¿2]
Тройка (x(t),u(t), ¡x(t)), t € [ii,¿2], называется допустимым процессом, если (и{), /х()) — допустимое управление, ai()~ соответствующее ему решение уравнения (1), те.
t
x{t) = x{h) + jf(x(T),u(T),T)dT+ I G(t)Mt) Vie (ii.ta], (4)
ti [ti,t]
которое удовлетворяет концевым ограничениям (2), (3) В силу регулярности меры fi функция х(-) непрерывна слева
В главе 1 исследованы условия 2-регулярности и 2-нормальности применительно к управляемой системе (1)- (3), а также для соответсвующей ей классической управляемой системы Кроме того, получены необходимые и достаточные условия 2-регулярности и достаточные условия 2-нормальности
Глава 2 посвящена исследованию локальной управляемости динамических систем
Рассматривается управляемая динамическая система
х = f{x,u,t), t € [ii,i2], (5)
x(ti) = хг (6)
Функция / удовлетворяет тем же предположениям, что и выше В качестве класса допустимых управлений рассматривается множество измеримых существенно ограниченных функций и € Ь^ь^г]
Пара вектор-функций (а;(£), € [^,¿2], называется допустимым
процессом, если и() — допустимое управление, а х() — соответствующее ему решение уравнения (5), удовлетворяющее начальному условию (б)
Фиксируем точку (¿ьй(-)) е К" х ¿^[¿ъ такую, что (£,«) — допустимый процесс, и ¿(¿х) = Х\
Для заданного £() е ¿^,[¿1,^2] через ) обозначим решение системы уравнений в вариациях
= ^(х (4), «(*), <)51®£ + !£(*(*), иф, *)£(*) с начальным условием
- о
Для заданных £(•)>??(•) 6 ¿^[¿1, ¿2] через ) обозначим решение системы уравнений в вариациях
л я /• Я2 1
Я2 ^ 92 /
с начальным условием
= 0
Положим Т(х1,й( )) = {/»€ ^(«а) = 0, е ¿2]
= (¿2)}
Определение 2.1. Пусть Н £ Т(х1,й(-)) Для задачи (5), (6) в точке (х1,й()) выполнено условие 2-регулярности по направлению /г, если
81X^2) + 62X^2) = у, (¿г) =0
Обозначим через Р оператор ортогонального проектирования Е" на ортогональное дополнение подпространства {у б К" £ Ь™^!,^]
У =
Показано, что 2-регулярный по некоторому направлению процесс является локально управляемым, а именно, доказана
Теорема 2.1. Если для задачи (5), (6) в точке (¿ьй(-)) выполнено условие 2-регулярности по некоторому направлению /г, то процесс
(£( ),«(•)) является локально управляемым из точки х\ 6 К" в точку £(¡2), те существуют константы «1, к2 такие, что
Мх \г - х{Ь)\ < Зщ е х{Ь) = г,
\\и2-й \\Ьп,< /са(\х{12) -г\ + |Р(£(*2) - г)\1'2), где х{) — решение задачи Коши
Получено достаточное условие, гарантирующее локальную управляемость 2-нормального процесса
Проведено исследование локальной управляемости систем с импульсными управлениями
Рассматривается управляемая динамическая система
= + [Ма], (7)
х{к) — XI, /л б К (8)
Функции / и б удовлетворяют тем же предположениям, что и выше В качестве класса допустимых управлений рассматривается множество пар (и, ¡1) иб1™р1,<2], Ц £ К
Тройка Ь е [¿1,<2]> называется допустимым процес-
сом, если (и(), )) — допустимое управление, а х(-) — соответствующее ему решение уравнения (7), те имеет место (4), которое удовлетворяет начальному условию из (8)
Фиксируем точку (¿1,й(-), А()) 6 М" х 2] х такую, что
(х, й,р) — допустимый процесс, и = Х\ Для
заданных £(•) £ ¿^[^¡¿г], V € 1*к(/г) через ) обозначим
решение системы уравнений в вариациях
«Фх^ХО = Ь)б1 + «(*), + С(4)<й/(*)
с начальным условием
$1x^1) = О
Для заданных £( ),г)() £ »,0 & ТК(А) через 62х(П1/в() обо-
значим решение системы уравнений в вариациях
д/ З2/
<Э2 Г <92 Г
а^и4 ч л 1 л л л ' дяди
с начальным условием
= О
Положим С = {у € Е" 3£ £ 6 ТК(А) + Ьш{Д}
¿2Х{^2) = у}
Положим Т(хий{),£()) = {(/г, € ££[Ма] * (Тк(Д) + Ьт{/»}) йх^Ъ) = О, Э(Е,|) е 1&[М2] х (ВД) + 1лп{£}) -¿2хы,еЕ(^) =
Определение 2.5. Пусть {Ь,д) е Т(х1,й( ),£()). Для задачи (7), (8) в точке (¿1, й(), Д()) выполнено условие 2-регулярности относительно К по направлению (Л, д), если
Vу € К" 36,6 е 2&[Ма]. 3^,1/2 е Тк(£) + Ьш{£}
¿1^11/1(^2) + ¿гЯ/ф^^г) - У, 61x^^2) = О
Теорема 2.6. Пусть для задачи (7), (8) в точке {х\,й( ),Д()) выполнено условие 2-регулярности относительно К по некоторому направлению (Л, д) Тогда процесс (£], й(-), £(•)) является локально управляемым из точки £1 € К" в точку £(¿2), то есть для произвольного I € пС существуют константы «4 > 0, > 0, > 0 такие, что
V* \г - х{Ь)\ < кг Зщ € Ц&иЬ], ^ € К(Тк(£) + 1лп{£})
х(£2) = г,
II и2 - й + || Мг - /х Цс. < к2 (|®(<2) - + - г, Скз)1/2)), где х() — решение задачи Коши
dx{t) = f{x{t),uz{t),t)dt + G(t)dцг(t): Х(Ь) =
/9— расстояние от точки до множества и Скз = сопе(ВКз(1)) П ЬгпС
В третьей главе диссертации исследована близость между необходимыми и достаточными условиями экстремума для 2-нормальных задач оптимального импульсного управления
Рассматривается задача оптимального импульсного управления, заключающаяся в минимизации функционала
«2
J = J{xuu,|J,) = W0{x1,X2) + Jfo(x(t),u{t),t)dt+ I g0(t)dц(t) —► тпгп
«1 [<1 м]
на множестве допустимых процессов, описываемых дифференциальной связью и концевыми ограничениями (1)-(3)
Здесь д° —/¡-мерная вектор-функция, \¥о и /° — скалярные функции Функция И^о предполагается дважды непрерывно дифференцируемой, функция — дважды дифференцируемой по а; и и для п в Ь в [¿ъ £2], а функция да — непрерывной
Определим на множествах I" х К"1 х Е1 х Е" х Е1 и К" х Е" х гамильтониан и малый лагранжиан по формулам
Н(х, и, ф, А0) = (/(I, и,*),ф) - А°/°(х, и,*),
1(хих2, А) = А°Жо(®1, ®2) + (А1, И^, х2)) , А = (А0, А1)
Здесь А0 € К1, А1 € Кш, а ф — гс-мерный вектор-столбец Пусть (£, й, Д)— заданный допустимый процесс
Определение 3.1. Процесс (ж, й, Д) удовлетворяет уравнению Эйлера-Лагранжа, если существует такой вектор А ф 0, что А0 > 0 и для вектор-функции ф, являющейся решением задачи Коши
ф = -дН{х({),й{Ь),Ь,ф{1))/дх, ф(Ь 1) = д1[х 1,х2,У)/дхи имеет место
дН{х(г),й(Ь)Х4>(*). А°)/9и = 0 для п в ^ [^1, = ~д1(хих2,\)/дх2,
(Ф(г), 0(1)ь) - х° (9°(г),у) < о V« е к, ы е [¿ьг2],
<^(«),Сг(«)0(0)-Ао<го(4).в(*)> = 0 дляД-пв
Здесь г>(£) = ад(^) — производная Радона-Никодима, |Д| — полная вариация Д, X! = ¿(¿1), Х2 = х{г2)
Обозначим через А(х, й, Д) множество всех векторов А, которые отвечают заданной экстремали (х, й, Д) в силу уравнений Эйлера-Лагранжа Если конус Л не содержит элементов вида (О,А1) (те элементов с А0 = 0), то задача называется нормальной В противном случае задачу называют анормальной и для нее необходимые условия первого порядка выполняются тривиально
Для формулировки условий второго порядка для процесса {х,й,р) введем в рассмотрение систему уравнений в вариациях
Здесь 5и 6 5/л € Тк(Д), а решение уравнения в вариациях
должно удовлетворять условию
дУУ дШ
¿2)^1) = 0, —(хих2)6хЦ2) = 0 (11)
Пусть Л € Л(£,й,/¿). На пространстве V — И.71 х 1,£2] пар (С,<5и) определим квадратичную форму Пд формулой
д21
/Я2 ту
й, г,ф) 1(5х(1),5и(1)), (дх(£), 5и{Щ <Й
и
Здесь и далее 8х — соответствующее (5и, 5ц) решение системы уравнений в вариациях (10) с начальным условием = С
Через X обозначим линейное подпространство X — Я" х £^[£1, ¿2] х С*, состоящее из всех тех ((,6и,6ц), что решение системы (10) 5х удовлетворяет граничным условиям (11) Для произвольного целого неотрицательного числа г через Лг = Аг(х,й,р) обозначим множество тех Л б Л(х,й, Д), для которых индекс сужения формы ПЛ на подпространство X не превышает г
Пусть Ф — фундаментальная матрица системы уравнений в вариациях (10), те Ф является решением однородной системы
= ф(«1 ) = /,
где /—единичная матрица Обозначим через (I размерность ядра блочной матрицы (2^2), где
д\¥ ь и
«Л
Теорема 3.1. Пусть допустимый процесс (£, является слабым локальным минимумом в задаче (1)-(3), (9) Тогда Аа ф 0 и для (С, 5и, 5ц) 6 X, таких, что
3/° ., .. , Л /. . . др.
I
Sx(t), -¿¿гШ, u(t), i) ) + ( 6u(t), -^(x(t),u(t), t)
dt+
+ J (g\t)M) + z2), (fofa), <ВД)Т) < 0,
Iti.ta]
имеет место
max ПаМ«)>0 (12)
AeAj,|A|=l
Пусть экстремаль (x,«, /i) анормальна (т e. d > 0) Тогда если conv Аа содержит ненулевое подпространство, то условие (12) выполняется автоматически, так как максимум зависящей от переменной Л линейной функции по множеству, содержащему одновременно два вектора А и (—А), неотрицателен Таким образом, если конус conv Ad не является острым, то условие (12) содержательной информации не несет Приведенная ниже теорема показывает, что в 2-нормальном случае это не так Оказывается, что в этом случае "зазор" между необходимыми условиями из теоремы 3 1 и достаточными условиями локального минимума в некотором смысле неулучшаем
Определение 3.2. Допустимый процесс (x,u,{i) называется конечномерным минимумом, если для любого содержащего точку й конечномерного подпространства Ri С Ь^ь^] и любого содержащего точку /2 конечномерного подпространства Д2 С С* процесс (x,u,jj,) является локальным минимумом в задаче (1)-(3), (9) с дополнительным ограничением и(-) 6 Ri, ) £ Кг
Предположим, что концевые ограничения регулярны, т е
Теорема 3.2. Предположим, что допустимый процесс (х,й,(1) является 2-нормальным для задачи (1)-(3), (9) и для него выполняются необходимые условия второго порядка из теоремы 3 1
Предположим также, что матрица df(x(t),u(t),t)/du имеет ранг m при почти всех t и существует непрерывная n-мерная функция £ такая, что £(i)G(i) еОи £(i)ff(z(i),u(i),i) = 0 для пв i е [tut2] Тогда существуют такие вектор v € R№ и вектор-функция (ilt) е L^Jij, ¿21, что для любого е > 0 тройка (х, й, Д) доставляет строгий конечномерный минимум в следующей возмущенной задаче
Wo[xi,X2) + e\{xi,x2) - (ii,i2)|2+
+
I {f°(x(t),u(t),t)+e\x(t)-x(t)\2)dt+ J g°(t)dfi{t)
—тт.
ti
[ti><j]
dx{t) = f(x(t),u(t),t)dt + ep{t)\x(t) - x{t)\2dt + G{t)dp(t), t 6 [tu h], W(xux2)+ev\(x1,x2) - {xux2)\2 = О, /i £ I
В четвертой главе получены необходимые условия оптимальности второго порядка для задачи (1)-(3), (9), основанные на модифицированной функции Лагранжа (функции Лагранжа - Авакова). Обозначим через Ь\ = Ь\ СО} Xу Ц/у йц, ф) функцию
Li = ty,x-f{x,u,t)-G{t)dii{t)), Li RxRnxKnxRmxR'!xR'1 R, а через L2 — L2(t, x, x, u, dpi, p, ф, A0, Six^p, g) функцию
L2 = A0 (f°(x, u, t) + g°(t)dfi(t)) + (p,x- f(x, и, t) - G(t)dfx(t)) -
■ К х Е" х К" х I"1 х I* х К" х К" х 1 х 8° х Кт -4 1
Для заданных Ь, е К", д{-) е р £ ГК(Д) через 5ххндр{) обо-
значим решение системы уравнений в вариациях
d{6i$p){t) = + ^-(m^(t),t)g{t)dt + G(t)dp(t)
Теорема 4.2. Для того, чтобы процесс (£(), й(-), £()) доставлял локальный минимум в задаче (1)-(3), (9), необходимо, чтобы для любой тройки {к,д( ),р()) € Т(х!,&(•),£()) нашлись такие вектор I € вектор-функция р() [¿ь ¿2] -4 Е" и не равные одновременно нулю число Ао, вектор й € Rí:l и вектор-функция ) 1, ¿г] -^ RГ^ что выполнены следующие соотношения
- (Ф, fx(x, и, + fu(x, и, t)g) ,
с начальным условием
SixUh) = h
(13)
Llx\£{tj) = (-iy+1~\xux2)s,j = l,2,
(14)
(15)
L1«I(i(t),fi(t)) = о для п в i e [ti,i2],
2) +
-О,
(4(0,й(О) - \
где
^(ад.ад) = О ДЛЯ П В * 6 ¿2],
Т(хии( ),£()) = | (М(-М )) е К" X 2£[Ма] х ТК(Д)
2 ЭТУ
^ = °> ^ Удовлетворяющая (13) - (16),
1=1
д2Ш
ь -1
д21< ди
= 1уеС (Ма];»*) / </>(*)№ - > о е К >
В заключении формулируются основные выводы диссертационной работы
Автор выражает глубокую благодарность научному руководителю профессору Араму Владимировичу Арутюнову за постоянное внимание к работе и всестороннюю поддержку
Публикации автора по теме диссертации
1. Арутюнов А.В , Павлова Н.Г. О топологических свойствах множества достижимости линейных систем Дифференциальные уравнения, 2004, том 40, N 11, с 1564-1566
2 Павлова Н.Г. Множество достижимости линейных систем Современные методы теории краевых задач Материалы весенней математической школы "Понтрягинские чтения -XVI" Воронеж В ГУ, 2005, с 120-121
3 Павлова H Г Условие 2-регулярности для управляемых систем XLII Всероссийская конференция по проблемам математики, информатики, физики и химии Москва РУДН, 2006, с.71
4 Павлова H Г Необходимые и достаточные условия экстремума для задач оптимального импульсного управления Вестник ВГУ, Серия Физика Математика, 2007, N 1, с 105-111
5 Pavlova N 2-regularity and 2-normality conditions for systems with impulsive controls Yugoslav Journal of Opérations Research, 2007, Volume 17, No 2, 149-164
6 Павлова H Г Условие 2-регулярности для систем с импульсными управлениями XLIV Всероссийская конференция по проблемам математики, информатики, физики и химии Москва РУДН, 2008, с 18
Напечатано с готового оригинал-макета
Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от 01.12 99 г Подписано к печати 13 05 2008 г Формат 60x90 1/16 Услпечл 1,0 Тираж 110 экз Заказ 244 Тел 939-3890 Тел/Факс 939-3891 119992, ГСП-2, Москва, Ленинские горы, МГУ им МВ Ломоносова, 2-й учебный корпус, 627 к
Введение
1 Условия 2-регулярности и 2-нормальности
1.1 Условия 2-регулярности и 2-нормальности.
1.2 Условия 2-регулярности и 2-нормальности для систем с импульсными управлениями.
1.2.1 Постановка задачи.
1.2.2 Условие 2-регулярности.
1.2.3 Условие 2-нормалыюсти
2 Управляемость
2.1 Локальная управляемость нелинейных систем.
2.1.1 Постановка задачи.
2.1.2 2-регулярность и управляемость.
2.1.3 2-нормальность и управляемость
2.2 Локальная управляемость линейных систем.
2.3 Локальная управляемость систем с импульсными управлениями
3 Необходимые и достаточные условия экстремума для 2-нормальных процессов
3.1 Необходимые условия экстремума.
3.2 Близость необходимых и достаточных условий экстремума для 2-нормальных процессов.
4 Условия оптимальности второго порядка
4.1 Необходимые условия экстремума для нелинейных систем
4.1.1 Постановка задачи.
4.1.2 Решение соответствующей абстрактной задачи
4.1.3 Необходимое условие локального минимума.
4.2 Необходимые условия экстремума для задач с импульсными управлениями
4.2.1 Постановка задачи.
4.2.2 Решение соответствующей абстрактной задачи
4.2.3 Необходимое условие локального минимума.
В настоящее время математический аппарат теории оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями, разработан достаточно полно. Фундаментальным результатом, полученным в этой области является принцип максимума JI.C. Понтрягина.
Одним из важных разделов теории оптимального управления является исследование задач оптимального импульсного управления, где изучаются динамические процессы с разрывными траекториями и обобщенными управлениями импульсного типа - векторными мерами. Это обусловлено в частности тем, что многие задачи оптимального управления, первоначально поставленные как классические, не имеют решения в традиционном классе абсолютно непрерывных траекторий и измеримых ограниченных управлений. Если в классической задаче оптимального управления множество допустимых значений управления неограни-чено, то в общем случае нельзя ожидать, что эта задача имеет решение в классе обычных управлений с разрывными траекториями.
Первые прикладные задачи, имеющие подобные особенности, возникли в ракетодинамике. Наиболее ярким примером является широко известная задача Лоудена о переводе космического корабля с одной орбиты на другую при минимальном расходе топлива. Следующий пример (см. [21]) в упрощенной форме моделирует особенности этой задачи.
Пример В.1. Требуется минимизировать критерий качества
Здесь и интерпретируется как скорость сжигания топлива, за счет которого создается сила тяги, а х - положение движущейся материальной точки. Задача состоит в переводе системы из точки ж(0) = 0 в точку :/;(Т) = 1 с минимумом расхода топлива. Заметим, что существуют ракетные двигатели, способные расходовать топливо с очень высокой скоростью, развивая громадную тягу в течение коротких отрезков времени. Поэтому допущение о неограниченности управления сверху достаточно реалистично.
В. 1) о при ограничениях u(t) > О, х = х + и, ж(0) = 0, ж(1) = 1.
В. 2)
Покажем, что в этой задаче обычное оптимальное управление не существует.
Для этого преобразуем критерий (В.1), используя дифференциальное уравнение и концевые условия из (В.2):
1 1 J (и) = j (£(t) - x{t))dt = 1 - J x(t)dt. о 0
Ясно, что задача минимизации J{u) равносильна максимизации критерия
Ми) = и) = j x(t)dt. о
Таким образом, дело сводится к поиску допустимой траектории, график которой ограничивает максимальную площадь над осью t.
Рассмотрим траекторию x(t), которая исходит из конечной точки (Т;х(Т)) = (1; 1) с управлением й = 0. Тогда x(t) = et1, ж(0) = е~х, так что x(t) не является допустимой траекторией. Однако, пара (х,й) задает границы возможного: для нее расход топлива "идеален— J(u) = 0, а ограничиваемая траекторией х площадь Ji(u) — 1 — е-1, как нетрудно увидеть, является верхней оценкой J\. J-[(u) < ./] (и) для любого допустимого управления u(t).
Убедимся, что к этой оценке можно приблизиться сколь угодно близко. Для этого построим следующую последовательность допустимых управлений и траекторий. ) I о, te[i/n,i], (Л - I nte^r, te[0,l/n), te[l/n,l).
Нетрудно подсчитать, что при п —> оо
J(un) = l(2-^je1^L (В. 3)
Jiun = 1 - J(un) 1 - е-1 = Ji(tt).
Отсюда следует, что оптимального управления не существует: мы не можем получить значение критерия J\ = 1 — е-1, так как оно достигается только на недопустимой траектории х, и в то же время это число является точной верхней гранью Ji(it) в силу (В.З).
Минимизирующая для J {и) последовательность обычных управлений {«„} неограничена по амплитуде вблизи точки t = 0, но интегралы от ип сходятся (см. В.З). Интуиция подсказывает, что ип — это некоторая аппроксимация импульсного воздействия в момент t = 0. В то же время последовательность траекторий {а;п} поточечно сходится к разрывной функции для которой критерий ,1\ в точности равен 1-е-1. Поскольку функция ж» "хорошо"аппроксимируется допустимыми траекториями, то ее естественно назвать обобщенной оптимальной траекторией в дайной задаче. Соответствующее импульсное управление представляет собой функцию е-1<5(0). Предельная картина (при п оо) оказывается такой: в начальный момент t = 0 мгновенно сжигается 1/е единиц топлива и управляемая материальная точка скачком перебрасывается на "магистраль":*;^) = et1, по которой движется в пассивном режиме до конечной точки.
Наглядным примером импульсного воздействия в макроэкономике могут служить так называемые монетарные импульсы — резкие изменения денежной массы в обращении. Они вызывают скачкообразное изменение ценовых уровней — важнейших показателей функционирования экономической системы. При попытке описать динамику цен с учетом монетарных импульсов мы вновь сталкиваемся с необходимостью рассматривать разрывные траектории (см. [60], [58]).
Многочисленные примеры моделирования скачкообразных процессов возникают при решении технических задач (см. [26, 35, 62]). Например, реакция опоры при ударном столкновении с нею ног шагающего робота или лазерное излучение в квантовой электронике являются импульсными по своей природе. Поэтому их моделирование также невозможно без введения обобщенных траекторий.
Траекторные компоненты минимизирующих последовательностей в таких нерегулярных, вырожденных задачах сводятся к разрывным функциям, а управляющие функции характеризуются наличием дельтообразных составляющих и сходятся в смысле распределений. Поэтому возникает проблема расширения этого класса задач, направленная на включение предельных элементов в множество допустимых процессов. На этом пути и возникают задачи импульсного управления.
В становление и развитие теории оптимального импульсного управления важнейший вклад внесли работы [20, 22-24, 26-34, 48, 51]. Вопросам оптимизации динамических систем, описываемых дифференциальными уравнениями с управляющими функциями импульсного типа, посвящено большое число исследований, в том числе работы [14, 27-29, 45]. Нелинейные управляемые системы являются важной и актуальной темой исследования. Ими описываются реальные процессы, многие прикладные задачи (в области экономики и техники). Несмотря на то, что исследования в этой области ведутся давно, до сих пор остаются малоизученными многие аспекты.
Для получения достаточных условий локальной управляемости динамической системы, а также при выводе необходимых условий первого и второго порядка для задачи оптимального управления, заключающейся в минимизации некоторого функционала на множестве допустимых процессов управляемой системы, большую роль играют понятия регулярности, 2-регулярности и 2-нормальности в рассматриваемой точке. Поясним суть этих определений для абстрактного отображения Ф, действующего из заданного банахова пространства Z в K.fc.
Пусть z — заданная точка из Z, и отображение Ф дважды непрерывно дифференцируемо в окрестности z.
Определение В.1. Отображение Ф называется регулярным (нормальным) в точке z, если ппФ'(г) = Rh, (В Л) где im— образ линейного оператора.
Известно, что если отображение Ф регулярно в точке z, то для него справедлива теорема об обратной функции. Кроме того, для задачи минимизации ip(z) ->• mm, Ф(г) = О, (В.5) где ip — заданная гладкая функция, справедлив принцип Лагранжа (при А0 = 1), а также необходимые условия второго порядка. Если же точка z является анормальной, то есть ппФ'^) Ф Жк, то утверждение классической теоремы о неявной функции, как известно, может не выполняться. Аналогично, в задаче минимизации (В.5) принцип Лагранжа является неинформативным, то есть выполняется при До = 0 (независимо от минимизируемой функции ср), а классические необходимые условия второго порядка могут не выполняться.
Таким образом возникает проблема нахождения условий, более тонких, чем условие (В.4), но которые бы гарантировали локальную разрешимость уравнения Ф(г) = у для всех 2, близких к точке у = Ф(£), а также наличие содержательных необходимых условий первого и второго порядка в задаче (В.5). Эти условия известны и называются условиями
2-регулярности (они были получены в [1]) и 2-нормальности ([б]). Приведем эти условия.
Положим
T(z) = {heZ: <b'(z)h = О, Ф "(z)[h, h] € 1шФ'(г)} .
Возьмем h G T(z). Определим линейный оператор G(z, h) : ZxKei^'(z) —> Rk по формуле
Определение В.2. Отображение Ф называется 2-регулярным в точке z по направлению h, если imG(z,h) =Шк. (В.6)
Как известно ([1]), существование вектора h 6 вдоль которого отображение Ф 2-регулярно в точке z, гарантирует разрешимость уравнения Ф(г) = у для всех у, достаточно близких к у = Ф(2). Кроме того, в задаче (В.5) для любого такого h справедливы некоторые необходимые условия первого и второго порядка, содержательные и в анормальном случае (то есть когда 1тФ'(,г) ф М.к).
Обозначим через конус, состоящий из таких А € Шк, А ф 0, что
Ф'(£)*А = 0 и в Z существует линейное подпространство П = П(А):
П С КегФ'(г), codimn < к; ^ <А,Ф(5)> [г,г]>0У2еП.
Сразу же отметим, что конус F2(z) может оказаться пустым. Он, например, заведомо пуст, ести отображение Ф нормально в точке В, т.к. из (В.4) вытекает, что Ф'(£)*А ф О V А ф 0. Кроме того, после присоединения к этому конусу нуля он становится замкнутым, но вовсе не обязан стать выпуклым.
Определение В.З. [8] Отображение Ф называется 2-нормальным в точке z, если конус convF2(z) является острым, т.е. не содержит ненулевых подпространств (случай F'j(5) = 0 не исключается, т.к. пустой конус острый по определению).
В настоящей работе условия 2-регулярности и 2-нормальности расшифровываются применительно к управляемым системам.
Перейдем к изложению результатов работы. Диссертация состоит из четырех глав, каждая из которых разделена на параграфы. Нумерация теорем, предложений, лемм, определений, замечаний, а также ссылок на формулы сквозная в пределах каждой главы.
В первой главе диссертации рассматривается управляемая динамическая система dx(t) = f(x{t),u{t),t)dt + G{L)dfi{t), t G [ti,t2], (В.7) x{t{) = хъ х(t2) = х2, (В.8)
W(xux2) = 0, fi G К. (В.9)
Здесь t G [<1,^2] — время, ti < t2 заданы, х — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве Мп, и = (щ, и2, ■ • •, ит) eRm - управление, / — н-мерная, G —п х ^-мерная, а W — ги-мерная вектор-функции (n, т, w — натуральные числа). Функция W предполагается дважды непрерывно дифференцируемой, а функция / — кусочно-гладкой, т.е. отрезок [ii, £г] представим в виде конечного числа отрезков [Ti,Tj+i] так, что сужение / на М" х Rm х [тг-,7*+1] бесконечно дифференцируемо.
Положим
К = \ !1 G С* ([^,i2];Rfc) : V непрер. (р : (p{t) G К* V t, L ip(t)dn > О V борел. В С [tut2] где К С. Шк — заданный острый выпуклый замкнутый конус, К* — его сопряженный. Другими словами, ц — А>мерная мера Бореля, такая, что fJ-(B) С К для любого борелевского множества В.
В качестве класса допустимых управлений рассматривается множество пар (и, fj.) : /i G К, и G L™[ti, t2].
Тройка (x(t),u(t),/j,(t)), t G [ii,i2]i называется допустимым процессом, если (w(-), /х(-)) — допустимое управление, а ж(-) — соответствующее ему решение уравнения (В.7), удовлетворяющее концевым ограничениям (В.8), (В.9): t x{t) = x{t1) + J f(x(r),u(r),T)dT+ J G(t)h(t) vte[tut2]. tl [h,t]
В работе расшифрованы условия 2-регулярности и 2-нормальности для управляемой системы (В.7)- (В.9), а также для соответсвующей ей классической управляемой системы. Кроме того, получены необходимые и достаточные условия 2-рсгулярности и достаточные условия 2-нормальности.
Для решения поставленной задачи система (В.7)-(В.9) была представлена в абстрактном виде. Была фиксирована точка й(-), /!(■)) Е Mn хК, такая, что (х, й, р,) — допустимый процесс, и x(ti) = х\.
Для произвольных (xi,u(-), ц(-)) 6 Kn х L™[ti,t2] х К, достаточно близких к (xi,u(-), /!(■)), в силу теорем о существовании и непрерывной зависимости решения задачи Копти от начальных условий и правой части существует единственное решение х(-) задачи Коши dx(t) = f(x(t),u{t),t)dt + G(t)dn(t),x(tx) = xu te[tut2], (В.10)
Для указанных {х\, и(-), ц(-)) было определено отображение Ф : Rn х L™[tu t2] хСМР по формуле
Здесь x(t; х\, w(-), д(-)), t Е [ti,t2] — решение задачи Коши (В.10).
Для расшифровки понятия 2-регулярности и 2-нормальности применительно к системе (В.7)-(В.9), были получены формулы для вычисления производных отображения Ф по (и(-),/л(-)).
Глава 2 посвящена исследованию локальной управляемости динамических систем.
Рассматривается управляемая динамическая система
Здесь t Е [ti,t2] — время, ti < t2 заданы, х — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве К™, и = (щ, «2, •. -, um) GMm — управление (n, то — натуральные числа). n-мерная вектор-функция / удовлетворяет следующим предположениям: при почти всех фиксированных t f(x,u,t) — дважды непрерывно дифференцируемая по (х, и) функция; для любых фиксированных (х, и) функции f(x,u,t), df{x,u,t)/d{x,u), d2f(x,u,t)/d(x,u)2 измеримы по t и на любом ограниченном множестве ограничены и непрерывны по (х, и) равномерно по t.
В качестве класса допустимых управлений рассматривается множество измеримых существенно ограниченных функций и G L™[ti,t2], Рассматривается допустимое управление й(-) и предполагается, что соответствующее ему решение задачи (В.11), (В.12) существует на [ti,t2]. Согласно теореме единственности, это решение, которое обозначаем через
Ф(хь«(•),/*(•)) - W{xux(t2-хи и(-), //(■))). х = f{x,u,t), t G [ti,t2], Xi.
B. 11) (Б.12) x(t), t G [ii, t2], единственно и в силу теоремы существования для каждого допустимого управления и(-), близкого к й(-) в метрике пространства L™[£i,£2], решение задачи (В.11), (В.12) существует.
Пара вектор-функций (x(t),u(t)),t G \ti,t2], называется допустимым процессом, если и(-) — допустимое управление, а х{-) — соответствующее ему решение уравнения (В. 11), удовлетворяющее начальному условию (В.12).
Фиксируем точку (£i,u(-)) gR"x L™[ti,i2], такую, что (х,й) — допустимый процесс, и x(ti) — х\.
Для заданного £(•) G L™[ti,i2] через обозначим решение системы уравнений в вариациях ^(x(t),Ht),t)5lX^ + ^(x(t),u(t),t)at) (В. 13) с начальным условием
S&zih) = 0. (5.14)
Для заданных £,(•),г](-) 6 L™[ti,t2] через 52х^(-) обозначим решение системы уравнений в вариациях d df d2f
-(<W/)W = x(t), u{t), t)S2x^(t)dt+^{x{t),u(t)tt)[Six^t), 5^)}+ d2f d2f
5.15) d2f с начальным условием О- (B-1Q)
Положим Т(хг,й(-)) = {he L™[tlft2] : SlXh(t 2) = 0, 3g G : faxhhfo) = hxg{t2)}.
Определение B.4. Пусть h G Т(хг, «(■)). Процесс (£(•), й(-)) 2-регулярен (для задачи (В.11), (В.12) в точке (£1, й(-)) выполнено условие 2-регулярности) по направлению h, если
VyG Е" 36, £2GL™M2]:
8гх^ (t2) + S2xhb (t2) = у, 6ixb(t2) = 0.
Обозначим через Pi и Р2 операторы ортогонального проектирования R" на подпространство {у G М" : G L™[ti,t2] : у = Six^fe)} и его ортогональное дополнение соответственно.
Показано, что 2-регулярный по некоторому направлению процесс является локально управляемым.
Теорема 2.1. Если для задачи (В.11), (В.12) в точке (жьй(-)) выполнено условие 2-регулярности по некоторому направлению h, то процесс (.£(•),&(•)) является локально управляемым из точки х\ € К" в точке x(t2), т.е. существуют константы Ki, к2 такие, что
Vz : \z — x(t2) | < кг 3uz e L™[tut2] : x(t2) = z, где x(-) — решение задачи Коши x = f{x, uz(t), t), t e [ti,t2], = x(ti), II uz-u \\ьш< K2(\x(t2) -z\ + \Р2{х(Ь) - z)\1'2).
Для допустимого процесса (x, й) обозначим через 3~(х, й) = 3" множество тех у G R", у ф 0, для которых существует абсолютно непрерывная вектор-функция ф = фу{-), являющаяся решением задачи Коши ф= ~dH(x(t),u(t),t,ip(t))/dx, = 0, такая, что ip(t2) = -у, dH(x(t)^(t),t,^(t))/du = 0 для п.вЛ € [tut2].
Предположим, что 5F ф 0. Для у 6 CF определим на пространстве квадратичную форму формулой h
В Н й, t, ф) £), 0] dt. h
Через ^2>п(ж, й) = 3~2iU обозначим множество тех у € 3", для которых индекс формы Qy не превышает п.
Определение В.5. Процесс (£(•), й(-)) 2-нормален (для задачи (В. 11), (В.12) в точке (xi,u(')) выполнено условие 2-нормальности), если конус сопуЗ^пО^м) является острым.
Получено условие, при котором локально управляем 2-нормальный процесс.
Теорема 2.2. Пусть процесс (ж, й) 2-нормален. Тогда процесс (х,й) локально управляем в точке x(t2), т.е. существуют константы к\. к2 такие, что
Vz : \z- x{t2)| < ку 3uz в L™[tut2] : x(t2) = z, где ж(-) — решение задачи Коши
X = f{x,uz(t),t), t е [ti,t2],,x(tl) = x(ti),
II uz - й ||is< K^P^xih) - z)| + |P2(x(t2) - z)\1'2), тогда и только тогда, когда существует такое £ G L™ [Zi, t2]1 что 0 Vy g Э-2,п(х,й).
Проведено исследование локальной управляемости систем с импульсными управлениями.
Рассматривается управляемая динамическая система сix(t) = f(x(t),u(t),t)dt + G(t)dfM(t), t G [ti,t2], {В. 17) x(ti) =xu ц G K. (5.18)
Здесь t G [h,t2] ~~ время, t\ < t2 заданы, x — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве R", и = (щ,и2,., ит) GKm - управление, / — n-мерная, G— пх к- мерная, а W — ги-мерная вектор-функции (к, п, m,w — натуральные числа). Функция W предполагается дважды непрерывно дифференцируемой, функция f — дважды дифференцируемой по ж и и для п.в. t G [^1,^2], а функция G — непрерывной.
К = G С* ([ti,t2];Kfc) : V непрер. tp : <p(t) 6 К* V t, J (p(t)dfj, > О V борел. В С [t\, i2] j , где К С - заданный острый выпуклый замкнутый конус.
В качестве класса допустимых управлений рассматривается множество пар (ы,/л) : ц G К, и е
Тройка {x(t), u(t), fJ-{t)), t G [t\,t2], называется допустимым процессом, если (?/(•),//(•)) — допустимое управление, а х(-) — соответствующее ему решение уравнения (В.17), удовлетворяющее условию (В.18): t x(t)=x{t1) + J f{x{r),u{r),T)dT+ J G{r)d,i{r) V t € [ti,t2\. ti [tut]
Фиксируем точку (xu й(-), Д(-)) G Шп x L™[ti,t2] x К., такую, что (ж,w, fx) — допустимый процесс, и x(ti) = х\.
Для заданных £(■) £ L™[ti,t2], и Е ТК(Д) через обозначим решение системы уравнений в вариациях d{5iX(:j){t) = ~{x{t),u{t),t)81x^{t)dt + ^{x{t),u{t),t)£{t)d1. + G{t)dv{t) с начальным условием
5\Xtv(ti) = 0.
Для заданных £(•),??(•) £ L™[tut2], и, в £ Тк(р) через 62х^в(-) обозначим решение системы уравнений в вариациях df d2f <92 f d2f с начальным условием 0.
Положим С = {у е Rn : 3£ € £ Тк(£) + Lin{£} : у}.
Обозначим через Р2 линейный непрерывный оператор, проектирующий Кп на какое-нибудь подпространство, дополняющее LinC.
Положим Т{хи й(-),А(0) = ((М) е L™[lut2] х (TK(/i) + Lin{/i}) : 5ixhg(t2) = 0, 3(h, g) <= b™[tx,t2] x (ТК(Д) + Lin{£}) : -J2xhhgg(t2) =
Определение В.6. Пусть (h,g) £ T(xi, u(-), £(■)). Для задачи (В.17), (В.18) в точке (хх, й(-), £(•)) выполнено условие 2-регулярности относительно К по направлению (h,g), если
VyelT' 3 31/х, глг е ТГк(А) Ч- Lin{A> :
Six^Ul(t2) + 52xhbgU2(t2) = у, 5ixb„2(t2) = 0.
Теорема 2.6. Пусть для задачи (В.17), (В.18) в точке (жх,й(-),£(•)) выполнено условие 2-регулярности относительно К по некоторому направлению (h,g). Тогда процесс й(-), £(■)) является локально управляемым из точки Xi £ R" в точке x(t2), т.е. для произвольного / £ riC существуют константы к2, такие, что z : |z - < К! 3u2 е L™[tbt2], G К(Тк(£) + Lin{£}) : где яг(-) — решение задачи Коши dx{t) = f{x(t), uz(t),t)dt + G{t)dpz(t), x{ti) = i(ti),
II (uz,pz) - («,£) IU-xC*< (|s(i2) ~ z\+ p{x(t2) - z,CK3)1/2)) .
Здесь p— расстояние от точки до множества и СКз = cone(BKS(l))r\LinC.
Получено условие, при котором локально управляем 2-нормальный процесс.
В третьей главе диссертации получены необходимые и достаточные условия экстремума для 2-нормальных задач оптимального импульсного управления.
Рассмотривается задача оптимального импульсного управления ti
J = J(xuu,p) =W0(x1,x2) + J f°(x(t),u(t),t)dt+ J g°(t)dp(t) —>■ min, h [ЧМ
В.Щ dx(t) = f(x(t),u{t),t)dt + G{t)dfi(t), t G [h,t2], {B.20) x{ti) = x1,x{t2)=x2, {B. 21)
W(xux2) = 0, peK. (B.22)
Определение В.7. Допустимый процесс (х, й, р) называется конечномерным минимумом, если для любого содержащего точку й конечномерного подпространства R С L™[ti,t2] процесс (х,й,р) является локальным минимумом в задаче (В.19)-(В.22) с дополнительным ограничением и(-) G R.
Определим на множествах Г х Р х I1 х Г х I1 и K2n х R1+w гамильтониан и малый лагранжиан по формулам
Н(х, и, t, ф, А0) = {f(x, и, t),iP)~ X°f(x, и, t), l(xих2, А) = ХЖЫ,х2) + (A1, W{xux2)) , А = (А0, А1).
Здесь A0 G К1, A1 G а ф — тг-мерный вектор-столбец. Пусть (х, й, р)— заданный допустимый процесс.
Определение В.8. Процесс (х, й, р) удовлетворяет уравнению Эйлера-Лагранжа, если существует такой вектор А ^ 0, что А0 > 0 и для вектор-функции -0, являющейся решением задачи Коши ф = -дН(х{г),й(г),г,ф$))/дх, ф(Ь) = dl(xux2, \)/дхх, (В.23) имеет место dH{x{t),u(t),t,ijj(t),X0)/du = 0 для п.в. t G ф(12) = -д1{хих2,\)/дх2, (Б.24) rf>{t),G{t)v) - a0 (g°(t),v) < 0 VveK,Vte [tuh], ij>(t),G(t)v(t)) - А° (g°{t),v(t)) = 0 для р, - п.в. t в [tut2].
Здесь v(t) = — производная Радона-Никодима, |/2| — полная вариация Д, xi = x(ti), х2 = x(t2).
Обозначим через А(.т, й, Д) множество всех векторов Л, которые отвечают заданной экстремали (х, й, fi) в силу уравнений Эйлера-Лагранжа.
Если конус А не содержит элемент вида (О, А1) (т.е. элемент с А0 = 0), то задача называется нормальной. В противном случае задачу называют анормальной и для нее необходимые условия первого порядка выполняются тривиально.
Для формулировки условий второго порядка для процесса (x,u,jl) введем в рассмотрение систему уравнений в вариациях d(5x) = ?f(x{t),u{t),t)Sxdt+ ^f{x(t),u(t),t)Su{t)dt + G{t)d{6Li){t). а/ с/ сь
Б.25)
Здесь 5и G L™[ti,t2], Sfi G Тк(Д), а решение уравнения в вариациях должно удовлетворять условию dW dW {хи x2)6x(t!) = 0, — {хг, x2)5x{t2) = 0. (В.26)
ОХ 1 ох2
Пусть A G А(ж, й, Д). На пространстве V = Rn х L™[£bt2] пар ((,5и) определим квадратичную форму Г2д формулой д21 а 2 гт й, i, [(Sx(t), Su(i)), (Sx(t), Su(t))] dt. h
Здесь и далее 5x — соответствующее (5u, 8(л) решение системы уравнений в вариациях (В.25) с начальным условием 5x{t\) — С
Через X обозначим линейное подпространство X = Rn х L™[ibi2] х С*, состоящее из всех тех (С, 5и, 5/х), что решение системы (В.25) 5х удовлетворяет граничным условиям (В.26). Для произвольного целого неотрицательного числа г через Аг = А.г(х,й,р) обозначим множество тех
Л £ Л (:r, u, /),), для которых индекс сужения формы Г2А на подпространство X не превышает г.
Пусть Ф — фундаментальная матрица системы уравнений в вариациях (В.25), т.е. Ф является решением однородной системы где I—единичная матрица. Обозначим через d размерность ядра блочной матрицы (ZfZ2), где dW dW ti ti
X<$>(t2) — {XUX2).
Теорема 3.1.(см. [58]). Пусть допустимый процесс (x,u,fi) является конечномерным минимумом в задаче (В.19)-(В.22). Тогда Л^ ф 0 и для ((, 8и, 8ji) G X, таких, что
J ^6x(ty?£(x(t),u(t),t)\ + /su(t),?£(£(t),u(t),t) dt+ i J (g°(t),6fl) + (хъ sa), (5x(t,), fa(*2))T) < 0, tl,<2] имеет место max ftA(C,<b)>0. IB.27)
Пусть экстремаль (ж, й, Д) анормальна (т.е. d> 0). Тогда если conv A(i — выпуклая оболочка конуса Ad — содержит ненулевое подпространство, то условие (В.27) выполняется автоматически, так как максимум зависящей от переменной Л линейной функции по множеству, содержащему одновременно два вектора Л и (—А), неотрицателен. Таким образом, если конус conv Л^ не является острым, то условие (В.27) содержательной информации не несет. Приведенная ниже теорема показывает, что в 2-нормальном случае это не так. Оказывается, что в этом случае "за-зор"между необходимыми условиями из теоремы 3.1 и достаточными условиями локального минимума в некотором смысле неулучшаем: t2
J (f°(x(t),u(L),'t) + e\x(t)-x(t)\2)dt + J g°(t)dfj,(t) —»■ min,
Предположим, что концевые ограничения регулярны, т.е. rank w.
Теорема 3.2. Предположим, что допустимый процесс (ж, й, р) является 2-нормальным для задачи (В.19)-(В.22) и для него выполняются необходимые условия второго порядка из теоремы 3.1.
Предположим также, что матрица df(x(t),u(t),t)/du имеет ранг ш при почти всех t и существует непрерывная ?г-мерная функция £ такая, что £(t)G(t) = 0 и t(t)%L(x(t),u(t),t) = 0 для n.B.t е [£i, -Тогда существуют такие вектор v Е Mw и вектор-функция f3(t) Е что для любого £ > 0 тройка (ж, й, fi) доставляет строгий конечномерный минимум в следующей возмущенной задаче:
W0{xux2) +е|(жь.г-2) - (жьж2)|2+ t2 ti [tiM dx(t) = f(x(t),u(i),t)dt + ep(t)\x{t) - x{t)\2dt + G(t)d/i(t), £ E [ti,t2], W(xl,x2) +ev\(xux2) - (&i,x2)\2 = 0, p EK.
В четвертой главе получены необходимые условия оптимальности второго порядка для задачи (В.19)-(В.22) , основанные на модифицированной функции Лагранжа.
Обозначим через L\ = Li(t,x,x,u,dfJ.,ip) функцию
Lx = {ф,х- /(ж, и, t) - G{t)dfi{t)), Lj : КхГхГхГх^хГ-il, а через L2 = L2(t, х, х, и, d(i,p, гр, А0, 5iXgp, д) функцию
L2 = До (f(x, и, £) + g°(t)dfi(t)) + (р,х- f(x, и, t) - G(t)dp(t))
- (Ф, fx(x, и, t)Sixhgp + fu(x, и, t)g) , ^:1хГхГхГх1'хГхГх1хГхГ4К.
Для заданных h Е R", g(-) E L™[£b£2], p E Тк(р) через 5\Xhgp(-) обозначим решение системы уравнений в вариациях d(6ix*p)(t) = ^(x(t),u(t),t)5lxf;p(t)dt + ^(x(t),u(t),t)g{t)dt + G(t)dp(t) с начальным условием
61х*м = h.
Теорема 4.3. Для того, чтобы процесс (£(•),£(•),/}(•)) доставлял локальный минимум в задаче (В.19)-(В.22), необходимо, чтобы для любой тройки (h, </(•), р(-)) G T(xi, й(-), //(•)) нашлись такие вектор I G М'", вектор-функция р(-) : [ii, t2] —> R™ и не равные одновременно нулю число Ао, вектор s G Шк1 и вектор-функция ф(-) : [ti,t2] ~* что выполнены следующие соотношения: где
1) { + Llx
О, x(t),u(t))
LiiU(u) = )*, 3 = 1,2, li«l(£(t),«(0) = о для п.в.г g [tut2],
2) {— -^L2± + L2x dW, g k®(£); 0, x(t),u(t)) aw (-l^fAo-^OcbXa) + — (жьж2)/ + dxj
L.
2«l(x(0,fi(0) 0 для n.B.t g [ti, t2]
JM»kx(t)Mt),P)
0,
5.28)
5.29)
5.30)
5.31) dW
T(.*b £(•),£(•)) = \ (h,g(-),p(-)) G RnxL™[t1}t2] : ^ z^^) =
2=1
Vs : Бф(-), удовл. (5.28) - (5.31), i,j=1 1 2
Я2 f d2 f d2f -^(x(t),u(t),t)[g(t),g(t)] ) dt = 0
КФ(£) = <peC([ti,f2];Rfc) : f ip(t)(dp, — d^)(t) > 0 V/л g ik i. L J[tiM J
1. Арутюнов А.В. Теорема о неявной функции и анормальные точки. Доклады Академии наук. Т. 368, е 5, с. 586-589. (1999)
2. Арутюнов А.В., Павлова Н.Г. О топологических свойствах множества достижимости линейных систем. Дифференциальные уравнения, 2004, том 40, N. 11, с.1564-1566.
3. А.В. Арутюнов, В.Н. Розова. Регулярные нули квадратичного отображения и локальная управляемость нелинейных систем. Дифференциальные уравнения. 1999 - Т. 35, N 6. - С.723-728
4. Арутюнов А.В., Ячимович В. 2-нормальные процессы управляемых динамических систем. Дифференциальные уравнения. 2002. Т. 38. N 8. С. 1017-1029.
5. Васильев Ф.П. Методы оптимизации. М., 2002
6. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977. - 624 с.
7. Гурман В.И. Вырожденные задачи оптимального управления. М.: Наука, 1977. - 304с.
8. Гурман В.И. Об оптимальных процессах особого управления // Автоматика и телемеханика. 1965. -Т.26, N5. -С.782-791.
9. Гурман В.И. Принцип расширения в задачах оптимального управления. М.: Наука, 1985. - 288с.
10. Гурман В.И., Дыхта В.А. Вырожденные задачи оптимального управления и метод кратных максимумов // Автоматика и телемеханика. -1977.- N3. С.53-59.
11. Гурман В.И., Дыхта В.А. Достаточные условия сильного минимума для вырожденных задач оптимального управления // Дифференциальные уравнения. -1976 Т.12, N12. - С.1229-1239.
12. Гурман В.И., Дыхта В.А., Колокольникова Г.А. Нелокальные преобразования вырожденных задач оптимального управления и импульсные режимы. Деп. в ВИНИТИ 15.06.90, N3455 - В90. - 75с.
13. Гурман В.И., Дыхта В.А., Колокольникова Г.А. и др. Принцип расширения в задачах оптимального управления // Изв. АН СССР. Техн. кибернетика. -1983 N2. - С.200-213.
14. Гурман В.И., Колокольникова Г.А. Условия оптимальности импульсных режимов. Деп. в ВИНИТИ 14.10.84, N6259-84 - 58с.
15. Дыхта В.А. Вариационный принцип максимума для импульсных и особых режимов в задаче оптимизации, линейной по управлению // Изв. вузов. Математика. 1991. - N11. - С.89-91.
16. Дыхта В.А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных процессов. Иркутск: Изд-во ИГЭА, 1995. - 186с.
17. Дыхта В.А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных и особых процессов // Сиб. матем. ж. 1994. - Т.35 - N1. - С.70-82.
18. Дыхта В.А. Импульсное оптимальное управление в моделях экономики и квантовой электроники // Автоматика и телемеханика -1999. N11. - С.100-113.
19. Дыхта В.А. Импульсно-траекторное расширение задач оптимального управления // Развитие и применение метода функций Ляпунова. -Новосибирск: Наука. Сиб. отд-ие, 1992. С.170-182.
20. Дыхта В.А. Качественное исследование моделей экономики // Тр. Вост.-Сибирской зональной межвуз. конф. по математике и проблемам ее преподавания в вузе. Иркутск, Изд-во Иркут. гос. пед. ун-та, 1999 - С.125-132.
21. Дыхта В.А. Необходимые условия оптимальности импульсных процессов при ограничениях на образ управляющей меры // Изв. вузов: Математика. 1996. - N12. - С.1-9.
22. Дыхта В.А. Принцип максимума для оптимальных импульсных процессов при ограничениях на образ управляющей меры // Оптимизация, управление, интелект. Журн. Всерос. ассоц. матем. программирования и АНН. - 1995. - N1. - С. 100-109.
23. Дыхта В.А. Принцип расширения в качественной теории управления // Методы решения задач теории управления на основе принципа расширения / В.А. Батерин, В.А. Дыхта, А.И. Москаленко и др. Новосибирск: Наука. СО, 1990. - Гл.1. - С.5-48.
24. Дыхта В.А. Условия локального минимума для особых режимов в системах с линейным управлением // Автоматика и телемеханика. 1981. - N12. - С.5-10.
25. Дыхта В.А., Колокольникова Г.А. Условия минимума на множестве последовательностей в вырожденной вариационной задаче // Математические заметки. 1983. - N5. - С.735-744.
26. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. М.: Физматлит, 2000. - 255 с.
27. Дыхта В.А., Самсонюк О.Н. Принцип максимума для импульсных процессов при ограничениях на образ и полную вариацию управляющей меры // Краевые задачи: Сб. науч. тр. Иркутск: Изд-во Иркут. ун-та - 1997. - С.122-138.
28. Завалищин С.Т. Специальные нелинейные уравнения в обобщенных функциях // Дифференц. уравнения. 1990. - Т.26, N8. -С.1316-1323.
29. Завалищин С.Т., Ревенко В.В., Сесекин А.Н. Нелинейные дифференциальные уравнения в обобщенных функциях: Препринт. УрО АН СССР. Свердловск, 1989. -67с.
30. Завалищин С.Т., Сесекин А.Н. Импульсные процессы: Модели и приложения. М.: Наука, 1991. - 256 с.
31. Завалищин С.Т., Сесекин А.Н., Дрозденко С.Е. Динамические системы с импульсной структурой. Свердловск: СреднеУральское изд-во, 1983. - 112с.
32. Колокольникова Г.А. Вариационный принцип максимума для разрывных траекторий неограниченных, асимптотически линейных управляемых систем // Дифференц. уравнения. 1997. - Т.ЗЗ, N12.- С.1631-1638.
33. Колокольникова Г.А. Импульсные режимы в нелинейных управляемых динамических системах и условия их оптимальности: Дис. . канд. физ.-матем. наук. Иркутск, 1985. - 157с.
34. Колокольникова Г.А. Исследование обобщенных решений задач оптимального управления с линейными неограниченными управлениями на основе кратных преобразований // Дифференц. уравнения.- 1992. Т.28, N11. - С.1919-1932.
35. Красовский Н.Н. Теория управления движением. Линейные системы. М.: Наука, 1968. - 475 с.
36. Красовский Н.Н. Управление динамической системой. Задача о минимуме гарантированного результата. М.: Наука, 1985. - 516 с.
37. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973. - 446 с.
38. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. - 392 с.
39. Ли Э.Б., Маркус Л. Основы теории оптимального управления. -М.: Наука, 1972. 574 с.
40. Павлова Н.Г. Множество достижимости линейных систем. Современные методы теории краевых задач: Материалы весенней математической школы "Понтрягинские чтения -XVI". Воронеж: ВГУ, 2005, с.120-121.
41. Павлова Н.Г. Условие 2-регулярности для управляемых систем. XLII Всероссийская конференция по проблемам математики, информатики, физики и химии. Москва: РУДН, 2006, с.71.
42. Павлова Н.Г. Необходимые и достаточные условия экстремума для задач оптимального импульсного управления. Вестник ВГУ, Серия: Физика. Математика, 2007, N. 1, с. 105-111.
43. Павлова Н.Г. Условие 2-регулярности для систем с импульсными управлениями. XLIV Всероссийская конференция по проблемам математики, информатики, физики и химии. Москва: РУДН, 2008.
44. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М., 1961
45. Ройтенберг Я.Н. Автоматическое управление. М.: Наука, 1978
46. Рокафеллар Р. Выпуклый анализ. М.: Наука, 1973
47. Рудин У.Функциональный анализ. М.: Наука, 1975
48. Arutyunov A., Dykhta V., Pereira F. Necessary Conditions for Impulsive Nonlinear Optimal Control Problems without a priori Normality Assumptions. Journal of optimization theory and appl. vol. 124, e 1, pp. 55-77 (2005).
49. Arutyunov A., Jacimovic V., Pereira F. Second order necessary conditions for optimal impulsive control problems. J. on Dynamical, and Control Systems., vol. 9 (2003), No. 1 , pp. 131 153.
50. Arutyunov A., Karamzin D., Pereira F. A nondegenerate maximum principle for the optimal control problem with state constraints. SI AM J.Control Optim. V.43, e5, p.1812-1843 (2005).
51. Kamien M.I., Schwartz N.L. The calculus of Variation and Optimal Control in Economics and Management // North Holland, NY -Oxford, 1981. -331p.
52. McShane E.J. Amer. J. Math. 1941. V. 63. P. 516-530.
53. Pavlova N. 2-regularity and 2-normality conditions for systems with impulsive controls. Yugoslav Journal of Operations Research, 2007, Volume 17, No 2, 149-164.