Необходимые условия оптимальности в различных классах экстремальных задач управления тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Карамзин, Дмитрий Юрьевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2003
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
Московский государственный университет имени М.В. Ломоносова Факультет вычислительной математики и кибернетики
на правах рукописи
Карамзин Дмитрий Юрьевич
Необходимые условия оптимальности в различных классах экстремальных задач управления
01.01.02 - дифференциальные уравнения
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва 2003
Работа выполнена на кафедре системного анализа факультета Вычислительной математики и кибернетики Московского государственного университета им. М.В. Ломоносова.
Научный руководитель
Официальные оппоненты
доктор физико-математических наук, профессор А.В. Арупонов
доктор физико-математических наук, профессор Л.А. Бекларян
кандидат физико-математических наук, доцент М.М. Потапов
Ведущая организация
Институт математики и механики Уральского отделения РАН
Защита состоится 28 ноября 2003 г. в 1420 часов на заседании Диссертационного совета К 501.001.07 при Московском государственном университете им. М.В. Ломоносова по адресу: 119992, Москва, Ленинские горы, МГУ, факультет Вычислительной математики и кибернетики, ауд. 685.
С диссертацией можно ознакомился в библиотеке факультета ВМиК МГУ. Автореферат разослан.^.?.£..'£$№....2003 г.
Ученый секретарь диссертационного совета, к.ф.-м.н.
В.М. Говоров
2.QQ3-Ä
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Настоящая работа посвящена изучению необходимых условий оптимальности в различных классах экстремальных задач управления.
В первой главе рассматривается обычная задача оптимального управления при самых общих предположениях относительно динамики управляемой системы (т.е. нет ни линейности по управлению, ни выпуклости векторграммы и т.д.). В работе [2] A.B. Арутюновым был предложен метод гладкого возмущения, с помощью которого исходная задача (предполагается, что она имеет решение) может быть приближена задачами с минимумом в обобщенных управлениях. Но для задачи с минимумом в обобщенных управлениях Принцип Максимума (ПМ) и условия второго порядка уже известны [3] (они получены A.B. Арутюновым методом штрафных функций). Тем самым результаты работы [3] распространяются на исходную, невыпуклую задачу. В настоящей работе метод гладкого возмущения перенесен на случай задачи с фазовыми ограничениями. Далее в первой главе для задачи с измеримым нефиксированным временем и фазовыми ограничениями доказывается ПМ. При этом особое внимание уделяется условиям трансверсальности по времени в форме [1], с помощью которых в предположениях гладкости, регулярности и управляемости получается невырожда-ющийся ПМ [1]. Говорят, что ПМ вырождается, если его условия могут быть удовлетворены тривиальным набором множителей с А0 = 0 и if>{t) = 0 Vi е (to,h), но, возможно, ^(ijt) Ф 0, к = 0,1 (ведь в задаче с фазовыми ограничениями сопряженная переменная есть функция с ограниченным изменением и, следовательно, может иметь скачки). Тогда общепринятое условие нетривиальности Ao+sup \ip(t)\ > 0 удовлетворяется, хотя ПМ, очевидно, не информативен, поскольку условие максимума не дает никакой полезной информации относительно значений оптимального управления.
Обратимся к истории вопроса. Впервые ПМ для задач с фазовыми ограничениями был получен Р.В. Гамкрелидзе [19]. ПМ в форме Гамкрелидзе имеет ряд достоинств и недостатков. С одной стороны он не вырождается, а мера г) имеет лишь абсолютно непрерывную составляющую и конечное число атомарных составляющих. С другой стороны, он доказан лишь для так называемых "регулярных" траекторий, которые, например, имеют лишь конечное число выходов на границу фазовых ограничений, а оптимальное управление предполагается кусочно гладким. В 1963 г. для задач с фазовыми ограничениями А.Я. Дубовицким и A.A. Милютиным получен ПМ без априорных предположений относительно оптимальных управлений и траекторий [9]. Оптимальной траектории в этом ПМ разрешено иметь счетное число выходов на границу фазоограничения, и Милютиным был даже построен пример линейной задачи с таким свойством. Им же были получены условия, гарантирующие отсутствие у меры г] сингулярной составляющей. Недостатком ПМ в форме Дубовицкого-Милютина является то, что для некоторых постановок задачи он вырождается (например, автономная задача быстродействия с закрепленными концами, лежащими на границе фазоограничения). Впервые на этот факт обратил внимание A.B. Арутюнов в работе [4]. Он же при довольно общих предположениях методом конечномерной аппроксимации доказал модифицированный вариант ПМ [1], который (в отличие от Дубовицкого-Милютина) не вырождается при известных условиях управляемости и регулярности (по этому поводу см. также работу Дубовицких [8]).
Два результата: Гамкрелидзе и Дубовицкого-Мнлютина, ставшие уже классическими, — это две принципиально разные теоремы и их действительно трудно сравнивать. Правильно было бы сказать, что обе теоремы затрагивают разные аспекты большой и сложной проблемы получения качественного ПМ для задачи с фазовыми ограничениями. Поясним здесь, что фазовые ограничения есть частный случай нерегулярных ограничений смешанного типа и этой нерегулярностью и объясняется вся сложность их исследования.
Во второй главе изучается одна задача оптимального распределения ресурсов по множеству независимых операций. Задачи оптимального распределения ресурсов относятся к сложным комбинаторным задачам управления проектами [5, 6]. Достаточно законченная теория существует для ряда постановок и, в частности, для случая независимых операций [6]. Предполагается, что скорость операций линейно зависит от количества ресурсов и от состояния операции. Постановка задачи продиктована практическими соображениями. В настоящей работе для этой задачи методом штрафов [1] получены необходимые условия оптимальности в форме ПМ.
В третьей главе рассматривается задача оптимального импульсного управления с векторной мерой. Оптимальное импульсное управление представляет собой интенсивно развивающийся раздел динамической оптимизации, в котором изучаются процессы с разрывными траекториями и нерегулярными управлениями импульсного типа, в качестве которых могут выступать векторные меры или обобщенные функции. Важным стимулом к развитию теории импульсного управления является моделирование физических процессов, управление которыми осуществляется в течение столь кратковременных промежутков, что их можно идеализировать как мгновенные, а результаты воздействия приводят к разрывам фазовых траекторий исследуемой системы. Примеры подобных ситуаций можно найти в механике, ракетодинамикс, квантовой электронике, лазеро- и робототехнике, экономике [10]. Помимо чисто физических приложений, становление теории импульсного управления во многом обязано внутренним потребностям самой математики: ведь многие задачи оптимального управления (с линейной по управлению динамикой) не имеют, как правило, решения в традиционном классе абсолютно непрерывных траекторий, если множество допустимых измеримых управлений не ограничено в пространстве Li. Однако, если это множество ограничено хотя бы в норме Li, то утверждать существование решения можно в более широком классе управлений — в классе так называемых импульсных управлений, в качестве которых (в данном случае) будут выступать борелевские меры. Причем каждому обычному управлению u(t) исходной задачи в расширенной будет отвечать абсолютно непрерывная борелевская мера ц с плотностью ^ = и (t). Указанный факт есть следствие известного утверждения о слабой-* секвенциальной компактности единичного шара в С*.
В развитие теории импульсного управления большой вклад внесли работы (в нашей стране) H.H. Красовского, A.B. Куржанского, М.И. Гусева, С.Т. Завалшци-на, А.Н. Сесекина, В.А. Дыхты, Б.М. Миллера (см. [7, 10, 11, 14, 15, 16, 17, 18]) и работы таких зарубежных ученых как Bressan, Pereira, Rampazzo, Silva, Vinter (см. [20, 21, 22, 23, 24]) и этот список является далеко не полным.
Цель работы. Получение необходимых условий оптимальности в различных экстремальных задачах управления.
Основные результаты.
1. Предложен метод гладкого возмущения задачи, позволяющий произвольную невыпуклую задачу оптимального управления приблизить задачами с минимумом в обобщенных управлениях. Для задачи с измеримым нефиксированным временем и фазовыми ограничениями при общих предположениях относительно данных и постановки задачи доказан ослабленный ПМ, из которого невырождающийся ПМ вытекает при известных условиях управляемости и регулярности.
2. Исследована задача оптимального распределения ресурсов по множеству независимых операций. Получены необходимые условия оптимальности в форме ПМ, который позже изучен и расшифрован для задачи на MINiMAX.
3. Рассмотрены системы дифференциальных уравнений с векторной мерой. Доказаны теоремы существования и единственности, формула для производной по начальным данным, леммы о предельных переходах. На множестве импульсных управлений введена метрика относительно которой осуществимы корректные предельные переходы в уравнении с векторной мерой. Само импульсное управление есть результат пополнения и определяется с точностью до изометрии как фундаментальная в указанной метрике последовательность абсолютно непрерывных векторных мер. Рассмотрена задача оптимального импульсного управления с векторной мерой со значениями в выпуклом замкнутом конусе и фазовыми ограничениями. Доказан ПМ. Исследованы условия невырожденности. Сформулировано определение управляемой траектории. В условиях гладкости доказан невырождающийся ПМ.
Научная новизна работы. Усилен ряд теорем, ослаблены требования на постановки задач, для которых ранее были выведены необходимые условия оптимальности. Для некоторых задач получены новые, ранее не известные условия.
Теоретическая и практическая ценность работы. Главы 1 и 3 диссертации носят в основном теоретический характер. Результаты главы 2 могут иметь непосредственное практическое приложение в некоторых задачах экономики.
Методы исследования. Основным иснтрументом исследования является гладкий вариационный принцип [12]. Применяется также метод штрафов [1] и вариационный принцип Экланда [13]. В работе использован аппарат теории дифференциальных уравнений, экстремальных задач, принципа максимума, элементы математического, функционального, выпуклого, негладкого анализов.
Апробация работы. Результаты диссертации были представлены на научно-исследовательских семинарах кафедры дифференциальных уравнений и функционального анализа РУДН (рук. Арутюнов A.B.), кафедры оптимального управления ф-та ВМК МГУ (рук. Васильев Ф.П.), научно-исследовательском семинаре при ВЦ РАН (рук. Шананин A.A.), а также на Всероссийской научной конференции по проблемам математики, информатики, физики, химии и методики преподавания естественнонаучных дисциплин (Москва, РУДН-2003).
Публикации. По теме диссертации опубликовано 3 работы.
Структура и объем диссертации. Диссертация состоит из введения, трех глав и библиографии. Общий объем диссертации 106 страниц, библиография включает 40 наименований.
Краткое содержание работы
В первой главе изучается задача оптимального управления
' Лр,«) = ео(р) шш,
' Ег(р) <0, £72(р) = О, < 0, ^
. и(4) 6 и(х,{) п.в. г, р = (хих2,и^2), х(и) = хи г(«2) = г2.
Здесь Е\, Е?, С вектор-функции со значениями в И,к>, ] = 1,2,3, фазовая переменная х принимает значения в п-мерном арифметическом пространстве 11". Вектор и, принимающий значения в Иш, называется управлением. В качестве класса допустимых управлений рассматриваются существенно ограниченные измеримые функции и (4). Многозначное отображение II ставит в соответствие каждой паре (х, £) непустой компакт и{х, г) С Нт.
Примем обозначения
(р) = {еиСр),..,б!,*,(?)}, Д = {1,..,А1}, Ег(р) = {е2,1(р),..,е2,*3{р)}, 12 = {!,•■, Ы, = ЫМ), ОМ)}, = {!,•■> М.
Теорема 2.1. Пусть (р*, «*) решение задачи (1) и с > Ци'Ць^. Тогда существуют такие числа тх < > ¿2, что для любого достаточно малого е > 0 найдутся зависящие от е: число 8 > 0; последовательность векторов {р«.} С Н2п+2, сходящаяся при к -» оо к некоторому вектору ре; последовательность функций {и*} с Ь™ [г!, г2], сходящаяся при к -¥ оо к некоторой функции ие; числовая последовательность а также семейства вещественных чисел € Л, {?2,<г}>7 е Ь, {р{}>3 £ /з, такие,
что
1) 0 < 7* < 2~к Ук;
2) |р'-р*|2 + |К-«1к||2<25е2У*;
3) Л > 0, С> —> 0 при е О V;;
4) процесс (ис,рс) является оптимальным в классе обобщенных управлений для следующей задачи:
ео(р) + е Е 7к[Ь ~ Р*|2 + Г 1« ~ «*И12<Й1 шш,
х = /(х,и,г), ' еиО) - £ме0(р) < Й,£е3, 1 € Л, |р - ре| < <5, е2л(р) - = 3 € /2,
- р>е0(р) < е М2], 5 £ /з, . и(*) € 11(х,Ь), |и(«)| < с п.в.
Теорема 2.1 обобщает метод гладкого возмущения, полученный в [2], на случай задачи с фазовыми ограничениями. Представленный метод возмущения дает возможность любую задачу оптимального управления, имеющую решение, приблизить задачами с минимумом в классе обобщенных управлений. Зачем это нужно? Для задачи с минимумом в обобщенных управлениях A.B. Арутюновым получены необходимые условия первого и второго порядков (см. [3]). Тогда с помощью построенного возмущения результаты работы [3] обобщаются на случай произвольной невыпуклой задачи оптимального управления.
Применительно к теории Принципа Максимума (ПМ) изложенный выше метод возмущения (теорема 2.1) имеет один существенный недостаток, который заключается в том, что в возмущенной задаче нарушается согласованность фазовых ограничений с концевыми. Значит, с помощью этого метода нельзя доказать невырож-дающийся ПМ [1]. Отмеченный недостаток метода компенсируется теоремой 5.1, в которой развивая идеи, заложенные в работе [2] и теореме 2.1, с помощью несколько модифицированного метода возмущений мы доказываем ослабленный ПМ [1].
Рассмотрим задачу (1) в более точной формулировке:
' J(p, и) = е0(р) -¥ min,
x = f(x,u,t), te [ti,ta], • Ях(р) < 0, E2(p) = 0, G(îr, t) < 0, (2)
и = (ui,ti2), R{x,u\,t) < 0, uj(t) e U2{t) п.в. t, p= (xi,x2, tl.tj), x(tt) = ®i, x(tl) -X2.
Здесь R — вектор-функция со значениями в R*4, отвечающая ограничениям смешанного типа. Координаты вектора управления и разбиты на две части и = («i, и^), «1 G Rmi, и2 6 Rmj, m = mi+ mi- U2 — заданное многозначное отображение со значениями в R"*2. Выделение у вектора и двух компонент щ и «2 позволяет учесть как смешанные ограничения R(x, u\,t) < 0, так и чисто геометрические и2 € U2(t). В качестве класса допустимых управлений рассматриваются существенно ограниченные измеримые функции u(t), такие, что u2(t) 6 U2(t) п.в.
Теорема 5.1. Пусть (р*, и*) оптимальный процесс в задаче (2) и выполнено предположение О), фазовые ограничения согласованы с концевыми, смешанные ограничения регулярны. Тогда существуют вектор А = (Ао, А1, А2), n-мерная вектор-функция с ограниченным изменением i>{t), А^-мерная измеримая, существенно ограниченная вектор-функция r(t) и борелевская вектор-мера 7] = (%,.., %3), такие, что для s = 1,2 выполняется
=Г s> - - L s)dr> -
Ж) = ¿(P*.*). Л° > 0, Ах > 0, (£i(p').Ai> = 0,
r{t) > 0, <г(t),R(x'{t),u'(t),t)} = 0 п.в. t 6 [t;,iî], t? > 0, gj(x*(t),t) = 0 Vi 6 supp(^), j e I3, max H(u,t) = H{u'{t),t) п.в. t e [tî.tj],
esslimsup max H(x'„u, (-1)'+1|V> A),i) + A) > 0,
«€f(i;,t) ox, at,
-W^*«'*' (-«•"¿v.*).')-+i-1^!;1^
- |^V(i),u"(i),iMt) = о П.В. t e M,
|A| + sup I^WI + IMIX).
Здесь H(x,u,ip,t) = (f{x,u,t),t/>) — функция Понтрягина, a /(jp, A) = A0eo(p) + Y^-i(Ej(j>), \j) — малый лагранжиан.
Во второй главе изучается следующая задача оптимального распределения ресурсов [5, 6]: даны к линейных динамических систем
х, = AjXj + BjUj, t е [0,ij], j = 1, ..,k, щ e Uj. (3)
Здесь Xj — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве Rn, j = 1,.., к. Вектор щ, принимающий значения в Rm, называется управлением. Каждая из систем определена на своем отрезке времени [0, tj], матрицы Aj,B} имеют размерности nxnimxn соответственно.
Значение управления щ в каждый момент времени t е [0, выбирается из заданных множеств из с Rm, каждое из которых выпукло, компактно и содержит нуль: 0 6 Uj. Для всех t > tj управление uj считается равным нулю. Кроме того, управления щ связаны совместным ограничением
к
Y,CjUj < ь, be к', ь>о, (4)
;=1
где Cj — заданные матрицы размеров т х I. Множество векторов и = (щ, ..,щ) 6 Rmt, удовлетворяющих (4), обозначим через Uc. Несложно заметить, что Uc с Rmfc выпукло, замкнуто и непусто, так как содержит нуль (Ь > 0).
Пусть г = (ii,.., tk) 6 R* —вектор, компонентами которого являются моменты завершения, т > 0. Введем в рассмотрение многозначное отображение U(t,r), определяемое по следующей формуле
U(t,r) =
йшь)
ПС^с U3(t,s) = { ^'/Д*'
где П означает декартово произведение множеств. Для каждого момента времени ( множество г) С К™* выпукло, компактно и непусто, так как содержит нуль.
Теперь, имея набор векторов начальных значений Хо = (жо,ъ ••! го,/с), вектор времени т и управление и(<) € г), можно решить каждую из систем (3) на своем отрезке времени [0,^], полагая Xj(0) = а управление и3(Ь) как проекцию вектора и({) на соответствующее _/-е подпространство. Результатом решения будет набор векторов конечных значений Ху = (жг,1> ■■>хт,к)'- — з — 1,..,к.
Задача заключается в том, чтобы набор векторов хо перевести в ху с наименьшим значением критерия <р(т), причем в качестве функции <р(т) может выступать:
1) линейная комбинация моментов tj, j = l,..,fc, т.е. ip(r) = где aj — заданные вещественные константы;
2) функция максимума: <р[т) = Тшлх = шах tj.
Более общая формулировка задачи включает в себя оба случая. <р(р) -» min,
ij = AjXj + BjUh t e [0,¿j], j = l,..,k, . .
ßi(p) < 0, Д2(р) = 0, W
p = (xo.Xt.t), u(i) e U(t,r) для почти всех t.
Здесь вектор-функции Е,: R*(2"+1) —у R*«, s = 1,2, задающие концевые ограничения, т.е. ограничения на концы траекторий Xj(t), j — 1 ,..,fc и на вектор времени г, а также функция р(р) предполагаются непрерывно дифференцируемыми. Вектор р = (хо,хг,т) называется концевым вектором.
Положим Ij(r) = {г : 1 < г < к, tT > t3}, где т = (ti, ...i*) — вектор времени. Теорема 4.1 (ПМ). Пусть (р*, и*) — решение задачи (5). Тогда существуют число А0 > 0, векторы Ai,A2, абсолютно непрерывные вектор-функции ij>j{t), j = 1,.., к со значениями в R" такие, что
Ь = -А'ф^ t е [0,tj], V-i(0) = ^-(p*,A), =-JL(р-,А), Ai>0, {Ei(p"), Ai) = О, am^£(Briir,^(t)) = Xj(Br<(t),^(i)) п.в. t 6 [0,T^],
Доказательство этой теоремы проводится методом штрафов [1].
Приведем расшифровку теоремы 4.1 для задачи на MINiMAX, т.е. для задачи с функционалом <р(т) = maxi<j<nij. Найдутся не разные одновременно нулю абсолютно непрерывные функции ф], j = 1,.., к такие, что
^ = -Ajipj, t € [0, tj], max f (BrUr,Mt)) = E(Br<(t),^(t)) п.в. t e max £ (Arx;(i;) + ßrur,vrra) =
nfc l l'T 'гел(т*)
В третьей главе рассмотрена задача оптимального импульсного управления с векторной мерой.
' J(p, и, ц, {иг}) = е0(р) ->• min,
dx = f(x, и, t)dt + g(x, t)dfi, t e [îq, fi], • ei (p) < 0, e2(p) = 0, ф, t) < 0, (6)
u(t) e U(t) С Rm n.B. t, Range(/i) с К, p = {xo,Xut0,ti), xo = x(to), xi = x(ti).
Здесь: ej, e2, <p — вектор-функции со значениями в R*->, j = 1,2,3 соответственно, g — матрица, имеющая к4 столбцов и п строк, х — фазовая переменная, принимающая значения в га-мерном арифметическом пространстве R", ц — ^-векторная борелевская мера, заданная на отрезке времени Т = [io.ii] и принимающая значения в выпуклом замкнутом конусе К, {иг} — семейство измеримых вектор-функций, рассматриваемых на отрезке [0,1], зависящее от параметра г € Г и определенным образом связанное с векторной мерой ц.
Определим понятие решения для уравнения с векторной мерой в задаче (6) [10, 17, 18, 21]. Пусть АеК, Д = (Д\..,Д*4) и 7 > |Д| = £*=i |Д*|. Тогда элементами множества %к{Д;т) С L*£([0,1]) являются измеримые существенно ограниченные вектор-функции v = (v1,.., vk'), заданные на отрезке [0,1] и принимающие значения в конусе К, такие, что
1)ёи«)| = 7П.в.ве[0,1]; j=i
2) [\j(s)ds = &,j = Jo
Отсюда видно, что множество ?{к(Д;т) всегда не пусто при 7 = |Д|, а при 7 > |Д[ это множество может быть как пустым так и не пустым (в зависимости от выбранного конуса К и соотношения чисел 7 и |Д|).
Если ц векторная мера, то:
• И = Ejii l/^l, где мера \nj\ есть вариация заряда
• Ds(/i) — {г 6 Т : Н({г}) > 0} - дискретный носитель
• ¡ic - ей непрерывная составляющая, т.е. векторная неатомическая мера, компонентами которой служат непрерывные составляющие компонент ¡¡\
• /'({У}) _ вектор из К, равный значению fi на одноточечном множестве {г}.
Семейство векторных функций {vr}, зависящее от параметра г G Т, будем называть присоединенным к векторной мере ¡л, если существует семейство неотрицательных чисел {7г}, геТ, в котором не более чем счетное число элементов отлично от нуля, такое, что £7г < оо и vr € 'НкМ{г})'>7г) Vr € Т.
Импульсным управлением в задаче (6) будем называть пару q = (/i;{tir}), где ¡j, векторная мера со значениями в конусе К, a {vr} некоторое присоединенное к fi семейство функций. Вариацией импульсного управления q = (fi-, {п,}) будем называть скалярную борелевскую меру |q[ = |дс| + £7Г5Г- Здесь 5Т означает меру Дирака,
сосредоточенную в точке г. Из определения присоединенного семейства сразу вытекает, что Оа(д) С Бв(|Ч|) (заметим, что вложение может быть строгим). Кроме того, ьг = 0 как только г ^ Е>з{[ч|). Таким образом, семейство {иг} по существу зависит от параметра г е и имеет не более чем счетное число функций, отличных от
нуля. Отметим также, что в случае, когда конус К вложен в положительный ортант, определение присоединенного семейства упростится. Действительно, тогда функции уг неотрицательны, откуда = т.е. вариация импульсного управления совпадает с вариацией векторной меры (что вообще говоря неверно для произвольного конуса). Отсюда уг ф О •О- г € Вз(/х), если К С К*1. Последнее утверждение также всегда верно для произвольного острого конуса.
Пусть г С Т, V е 1]) и х е Я". Тогда функция аг(-) = аг(-;х,у) определя-
ется как решение следующей системы уравнений:
* аг = д(ог, т>, в € [0,1], Ог(0) = х.
Положим £(х, г, ь) — аг(1).
Перейдем непосредственно к определению решения. Зафиксируем произвольное импульсное управление q = (д; {иг})- Функция х(Ь), заданная на отрезке Т, называется решением уравнения (6), отвечающим набору (х0,и,ц), если г(40) = х0 и
х(г) =!„+/' /(х, и, в)<1з + ( д{х, (7)
+ е [аф-),г,уг)-х(г-)},ы>1а.
геЦа(|ч|), г<(
Данное определение корректно в следующем смысле. Пусть — последовательность абсолютно непрерывных векторных мер, слабо сходящаяся к векторной мере д, и пусть Х{ — абсолютно непрерывная траектория, отвечающая в силу (теперь уже обычного) дифференциального уравнения задачи (6). Тогда существует присоединенное к ц семейство функций {иг} такое, что траектория ж(<), отвечающая в силу уравнения (7) импульсному управлению q = (//, {уг}), является предельней для {г,}. Точнее, переходя к подпоследовательности, х,(Ь) —> х{Ь) ^ Е)в(|<1|) \ {¿о, ¿1}-
И обратно: для любой функции х(4), являющейся решением в смысле (7) сущест-<* вует слабо сходящаяся к ц последовательность абсолютно непрерывных векторных
мер, такая, что последовательность соответствующих траекторий сходится к х(Ь). Строгие формулировки и доказательства приведенных фактов содержатся в п. 3. V Если ф(х, <) — непрерывная скалярная функция, то положим
Неравенство <р(х, 4) < 0 в (6) следует понимать в обобщенном смысле:
4>(х, г) < О gc вир <р*(х, *) <0, ] = 1,.., к3.
Это означает, что траектория х(4) удовлетворяет фазовым ограничениям если и только если 1) <р{х(г), ¿) < 0 6 [(0, 2) ¡р(ат(з), г) < 0 Уз е [0,1] Уг 6 Ш(|ц|) (см. также [10,17, 18]).
На фиксированном отрезке времени Т = [toi <i] доказана
Теорема 9.2. Пусть (р*,и*, q*), q* = (¿и*;{г£}) — решение задачи (6) и фазовые ограничения согласованы с концевыми. Тогда существуют число Ао > 0, векторы Xj е R*J, j = 1,2, Ах > 0, вектор-функция ф е Vn(T), вектор-мера г] = (г?1,..,?)*3), т? 6 С\{Т)' üs(|q*|) П Ds(íj) = 0, а для каждой точки г е Ds(|q*|) существует своя вектор-функция ат е V"([0,1]) и своя вектор-мера r¡r = (г/},.., т/*3), r¿ е С+([0,1]) такие, что
ф{1) = ф0 - f Hx(s)ds - ( Qx(s)dfí*c + f <pI{x\ s)dr, + Ф{ф, í), t G (í0, ti],
víO v [to,t] J [¿O
*(iM) = £
r£D>(|q'|),r<t
' da'T = g(a;, r)v;ds, dffT = - 9ÍT(K, r)<rrv?ds + <p¿(a*r, r)dr¡r> s e [0,1], oí(0) = í*(r-), ат{0)=ф(т~),
snpp(4) С {s : <p»(a$(«),r) = 0}, j = 1 ,..,k3, r £ Ds(|q*|)j
(Ai, ex(p*)) = 0, t) = 0 rf-n.B. Vj;
= -ff(í) п.в.;
gcsup(Q(í),m) <0 Vm e ЛГ, j( (Q(i), dq*) - 0;
1*1 +NI + E iWI = l-
reiMIq'l)
Замечание. Здесь С}(х,ф,Ь) = фтд(х, í). Пусть го* = ^ij — производная Радона-Никодима векторной меры /и* по мере \i¿¡.\. Тогда из условий теоремы вытекает:
1) Q{t) eK'VteTu Qr{s) eK°4se [0,1] Vr е Ds(|q*|);
2) (Q(i),m'c(t)) = 0 1/íl-n.B. и {Qr(s),v'r(s)) = 0 п.в. s e [0,1] Vr £ Ds(¡q«|).
Предположение Г) Функция / непрерывно дифференцируема по совокупности переменных, а многозначное отображение £/(•) постоянно, т.е. U(t) = U для некоторого компакта U.
Определение 1.4. Пусть выполнено предположение Г). Допустимую траекторию x(t), t 6 [¿о, ¿i] будем называть управляемой в концевых точках (относительно фазовых ограничений), если найдутся векторы щ € U, тъ в К такие, что
и*.**)+ 0 Vj: <fp{xí,tk) = 0,
где хк = x(tk), к = 0,1.
Если д = 0 или ц из класса абсолютно непрерывных векторных мер с плотностью в Loo, то определение 1.4 превращается в известное определение управляемости для связанной с (6) обычной задачи оптимального управления [1, с.112].
Для задачи с нефиксированным временем получена
Теорема 9.3. Пусть (р*, и*, q*) — решение задачи (6), выполнено предположение Г), фазовые ограничения согласованы с концевыми, фазовые и концевые ограничения регулярны и оптимальная траектория управляема в концевых точках относительно фазовых ограничений. Тогда существуют число А0 > 0, векторы А3 £ R*j, j = 1,2, Ai > 0, вектор-функция ф £ Vn(T*), скалярная функция ф £ V(T*), вектор-мера г) - {П1,-,^), г? 6 С'+(Т'У. Ds(|q*|) П Dsfa) = 0, а для каждой точки т £ Ds(|q*|) существуют свои вектор-функция ar £ V"([0,1]), скалярная функция вт £ V([0,1]) и вектор-мера т)т = (»¿,..,jj*s), tfr е С|([0,1]) такие, что
m = Фа - /'Hx{s)ds -[ Qx(s)dnl + [ s)dr, + S(ф, t), t £ (tj,i'],
E ЫЪ-Мг-)),
rgDs(|q*|), T<t
ФЮ = Фа + \\ Ht(s)ds +[ Qt(s)dfi*c - f <pj(x", s)dr, + в(ф, t), t £ (f0, ij],
©(*.*) = E Pr(i)-«r-)i,
reDs(|q*|),r<t
' da; = g{a*T, r)v^ds,
dar = - EjLi r)aTtP'ds + r)Afr, ' d&r = (&(<*;, г)<, <Tr)ds - tpj(a'rl r)dr/r, s £ [0,1], a;(0) = s'(i-), ar(0) = ф(г~), 0r(O) = ф(г~), supp(tf') С {в : ^(of(i),r) = 0}, j = 1, ..,*,, г 6 Du(|q*|);
(Ai, ei(p')) = 0, i) = 0 rf-п.в. Vj;
max Я (и, t) = Я(4) п.в. i, max Я(и, i) = ¿(i) Vi e (to, ij);
gc sup(Q(i), m) < 0 Vm £ K, J^(Q(t), dq*) = 0;
Ao + £({t:Wt)|>0})+ E ^({t = Wi)l > 0})|q*|(W) = 1.
r£D»(|q4)
В конце гл. 3 приводится пример (пример 9.1), показывающий, что если условия управляемости (определение 1.4) нарушаются, то ПМ, доказанный в теореме 9.2, может вырождаться (см. также [1, пример 4.1, с. 111]).
Литература
[1] Арутюнов A.B. Условия экстремума. М., Факториал, 1997.
[2] Арутюнов A.B. Расширения и возмущения задач оптимального управления. Тр. , МИАН, 1998, Т. 220, с. 27-34. !
[3] Арутюнов A.B. Возмущения экстремальных задач с ограничениями и необходи- J мые условия оптимальности. Итоги науки и техники. ВИНИТИ. Математический анализ, 1989, Т. 27, с. 147-235.
[4] Арутюнов A.B. К необходимым условиям оптимальности в задаче с фазовыми ограничениями. Докл. АН СССР, 1985, Т. 280, N 5, с. 1033-1037.
[5] Баркалов С.А., Бурков В.Н. Минимизация упущенной выгоды в задачах управ- ' ления проектами. Москва, Ин-т проблем управления, 2001.
[6] Бурков В.Н. Модели и методы мультипроектного управления (препринт). Мое- ' ква, Ин-т проблем управления, 1997. j
[7] Гусев М.И. Об оптимальном управлении обобщенными процессами при невыпуклых фазовых ограничениях. Дифференциальные игры и задачи управления. Свердловск: УНЦ АН СССР, 1975. |
[8] Дубовицкий А.Я., Дубовицкий В.А. Необходимые условия сильного минимума в задачах оптимального управления с вырождением концевых и фазовых ограничений. УМН, 1985, Т. 40, N 2, с. 175-176.
I
[9] Дубовицкий А.Я., Милютин A.A. Задачи на экстремум при наличии ограничений. Докл. АН СССР, 1963, Т. 149, N 4, с. 759-762; ЖВМиМФ, 1965, Т. 5, N 3,
с. 395-453. |
[10] Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложени- . ями. М., Физматлит, 2000.
[11] Завалищин С.Т., Сесекин А.Н. Импульсные процессы: модели и приложения. М., Наука, 1991.
[12] Иоффе А.Д., Тихомиров В.М. Несколько замечаний о вариационных принципах. Мат. заметки, 1997, Т.61, N 2, с. 305-311
[13] Кларк Ф. Оптимизация и негладкий анализ. М., Наука, 1988. I
[14] Красовский H.H. Теория управления движением. М., Наука, 1968. i
[15] Куржанский А.Б. Оптимальные системы с импульсными управлениями. Диф- 1 ференциальные игры и задачи управления. Свердловск: УНЦ АН СССР, 1975,
с. 131-156. I
[16] Куржанский А.Б., Осипов Ю.С. К управлению линейной системой обобщенными воздействиями. Дифференциальные уравнения. 1969. Т.5. N 8, с. 1360-1370.
[17] Миллер Б.М. Условия оптимальности в задачах обобщенного управления. Автоматика и телемеханика, 1992, N 5, с.50-58.
[18] Миллер Б.М. Обобщенные решения в нелинейных задачах оптимизации с импульсными управлениями. Автоматика и телемеханика. I. Проблема существования решепкя, 1995, N 4, с.62-76. II Представление решений с помощью дифференциальных уравнений с мерой, 1995, N 5, с.56-70.
Г
[19] Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М., Наука, 1983.
^ [20] A. Bressan, F. Rampazzo. Impulsive Control Systems with Commutative Vector
Fields. J. of Optimization Theory and Applications, vol. 71 (1991), pp. 67-83.
[21] F.M.F.L. Pereira and G.N. Silva. Necessary conditions of optimality for vector-valued impulsive control problems. Systems and Control Letters 40, 2000, pp. 205-215.
[22] G.N. Silva and R.B. Vinter. Measure differential inclusions, J. Math. Anal. Appl, 202 (1996), pp. 727-746.
[23] G.N. Silva and R.B. Vinter. Necessary conditions for optimal impulsive control provlems. SIAM J. Control Optim., 35 (1997), pp. 1829-1846.
[24] R.B Vinter and F.M.F.L. Pereira. A maximum principle for optimal processes with discontinuous trajectories. SIAM J. Control Optim., 26 (1988), pp. 205-229.
Публикации по теме диссертации
1) A.B. Арутюнов, Д.Ю. Карамзин. Расширение и возмущение задачи оптимального управления с фазовыми ограничениями Вестн. Моск. ун-та. Сер. 15, ВМиК, 2002, N 2, с. 31-35.
г 2) Д.Ю. Карамзин. К теории принципа максимума в задачах с фазовыми ограни-
чениями. Вестн. Моск. ун-та. Сер. 15, ВМиК, 2002, N 4, с. 23-31.
i
1 3) A.B. Арутюнов, В.Н. Бурков, А Ю. Заложнев, Д.Ю. Карамзин. Задача опти-
мального распределения ресурсов по множеству независимых операций. Автоматика и телемеханика, N 5, 2002, с. 108-119.
»18143
2оо?-/|
I 81
¥
Издательство ООО "МАКС Пресс". Лицензия ИД № 00510 от 01.12.99 г. Подписано к печати 22.10.2003 г. Формат 60x90 1/16. Усл.печ.л. 0,75. Тираж 100 экз. Заказ 834. Тел. 939-3890,939-3891,928-1042. Тел./факс 939-3891. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В.Ломоносова.
ВВЕДЕНИЕ.
Краткое содержание работы.
ГЛАВА I. РАСШИРЕНИЕ И ВОЗМУЩЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ.
1. Расширение задачи оптимального управления и вопрос о гладком возмущении.
2. Возмущение задачи оптимального управления с фазовыми ограничениями.
2. Постановка задачи.28
3. Простейшая задача.29
4. Принцип максимума.34
5. Расшифровка ПМ для задачи на MINiMAX.36
1. Арутюнов А.В. Условия экстремума. М., 1997.
2. Арутюнов А.В. Расширения и возмущения задач оптимального управления. Тр. МИАН, 1998, Т. 220, с. 27-34.
3. Арутюнов А.В. Возмущения экстремальных задач с ограничениями и необходимые условия оптимальности. Итоги науки и техники. ВИНИТИ. Математический анализ, 1989, Т. 27, с. 147-235.
4. Арутюнов А.В., Тынянский Н.Т. О принципе максимума в задаче с фазовыми ограничениями. Изв. АН СССР. Сер. техн. кибернетика, 1984, N 4, с. 60-68.
5. Арутюнов А.В. К необходимым условиям оптимальности в задаче с фазовыми ограничениями. Докл. АН СССР, 1985, Т. 280, N 5, с. 1033-1037.
6. Баркалов А., Бурков В.Н. Минимизация упущенной выгоды в задачах управления проектами. Москва, Ин-т проблем управления, 2001.
7. Благодатских В.И., Филиппов А.Ф. Дифференциальные включения и оптимальное управление. Труды МИАН, 1985, т.169, с.194-252.
8. Бурков В.Н. Модели и методы мультипроектного управления (препринт). Москва, Ин-т проблем управления, 1997.
9. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М., 1977.
10. Васильев Ф.П. Численные методы решения экстремальных задач. М., 1980.
11. Гамкрелидзе Р.В. Основы оптимального управления. Тбилиси: Изд-во Тбил. унта, 1977.
12. Гусев М.И. Об оптимальном управлении обобщенными процессами при невыпуклых фазовых ограничениях. Дифференциальные игры и задачи управления. Свердловск: УНЦ АН СССР, 1975.
13. Демьянов В.Ф. Минимакс: дифференцируемость по направлениям. ЛГУ, 1974.
14. Дубовицкий А.Я., Дубовицкий В.А. Необходимые условия сильного минимума в задачах оптимального управления с вырождением концевых и фазовых ограничений. УМН, 1985, Т. 40, N 2, с. 175-176.
15. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. Мат. сб. 51, 2 (1966), с.100-128. «> I