Математическая теория субоптимального управления распределенными системами тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Сумин, Михаил Иосифович
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Нижний Новгород
МЕСТО ЗАЩИТЫ
|
||||
2000
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
На правах рукописи
X
СУМИН Михаил Иосифович
МАТЕМАТИЧЕСКАЯ ТЕОРИЯ СУБОПТИМАЛЬНОГО УПРАВЛЕНИЯ РАСПРЕДЕЛЕННЫМИ СИСТЕМАМИ
Специальность: 01.01.02 - Дифференциальные уравнения
Автореферат диссертации на соискание ученой степени доктора физико-математических наук
Нижний Новгород - 2000
Работа выполнена в Нижегородском государственном университете им. Н.И.Лобачевского
Официальные оппоненты:
Доктор физико-математических наук, профессор Ф.П.Васильев
Доктор физико-математических наук, профессор С.Н.Слугин
Доктор физико-математических наук, профессор А.В.Фурснков
Ведущая организация — Институт математики и механики Уральского Отделения РАН
Защита диссертации состоится "
вг/^ ^^ чя-г. на заседании диссертационного совета Д 063.77.07 по защите диссертаций на соискание ученой степени доктора физико-математических наук в Нижегородском государственном университете по адресу: 603600, Нижний Новгород, ГСП-20, пр.Гагарина, 23, корп.2.
С диссертацией можно ознакомиться в фундаментальной библиотеке ННГУ.
Автореферат разослан п - / п 9ппп г.
Ученый секретарь диссертационного совета Д 063.77.07,
кандидат физико-математических наук,
доцент г В.И.Лукьянов
Общая характеристика диссертации
Диссертация посвящена развитию математической теории субоптимального управления распределенными системами (т.е. системами, описывав емыми уравнениями с частными производными) или, другими словами, математической теории оптимального управления распределенными системами, в которой "базовым элементом" теории является не оптимальное управление (обычное, т.е. измеримое по Лебегу, или обобщенное1), а минимизирующая последовательность (м.п.) обычных управлений.
Актуальность темы. Центральный результат математической теории оптимального управления - принцип максимума Л.С.Понтрягина. После его открытия последовали всевозможные обобщения. Во первых, были созданы различные общие схемы получения необходимых условий экстремума в абстрактных задачах с ограничениями (А.Я.Дубовицкий и А.А.Милютин, В.Г.Болтянский, Р.В.Гамкрелидзе и Г.Л.Харатишвили, L.W.Neustadt и др.). В дальнейшем эти схемы постоянно развивались, с их помощью решались все более сложные задачи оптимального управления (А.В.Дми-трук, А.Я.Дубовицкий, А.А.Милютин, Н.П.Осмоловский и др.).
Одновременно с созданием абстрактных схем интенсивно развивается также и теория " собственно задач" оптимального управления разнообразными сосредоточенными и распределенными системами (A.B.Арутюнов, С.М.Асеев, В.И.Благодатских, А.Г.Бутковский, Ф.П.Васильев, С.А.Вах-рамеев, Р.Габасов, В.И.Гурман, В.Ф.Демьянов, А.И.Егоров, Ю.В.Егоров, М.И.Зеликин, А.Д.Иоффе, Ф.М.Кириллова, Ю.Н.Киселев, Н.Н.Красовский, В.Ф.Кротов, А.В.Кряжимский, А.Б.Куржанский, К.А.Лурье, Б.Ш.Морду-хович, М.С.Никольский, Ю.С.Осипов, В.И.Плотников, Л.И.Розоноэр, Т.К. Сиразетдинов, В.М.Тихомиров, Е.Л.Тонков, В.А.Троицкий, А.Ф.Филиппов, А.В.Фурсиков, F.H.Clarke, J.L.Lions, J.Warga, L.J.Young, и др.).
В то же время появляются и различные общие подходы к получению принципа максимума для систем с распределенными параметрами (Ю.В. Егоров, А.С.Матвеев, В.И.Плотников, В.А.Якубович, H.O.Fattorini и др.). Теория оптимального управления распределенными системами быстро развивается в самых разных направлениях (С.А.Авдонин, Л.Т.Ащепков, О.В. Васильев, Ф.П.Васильев, А.И.Егоров, С.А.Иванов, А.З.Ишмухаметов, A.B. Кряжимский, А.И.Короткий, В.И.Максимов, А.С.Матвеев, С.Ф.Морозов, Ю.В.Орлов, Ю.С.Осипов, М.М.Потапов, С.Н.Слугин, В.А.Срочко, В.И.Сумин, А.В.Фурсиков, В.А.Якубович, V.Barbu, H.O.Fattorini, H.Frankowska, B.S.Mordukhovich, J.L.Lions и др.).
'Здесь ■ iixi обобщено« управлевае, » также picnepiiit »адачв оптвмалкаого увравлеввв аоаамаетсв ■ смысле РЗ-Гаккреладее, Дж.Варгв:
[Г] Гамкрелвдэе Р.В. Освови оатваальвого увраалевав. Тбвласв: Им-во Тбал. уа-та, 1977.
[В] Варга Дж. Овтанальаое увравлеаае даффереваяальвыма в фувкавовальаына урвавеввкма. M.: Наука, 1977.
Диссертация посвящена различным аспектам теории субоптимального управления распределенными системами, связанным так или иначе с принципом максимума Л.С.Понтрягина, который для краткости мы будем называть ниже просто принципом максимума.
Как уже отмечено выше, существующие в теории оптимального управления абстрактные подходы (схемы) позволяют эффективно получать в различных сложных задачах оптимального управления с ограничениями условия оптимальности как первого, так и более высоких порядков, а также результаты так или иначе связанные с условиями оптимальности (принципом максимума). Однако все эти подходы предполагают наличие по крайней мере одного очень существенного обстоятельства
(I): существование оптимального элемента, каковым может являться как обычное, так и обобщенное управление.
Указанное обстоятельство обеспечивается в случае обычного оптимального управлепия во всех упомянутых выше схемах посредством постулирования факта существования (как известно2, именно это привело к возникновению словосочетания " наивная теория оптимального управления"), если на задачу не наложены дополнительные и, как правило, весьма жесткие условия существования оптимально!« элемента. При этом для задач опти-мальпого управления обыкновенными дифференциальными уравнениями, а также в случае управляемых уравнений из весьма широкого класса так называемых полулинейных уравнений в частных производных существование оптимальных обобщенпых элементов дается "практически даром".
В то же время, в теории оптимального управления распределенными системами несуществование обычного оптимального управления и одновременно невозможность расширения задачи в том или ином смысле (Р.В.Гам-крелидзе, Дж.Варга, А.Ф.Филиппов, Л.Янг) не является каким-либо редким и патологическим событием. Приведем для иллюстрации следующий продетой пример, связанный с одномерной задачей Гурса-Дарбу. Пример 1. Рассмотрим задачу оптимального управления
10(и) = £ £(г2(х,у) - и2{х, у)) йхйу Ы, и &Т>,
V = {и е ^{Щ : и(х,у) е [-1,1] п.в. наП}, П = [0,1] X [0,1],
хху = и(л:, у)гх + и(х,у), г(х,0) = г(0,у) = 0.
Специфика такой хорошо известной конструкции функционала такова, что в этой задаче нижняя грань равна —1. Очевидно, что она не достигается ни на каком обычном управлении. Т.к.
г[и](х, у) = /о*(ехР(£ и(6,6) ¿6) -
2(Я] Янг Л. Лиан 00 в»ря»ивоннон7 асчяслсню ■ т«ори опт малы ого хораимни. М.: Млр, 1974.
то можно заметить, что последовательность
иЧх «л^1 *е[0,1], i = 1,3.....2.-1,
у €(#,£), г €[0,1], i — 2,4,..., 2г, ¿=1,2,...
является минимизирующей и для нее выполняется предельное соотношение lo(u') —> —1, г —со, в то время как для последовательности
v'(x V^i1 х » е [0,1], j = 1, 3,. .., 2« — 1,
® У €[0,1], J =2,4.....2г', ¿ = 1,2,...
указанное предельное соотношение не выполняется. Можно утверждать также, что первая из отмеченных последовательностей удовлетворяет принципу максимума для м.п. [1], а вторая - нет. В то же время, обе эти последовательности управлений, как нетрудно заметить, сходятся (в слабой норме \ ■ |ш, см. [В], [Г]) к одному и тому же обобщенному управлению v(x,y) = +
Подобные примеры говорят о том, что в теории оптимизации распределенных систем в общей ситуации "единственным выходом" для получения "каких-либо" условий оптимальности является рассмотрение именно м.п. в качестве "базового элемента" теории.
Представляется целесообразным здесь также отметить и еще одно обстоятельство, с которым приходится неизбежно сталкиваться в теории оптимального управления системами с операторными ограничениями3. Оно связано с возможпой невыполнимостью принципа максимума4. Многие примеры задач оптимального управления с операторными ограничениями, в которых не справедлив принцип максимума, достаточно хорошо известны (см. также пример невыполнимости принципа Лагранжа в книге5, С.261). Одпим из них является ставший уже классическим пример Ю.В.Егорова6, С.42, другой может быть найден, например, в монографии7, п.5.6, С.313. Аналогичные примеры, связанные с простейшими задачами оптимальпого управления как для обыкновенного дифференциального уравнения, так и для уравнения теплопроводности с фазовым (полуфазовым) ограничением типа равенства, в которых в качестве целевого выступает пространство ¿г(0,1), можпо найти, например, в [28, 29, 31]. Эти, а также другие подобные примеры (естественно, их число можно неограниченно увеличивать) объединяет одно очень важное обстоятельство: выполнимость принципа
'Здесь ■ и ж же под операторный! ограничевиями ны поминаем ограниченна, задаваемые оператором с бесконечномерным
образом; н протяжном те случае ограниченна называем функциональными.
'Здесь речь ндет о том, что • задачах оптимального управлении с операторными ограниченнвми (для простоты рас-
сматриваем лишь случай огравкчений-равенств) Jo(u) min, /i(u) = 0, u e T>, где Jo : Т> -+ К1 - мвннмизируемый функционал, /1 : U -t В - оператор, задающий ограничение, V - множество допустимых управлений, В - бесковечвомерное бдя ахово пространстио, вообще говоря, не верва импликация, согласно коюро! оптимально« управление е V в задаче на услонный экстремум удовлетворяет прннцнцу максимума в задаче "безусловной минимизации" функционала Лагранжа Л0/„М + (Ai,/i(u)) min, u 6 Р, А0 > 0, А, е ß', (А0, А,) 0.
Б[АТФ] Алексееи B.M., Тихомиров В.М., Фомин С.В. Оптвмальное управлевве. М.: Наука, 1979.
®[В1] Васильев Ф.П. Методы решении экстремальных задач. М.: Наука, 1981.
7Балакрвшиан A.B. Прикладной функциональный анализ. М.: Наука, 1980.
максимума в них и, более того, регулярного принципа максимума (т.е. с непулевым множителем, соответствующим функционалу качества) жестко связано с дифференциальными свойствами функций значений задач как функций параметра, аддитивно входящего в ограничение - наличие нормали в каком-либо естественном смысле к надграфику функции значений при некотором выбранном значении параметра гарантирует выполнимость в соответствующей задаче регулярного принципа максимума.
Сказанное выше служит мотивацией отказа в настоящей работе от традиционного требования выполнимости в задачах оптимального управления отмеченного выше обстоятельства (I) и рассмотрения, в контексте общей идеологии метода возмущений (см., например, [АТФ], С.263), задачи оптимального управления как элемента семейства задач, зависящих от параметра, аддитивно входящего в ограничение. Говоря конкретнее, мы рассматриваем задачу минимизации
(Ач) 10(и) —> тГ, /1(11) € М + <7, и &Т>, д € $ — параметр,
где Т> - полное метрическое пространство называемых управлениями элементов и с метрикой В - равномерно выпуклое банахово пространство с дифференцируемой по Фреше нормой, /о : ТУ —¥ И1 - непрерывный ограниченный снизу функционал, 1\ : Т) —> В - непрерывный оператор, М С В - выпуклое замкнутое (вообще говоря, без внутренних точек) множество. В соответствии со сказанным основным "объектом", подлежащим "нахождению", является м.п. - мипимизирующее приближенное решение (м.п.р.) в смысле Дж.Варги [В], т.е. последовательность элементов и' <Е Т>, ¿ = 1,2,..., такая, что
/о(и') </?(?) + *',
для некоторых последовательностей сходящихся к нулю неотрицательных чисел &', е', г = 1,2,..., где
/З(я) = (3+0(ч) = А(?). Ш = ™ЪМи)'
/Зе(д) ее +оо, если Ц = 0, VI = {и 6 V : р{Ь{и) ~ч,М)< е}, е > О,
р(-,М) - функция расстояния. Возникающая здесь функция /3 : В —> И1 и {+00} называется функцией значений задачи (Лд) и для нее спра^ ведливо неравенство /?(д) < /?о(?) V? € В, где Ро : В -4 Я1 - классическая функция значений. В связи с задачей (Л,), которая имеет вид абстрактной задачи минимизации с ограничением в банаховом пространстве, но аксиоматика которой нацелена прежде всего на задачи оптимального управления, и в связи с введенным понятием м.п.р. отметим следующие обстоятельства: (а) м.п.р. всегда существует; (Ь) функция значений /3, " согласованная"
именпо с понятием м.п.р. (а не с понятием классического оптимального управления) является, в отличие от функции значений ßo, всегда полунепрерывной снизу; (с) использование понятия м.п.р. позволяет записывать все результаты для задачи (^4,) в терминах расширенной задачи, если такое расширение возможно; (d) именно понятие м.п.р. существенно используется в теории численных методов оптимального управления, а также в теории задач оптимального управления с приближенно известными исходными данными; (е) понятие м.п.р. несет в себе регуляризирующее начало; (f) понятие м.п.р. является удобным с прикладной (инженерной) точки зрения (подробности см., например, в [В]).
Следует отметить, что различные аспекты теории оптимального управления, связанные с субоптимальностью и м.п., постоянно привлекали внимание исследователей (Дж.Варга, Р.Габасов, Ф.М.Кириллова, Б.Ш.Морду-хович, V.Barbu, I.Ekeland, H.O.Fattorini и др.). Однако практически до последнего времени все результаты работ по м.п. группировались лишь вокруг получения необходимых условий. В цикле работ H.O.Fattorini (см., например, работу8) изучались необходимые условия для м.п., а также вопросы сходимости м.п. для целого класса задач оптимального управления абстрактными полулинейными дифференциальными уравнениями в банаховом пространстве с терминальным ограничением и нефиксированным временем. В самое последнее время интерес к проблеме необходимых условий субоптимальности и для м.п. был проявлен авторами работы9 (см. также ряд последующих работ тех же авторов).
Полунепрерывность спизу функции значений ß является наиважнейшим обстоятельством в теории оптимального управления, т.к. позволяет "подключить" к исследованию оптимизационных задач интенсивно развивающийся в последние годы аппарат негладкого анализа, а, именно, анализа нормалей (проксимальных нормалей) к замкнутым множествам в банаховых пространствах и обобщенного дифферепцирования негладких функций в банаховых пространствах. Различные важные результаты по негладкому анализу были получены в работах целого ряда авторов (Б.Ш.Мор-духович, J.M.Borwein, F.H.Clarke, A.D.Ioffe, P.D.Loewen, R.T.Rockafellar, Y.Shao, H.M.Strojwas и др.). Именно использование негладкого нормального анализа и теории обобщенного дифференцирования полунепрерывных снизу функций позволяет рассматривать любую задачу оптимального управления "не изолированно", а как элемент семейства аналогичных задач и получать информацию "в целом" о семействе и, как следствие, во мпо-
'Pattorini Н.О. Conrergence of euboptimal controli: the point target caje // S1AM J. Control Optim. 1990. V.28. No.2. P.320-341.
'Mordukhovich B.S., Zhang K. Exiitence, Approximation, and Suboptimalit? Conditioni for Minimal Control of I It at T; an lir r Syttemi with State Conitraintt // Lecture Notei in Pure and Applied Mathematics Mucel DcLker, New York. 1994. V l60. P.251-270.
гих важных частных случаях о каждой конкретной задаче отдельно. Такой подход приводит к возможности изучения условий регулярности, нормальности, проблемы чувствительности для широкого класса задач оптимального управления, а также позволяет "сблизить" теорию необходимых условий (теорию принципа максимума) и теорию численных методов оптимального управления. При этом важно подчеркнуть, что первые результаты в этом направлении были получены в работах таких авторов как F.H.Clarke, P.D.Loewen (см., например, монографию10 и статью11) для задач оптимального управления системами обыкновенных дифференциальных уравнений. В этих работах были получены полезные представления для обобщенных градиентов в смысле Кларка функций значений в терминах множителей Лаграпжа. Однако в них рассматривались классические оптимальные управления и функции значений, а на задачи накладывались специальные условия для обеспечения полунепрерывпости снизу классической функции значений в окрестности рассматриваемого фиксированного значения параметра.
Рассмотрение задачи (семейства задач) (/19) дает возможность изучения широкого спектра различных классических вопросов теории оптимизации, к которым можно отнести: 1) необходимые и достаточные условия для м.п.р. (в частности, для обычных или обобщенных оптимальных упраг влений); 2) различные свойства регулярности, нормальности, их связь с множителями Лагранжа, с дифференциальными свойствами функции значений, с векторами Куна-Таккера; 3) свойства чувствительности; 4) негладкие задачи; 5) числеппые методы оптимального управления; 6) методы решения задач с приближенно известными исходными данными, регуляризация в задачах оптимального управления и др..
В результате "расшифровки" абстрактных результатов для задачи (Л,) в диссертации получаются конкретные результаты по указанным вопросам для распределенных задач оптимального управления системами, описываемыми линейными, полулинейными и квазилинейными параболическими, эллиптическими и гиперболическими уравнениями с различными функциональными и операторными ограничениями. При этом, несмотря на то, что целевое пространство задачи (Aq) является равномерно выпуклым, мы показываем как на основе этих результатов получаются результаты, связанные с перечисленными выше вопросами, также и для задач вида (Aq) с нерефлексивными целевыми пространствами.
Подытоживая сказанное, можно утверждать, что переход к рассмотрению м.п.р., представляющий собой в известном смысле "максимальное"
10[К] К л • [J I ф. Оотшпэаяпя ■ иеглалкя! аяалпэ. М.: Hay", 1988.
"Clarke F.H., Lotwtn P.D. The Value Function in Optimal Control: Seniitivitj, Controllability and Time-Optimality // SIAM J. Control Optim. 1986. V.M, No.J. P.243-S63.
расширение исходной задачи, находится в согласии с известным высказыванием Д.Гильберта [Я] о том, что "каждая задача вариационного исчисления имеет решение, если слово "решение" понимать подходящим образом". Понимая здесь под решением м.п., мы показываем, что основанная на этом понятии теория, обобщая традиционную, дает возможность получить новую полезную информацию о задаче, что вполне схоже с ситуацией, возникающей при переходе от обычных управлений к обобщенным [В], [Г].
Цель диссертационной работы. Цель работы состоит в разработке методов теории субоптимального управления распределенными системами, предназначенных для решения вопросов указанной теории, связанных с необходимыми и достаточными условиями на м.п., с различными свойствами регулярности и нормальности, с проблемой чувствительности, с негладкими задачами, с численными методами, с задачами с приближенно известными исходными данными.
Методы исследования. В диссертации использованы методы оптимизации, оптимального управления, негладкого анализа, обыкновенных дифференциальных уравнений и дифференциальных уравнений с частными производными, функционального анализа и теории функций действительного переменного.
Научная новизна. В диссертации разработаны основы математической теории субоптимального управления системами с распределенными параметрами. Показано, что на основе этой теории получаются новые для оптимального управления результаты, относящиеся как к собственно теории, так и к теории численных методов. Все результаты диссертации (главы 1-7) являются новыми.
Степень обоснования результатов диссертации. Все научные положения и выводы диссертационной работы строго математически обоснованы. Результаты, полученные в диссертации, хорошо согласуются с работами других авторов как отечественных, так и зарубежных.
Теоретическая и практическая ценность. Работа носит теоретический характер. Полученпые в ней результаты и методы могут быть применены в теории оптимального управления: 1) при теоретическом исследовании многих сложных конкретных задач с различного рода функциональными и операторными ограничениями; 2) при численном решении различных задач оптимального управления распределенными системами с помощью предложенных в диссертации двойственных численных методов.
Результаты диссертации вошли в отчет о НИР12, учебное пособие13 и
13Теорвя оптимального управления распределенными системами: субоптимальность, минимизирующие последовательности, численные методы. Отчет о НИР ио гранту Конкурсного центра при С.-Петербургском университете Госкомитета РФ по высшему образованию (Л1о93-1-71-19), Л/о госрегистрации 01 9.40006443.1994, 74 с.
1эНовоженов ММ., Сумин В И., Сум ни М.И. Методы оптимального управления системами математической физики. Учебное пособие. Горьки!: Изд-во ГГУ. 1986.-87 с.
были включены в спецкурсы, читаемые студентам Нижегородского государственного университета им. Н.И.Лобачевского.
Апробация работы. Результаты диссертации докладывались и обсуждались: на Международной конференции "Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде" (Екатеринбург, 2000); на Симпозиуме "Математическое моделирование в естественных и гуманитарных науках", посвященном 80-летию М.А.Красносельского (Воронеж, 2000); на Международной конференции, посвященной 90-летию со дня рождения Л.С.Понтрягина (Москва, 1998); на IV, VI, VII, VIII, IX, X, XI весенних воронежских школах "Понтрягинские чтения" (Воронеж, 1993, 1995, 1996, 1997, 1998, 1999, 2000); на Международной конференции ИФИП "Моделирование и оптимизация систем с распределенными параметрами с приложениями к инженерии" (Варшава, 1995); на III Всесоюзной школе "Понтрягинские чтения. Оптимальное управление. Геометрия и анализ" (Кемерово, 1990); на школе "Современные методы в теории краевых задач" (Воропеж, 1992); на XIV Всесоюзной школе по теории операторов в функциональных пространствах (Н.Новгород, 1991); на Первом Международном семинаре ИФАК "Негладкие и разрывные задачи управления и оптимизации" (Владивосток, 1991); на 1,11 Международных конференциях "Математические алгоритмы" (Н.Новгород, 1994,1995); на Международной научной конференции "Экстремальные задачи и их приложения" (Н.Новгород, 1992); на Всесоюзной конференции "Негладкий анализ и его приложения к математической экономике" (Баку, 1991); на Научной школе-семинаре "Разрывные динамические системы" (Ужгород, 1991); на Vil,IX Всесоюзных конференциях "Проблемы теоретической кибернетики" (Иркутск, 1985; Волгоград, 1990); на Всесоюзной конференции "Теория, методология и практика системных исследований" (Москва, 1985); на Итоговых научных конференциях Горьковского госуниверситета (1986-1990).
По теме диссертации были также сделаны доклады па семинаре по оптимальному управлению (ННГУ, рук. проф. В.И.Плотников, 1977-1988), на Волго-Вятском региональном семинаре по математической физике и оптимальному управлению (рук. проф. С.Ф.Морозов, 1990-1992), на семинарах в Московском государственном университете (рук. проф. Ф.П.Васильев, 1987, 1993, 2000; рук. проф. М.И.Зеликин, 2000; рук. проф. М.С.Никольский, 1988, 1990; рук. проф. А.В.Фурсиков, 2000), на семинаре в Институте математики и механики УРО РАН (рук. акад. РАН Ю.С.Осипов, чл.-корр. РАН А.В.Кряжимский, 1991,1993), насеминарев Институте проблем упра^ влепия (рук. проф. В.И.Уткин, 1986).
Результаты диссертации на протяжении ряда лет являлись составной частью результатов работы, выполняющейся при финансовой поддержке
различных научных Фондов:
1993 - 1994 г.г. - грант Международного Научного Фонда (фонд Дж.Сороса) и Российской Академии Естественных Наук (РАЕН);
1993 - 1995 г.г. - грант Конкурсного центра при С.-Петербургском университете Госкомитета РФ по высшему образованию (проект Л/Ь 93-1-7119), тема "Теория оптимального управления распределенными системами: субоптпмальность, минимизирующие последовательности, численные методы" ;
1995 - 1997 г.г. - грант Российского Фонда Фундаментальных Исследований (проект Л/о 95-01-00701), тема "Теория субоптимального управления распределенными системами и функциональные вольтерровы уравнения";
1998 - 2000 г.г. - грант Российского Фонда Фундаментальных Исследований (проект А/о 98-01-00793), тема "Теория субоптимального управления распределенными системами: минимизирующие последовательности, операторные ограничения, граничные управления, численные методы".
Публикации. Все результаты, вошедшие в диссертацию (главы 1 -7), являются новыми, изложены в работах [1] - [36] и целиком принадлежат автору диссертации. В трех совместных с В.И.Плотниковым работах [1, 3, 5] рассматривались лишь необходимые условия, причем только для классических м.п., т.е. для м.п. управлений, удовлетворяющих ограничениям в точном смысле. Из этих, по сути дела, первых работ по м.п. в оптимальном управлении автором используется лишь общая идея перехода в распределенных задачах оптимального управления к рассмотрению в качестве "базового элемента" теории именно м.п., а не оптимального управления. В диссертации же в качестве "базового элемента" используется м.п.р. в смысле Дж.Варги. Это позволило построить совершенно новую теорию субоптимального управления и рассмотреть при этом весьма широкий спектр оптимизационных вопросов, изучение которых было бы совершенно невозможно в рамках классических м.п..
В двух других совместных с В.И.Плотниковым работах [2, 4], а также в двух совместных работах с С.Ф.Морозовым [7, 11] авторами были предложены методы получения необходимых условий оптимальности в негладких (разрывных) задачах оптимального управления, одними из составных частей которых являются процедуры сглаживания исходных данных. Эти процедуры сглаживания, в равной мере принадлежащие авторам указанных работ, используются в главе 5 для изучения новых вопросов, совершенно не затрагиваемых в указанных совместных статьях.
В совместной с В.И.Сумипым работе [21] содержатся результаты, иллюстрирующие эффективность предлагаемых в диссертации методов и показывающие возможность их применения и к такому достаточно широкому
»
кругу задач субоптимального управления распределенными системами, как задачи, описываемые так называемыми функциональными вольтерровыми уравнениями, теория которых разрабатывается в работах В.И.Сумина. Все результаты [21], связанные со свойствами регулярности, нормальности, чувствительности и т.п., получены методами, разработанными автором диссертации. При этом, естественно, использовались результаты, связанные с существованием и устойчивостью решений указанных уравнений, принадлежащие В.И.Сумину.
Структура и объем диссертации. Диссертация состоит из введения, 7 глав и списка литературы. Содержание изложено на 350 страницах, включая список литературы из 255 наименований.
Содержание диссертации
Во введении обсуждаются актуальность темы диссертации, новизна полученных результатов, их теоретическая ценность, а также кратко излагав ется содержание работы.
Первая глава диссертации полностью посвящена изучепию абстрактной задачи минимизации При получении абстрактных необходимых условий (суб)оптимальности и представлений для субдифференциалов функций значений указанная абстрактная задача каждый раз на определенном этапе трансформируется в задачу минимизации на некотором полном метрическом пространстве функционала типа максимума от конечного числа "обычных" (в смысле существования первых вариаций) функционалов. Поэтому п. 1.1 посвящен доказательству обобщенного правила множителей для (суб)оптимальных элементов в такой задаче.
В п.1.2 непосредственно рассматривается аксиоматика абстрактной параметрической задачи Использование в качестве множества допустимых элементов полного метрического пространства объясняется тем, что одним из основных инструментов в теории субоптимального управления является вариационный принцип Экланда14. Выбор в качестве целевого в задаче (Л,) равномерно выпуклого пространства с дифференцируемой по Фреше нормой обусловлен двумя моментами. Во-первых, т.к. равномерная выпуклость пространства обеспечивает его строгую нормирован-ность, то проекция точки на выпуклое замкнутое множество в этом случае существует и единственна, что в совокупности с дифференцируемостью нормы приводит к непрерывной дифференцируемости по Фреше для любого выпуклого замкнутого множества М С В выпуклой функции (функционала) расстояния р(-,М) в окрестности любой точки д £ В такой, что р(д,ЛЛ) > 0. Во-вторых, равномерная выпуклость позволяет нам считать В
"[Е] ЕЫи<| I. Он 1Ъе Угг1»Иов>1 Рпвйр|( // ]. Ма(Ь. Ап>1. Арр1. 1974. У.47. Ыо.З. Р.ЗМ-ЗЫ.
пространством Асплунда15, что, в свою очередь, позволяет применять для изучения задачи (Ая) как эффективные методы негладкого секвенциального анализа для таких пространств, развитые в последние годы в работах таких авторов как Mordukhovich В.S., Shao Y.(см., например, монографию16 и работу17), так и различные другие эффективные методы негладкого проксимального анализа для замкнутых множеств в банаховых пространствах. Особо оговоримся, что часть основных результатов настоящей работы так или иначе используют понятия нормалей и субдифференциалов именно в смысле работ [M], [MS], т.к., с одной стороны, в этих работах развито весьма полное и удобное субдифферепциальное исчисление, а с другой, как известно18, именно эти, вообще говоря, невыпуклые конструкции негладкого анализа являются, в известном смысле, наиболее "тонкими" по сравнению с другими аналогичными конструкциями (см. также19, С.90).
Любой метод получения необходимых условий оптимальности предполагает прежде всего решение двух основных проблем. Одна из пих заключи ется в эффективном вычислении первых вариаций функционалов оптимизм циопной задачи, другая же - в "учете" ограничений задачи. Можно утверждать, что предлагаемый в работе подход к получению необходимых условий для м.п.р. (условий (суб)оптимальности) и представлений в терминах множителей Лагранжа для субдифференциалов dß(q), dcoß(q) в смысле [М], [MS], в своей основе для решения двух отмеченных проблем стирается на два хорошо известных в теории оптимального управления подхода. Для подсчета первых вариаций функционалов в конкретных задачах применяется идея В.И.Плотникова20 использования для этой цели линейных интегральных представлений их приращений. Для учета же ограничений задач применяются различные модификации метода Ф.Кларка21, заключающегося в сведении задачи с ограничениями к задаче минимизации функ-циопала. типа максимума с применением вариационного принципа Экланда [Е], необходимые условия в которой получены в п. 1.1.
Аксиоматика задачи (Aq) предполагает наличие линейного пространства "параметров варьирования" M с элементами m и отвечающих каждому управлению и G Т> "своих" выпуклого множества Ми С М, числа аи,т > 0 и непрерывного отображения - вариации управления NUim : [0, au,m] -+ Z>,
'^Напомним, что пространством Асплунда называется банахово пространство ва котором всякв1 непрерывны! выпуклы! функционал всюду плотно дифференцируем по Фреше
16[М] Мордукович Б.Ш. Методы аппроксимапи! в задачах оптимизации и упраилеиия. M : Наука, 1988.
17[MS] Mordukhovich B.S., Shao Y. Nonimooth Sequential Analyiit in Aiplnnd Spacei // TYant. Amer. Math. Soc. 1996. V.346. No.4. P.1235-1280.
18Ioffe A.D. Approximate Sob differential and Application!. I: The Finite Dimeniional Theory // Tr an i Amer. Math. Soc. 1984. V.281. P.389-416.
19Тихомнрои В M. Выпуклы! анализ // Итоги науки и техники. ВИНИТИ. Соиремеяные проблемы математики, фундаментальные направления. 1987. Т.Н. C.5-101.
30Плотпикои В.И. Необходимые и достаточные условия оптимальности и условия единственности оптимизирующих функций для упраиляемых систем общего вида // Изв. АН СССР, сер. матеи. 1972. Т.36. А^оЭ. С 652-679.
"Clark. P H. A New Approach to Lagranga Multipliera // Math. Oper. R*|. 1976. V.l. No.2. P165-174.
N„,m(0) = и. Приняв обозначения Фо(и) = q) = p{Ii(u) — д,М),
запишем первую из аксиом - аксиому существования первых вариаций:
для некоторой функции с : [0,1] -> R\, с(0) = 0, ?(а) > 0 при а > О, существуют пределы
¿Ф0(и,т) = lim -i-(í0(Nu,m(a)) - Ф„(и)) Vu е V, т е MU) 69,(«, т;р) = lim -^-(í,(Nu,m(a)1?) - Ф,(в, д))
а->о <;(а)
Vu е Т> такого, что Фi(u,q) > 0, m 6 М„, р= dp(I\(u) — q,M). Ее главное отличие от аналогичных аксиом абстрактных схем других авторов (А.С.Матвеев, В.И.Плотников, В.А.Якубович, H.O.Fattorini и др.) заключается в постулировании факта существования не предела &1\ (и, т) = lim(/i(Num(a)) — /](и))/?(а) € В как элемента целевого пространства В, а числового предела ¿Ф](и, т;р), в котором "учитывается" одновременно посредством функции расстояния р(-,М) и ограничение p(/i(i¿) — q,M) — 0. В конкретных задачах с учетом дифференцируемости по Фреше функции расстояния р(-,М) в окрестности точек q таких, что p(q,M) > 0 (см. выше) вычисление первой вариации ¿Ф] (u, т; р), как правило, существенно проще подсчета традиционного предела SJi(u, m). В то же время, градиент р = др(1] (и) — q,Ai) в конечном итоге "трансформируется" в множитель Лагралжа (функциональный, если В - функциональное пространство), отвечающий операторному ограничению 1\(и) 6 М + q.
Вторая аксиома постулирует "нужные" и согласованные с варьированием управления дифференциальные свойства метрики d метрического пространства управлений (подобные аксиомы в схемах других авторов не использовались). Третья - обеспечивает традиционную "линейность" первых вариаций функционалов Фо, Ф1 по параметрам варьирования т.
Далее, т.к. метод получения необходимых условий для м.п.р. в задаче (Ая) предполагает использование предельного перехода в семействах необходимых условий для некоторых промежуточных оптимизационных задач, то следующие две аксиомы как раз и представляют собой аксиомы предельных переходов по и и q в семействах первых вариаций 5Фо, ¿Фь Первая из них, которую можно назвать аксиомой сильного предельного перехода, постулирует непрерывность первых вариаций в метриках пространств "D, В: сильная сходимость и' —> u, q' —> q, i 00 в случае Фi (и, q) > 0 (для ¿Фi) и, как следствие, сильная сходимость р' = др{1\(и') — q', М) б В* к р = др(1\(и) — q, Л4) б В*, влечет сходимость первых вариаций ¿Фо, ¿Фь
Вторая аксиома предельного перехода, которую условно можно назвать аксиомой слабого предельного перехода, постулирует возможность аналогичного предельного перехода при и' —>■ и, q' q, i оо, в метриках "D
и В в случае Фi(u,q) — 0, т.к. для таких (и, g) первая вариация <5Ф] вообще не определена. В этом случае р' = др(1\{их) — q\M) G В' сходится к некоторому элементу р б В' лишь слабо и аксиома показывает как надо понимать предельный переход в семействе первых вариаций в ситуации когда и — и0 является оптимальным управлением, удовлетворяющим равенствам Jo(u») =/?(?), p(I1(u°)-q,M) = 0.
И, наконец, последняя аксиома (ее можно назвать аксиомой компактности) предполагает, что множество {/i(u) : и € 2?, /о(и) < С1} есть компакт в В при любом С, при котором оно не пусто. Это условие является естественным для задач оптимального управления и выполняется во многих наиболее интересных конкретных задачах с различными ограничениями.
П.п.1.3, 1.4 посвящены доказательству различных вариантов необходимых условий для м.п.р. в задаче (Ая). Эти и подобные им абстрактные результаты для задачи (Л?) мы называем также абстрактными принципами максимума для м.п.р., т.к. именно в результате их "расшифровки" получаются принципы максимума для м.п.р. в конкретных задачах оптимального управления. В частности, в п.1.3 показывается, что, если выпуклое замкнутое целевое множество M является достаточно "богатым", т.е. удовлетворяет некоторым дополнительным условиям (например, в случае гильбертова прострапства В достаточно, чтобы M имело в соответствии с терминологией22 конечную коразмерность23), то любое м.п.р. в задаче (Л?) при q G dom/З удовлетворяет абстрактному принципу максимума. В то же время, в п.1.4, в свою очередь, в частности, показывается, что аналогичный принцип максимума, причем в регулярной форме (т.е. с ненулевым множителем, отвечающим функционалу качества) сохраняет свою силу для любого м.п.р. без дополнительных условий на М, но естественно не для любого q Ç dom/З, а лишь для тех из них, для которых не пуст субдифференциал Фреше d/3(q), понимаемый в смысле [M], [MS]. Более того, здесь же получаются и представления для субдифферепциала df3(q) и сингулярного субдифферепциала d°°/3(q) в смысле [M], [MS] в терминах множителей Лагранжа (точнее, в терминах слабых предельных точек последовательностей таких множителей), связывающие дифференциальные свойства функции значений f3 с множителями Лагранжа.
В п.1.5 на основе результатов п.п.1.3, 1.4 доказываются различные общие свойства регулярности, нормальности, чувствительности для абстрактной задачи (Л,). И, наконец, заключительный п.1.6 главы 1 посвящен доказательству абстрактных принципов максимума для так называемых экстре-
"Fattorini И.О. A Unifled Thcoty of Nccctf ary Conditioni for Nonlinear Noncoirrex Control Syitemi // Appt. Math. Optim. 1987. V.15. Р.Ш-185.
"Мы говорвм, что ывожество M С В шест конечную кораемерность, если существует ваккнутое подпространство H с В конечно! коразмерности такое, что множество Jl^conuМ) имеет непустую ввутревность в Н, где П оевачаат ортогональное проектвроваиве В на И.
мальных последовательностей. При этом понятие экстремальной последовательности является естественным обобщением в случае субоптимальной теории такого классического понятия как экстремальное управление.
Глава 2 посвящена рассмотрению на основе абстрактных результатов главы 1 задач (суб)оптимального управления параболическими уравнениями [17] - [20], [22, 23], [25] - [31]. В п.2.1 рассматриваются задачи с фиксированным и нефиксированным временем (без варьирования времени) и с ограничением типа включения в конечномерное множество. Проиллюстрируем его результаты на примере классической задачи с равенствами и неравенствами (в упрощенной постановке)
(Pq) /0(и) inf, /i(u) € М + q, u€ V, q € ß = Rx, q - параметр,
где h{u) = (Ji(u),... , Jx(u)), q = (qu . .., qx),
Ji(u) = JnGi(x,z[u](x,T))dx, i= 0,1,...,ae, Ia{u) = J0{u),
D = {u€ Loo(Qt) ■ u(x, t) € U п.в. на <?т}> V С ßm - компакт, П - ограни-челная область в Л", М = М- = {х = (xj,..., хх) 6 R* : х\ < 0,..., xXl < O.Xa^+i = 0, ....Ха = 0), z[u] 6V2°(Qt) " соответствующее управлению и слабое решение в смысле24 первой краевой задачи для линейного параболического уравнения с дивергентной главной частью (считаем здесь без ограничения общности, что v 6 Ltx,(i2) фиксированная функция)
z, - ^~(a,j(x, t)zx>) + Ь,(х, t, и(х, t))zXl + а(х, t, и(х, t))z + f{x, t, u{x, t)) = 0,
(1)
z(x, 0) = v(x), x eil, z(x, t) = 0, (r, t) e ST.
При некоторых естественных для теории оптимального управления предположениях здесь показывается, что для задачи (Pq) справедлива вся аксиоматика п.1.2.. Обозначив Н(х, t, z,p, и, г/) = —ч(Ё bi(x,t,u)p, + a(x,t,u)z +
1=1
f(x, t, и)), введем
Определение 1. Последовательность и' € Т>, 1 = 1,2,..., назовем стационарной последовательностью (с.п.) в задаче (Pq) с М = М-, если и' € PJ* и существует ограниченная последовательность векторов ц' G R*+1, i = 1,2,..имеющая только ненулевые предельные точки
,4 > 0, ¿ = 0,1,...,»,, 4Ш«')~Як)> "У, ¿ = 1,2,...,аеь
такая, что ß[u] = (г[и]> гЛиШ
/ шах{(Я(х, t, t),v, г,[и'](х, t))-
jWt vzu
И[ЛСУ] Jluumiui O.A., Соловавков В.А., Уриши H.H. Jlinlliu ■ вва1алаа<|аы* урааааваа вараболачивого тваа. М.: Науаа, 1967.
Н{х, (, ¿), и'(х, «), ()))} ¿хМ < у, V > О, У О, I' оо,
О
где г?[и'] (Ят) решение при и = и' сопряженной задачи
- + и(х, ¿))г?) + а(г, и(х, ¿»т/ = О,
г?(г,т) = -£ ^УД^.фКх.Т)), г 6 П; 4(^,0 = о, (х, *) € 5Г.
*=о
Определение 2 С.п. в задаче (Рч) и* € "Щ, х = 1,2,..., У > 0, У -»■ 0, I —>• оо, называется нормальной (регулярной, анормальной), если все (существуют, не существуют) соответствующие последовательности ц\ I — 1,2,..., имеют (имеющие, имеющие) предельные точки (х лишь с компонентой ца ф 0 (лишь с компонентой уц ф 0, с компонентой цо ф 0 ). Задача (Рч) называется нормальной (регулярной, анормальной), если все ее (в ней существуют, все ее) стационарные последовательности нормальны (являющиеся регулярными, анормальны).
Следами соответствующих абстрактных результатов п.п.1.4, 1.5 в задаче (Рч) с М — М- являются, например, следующие результаты, для формулировки которых определим предварительно множества множителей
Ь\ = {-(¿£1,...,^) € Яж : (1 = (цо, Ш, е Яж+\ у. ф 0, ц0 = А,
существует стационарная в задаче (Р?) с М = М- последовательность управлений, для которой соответствующая ей согласно определению 1 последовательность векторов д', » = 1,2,..., имеет вектор /х своей предельной точкой}, Л = 0,1; = Ь\ и{0}, М\ = Ь]. Теорема 1 Любое м.п.р. в задаче (Ря) является с.п.. Пусть далее д(3(д), /?(<}), - соответственно субдифференциал, син-
гулярный субдифференциал и субдифференциал Фреше функции (5 в смысле [М], [МБ].
Теорема 2 Пусть /?(?) < +оо. Тогда
др(д) = др{ч)^м\, = М°я.
Лемма 1. Если < оо и = {0}, т.е. задача (Рч) нормальна, то функция Р является липшицевой в окрестности ц.
Лемма 2. Если ф 0, то в задаче (Рч) имеются регулярные м.п.р..
Если же дР(д) ф 0, то все м.п.р. в задаче (Рч) являются регулярными. Лемма 3. Множество точек ц € <1от(3, для которыг в задаче (Рд) все м.п.р. регулярны, всюду плотно в ¿отР.
В то же время, можно утверждать, что в случае, если задача (Ря) с М = М- не содержит ограничений типа равенства, то утверждение леммы 3 можно существенно усилить. А, имепно, справедлива
Лемма 4. Если задача (Рч) с М = М,- не содержит ограничений типа равенства, т.е. ?В\ = ав, то при п. в. q € dorn ß все м.п.р. в задаче являются регулярными, т.е., другими словами, свойство, согласно которому все м.п.р. в задаче с неравенствами регулярны, является свойством общего положения для q £ domß.
Лемма 5. Если функция ß липшицева в окрестности q, то в каждой точке этой окрестности в задаче (Pq) существуют регулярные м.п.р.. Лемма 6. Если в задаче (Pq) имеет место неравенство ß(q) < ßo(q), то любая последовательность и', i = 1,2,..., удовлетворяющая соотношениям 1й(и') -)■ ß € [ß{q),ßo(q)l /о(«О < А>(?) + £*, и< 6 е' 0, : оо, является с.п., а в случае ß € \ß(q),ßo{q)) не является нормальной см. в задаче (Рч).
Следствие 1 Строгое неравенство ß(q) < А>(<?) е задаче (Pq) не может выполняться, по крайней мере, в двух следующих случаях: 1) задача нормальна; 2) в задаче имеется нормальное м.п.р..
Лемма 7. Если ц € Л = {А € R* : Ai > О,..., А*, > 0} есть вектор Куна-Таккера в задаче (Рч), т.е. ß(q) < Jo(u) + £ — ?*) Vu 6 Т>, то
И, наконец, завершим перечисление свойств регулярности, нормальности задачи (Pq) с равенствами и неравенствами формулировками трех заключительных лемм, не вытекающих непосредственно из результатов п.1.5, первые две из которых являются обобщениями на случай субоптимального управления классических условий нормальности из математического программирования (речь идет об условиях Слейтера и линейности), а третья -связывает субдифференциал dß(q) в смысле [М], [MS] функции значений с векторами Куна-Таккера и дает точное представление для него в терминах множителей Лагранжа в "линейно-выпуклой" задаче (Pq)-Лемма 8. Пусть в задаче (Pq) отсутствуют ограничения типа равенства, то есть ае = ав], а исходные данные имеют вид: bi(x,t,u) = bi(x,t), i = 1 ,...,п, а(х, t, и) = a(x,t), Gi(x,z) = Gj(x, z) + Gj(x), i= l,...,ae, функции G} выпуклы по z. Если при этом существует и0 6 "D, для которого Ji(u°) < qi, i = 1,..., ае, то задача (Pq) нормальна. Лемма 9. Пусть в задаче (Рч) функции bi(x,t,u),i = 1,...,п, a(x,t,u) такие же, как в предыдущей лемме, G;(х, z) = G](x)z+G?(х), i = 1,..., ае, и существует последовательность и' € ¿PJ , t = 1,2,..., У > 0, У -> 0, i оо, не являющаяся с.п.. Тогда задача (Рч) нормальна. Лемма 10. Пусть задача (Рч) линейно-выпукла (bi(x,t,u) — bi(x,t),i = 1,... ,n, a(x,t,u) = a(x,t), Gi{x,z) = G}(x,z) + Cftx), i = 1,...,аеь функции Gj выпуклы по z, Gi(x, z) = G}(x)z + G?(x), t = aej + 1,..., ae^ и Kop-
мальна. Тогда имеет место равенство d(3(q) — Mq — —Mq, где Mq -множество всех векторов Куна-Таккера задачи (Pq).
Изучение задачи (Pq) с фиксированным временем заканчивается рассмотрением конкретных иллюстративных примеров.
П.2.2 посвящен частному случаю задачи п.2.1 с нефиксированным временем, в котором, однако, оказывается возможным его варьирование. Здесь сделан ряд достаточно жестких предположений об исходпых данных задачи, предназначенных именно для обеспечения предельных переходов, связанных с варьированием времени. Эти дополнительные предположения в теории оптимального управления распределенными системами весьма ограничительны, но без них подсчет первых вариаций функционалов при варьировании времени сталкивается с принципиальными трудностями, обусловленными "недостаточно хорошими" свойствами производных от решений прямых и сопряженных задач в случае "общих" условий на исходные данные. В п.2.2 последовательно проверяется справедливость аксиоматики "абстрактного" п.1.2 и формулируется принцип максимума для м.п.р., который благодаря вариации времени, в отличие от ситуации п.2.1, заведомо не вырождается в важном частном случае задачи быстродействия.
В отличие от п.п.2.1, 2.2, в п.2.3 рассматривается задача (суб)оптималь-ного управления параболическим уравнением с нефиксированным временем, а также с операторным ограничением типа включения в функциональное множество и с граничным управлением
(Pq) /0(7r,T)-+inf, h(тг,T)eM + q, (тг,T)ev, деВшЬ2(П),
где q - параметр,
/о(тг,Т) = jnG(x,z[*,T](x,T),v(x),T)dx + fs^(S,t,w(S,t),T) dsdt,
1г(ж,Т) = г[п,Т](;Т),
тг = (u,v,w) € VT, VT = Vj x V2 x Vj, Vf = {u 6 MQr) : u{x,t) G U п.в. на Qt}, Т>2 = {v е Loo(iî) : v(x) G V п.в. на fi}, T>J = {w G L^Sj) : w(x, t) G W п.в. на ST}, U С Rm, V С Л1 - компакты, W С R1 - выпуклый компакт, fi С R" - ограниченная область с кусочно гладкой границей, V = {(эт, Т) : 7г G VT, Т > 0} - множество четверок управляющих параметров, M С .¿^(fi) - выпуклое замкпутое множество, г[тг,Т] G V2lfl(QT) - соответствующее четверке (ж, Т) слабое решение в смысле [ЛСУ] третьей краевой задачи для линейного параболического уравнения с дивергентной главной частью (1) с краевым условием третьего рода
dz
z(x, 0) = «(ж), x G fi, —+ о(х, t)z = ю(х, t), (x, t) G ST.
Здесь опять же при некоторых естественных для теории оптимального управления условиях на исходные данные задачи (Р?) последовательно проверяется выполнимость абстрактной аксиоматики п. 1.2 и формулируются соответствующие результаты, спектр которых, естественно, несколько сужается по сравнению с задачами с конечномерным целевым пространством. Здесь показывается, в частности, что любое м.п.р. (любая оптимальная четверка (7г°,Т°), /о(тг0,Т°) = ß{q)) в случае произвольного выпуклого замкнутого М при условии непустоты субдифференциала Фреше dß(q) ф 0 является регулярной с.п. (удовлетворяет регулярному принципу максимума). Множество же тех элементов q 6 dorn ß, для которых это имеет место, всюду плотно в dorn ß.
Более того, оказывается справедливым полностью аналогичный результат и в случае задачи (Pq) типа задачи быстродействия (G(x,z,v,T) = Т, Ф(x,t,w,T) = О, М = {0}i,j(n)): для любой постоянной С > 0 множество тех элементов q € U^/](Х>Т,Т), для которых любое м.п.р. в задаче быстродействия (Pq) удовлетворяет принципу максимума с неравным нулю предельным функциональным множителем Лагранжа (с неравным нулю функциональным множителем Лагранжа в случае существования отималь-ной четверки (7г°,Т0)), всюду плотно в ^U^ Ii(T>T,Т).
Здесь же отмечается, что в отличие от задач с конечномерными целевыми пространствами в задачах с фазовыми поточечными ограничениями типа неравенства в случае равномерно выпуклых бесконечномерных целевых пространств условия типа условий Слейтера и линейности, вообще говоря, уже не являются условиями нормальности, т.к. в таких задачах сам принцип максимума может не быть справедливым. Однако указанные условия можно назвать условиями так называемой условной нормальности, что, например, в случае задачи (Pq) с фиксированным временем с М — {у 6 ¿2(ß) : у{х) < 0 п.в. на fi}, b,(x, t, и) — b,(x, t), а(х, t, и) — а(х, t), как показано в п.2.3, означает (применительно к условию Слейтера), что в пей могут существовать только нормальные с.п., если существует такая тройка п G что выполняется условие Слейтера г[тг](х,Т) < 0 при п.в. г € П. В то же время, легко сообразить, что в задачах типа задачи (Pq) с бесконечномерным целевым пространством и с "бедным" множеством М нормальность задачи уже не влечет автоматически липшицевость функции значений. Здесь под "бедным", например, в случае целевого гильбертова пространства В понимается множество, не являющееся множеством конечной коразмерности. В заключение п.2.3, приводятся примеры, иллюстрирующие приведенные выше факты, связывающие выполнимость принципа максимума с дифференциальными свойствами функции значений.
В главе 3 рассматриваются задачи (суб)оптимального управления для
квазилинейных и полулинейных эллиптических уравнений как с фазовыми, тале и со смешанными ограничениями. При этом мы рассматриваем фазовые ограничения и в равномерно выпуклом пространстве (что представ вляется вполне естественным во многих задачах оптимального управления распределенными системами) и в "более привычном" для подобных задач пространстве непрерывных функций с равномерпой метрикой. Конечно, задачам оптимального управления с фазовыми ограничениями посвящено большое количество разнообразных работ. Среди них следует в первую очередь отметить ставшие уже классическими работы по фазовым и смешанным ограничениям в задачах оптимального управления обыкновенными дифференциальными уравнениями А.В.Арутюнова, А.В.Дмит-рука, А.Я.Дубовицкого, А.А.Милютина и др.. В последние 10-15 лет получила интенсивное развитие и теория задач оптимального управления с фазовыми ограничениями для распределенных систем (А.С.Матвеев, J.J.Ali-bert, J.F.Bonnans, Е.Casas, J.P.Raymond и др.). В то же время, условия на м.п. и связанные с этим вопросы регулярности, нормальности, чувствительности для задач оптимального управления параболическими и эллиптическими уравнениями с фазовыми ограничениями ранее, по-видимому, не рассматривались [32] - [34], [36]. Здесь же приводятся иллюстративные примеры, говорящие о существенности получаемых результатов.
В п.3.1 изучается задача с фазовым ограничением
(Рч) /о(тг)inf, /1(7r)eM + q, ireV, q€B=Lp(X), q - параметр, где
/о(тг) = /п F(x, *[*](*), *.[*](*), «(я), v(s)) dx, 7,(тг) = G(-, ф](-)),
M С Lp(X) - выпуклое замкнутое множество, 1 < р < 2п/(п — 2), X С íT - компакт, представляющий собой замкнутую подобласть ограниченной области ÍÍ С FC (в частности, X может совпадать с П), V = Т>\ X Т>2, V¡ = {и € ¿oo(fi) : u(.r) € U п.в. на П}, V2 = {v е L^Sl) : v(x) € V п.в. на П}, U С Rm - компакт, V С R1 - выпуклый компакт, z[ir] - соответству-
ющее паре 7Г = (к, v) 6 "D слабое решение в смысле25 задачи Дирихле для квазилинейного эллиптического уравнения с дивергентной главной частью
-^-аЛх, z,zx,v(x)) + a(x,z, zx, и(х)) = 0, z(x) = 0, х € S. axi
Замена целевого пространства Ь2(П) (см. аналогичную задачу для пара^ болического уравнения п.2.3) па LP(X) с указанными границами изменения показателя р, связана, во-первых, с классическим фактом вложимости
о
W^íí) в Lp(Sl) с р € [1,2п/(п— 2)) и, во-вторых, с естественным желанием
ЗВ[ЛУ] Падыжеискав О.А., Уральпава 11.!! Лввсйвыс в квазвлвяейвыс уравнена! аллнптвческого твва. М.: Наука, 1973.
иметь существенно более широкий выбор возможных функций Р, в. Важно отметить, что в подобных задачах оптимального управления с достаточно общими условиями на исходные данные в качестве целевого пространства В, вообще говоря, не вполне естественно брать пространство С(Х), т.к., как показано в [ЛУ], Гл.1, §2, для эллиптических уравнений с общего вида условиями на порядки роста "коэффициентов" далеко не всегда является естественным требование принадлежности решений классам С°(П) с а > 0.
В п.3.1 при весьма общих условиях на порядки роста по г, гх функций, задающих исходные данные задачи (Ря), показывается выполнимость в задаче абстрактной аксиоматики п. 1.2 и формулируются принципы максимума для м.п.р. (для оптимальных управлений), по своей сути вполне аналогичные принципам максимума п.2.3, в случаях: 1) тЬМ ф 0; 2)
ьт Ф е.
Отдельно следует сказать о следующем важном обстоятельстве. В отличие от аналогичной задачи п.2.3 для параболического уравнения, здесь для подсчета первых вариаций функционалов Фо> применяются так называемое двухпараметрическое импульсное (игольчатое) варьирование [15, 16] управления и(-) ж соответствующие повторные предельные переходы, возможность применения которых заложена в альтернативной аксиоматике "абстрактного" п.1.2, связанной именно с двухпараметрическим способом варьирования. Это объясняется достаточной общностью задачи и невозможностью при сделанных общих предположениях об исходных данных "вложить" решения прямой и сопряженных задач в "подходящие" для традиционного вычисления первых вариаций гельдеровские классы Са(П) с а > 0.
В п.3.2 рассматривается формально частный случай задачи п.3.1 {Рч) 1о(и)->М, Ы^еМ + я, иет>, деС(Х) = В, д - параметр, где
/0(и)= ¡пР(х,г[и](Х),и{х))<1х, 1г(и) = 2[и](-)),
М С С{Х) - выпуклое замкнутое множество всех непрерывных неположительных функций па X, X С П - произвольный компакт, П - ограниченная область в Я" с липшицевой границей, Т> = {и 6 ¿оо(^) : 6
о
и п.в. на Я}, и С Л"1 - компакт, г[и] €1Уз(П) - соответствующее управлению и € Т> слабое решение в смысле [ЛУ] задачи Дирихле для полулинейного эллиптического уравнения с дивергентной главной частью
,) + а(г, *,«(*)) = 0, г(х) = 0, х € 5. (2)
Условия на исходные данные задачи (Р„) традиционно обеспечивают существование и единственность решения г[и] для любого и 6 2?, а также их
вложимость в гельдеровский класс Са(П) с а > 0. Однако принципиальное отличие этой задачи от предыдущей заключается в том, что целевое пространство в ней есть пространство С(Х), т.е. не является рефлексивным, а, стало быть, и равномерно выпуклым.
В связи с этим мы естественно не можем напрямую применить к этой задаче абстрактные результаты п.п.1.4 - 1.6. Тем не менее, мы показываем как абстрактные результаты этих пунктов могут быть использованы и при исследовании классических оптимизационных задач с нерефлексивными целевыми пространствами. Мы делаем это па основе двух подходов. В основе первого подхода лежит метод [9] аппроксимации исходной задачи с фазовым ограничением или, другими словами, задачи с бесконечным числом функциональных ограничений, последовательностью задач с конечным числом функциональных ограничений
(P¿) /о(и) inf, Il(u) 6 Mk+q\ и 6 V, qk € & - параметр, где Мк = {ук € & : y¡ < 0,..., у» < 0}, 1к(и) = (/*(и),..., /¿(и)), Ik(u) ее
Хк= {xk,i.. ,xk'lt} СХ - конечная 1 /к сеть компакта X, XkCXk+i, к — 1,2,. .., X - счетная всюду плотная сеть компакта X. Оказывается спра/-ведливой следующая аппроксимационная
Лемма 11. Пусть (3(q) < оо, q 6 С(Х). Тогда существует последовательность векторов qk € R1', к = 1,2,..., такал, что Рк{як) /?(?)> к ~+ оо. В качестве такой последовательности может быть взята последовательность qk = . . . ,q¡t), qk = q(xk,')> i = 1, ...
Таким образом, в силу леммы 11, полезной и с точки зрения численных методов, мы аппроксимируем исходную задачу задачами с конечномерными целевыми пространствами R,k, к каждой из которых могут быть применены все абстрактные результаты п.п.1.3- 1.5 подобно тому как это сделано в параболическом случае в п.2.1. На основе указанной аппроксимации и последующего предельного перехода в получаемых результатах при стремлении количества ограничений к бесконечности получаются различные результаты, связанные необходимыми и достаточными условиями для м.п.р., с условиями регулярности, нормальности, со свойствами чувствительности в исходной задаче. Для перечисления некоторых из них введем следующее Определение 3. Пусть ¡3(q) < оо. Последовательность и' 6 Т>, з = 1,2,... назовем стационарной последовательностью (с.п.) в задаче (Ря), если и' з = 1,2,..., и существует ограниченная последователь-
ность пар (fig, А'), цq > О, А* € M(il) = Со (П) fCo(Ü) - пространство всех непрерывных функций на Í1, зануляющихся на dílj, fiJ + |А'| ф 0, имею-
щая только ненулевые предельные (в *-слабом смысле для второй компоненты) точки (/¿о, А) Ф 0, с положительной мерой A', Jx{G(x, z[u*](x)) — q(x)) X'(dx) > —у', такая, что
JQ тах{Я(х, z[u'](x), v, i>'(x),fi'a) - H(x, 2[u'](x), u'(x), ф'{х), fi'0)} dx < 7',
где ф'(х) = = /^rfofii'Kx) + J?'[u'](x), Vo[u'] бИ^П) - решение
сопряженной задачи
Q
+ V,a(x, z[u](x), u(x))tj = fi, r?(x) = 0, x € 5, ц G AÍ(Í2)
при и = и',ц = -V^FÍ-.íMÍ-), «'(O), »?'H <r 6 [l,n/(n - 1)), -
решение той же сопряженной задачи при и = и', ц = — VzG(-,z[u'](-))A,; II(x, z, и, ц,ца) = z,u) - HüF(x, z, и), 7' > 0, -у* —)■ О, s -)■ оо. Теорема 3i Каждое м.п.р. в задаче (Рч) является с.п.. Определение 4 С.п. и' € ТУ?, з = 1,2,..., у* > 0, у' 0, а оо, «азовел« нормальной (регулярной, анормальной), если все (существуют, не существуют) соответствующие ей последовательности ({.i5,A*), s = 1,2,..., имеют (имеющие, имеющие) предельные точки (в *-слабом смысле для второй компоненты) лишь с компонентой цо > О (лишь с компонентой fio > 0, с компонентой fio > 0).
Достаточными условиями нормальности в задаче с фазовыми ограничениями являются условия, которые также можно назвать условиями Слейтера и линейности, являющиеся аналогами одноименных условий "конечномерного" случая п.2.1. Аналогично конечномерному случаю п.2.1 разрешается здесь и проблема чувствительности. "
Теорема 4 Если задача (Рч) нормальна, то ее функция значений липши-
цева в окрестности q € С(Х).
Эта теорема, в известном смысле, обратима.
Теорема 5 Пусть функция значений /3 задачи (Pq) является липшицевой в окрестности q. Тогда в задаче (Pq>) при всех q' из этой окрестности существуют регулярные м.п.р..
В общей же ситуации, когда липшицевость функции значений /3, вообще говоря, не имеет места, справедлив следующий общий результат, который можно интерпретировать как результат, говорящий о том, что множество регулярных задач (Рч) "весьма богато", а, именно, справедлива Теорема 6 Для любой точки q € dom/3 и любой непрерывной положительной функции £ € С(Х) для почти все точек q' на луче + : í > 0} в задаче (Pf) все м.п.р. регулярны.
Второй подход к исследованию задачи (Р5) состоит в переходе к некоторой "эквивалентной" задаче с равномерно выпуклым целевым простран-
ством. Он подразумевает, что X С П есть замкнутая подобласть области il. В этом случае можно заметить, что в силу "заглаженпости" решений z[u] (все они принадлежат классу С°(П) с а > 0 и их нормы в этом классе равномерно по и 6 2? ограничены) в каждой точке q € dorn ß (здесь ß - функция значений для исходной задачи с ß=C(X)) совпадает со значением ß'(q) функции значепий "той же" задачи, но с целевым пространством L,(X), s > 1, и в случае q 6 С(Х) любое м.п.р. в задаче (Р?) с фазовым ограничением, понимаемым как ограничение в пространстве С(Х) является одновременно м.п.р. в той же задаче, но с фазовым ограничением, понимаемым в пространстве L,(X). Поэтому для записи принципа максимума для м.п.р. в задаче (Pq) с В = С(Х) оказывается возможным записать сначала необходимые условия для м.п.р. в"тойже" задаче с В = L,(X) (та>-кие условия получены в п.3.1), а затем после некоторой так называемой " перенормировки" множителей Лагранжа получить принцип максимума для м.п.р. в исходной задаче.
В заключение, в п.3.2 показывается, что задача (Р?) на самом деле может быть расширена в смысле [В], [Г] и все результаты, полученпые выше в терминах м.п.р., могут быть "переписаны" и в терминах обобщенных оптимальных (стационарных) управлений. В то же время, если принимать во внимание интересы приложений, то формулировки результатов в терминах м.п.р., состоящих из обычных измеримых управлений (которые, вообще говоря, можно считать просто "релейными" функциями) представляются более предпочтительными по сравнепию с "теми же" формулировками в терминах обобщепных управлений - функций со значениями в пространстве абстрактных мер. П.3.2 завершается рассмотрением ряда иллюстративных примеров.
В п.3.3 показывается, что абстрактное обобщенное правило множителей п.1.1 может быть применено для получения принципа максимума и в задаче оптимального управления полулинейным эллиптическим уравнением с регулярным смешанным ограничением
(Po) /0(u)->-inf, Ii(u)eM, ueV,
где
/„(«) = fnF{x,z[u]{x),u(*))dx, 1г(и) = 0(;2[и](-),щ(.)),
V = {и ={щ, щ) € ЬХ(П) : щ(х) 6 и2(х) 6 U2 п.в. на П}, U2 С FC"* - компакт, Ш] + тг = m, il С й" - ограниченная область в R" с липши-цевой границей, М С 1/оо(0) - выпуклое замкнутое множество всех неположительных функций на О, z[u] €ТУ5(П) - соответствующее управлению u € V слабое решение в смысле [ЛУ] задачи Дирихле (2). Исходные данные задачи (Pq) удовлетворяют некоторым достаточно традиционным предпо-
ложениям, из которых выделим условие выпуклости функции G по uj при всех х, z, условие регулярпости смешанного ограничения (см, например, монографию26): VUlG(x, 2, uj) ф 0, если G(x,z, щ) = 0. При сделанных предположениях оказалось возможным с помощью вариационного принципа [Е] " аппроксимировать" исходную задачу со смешанным ограничением последовательностью задач минимизации функционалов типа максимума из п.1.1 и получить аналогичный известным в теории оптимального управления обыкновенными дифференциальными уравнениями (см, например, цитированную выше монографию [А]) принцип максимума в исходной задаче со смешанным ограничением в результате предельного перехода в семействе вспомогательных принципов максимума.
И, наконец, заключительный п.3.4 главы 3 посвящен исследованию задачи, аналогичной задаче п.3.2, но с граничным управлением
(Рч) /о(и) inf, Ii(u)eM + q, и 6 V, q G С(Х), q— параметр,
где
/0(и) = jf^r, *[««](*)) dr + ¿^(».zMW.uWJde, /,(и) = G(-,*[«](•)),
X С ii - компакт, il С Я" - ограниченная область с липшицевой границей, S — дй, D = {u£ ¿оо(^) : и(х) 6 U п.в. на 5}, U С й1 - компакт, М С С(Х) - выпуклое замкнутое множество с непустой внутренностью, имеющее вид {у £ С(Х) : у(х) € Y(x) Vx е X}, К(аг) = [К,(г), ВД] С й1, П(х) < Г2(х), Г, : X й1 U {-оо}, К2 : X й1 U {+оо} - соответственно полунепрерывная снизу и полунепрерывная сверху функции, являющиеся непрерывными в каждой точке, в которой они конечны (возможны случаи К](г) = — оо, Yi(x) = +оо), z[u] £ И^(П) - соответствующее управлению и € 2? слабое решение в смысле [ЛУ] третьей краевой задачи (задачи Неймана при сг(х) = 0) для полулинейного эллиптического уравнения с дивергентной главной частью
д dz(x)
~for(a'j(x)z*,) + z) ~ °> -qJJ- + а(хЫх) = "(*)> xeS.
Здесь, как и в п.3.2, при некоторых традиционных для подобного рода задач предположениях применяется метод [9] аппроксимации задачи с фазовым ограничением последовательностью задач с конечным числом функциональных ограничений, в результате чего формулируются и доказываются результаты в целом аналогичные результатам п.3.2 и связанные с поточечным принципом максимума, регулярностью, нормальностью, чувствительностью.
ät[A] А р fr юн о» A.B. Услояая мстрсмунь. Норииыыя ■ яырвжлкяы« щш. М.: Ияд-во 'Фшдрям",1№.
Глава 4, состоящая из одного пункта, посвящена задачам (суб)оптималь-ного управления гиперболическими уравнениями. В качестве конкретной задачи здесь рассматривается задача субоптимального управления так называемой системой Гурса-Дарбу
(Pq) 70(u) -+ inf, Ii(u)eM + q, uG V, q G B, q — параметр,
где V = {u G Ьоо(П) : u(x, y) G U п.в. на П}, U С Дт - компакт, П = [О, а] X [0,6] С R2, a, b > 0 - заданные числа, М - выпуклое замкнутое множество всех неположительных функций в одном из двух пространств В: ¿2(П) или С(П),
/о(u) = F{x, у, z[u](x, у), zx[u](x, у), zv[u](x, у), и(х, у)) dxdy+
Е Gj(z[u](xi, у»')), /,(«) ЕЕ G(; ., *[«](.,.)), i=l
(х}, у^) G П, j = 1,... , as, - заданный набор точек, z[u] - соответствующее управлению и G 2? абсолютно-непрерывное решение векторного гиперболического уравнения с граничными условиями Гурса-Дарбу
= /(*> y,z,zx,zy,u{x,y))t *(0,») = <£*Ы, У G [0,6], г(*,0) = ¿„(х), х G [0,а], ¿,(0) = ¿„(0), с заданными липшицевыми функциями : [0,6] —^ Л™, фу : [0, а] —> Л".
Различные задачи оптимального управления системой Гурса-Дарбу рассматривались с точки зрения получения необходимых условий во многих работах (О.В.Васильев, В.И.Плотников, В.И.Сумин, В.А.Срочко и др.). Однако, можно, по-видимому, утверждать, что задача оптимальпого управления системой Гурса-Дарбу с поточечным фазовым ограничением изучав лась лишь в монографии27 . Столь "малое" внимание к этой задаче связано с существом дела и объясняется ее достаточной сложностью, несмотря на "кажущуюся простоту". Здесь, в отличие от [У], мы рассматриваем задачу (суб)оптимального управления системой Гурса-Дарбу с фазовым ограничением при существенно более слабых по сравнению с [У] условиях на исходные данные, а, именно, правая часть системы и интеграпт функционала, а также их градиенты по z, zx, zv должны удовлетворять лишь традиционным условиям типа Каратеодори.
В п.4.1 предварительно показывается, что задача (Pq) с целевым пространством В = Ьг(П) удовлетвоярет всем абстрактным условиям п.1.2 и, значит, к ней применимы, как и в предыдущих главах, результаты п.п.1.3, 1.4. Затем принцип максимума для м.п.р. для задачи (Pq) с целевым пространством Li(П), согласно методу п.3.2, посредством "перенормировки"
а7[У] У слои * эвстренуив ■ loMtp^ttiiiui нноды ptDiiii » 9UMU oanmiiml riBipBuiqicui иски. Put. Bi. сильев О-В. - Новосвбврск: Наукв, 1993.
множителей Лагранжа преобразуется в принцип максимума для м.п.р. в задаче (Рч) с целевым пространством С(П). Здесь же формулируются и достаточные условия для м.п.р.. Рассматриваемая задача, по форме близкая задаче п.3.2, имеет одно принципиальное с ней различие. Ele, вообще говоря, нельзя расширить в смысле [В], [Г] и по этой причине, по сути дела, единственным "инструментом" для решения подобных нелинейных задач оптимального управления является лишь принцип максимума для м.п.р.. Это важное обстоятельство иллюстрируется в п.4.1 посредством конкретного примера задачи (Рч) с фазовым ограничением в С(П), в котором не существует обычного оптимального управления и для которого показывав ется невозможность расширения в смысле [В], [Г]. В то же время, м.п.р. в этом примере идентифицируется с помощью принципа максимума. В п.4.1 приводятся также примеры двух задач с целевым пространством /^(П), удовлетворяющих условию Слейтера, первая из которых не является нормальной, т.к. в ней не выполняется принцип максимума, а вторая таковой является. Эти примеры иллюстрируют высказанное в п.2.3 утверждение о том, что условия Слейтера и линейности в задачах с рефлексивными целевыми пространствами являются условиями лишь условной нормальности.
В главе 5 рассматривается так называемая негладкая задача субопти-мальпого управления параболическими уравнениями, т.е. задача в которой функции, задающие исходные данные, являются лишь липшицевыми по фазовым переменным. Сама негладкая задача по форме полностью повторяет задачу п.2.1. Ее исходные данные удовлетворяют тем же условиям (здесь рассматривается задача лишь с негладкими функционалами, однако, тот же метод может быть эффективно применен и в задачах с негладкими "правыми частями" уравнений), что и в "гладком" варианте задачи в п.2.1, но градиент VzGj(x,z) здесь понимается как первая обобщенная производная (в смысле С.Л.Соболева) в R1 при п.в. х € ÍÍ функции Gj(x,-) : R1 R1. Обычное для "гладкой" теории условие па градиент |V2Gj(r,z)| < N{M) Vz € Si, = {у 6 R1 : |у| < М}, х е П, в нашем случае понимаемое как условие на обобщенную производную V¡Gj, эквивалентно локальной липшицевости G¡ по z. Нам удобнее записывать последнее условие именно в терминал обобщенных производных из-за применяемого метода исследования негладкой задачи, связанного с усреднениями функций.
Основная цель данной главы - показать, что большая часть результатов "гладкого" случая п.2.1 так или иначе переносятся и на негладкие задачи. Все ее результаты формулируются в терминах обобщенных градиентов Кларка dczGj(x, z). В то же время, т.к. постановка негладкой задачи использует обобщенные производные в смысле С.Л.Соболева, а метод ее решения использует усреднение функций, то здесь устанавливается
полезное представление обобщенного градиента Кларка локально липши-цевой функции в терминах ее первых обобщенных производных в смысле С.Л.Соболева. Из-за негладкости задачи для ее решения нельзя напрямую воспользоваться абстрактной теорией главы 1 также, как мы это сделали в п.2.1. Однако, если нужным образом ее "сгладить", то применение абстрактной теории для исследования задачи (Р}) уже оказывается возможным. Указанное "сглаживание" мы проводим, следуя разработанному в [2, 4] методу. В этих работах был предложен общий подход к получению необходимых условий оптимальности для негладких задач оптимального управления как сосредоточенными, так и распределенными системами. В то же время, в них не рассматривались вопросы, связанные с субоптимальностью и м.п.. Здесь же мы рассматриваем в терминах м.п. и с.п. новые оптимизационные проблемы (дифференциальные свойства функции значений, регулярность, нормальность, векторы Куна-Таккера и т.д.) для пе-гладких задач оптимального управления [25], которые совершенно не рассматривались в [2, 4]. Впрочем, пам неизвестны и работы каких-либо других авторов, в которых изучались бы указанные вопросы для негладких задач оптимального управления.
Глава 6 посвящена двойственным численным методам в теории оптимального управления распределенными системами, основанным на использовании модифицированных (расширенных) функций (функционалов) Ла-гранжа. Как отмечепо в монографии28, алгоритмы оптимизации, основанные па использовании расширенных лагранжианов, являются наиболее эффективными общими методами решения задач оптимизации с нелинейными функционалами и ограничениями. В то же время, анализ публикаций по численным методам двойственного типа для задач оптимального управления распределенными системами показывает, что в этом направлении делаются сейчас, по-видимому, только первые шаги [14, 23, 35].
В п.6.1 излагается общий метод нахождения м.п.р. в задаче п.2.1 при 5=0. Обозначим через £ множество обобщенных управлений и со слабой нормой |-|ш (см. [В]), являющееся расширением в смысле [В], [Г] множества обычных управлений V. Метод предназначен для нахождения м.п.р. и' € Т>, » = 1,2,..., в задаче (Ро), которое без ограничения общности (в силу компактности в слабой норме | • множества 5) считается сходящимся в слабой норме | • |ш к некоторому управлению (вообще говоря, обобщенному) и" : — -4 0, I оо, и" € = П^ где - замыкание в слабой
норме | • |„ множества ТУа. Заметим гут же, что несмотря на использование обобщенных управлений, расширения задачи (Ро) формально не требуется.
Предполагается, что задача (Ро) удовлетворяет условиям п.2.1 и допол-
и[№] Мну М. Матеивтвямю» врогрвмнвровавв*. Теорвв я влгорвтмы. М.: Нвуи, 1990.
нительно трем условиям:
(a) задача (Ро) нормальна;
(b) обобщенное управление Vй является изолированным, т.е. в некоторой окрестности 5е(v°) = {v € S : — i/°\w < е} нет других управлений и, которые являлись бы предельными в слабой норме | • |ш точками с.п. задачи
(c) задача (Ро) обладает вектором Куна-Таккера ц 6 IIя, т.е.
0(O)<Z*(u,M) = Jo(u) + f>,JÎ(u) VuÇVnSjyïj, N >0,j = l,...,«,.
1=1
Из этих трех условий "наиболее существенными" являютя условия (а) и (с), а задачи, в которых выполняются все три условия "следует искать" в первую очередь, конечно, среди так называемых линейно-выпуклых задач. Излагаемый метод заключается в максимизации на множестве S(M°,a) = {у € R* : р(у,М°) < а}, а > О, М° - множество всех векторов Куна-Таккера задачи (Ро), вогнутой функции значений для модифицированной функции Лагранжа (см. монографию29)
К(-) = inf L«(u, •) : S(M°, а) Я1, Lc(u, ц) =
u €РП5, (v°)
+ f E{[max{0)W + cJ,(u)}]2-^}+ £ £
i=l i=ac,+l z ¡=ге,+1
причем argmax {Vc(/i), /î 6 S(M°, a)} = M0. В п.6.1 последовательно предлагается " явное" выражение для субградиента в смысле выпуклого анализа функции — Ус(-) и показывается, что для численного решений двойственной задачи и одновременно для нахождения искомого м.п.р. могут быть эффективно использованы хорошо разработанные методы негладкой (выпуклой) минимизации и, в частности, например, так называемый £*-субградиент-ный метод30. Доказывается сходимость метода в слабом смысле (в норме I • |ш), если и° - обобщенное управление и в смысле сходимости по мере, если Vй - обычное управление. Здесь же обсуждается возможность оценки "качества" этой сходимости с помощью так называемого функционала невязки принципа максимума [14, 23] и результатов п.2.1, связанных с чувствительностью задачи.
В п.6.2 предлагается по сравнению с методом п.6.1 существенно более общий, с точки зрения жесткости условий на исходные данные задачи, численный метод ее решения. Для более компактного изложения общей идеи метода предполагается, что, в отличие от задачи п.6.1, задача п.6.2 такова, что допускает расширение в смысле [В], [Г]. Однако, последнее требование "при желании" может быть опущено.
39[Б] Бертсекас Д. Условна* оптаивэаци и методы мвожвхеле! Паграяжа. M.: Раджо ■ свиь, 1987.
30Демидов В.Ф., Васвльсв Л .Б. Нвдвффсренциргемая оптвмвзнци. М.: Наука, 1981.
Его принципиальное отличие от метода предыдущего п.6.1 заключается в том, что единственным существенным требованием для его реализации является лишь условие некоторой "регулярности" задачи в смысле непустоты субдифференциала Фреше 3/3(0). Показывается, что данное обстоятельство " порождает" точный недифференцируемый штрафной функционал в виде (см. также [Б1, Гл.4) РсМ = Ja{v) + C Е gj(v) + C Е
>=i >=«i+i
где д^(у) = max{J¡(и), 0}, v £ S, S - множество допустимых обобщенных управлений из п.6.1, а любое (вообще говоря, обобщенное) решение i/° исходной задачи (Рц) является строгим решением задачи "безусловной" минимизации Pc(v) —► min, и € S. В связи с этим требованием здесь уместно напомнить, что регулярными в этом смысле задачами, согласно результат там п.2.1, заведомо являются задачи для значений параметра q & R" из плотного в dorn ß множества, а в случае отсутствия ограничений-равенств - для п.в. q 6 domß. Таким образом, можно утверждать, что результаты данного пункта подчеркивают еще раз важность исследования дифференциальных свойств функций значений не только с точки зрения вопросов, связаппых с принципом максимума для м.п.р., со свойствами регулярности, нормальности, но и с точки зрения теории численных методов оптимального управления.
В заключительной седьмой главе диссертации показывается, что понятия субоптимальности и м.п. являются центральными для задач оптимальпого управления, исходные данные которых заданы лишь приближенно. В случае приближенно известных исходных данных само понятие классического оптимального управления как бы теряет смысл, т.к. в "возмущенной" задаче его просто может не существовать, а если оно и существует, то не вполне попятно какое "отношение" оно имеет к искомому оптимальному управлению. Ситуация кардинально меняется, если в качестве "базового элемента" теории мы рассматриваем м.п.р..
В п.7.1 рассматривается задача для параболического уранения из п.2.3, но с фиксированным временем и с исходными данными b¡, i = 1,. . ., гг, а, /, er, G, Ф, Ai, U, V, W, известными лишь с некоторой погрешностью, величина которой "определяется" числовым параметром S > 0. Здесь поксозывается, что все результаты п.2.3, связанные с принципами максимума для м.п.р. как в случае конечной коразмерности множества М, так и без этого дополнительного условия (в случае dß(q) ф 0), практически полностью сохраняют свою силу. При этом в этих результатах следует лишь все исходные данные взять с соответствующим индексом 5. В случае же достаточных условий для м.п.р. ситуация по сравнению с задачей с точными данными " существенно" изменяется: для того чтобы данная последовательность была м.п.р. следует, вообще говоря, требовать согласованного
стремления к нулю точности задания исходных данных S, "точности выполнимости" принципа максимума, " точности выполнимости" ограничения задачи.
И, наконец, остановимся кратко на результатах п.7.2. Здесь рассматривается важный частный случай задачи п.2.3 - задача минимизации сильно выпуклого функционала
(Р?) /оМ-Mnf, JiMeM + î, тгех», qeB = L3(ty, где
M») = Н«1ВЛг + H\lft + IHIU. M*) = *М(-.П
п = (u, V, ш) 6 Т>, M = {/i}, h € ß; z[ir] G V,2I,0(Qt) - соответствующее тройке 7г слабое решение в смысле [ЛСУ] третьей краевой задачи для линейного параболического уравнения
z{x, 0) = х 6 П, щ + а(х, t)z = w(x, t), (x, i) G ST,
множество DT определено также как в п.2.3, а компакты U, V выпуклы (также как и И7). Легко видеть, что эта задача всегда имеет решение 7г°, если только ф 0. Очевидно, сформулированная задача (Pq) является обратной задачей по нахождению нормального решения уравнения (3) при известном наблюдении h. Как и в п.7.1, исходная задача с М° = {Л0} = {0}ь2(П) считается заданной здесь с ошибкой <5:
IIb? - Ь?1Ьл„ На' - «°11эд„ Wf* - f%,QT < S, b* - < s, ||Л'|Ь,п < s.
Приводятся два метода решения или - два метода регуляризации для рассматриваемой обратной задачи. Первый можно отнести к группе методов невязки [В1]. В нем необходимо решать вспомогательную задачу
(/*") /о(тг) inf, Js{n) = ||г'[тг](-,Г) -h1- q\\lfl < a, ir G V.
На основе результатов п.2.1, связанных со свойствами нормальности и чувствительности задач с конечномерным целевым пространством (в данном случае с одномерным) здесь показывается, что при выполнении условия согласования <52/а(<5) 0, S —f 0 выполняется предельное соотношение - 7r5||2,QrXf)xSr 0, S -> 0, где тг*'а решение задачи (Pqi,a), т.е. показывается сильная сходимость регуляризованных решений к точному решению 7г® исходной задачи. Отметим при этом, что при каждом фиксированном а > 0 задача (Pq'a) удовлетворяет всем условиям, при которых была доказана сходимость двойственного численного алгоритма в п.6.1 и, значит, этот алгоритм может быть применен здесь для ее решения, а "оценка
качества" решения может производиться с помощью функционала невязки принципа максимума.
Второй метод регуляризации можно отнести условно к группе методов типа алгоритма Удзавы (см, например, монографию [Ml]). Он, по сути дела, является двойственным методом, аналогичным методам главы 6 и заключается в непосредственном решении двойственной к исходной задачи
V/(A)->sup, А G L2{Ü), vq'(А) = min ¿{От, А),
L*(тг, А) = /о(тг) + (А, *'[*](., T)-hs-q), n£V, А € L2(ii).
Показывается, что функция значений V* дифференцируема по Фреше, ее градиент удовлетворяет условию Липшица, приводится " явное" выражение для этого градиента. Последние обсоятельства позволяют применить для максимизации функции Vстандартные градиентные методы [Bl], [М1]. Такая максимизация проводится с помощью обычного метода регуляриза/-ции А.Н.Тихонова [В1], т.е. с помощью решения регуляризованной двойственной задачи Vf(\) — а||А||2 —тах, А 6 и согласования пара^ метра регуляризации а с ошибкой измерения S, Выполнимость условия согласования 6/а(8) —> 0, 8 0, приводит к сильной сходимости регуля-ризованных решений к точному решению исходной задачи
где тг^[А] - решение задачи Lsq(n, А) min, 7г € Т>, а А^,а - решение двойственной задачи.
Основные результаты диссертации
1. Предложена ориентированная на задачи оптимального управления абстрактная схема исследования задачи оптимизации на полном метрическом пространстве функционала с аддитивно зависящим от параметра ограничением типа включения в выпуклое замкнутое множество равномерно выпуклого банахова пространства с дифференцируемой по Фреше нормой. "Базовыми" понятиями в этой схеме служат не оптимальные (как обычно), а м.п. элементов или, точнее, так называемые м.п.р. в смысле Дж.Варги. Показана применимость предложенной схемы к широкому кругу конкретных разнообразных задач оптимального управления. Эта абстрактная схема может быть названа также методом возмущений в теории субоптимального управления распределенными системами.
2. Получены необходимые и достаточные условия для м.п.р. (принципы максимума для м.п.р.), трансформирующиеся "в пределе" в случае существования оптимального управления в "обычные" условия оптимальности, в задачах (суб)оптимального управления распределенными системами
с различными ограничениями в конечномерном пространстве. Получены представления для субдифференциалов (в смысле Ф.Кларка, Б.Ш.Морду-ховича) функций значений этих задач в терминах множителей Лагранжа, различные необходимые и достаточные условия регулярности, нормальности, связывающие эти понятия с дифференциальными свойствами функций значений. Изучена проблема чувствительности для таких задач. Показано, что регулярность задач оптимального управления является их весьма типичным свойством, заведомо имеющим место при всех значениях параметра из плотного множества в эффективном множестве функции значений, а в случае задач лишь с ограничениями типа неравенства, для "почти всех" имеющих смысл задач, т.е. для почти всех значений параметра из эффективного множества функции значений.
3. Доказаны необходимые и достаточные условия для м.п.р. в задачах оптимального управления параболическими, эллиптическими и гиперболическими уравнениями с ограничением типа включения в выпуклое замкнутое множество равномерно выпуклого пространства (Ьр, р€ (1,+оо)). Показано, что существование нормали в том или ином естественном смысле к надграфику функции значений влечет выполнимость регулярного принципа максимума в таких задачах и эта регулярность задачи заведомо имеет место для всех значений функционального параметра из плотного множества во множестве всех тех его значений, где задача имеет смысл.
4. Показано, что предложенная абстрактная схема оказывается пригодной и для исследования задач с нерефлексивными целевыми пространствами, а многие из результатов, связанных с условиями на м.п., со свойствами регулярности, нормальности, чувствительности и полученных для задач с конечномерными целевыми пространствами, переносятся и на задачи с поточечными фазовыми ограничениями, понимаемыми как ограничения в пространствах непрерывных функций с равномерной метрикой, с распределенными, начальными и граничными управлениями в случаях линейных и нелинейных (в частности, полулинейных и квазилинейных) управляемых уравнений.
5. Получен принцип максимума в задаче с регулярными смешанными ограничениями в случае управляемой задачи Дирихле для полулинейного эллиптического уравнения. Тем самым показана применимость предложенной абстрактной схемы и в распределенных задачах оптимального управления со смешанными ограничениями.
6. Показано, что "большая часть" результатов, связанных со свойствами нормальности, регулярности и чувствительности переносятся и на так называемые негладкие задачи оптимального управления распределенными системами, т.е. на задачи с негладкими (липшицевыми) по фазовым пе-
ременным "правыми частями" и функционалами.
7. Предложены два метода численного решения для задачи оптимального управления параболическим уравнением с конечным числом функциональных ограничений типа равенства и неравенства. Первый из них основан на максимизации функций значений модифицированного функционала Лагранжа (расширенного лагранжиана), доказана его сильная сходимость, обсуждена возможность оценки "качества" этой сходимости с помощью так называемого функционала невязки принципа максимума. Во втором методе все решения исходной задачи являются строгими решепиями задачи "безусловной" оптимизации точного недифференцируемого штрафного функционала.
8. Показано, что применение м.п.р. в смысле Дж.Варги позволяет эффективно распространить теорию необходимых условий оптимальности на задачи с приближенно известными исходными данными.
9. Установлено, что полученные "теоретические" результаты, связанные с условиями на м.п.р., нормальностью, чувствительностью могут быть эффективно применены в классической задаче приближенного нахождения нормального решения краевой задачи для параболического уравнения при известных приближенно коэффициентах и финальном наблюдении. Для этой обратной задачи предложены два численных метода - два метода регуляризации. Первый из них можно отнести к группе методов невязки, второй - заключается в непосредственном решении па основе метода регуляризации А.Н.Тихонова задачи, двойственной к исходпой задаче.
Основные публикации по теме диссертации
[1] Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей в задачах управления системами с распределенными параметрами // Ж. вычисл. матем. и матем. физ. 1982. Т.22. Л/о1. С.49-56.
[2] Плотников В.И., Сумин М.И. Необходимые условия в негладкой задаче оптимального управления // Матем. заметки. 1982. Т.32. Л/о8. С.187-197.
[3] Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей // Дифференц. уравнения 1983. Т.19. Л/о4. С.581-588.
[4] Плотников В.И., Сумин М.И. Оптимальное управление объектами с распределенными параметрами, описываемыми негладкими системами Гурса-Дарбу с ограничениями типа неравенства // Дифференц. уравнения. 1984. Т.20. Л/о5. С.851-860.
[5] Плотников В.И., Сумин М.И. Об условиях на элементы минимизирующих последовательностей задач оптимального управления // Докл. АН СССР. 1985. Т.280. Л/о2. С.292-296.
[6] Сумин М.И. О достаточных условиях на элементы минимизирующих последовательностей // Ж. вычисл. матем. и матем. физ. 1985. Т.25. Nol. С.23-31.
[7] Морозов С.Ф., Сумин М.И. Об одном классе задач управления динамическими системаи с разрывной правой частью // Кибернетика. 1985. Л/ЬЗ. С.59-65.
[8] Сумин М.И. Достаточные условия оптимальности в негладких задачах оптимального управления распределенными системами // Дифференц. уравнения. 1986. Т.22. С.326-337.
[9] Сумин М.И. О минимизирующих последовательностях в задачах оптимального управления при ограниченных фазовых координатах // Дифференц. уравнения. 1986. Т.22. Л/оЮ. С.1719-1731.
[10] Сумин М.И. Оптимальное управление системами с приближенно известными исходными данными // Ж. вычисл. матем. и матем. физ. 1987. Т.27. Л/о2. С.163-177.
[11] Морозов С.Ф., Сумин М.И. Оптимальное управление скользящими режимами разрывных динамических систем // Известия ВУЗов, Математика. 1990. Л/bl. С.53-61.
[12] Сумин М.И. Оптимальное управление разрывными динамическими системами со скользящими режимами // Дифференц. уравнения. 1988. Т.24. Л/о11. С.1911-1922.
[13] Сумин М.И. Оптимальное управление объектами, описываемыми квазилинейными эллиптическими уравнениями // Дифференц. уравнения. 1989. Т.25. .Л/о8. С.1406-1416.
[14] Сумин М.И. О функционале невязки принципа максимума в теории оптимального управления // Ж. вычисл. матем. и матем. физ. 1990. Т.ЗО. Л/о8. С.1133-1149.
[15] Сумин М.И. О первой вариации в теории оптимального управления системами с распределенными параметрами // Дифференц. уравнения. 1991. Т.27. Л/о 12. С.2179-2181.
[16] Сумин М.И. О необходимых условиях оптимальности в задачах оптимального управления системами с распределенными параметрами // Методы прикладного функционального анализа. Межвузовский сборник. Н. Новгород: Изд-во ННГУ. 1991, С.88-94.
[17] Сумин М.И. Субоптимальное управление системами с распределенными параметрами. Труды первой Международной конф. "Математические алгоритмы", Н.Новгород: Изд-во ННГУ, 1995, С.116-125.
[18] Sumin M.I. SuboptimaJ control of systems with distributed parameters: minimizing sequences, value function, regularity, normality, Abstracts of IFIP Conf. " Modelling and optimization of distributed parameter systems
with applications to engineering", Warsaw, Poland, 1995, Warsaw: System Research Institute, 1995, P.156-157.
[19] Sumin M.I. Suboptimal control of systems with distributed parameters: minimizing sequences, value function, regularity, normality // Control and Cybernetics. 1996. V.25. No.3. P.529-552.
[20] Сумин М.И. Субоптимальное граничное управление системами, описываемыми параболическими уравнениями. Тезисы докл. школы "Пон-трягинские чтения - VII", Воронеж: ВГУ, 1996, С.172.
[21] Сумин В.И., Сумин М.И. Субоптимальное управление вольтерровыми функциональными уравнениями: минимизирующие последовательности, функция значений, регулярность, нормальность. Математическое моделирование и оптимальное управление, Межвузовский сборник научи. тр., Н.Новгород: Изд-во ННГУ, 1996, С.23-31.
[22] Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений // Ж. вычисл. матем. и матем. физ. 1997. Т.37. Л/ol. С.23-41.
[23] Сумин М.И. Субоптимальное управление системами с распределенными параметрами: свойства нормальности, субградиентный двойственный метод" // Ж. вычисл. матем. и матем. физ. 1997. Т.37. Л/о2. С.162-178.
[24] Сумин М.И. Субоптимальное граничное управление эллиптическими уравнениями с фазовыми ограничениями. В кн. "Совремепные методы в теории краевых задач. Тезисы докладов школы "Понтрягинские чтения - VIII", Воронеж: ВГУ, 1997, С.146.
[25] Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений, регулярность, нормальность, негладкие задачи, Нижегородский ун-т,- Н.Новгород, 1996. - 120с. Деп. в ВИНИТИ 08.01.97. Л/о 62-В97.
[26] Сумин М.И. Субоптимальное граничное управление параболическими уравнениями с операторными ограничениями, В кн. " Воронежская весенняя математическая школа. Современные методы в теории краевых задач. Понтрягинские чтения - IX, Тезисы докладов", Воронеж: ВГУ, 1998, С.192.
[27] Сумин М.И. Принцип максимума в теории субоптимального управления распределенными системами, В кн. "Международная конференция, посвященная девяностолетию со дня рождения Л.С.Понтрягина, Москва, 31 августа - 6 сентября 1998 г., Тезисы докладов, Оптимальное управление и добавления", Москва: МГУ, 1998, С.261-263.
[28] Сумин М.И. Субоптимальное управление распределенными системами I. Абстрактная задача минимизации с операторным ограничением в
гильбертовом пространстве, Вестник ННРУ "Математическое моделирование и оптимальное управление", Н.Новгород: Изд-во ННГУ, 1998, 2(19), С.152-165.
[29] Сумин М.И. Субоптимальное управление распределенными системами II. Параболическое уравнение, операторное ограничение, граничное управление, Вестник ННГУ "Математическое моделирование и оптимальное управление", Н.Новгород: Изд-во ННГУ, 1999, 1(20), С.138-153.
[30] Сумин М.И. Принцип максимума в параметрической задаче быстродействия для параболического уравнения с операторным ограничением в гильбертовом пространстве В кн. "Воронежская весенняя математическая школа. Современные методы в теории краевых задач, Понтрягин-ские чтения-Х, Тезисы докладов", 1999, Воронеж: Изд-во ВГУ, С.235.
[31] Сумин М.И. Принцип максимума в теории субоптимального управления распределенными системами с операторными ограничениями в гильбертовом пространстве // Итоги науки и техники. ВИНИТИ. Современная математика и ее приложения. Тематические обзоры. 1999. Т.66. С.193-235.
[32] Sumin M.I. Optimal control of eemilinear elliptic equation with state constraint: maximum principle for minimizing sequence, regularity, normality, sensitivity // Control and Cybernetics. 2000. V.29. No.2. P.449-472.
[33] Сумин М.И. Субоптимальпое управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, I: принцип максимума для минимизирующих последовательностей, нормальность // Известия ВУЗов, Математика. 2000. А/Ь6. С.33-44.
[34] Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, II: чувствительность, типичность регулярного принципа максимума // Известия ВУЗов, Математика. 2000. А/о8. С.52-63.
[35] Сумин М.И. Оптимальное управление параболическими уравнениями: двойственные численные методы, регуляризация, В кн. " Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде. Сб. докладе» к Международной конференции (Екатеринбург, 30 мая - 2 июня 2000 г.)", 2000, Екатеринбург: Изд-воИн-та математики и механики УрО РАН. С.66-69.
[36] Сумин М.И. Субоптимальпое управление полулинейным эллиптическим уравнением с фазовым ограничением и граничным управлением // Дифференц. уравнения. 2000. Т.36. А/о11.
0 Введение
0.1 Сокращения, обозначения, нумерация.
0,2 Общая характеристика диссертации
0.3 Краткий обзор содержания диссертации.
0.4 Основные результаты диссертации.
1 Абстрактная параметрическая задача минимизации с операторным ограничением в равномерно выпуклом пространстве
1.1 Правило множителей для субоптимальных элементов в метрическом пространстве
1.2 Абстрактная задача минимизации с параметром в ограничении.
1.2.1 Постановка абстрактной параметрической задачи минимизации, минимизирующее приближенное решение (м.п.р.).
1.2.2 Аксиоматика.
1.3 Абстрактный принцип максимума для м.п.р. в случае "богатого" целевого множества.
1.4 Абстрактный принцип максимума для м.п.р. в случае "бедного" целевого множества. Субдифференциалы функции значений.
1.4.1 Полунепрерывность снизу функции значений в параметрической задаче минимизации.
1.4.2 Нормали Фреше, субдифференциалы и сингулярные субдифференциалы полунепрерывных снизу функций.
1.4.3 Абстрактный принцип максимума для м.п.р.
1.4.4 Субдифференциалы функции значений.
1.5 Регулярность, нормальность, чувствительность в параметрической задаче с операторным ограничением в равномерно выпуклом пространстве.
1.6 Экстремальные последовательности.
2 Субоптимальное управление параболическими уравнениями 95 2.1 Задача с нефиксированным временем без его варьирования и с ограничением типа включения в конечномерное множество.
2.1.1 Постановка задачи.
2.1.2 Проверка выполнимости абстрактной аксиоматики.
2.1.3 Задача с фиксированным временем.
2.1.4 Принцип максимума для м.п.р. в задаче с фиксированным временем
2.1.5 Достаточность принципа максимума для м.п.р. в задаче с фиксированным временем.
2.1.6 Свойства регулярности, нормальности в задаче с ограничением типа включения с фиксированным временем
2.1.7 Принцип максимума для м.п.р. в задаче с ограничениями типа равенства и неравенства.
2.1.8 Достаточность принципа максимума в задаче с равенствами и неравенствами
2.1.9 Свойства регулярности и нормальности в задаче с равенствами и неравенствами, типичность регулярности.
2.1.10 Особые минимизирующие последовательности, сходимость минимизирующих последовательностей в задаче с фиксированным временем
2.1.11 Иллюстративные примеры.
2.1.12 Задача с нефиксированным временем.
2.1.13 Принцип максимума для м.п.р. в задаче с нефиксированным временем
2.1.14 Нормальность, регулярность в задаче с нефиксированным временем
2.1.15 Экстремальные последовательности.
2.2 Задача с нефиксированным временем с его варьированием и с ограничением типа включения в конечномерное множество.
2.2.1 Постановка задачи.
2.2.2 Проверка выполнимости абстрактной аксиоматики.
2.2.3 Принцип максимума для м.п.р.
2.3 Задача с граничным управлением и с ограничением типа включения в функциональное множество общего вида в гильбертовом пространстве
2.3.1 Постановка задачи.
2.3.2 Проверка выполнимости абстрактной аксиоматики.
2.3.3 Принципы максимума для м.п.р., свойства регулярности и нормальности в задаче с операторным ограничением.
2.3.4 Регулярность, нормальность, условная нормальность в задаче с операторным ограничением
2.3.5 Иллюстративные примеры.
3 Субоптимальное управление эллиптическими уравнениями
3.1 Субоптимальное управление квазилинейным эллиптическим уравнением с поточечным фазовым ограничением общего вида в равномерно выпуклом пространстве
3.1.1 Постановка задачи.
3.1.2 Проверка выполнимости абстрактной аксиоматики.
3.1.3 Принципы максимума для м.п.р., принципы максимума.
3.2 Субоптимальное управление полулинейным эллиптическим уравнением с фазовым ограничением в пространстве непрерывных функций.
3.2.1 Постановка задачи.
3.2.2 Вспомогательные результаты.
3.2.3 Аппроксимация задачи с фазовым ограничением задачами с конечным числом функциональных ограничений
3.2.4 Проверка выполнимости абстрактной аксиоматики в аппроксимирующей задаче.
3.2.5 Принцип максимума для м.п.р. в задаче с фазовым ограничением
3.2.6 Регулярность, нормальность, условие Слейтера, условие линейности
3.2.7 Липшицевость функции значений, чувствительность.
3.2.8 Типичность регулярности
3.2.9 Переформулировка исходной задачи как задачи с равномерно выпуклым целевым пространством.
3.2.10 Расширение исходной задачи с фазовыми ограничениями.
3.2.11 Иллюстративные примеры.
3.3 Принцип максимума в задаче оптимального управления полулинейным эллиптическим уравнением со смешанным ограничением.
3.3.1 Постановка задачи со смешанным ограничением.
3.3.2 "Эквивалентная" задача с равномерно выпуклым целевым пространством
3.3.3 Проверка выполнимости абстрактной аксиоматики.
3.3.4 Принцип максимума в исходной задаче со смешанным ограничением
3.4 Субоптимальное управление полулинейным эллиптическим уравнением с фазовым ограничением в пространстве непрерывных функций и граничным управлением
3.4.1 Постановка задачи.
3.4.2 Вспомогательные результаты.
3.4.3 Аппроксимация задачи с фазовым ограничением задачами с конечным числом функциональных ограничений
3.4.4 Проверка выполнимости абстрактной аксиоматики в аппроксимирующей задаче.
3.4.5 Принцип максимума для м.п.р. в задаче с фазовым ограничением и граничным управлением
3.4.6 Регулярность, нормальность.
3.4.7 Липшицевость функции значений, чувствительность.
3.4.8 Иллюстративные примеры.
4 Субоптимальное управление гиперболическими уравнениями
4.1 Задача параметрического субоптимального управления системой Гурса-Дарбу
4.1.1 Постановка задачи.
4.1.2 Задача с фазовым ограничением в £э(П).
4.1.3 Принципы максимума в задаче с фазовым ограничением в Ьг(П)
4.1.4 Иллюстративные примеры к задаче с фазовым ограничением в Ьг(П)
4.1.5 Задача с фазовым ограничением в С(П)
4.1.6 Иллюстративные примеры к задаче с фазовым ограничением в С(П)
5 Субоптимальное управление в негладких задачах оптимизации распределенных систем
5.1 Параметрическая негладкая задача оптимального управления для параболического уравнения.
5.1.1 Постановка негладкой задачи
5.1.2 Связь между обобщенным градиентом Кларка и обобщенной производной в смысле С.Л.Соболева.
5.1.3 Вспомогательные задачи, сглаживание.
5.1.4 Проверка выполнимости абстрактной аксиоматики в сглаженных вспомогательных задачах.
5.1.5 Условия субоптимальности в сглаженной вспомогательной задаче
5.1.6 Предельный переход во вспомогательных необходимых условиях при стремлении к нулю параметра сглаживания, принципы максимума для м.п.р.
5.1.7 Регулярность, нормальность, чувствительность в негладкой задаче
6 Двойственные численные методы в задачах оптимального управления
6.1 Численный метод для нахождения минимизирующей последовательности в случае существования вектора Куна-Таккера.
6.1.1 Постановка задачи.
6.1.2 Модифицированный функционал Лагранжа.
6.1.3 Функция значений м.ф.Л. и ее субдифференциал
6.1.4 Максимизация функции значений м.ф.Л., сходимость двойственного метода
6.1.5 Функционал невязки принципа максимума.
6.2 Метод точного недифференцируемого штрафа для регулярной задачи оптимального управления
6.2.1 Постановка задачи.
6.2.2 Расширение исходной задачи.
6.2.3 Нормаль Фреше и точный штрафной недифференцируемый функционал
7 Субоптимальное управление для задач с приближенно известными исходными данными, регуляризация
7.1 Субоптимальное управление для задач с приближенно известными исходными данными
7.1.1 Постановка задачи.
7.1.2 Принцип максимума для м.п.р. как необходимое условие в задачах с приближенными данными
7.1.3 Принцип максимума для м.п.р. как достаточное условие в задачах с приближенными данными, регуляризирующее свойство м.п.р.
7.2 Численные методы нахождения нормального решения обратной задачи, регуляризация
7.2.1 Постановка задачи.
7.2.2 Метод невязки для решения обратной задачи.
7.2.3 Алгоритм Удзавы для решения обратной задачи.
Введение
0.1 Сокращения, обозначения, нумерация
Список сокращений т.к. - так как; т.е. - то есть; п.в. - почти все, почти всюду; о.о. - ограничение общности; м.п. - минимизирующая последовательность; м.п.р. - минимизирующее приближенное решение; э.п. - экстремальная последовательность.
Список основных обозначений - " равно по определению" или " тождественно равно";
V - " для всех";
3 - " существует";
0 - пустое множество;
0}^- - нуль линейного пространства X; х £ X : .} - совокупность элементов множества X, обладающих свойством "."; X х Y - декартово произведение множеств X и У;
X - внутренность множества X; г i X - относительная внутренность X;
X - замыкание множества X; дХ - граница множества X; meas X - лебегова мера множества X; сГ - знак слабого со звездой замыкания; conv - выпуклая оболочка; dorn / - эффективное множество функции (функционала) /;
Ргх(а>) - проекция точки а на множество X; р(X) - функция (функционал) расстояния до множества X; dp(-, X) - производная Фреше (градиент) функции расстояния;
PNq(x) - совокупность всех проксимальных нормалей к множеству П в точке х;
Nc(x; П) - нормальный конус Кларка в х к П; dcf(x) - обобщенный градиент Кларка функции / в точке х\ q f(x) - сингулярный обобщенный градиент Кларка функции / в точке х;
N(x;ü) - нормальный конус Фреше к П в х\
N(x; П) - нормальный конус ко множеству ÍI в х; df(x) - субдифференциал (по Мордуховичу) функции / в точке X]
9°°/(х) - сингулярный субдифференциал (по Мордуховичу) функции / в точке х; х*,х) - значение линейного функционала х* 6 X* на элементе х £ X;
Ят - га-мерное пространство векторов-столбцов х = (хх,.,хт) с евклидовой нормой 1= дтхп тп мерНое пространство (га х п)-матриц А = {<%} с евклидовой нормой \А\ =
Е Е 4>1/2; ! = 1.7 =
1С(Ктхп) - метрическое пространство всех компактных множеств в Ятхп с метрикой Хаус-дорфа; Я» : \х\ < М}; б) = {х е Яп : зуе А, \х-у\< 6};
- лебегово пространство га-вектор-функций г(х) = (гх(х),. ,гт(х)), х 6 с нормой
1М1р,0 = { / И^)|р ¿г}», 1 < Р < ОО, |И|оо,п =угаг вир |г(дг)|, 1^(0) = Ьр(О);
- лебегово пространство га х п-матриц-функций г(х) = {^(яг)}, гс 6 О, с нормой
1Мко = { / |-Ф)Р 1 < р < ОО, ЦлЦсо^ =»га»вир |г(лг)|;
Л хеп
- банахово пространство абсолютно непрерывных функций V : П —>• Яп, П = [О, а] х [0,6] С Я2, ь(х, 0) = г/(0, у) = 0, с конечной нормой ||г/||^,„(п) = Н^у Нр,п
С(Г2) - банахово пространство непрерывных в О функций г(-) с конечной нормой
4о = шах
Со(П) - пространство всех непрерывных на О функций, зануляющихся на <9П; М(О) - множество всех регулярных радоновских мер на О, М(П) = Сд(П); М(О) - множество всех регулярных радоновских мер на П, М(П) = С*(П); Дальнейшие обозначения в этом пункте заимствованы из [67], [69]: П - область в Яп, т.е. открытое связное множество точек в Яп;
5т - цилиндр П х (0, Т); Вт - боковая поверхность цилиндра СЦт, т.е. множество Е яп+г: хе эа, г е [о,т]};
Ья,г(Ят) - банахово пространство, состоящее из всех измеримых по Лебегу на (¿т функций •) с конечной нормой
-\кг,Ят = (j*(Ju Hx^dx^dt)1*а £ (0,1) - банахово пространство непрерывных в области П (с липшицевой границей) функций z(-) с конечной нормой sup I.MI + <,)?>, <4->- «Р
J ^г — аг' l^/ на^2( qF), а € (0,1) - банахово пространство непрерывных в цилиндре Qt (с липшицевой границей области О) функций z(-,-) с конечной нормой м$= sup + t)eQr зир ———-, 8ир ■/ ;
И^П), д > 1 - банахово пространство, состоящее из функций г(-) € имеющих все первые обобщенные производные с конечной нормой
Я > 1 - банахово пространство, состоящее из функций г{-, •) Е ¿9(<5т), имеющих обобщенные производные 1,3 = 1,. , га, с конечной нормой п п п
1М®Г = \\4ч,ят + \Ы\я,дт + £1Ык<?Г + 11^11^; г=1 6=1>=
И^21,0(<5г) - гильбертово пространство со скалярным произведением
Ят ¿=
- гильбертово пространство со скалярным произведением г1, г2) = / + Е +г}{х,Ь)г*{х,г))<Ъац
•/От .-»
У3(дГ) - банахово пространство, состоящее из всех элементов И^'^фт) с конечной нормой
- банахово пространство, состоящее из всех элементов непрерывных по t в норме £2(0), с конечной нормой ЬИМ-* \
Нуль сверху над Ш^'0, И^'1, ^з(фг)> ^'"(фг) означает, что берутся лишь те элементы этих пространств, которые обращаются в нуль на
Нумерация
Нумерация пунктов в каждой главе, а также формул, теорем, лемм, следствий, замечаний в каждом пункте своя. Поэтому при ссылке на формулу (3) из п.2 главы 1 пишем "формула (1.2.3)".
0.2 Общая характеристика диссертации
Диссертация посвящена развитию математической теории субоптимального управления распределенными системами (т.е. системами, описываемыми уравнениями с частными производными) или, другими словами, математической теории оптимального управления распределенными системами, в которой "базовым элементом" теории является не оптимальное управление (обычное, т.е. измеримое по Лебегу, или обобщенное), а минимизирующая последовательность обычных управлений.
После открытия принципа максимума последовали его всевозможные обобщения. Во первых, были созданы различные общие схемы получения необходимых условий экстремума в абстрактных задачах с ограничениями (А.Я.Дубовицкий и А.А.Милютин, Р.В.Гамкрелидзе и Г.Л.Харатишвили, L.W.Neustadt и др., см., например, [28, 30, 41, 82, 95, 129, 241]). В дальнейшем эти схемы постоянно развивались и с их помощью решались все более сложные задачи оптимального управления (А.В.Дмитрук, А.Я.Дубовицкий, А.А.Милютин, Н.П.Осмоловский и др., см., например, [3, 8, 38, 39, 42, 43, 70, 83, 84, 104, 243]).
Одновременно с созданием абстрактных схем исследования задач оптимального управления интенсивно развивается также и теория "собственно задач" оптимального управления различными системами с сосредоточенными и распределенными параметрами (А.В.Арутюнов, В.И.Благодатских, В.Г.Болтянский, А.Г.Бутковский, Ф.П.Васильев, Р.Габасов, В.Ф.Демьянов, А.И.Егоров, Ю.В.Егоров, М.И.Зеликин, А.Д.Иоффе, Ф.М.Кириллова, Н.Н.Красов-ский, А.В.Кряжимский, А.Б.Куржанский, К.А.Лурье, Б.Ш.Мордухович, М.С.Никольский, Ю.С.Осипов, В.И.Плотников, Л.И.Розоноэр, С.Н.Слугин, Т.К.Сиразетдинов, В.М.Тихомиров, Е.Л.Тонков, В.А.Троицкий, А.Ф.Филиппов, А.В.Фурсиков, F.H.Clarke, J.L.Lions, J.War-ga, L.J.Young, и др., см., например, [2, 4, 5, 6, 7, 12, 14, 15, 16, 17, 18, 20, 23, 25, 37, 40, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 72, 74, 86, 92, 99, 100, 101, 105, 106, 107, 108, 121, 130, 133, 178, 179, 180, 182, 183, 185, 186, 187, 196, 199, 212, 213, 214, 215]).
В то же время появляются и различные общие подходы к получению принципа максимума для распределенных систем (Ю.В.Егоров, В.И.Плотников, В.А.Якубович, А.С.Матвеев, H.O.Fattorini и др., см., например, [48, 51, 52, 53, 77, 78, 79, 80, 81, 109, 110, 111, 112, 113, 114, 115, 191, 192, 193, 194, 195, 219]).
Теория оптимального управления системами с распределенными параметрами интенсивно развивается в различных направлениях (С.А.Авдонин, Л.Т.Ащепков, О.В.Васильев, Ф.П.Васильев, А.И.Егоров, С.А.Иванов, А.З.Ншмухаметов, А.В.Кряжимский, А.И.Короткий, В.И.Максимов, А.С.Матвеев, С.Ф.Морозов, Ю.В.Орлов, Ю.С.Осипов, М.М.Потапов, С.Н.Слугин, В.А.Срочко, В.И.Сумин, А.В.Фурсиков, В.А.Якубович, V.Barbu, H.O.Fattorini, H.Frankowska, B.S.Mordukhovich, J.L.Lions и др., см., например, [1, 10, 19, 20, 21, 22, 54, 56, 57, 62, 63, 73, 75, 76, 93, 98, 102, 103, 116, 117, 118, 119, 128, 138, 139, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 185, 186, 187, 188, 197, 201, 202, 203, 204, 220, 221, 222, 223, 225, 226, 232, 234, 235, 236, 242]).
Диссертация посвящена различным аспектам теории субоптимального управления распределенными системами, связанным так или иначе с принципом максимума Л.С.Понтрягина, который для краткости мы будем называть ниже просто принципом максимума.
Как уже отмечено выше, в теории оптимального управления сосредоточенными и распределенными системами существуют несколько абстрактных схем получения условий оптимальности. Эти схемы позволяют эффективно получать в различных сложных задачах оптимального управления с ограничениями условия оптимальности как первого, так и более высоких порядков [3, 8, 28, 30, 38, 39, 41, 43, 48, 51, 52, 53, 70, 77, 78, 79, 80, 81, 82, 83, 84, 95, 104, 109, 110, 111, 112, 113, 114, 115, 129, 191, 192, 193, 194, 195, 219, 241, 243], а также результаты так или иначе связанные с условиями оптимальности (принципом максимума). Важно отметить, что все эти абстрактные подходы предполагают наличие по крайней мере одного очень существенного обстоятельства: (I) Существование оптимального элемента. В теории оптимального управления таковыми являются обычные (измеримые по Лебегу) или обобщенные [18, 27, 29, 183, 196, 224] оптимальные управления. Отмеченное обстоятельство обеспечивается в случае обычного оптимального управления во всех упомянутых выше схемах посредством постулирования факта существования (как известно [196], именно это привело к возникновению словосочетания "наивная теория оптимального управления"), если на задачу не наложены дополнительные и, как правило, весьма жесткие условия существования оптимального элемента. При этом, как известно, для задач оптимального управления обыкновенными уравнениями, а также для весьма широкого класса так называемых полулинейных уравнений в частных производных существование оптимальных обобщенных элементов дается " практически даром".
В то же время, в теории оптимального управления распределенными системами несуществование обычного оптимального управления и одновременно невозможность расширения задачи в том или ином смысле [18, 27, 29, 183, 196, 224] не является каким либо редким и патологическим событием. Рассмотрим для иллюстрации следующий простой пример.
Пример 0.2.1. Рассмотрим простейшую задачу оптимального управления для одномерной задачи Гурса-Дарбу [ (г2(х, у) - и2{х, у)) ¿хйу Ы, u€V) JQ 30
Т> = {ие Ьоо(П) : и(х,у) е и = [-1,1] п.в. на П}, П = [0,1] х [0,1], гху = и(х, у)гх + и(х, у), г(х, 0) = г(0, у) = 0.
Специфика такой хорошо известной конструкции функционала такова, что в этой задаче нижняя грань I* > —1. В то же время, легко заметить, что эта нижняя грань не достигается ни на каком обычном управлении. Принцип максимума для м.п. [122] здесь имеет вид
Г Г m^ {i(x)y){zx[u%x,y)^l){v-ul{x,y))-{{u\x,y))2-v2)}dxdy<1\ (0.2.1) ^о Зо »е[-1,Ц где 7! >0, 7® —> 0, « -> оо, %\и1] - решение граничной задачи, соответствующее управлению и1, г}[иг] - решение при и = и1 сопряженной задачи
Ф, у) ~ / «К У)Ф, у)йу = ~2 / / У) иу ¿X оу
Элементарный анализ принципа максимума (0.2.1) показывает, что любая последовательность управлений и1, i = 1,2,., будет ему удовлетворять, если \и1{х, у)\ 1, гх[иг](х, у) -» —1, ¿ со, по мере на П. Т.к. и](лг, у) = [ (ехр( Г «(&, ¿6) ~ 1) <#1, 3О Зо то можно заметить, что последовательность иЧх и\ = I1 уе ^ е |0,1], ¿ = 1,3,.,2.-1,
1 'У}- 1-1 ^е[0,1], 3 = 2,4,.,2г, ¿ = 1,2,. удовлетворяет принципу максимума (0.2.1), в то время как для последовательности vHx tris í1 ¡^[0,1], J = к ,У> 1-1 X е ye [0,1], J= 2,4,. ,2», г = 1,2,. не выполняется предельное соотношение r¡[v%](x, y)(zs\vl]{x, у) +1) —> 0 по мере на П и принцип максимума (0.2.1) и, стало быть, она не является минимизирующей. В то же время, обе эти последовательности управлений, как нетрудно заметить, сходятся (в слабой норме ¡u,, см. [18]) к одному и тому же обобщенному управлению у) = |¿i + |¿-(-i.
Аналогичный пример с выпуклым по фазовой переменной и независящим от управления ин~ тегрантом интегрального функционала для двумерной системы Гурса-Дарбу можно найти в [34]. Более того, как показано в [34], гарантированное существование обычного оптимального управления для управляемой системы Гурса-Дарбу в задаче минимизации (без ограничений) интегрального функционала указанного выше вида жестко связано со специальной структурой нелинейной правой части системы и предполагает наряду с другими весьма жесткими условиями обязательную аддитивную разделенность производных от решения и управления f(x, у, Z, Z:c, Zy, и) = Д (х, у, Z, Zr, Zy) + f2(x, у, z, и).
Подобные примеры говорят о том, что в теории оптимизации распределенных систем в общей ситуации единственным выходом для получения " каких либо" условий оптимальности является рассмотрение именно м.п. в качестве "базового элемента" теории.
Представляется важным здесь также отметить и еще одно обстоятельство, с которым приходится неизбежно сталкиваться в теории оптимального управления системами с операторными ограничениями. При этом здесь и ниже под операторными ограничениями мы понимаем ограничения, задаваемые оператором с бесконечномерным образом; в противном же случае ограничения называем функциональными. Это обстоятельство связано с возможной невыполнимостью принципа, максимума. Оговоримся особо, что мы подразумеваем под невыполнимостью принципа максимума. Хорошо известно, что в задаче оптимального управления с функциональными ограничениями (для простоты рассматриваем лишь случай ограничений-равенств)
Io(u) min, h{u) =0, и £ V, где Iq : V R1 - минимизируемый функционал, I\ : V В - оператор, задающий ограничение, V - множество допустимых управлений, В - конечномерное банахово пространство, оптимальное управление и0 £ V удовлетворяет принципу максимума в задаче "безусловной минимизации" функционала Лагранжа o/o(«) + (Ai, /i(i»)) min, и € V, До > 0, Ai € В\ (A„, Аг) ф 0.
В случае же бесконечномерного целевого пространства В указанная импликация, вообще говоря, не верна, если на исходные данные задачи не накладываются некоторые существенные дополнительные условия.
В теории оптимального управления обыкновенными системами, как известно [8, 43], такие условия на исходные данные являются совокупности условий, объединяемых терминами общая каноническая задача [43] или регулярная каноническая задача [8]. В ряде других подходов (см., например, [219]) выполнимость принципа максимума обеспечивается за счет достаточно жестких условий на множество допустимых управлений (оно должно быть достаточно "богатым", что "не соответствует" классическим постановкам задач оптимального управления с существенно ограниченными управлениями), функционал и "правую часть" управляемой системы, обеспечивающих в процессе доказательства принципа максимума слабую сходимость последовательности функциональных множителей Лагранжа к неравному нулю предельному множителю. К числу типичных условий, "способствующих" выполнимости принципа максимума в задачах с операторными ограничениями относится также и стандартное условие непустоты внутренности целевого множества задачи, т.е. того множества, которому должны принадлежать значения оператора, задающего ограничение, а также условия регулярности смешанных ограничений в задачах оптимального управления со смешанными ограничениями.
Многие примеры задач оптимального управления с операторными ограничениями, в которых не справедлив принцип максимума, достаточно хорошо известны [23, 48] (см. также [2, с.261]). Напомним два из них. Первым из примеров, которые мы здесь приведем, является ставший уже классическим пример Ю.В.Егорова [23, 48], "снабженный" нами дополнительно параметром в ограничении.
Пример 0.2.2.
Io(v,T) = Т -»■ inf, h(v, Т) = x[v,T](T) = q, q £ l2 - параметр (0.2.2) x = v(t), x(0) = 0, x(t) = (^(i), x2{t),.), v(t) = (v^t), v2(t),. .), x(t) G h Ví > 0, и = (v,T) G V, V = {(г/, Г) :veVT, Т > 0},
VT = {v: v¡ е Leo(0,Г), И*)| < 1/г + 1/г2, i = 1,2,.}.
Как известно (см., например, [23, с.43]), в этой задаче при q = (1,1/2,., 1 fi,. .) оптимальное время равно 1 и достигается, например, при г/(£) = v(t) = (1,1/2,., If i,.). Однако, ни это, а также никакое другое допустимое управление, приводящее в точку q за время 1, не удовлетворяет принципу максимума. В силу простоты примера, легко показать, что данный факт обусловлен тем обстоятельством, что точка q не является опорной ко множеству достижимости I^V1,!). При этом она является граничной для множества ^(V1,!), т.е. управление v(t) является экстремальным (см., например, [71]) на отрезке [0,1]. Подобные ситуации, когда экстремальные управления для задач в бесконечномерных пространствах не удовлетворяют принципу максимума, хорошо известны (см., например, [11, с.310])). Более того, в силу простоты примера, можно также утверждать, что во множестве достижимости U Ii(T>t,T) всюду плотно лежат точки q, для которых любое оптимальное управление в задаче (0.2.2) удовлетворяет принципу максимума. Таковыми заведомо являются, например, все точки из этого множества с конечным числом ненулевых компонент.
В качестве второго примера рассмотрим простейшую задачу оптимального управления для уравнения теплопроводности с фазовым (полуфазовым) ограничением типа равенства, в котором в качестве целевого пространства выступает пространство ¿2(0,1) [155].
Пример 0.2.3. Рассмотрим задачу с фиксированным временем v*(x)v(x) dx -> inf, z{v]{x,T) = q G ¿2(0,1), q — параметр, v(x) G V = [—1,1], •J 0 дг/дг - д2г/дх2 = 0, ф, 0) = у(х), х £ О = (0,1),
1)!дх — г (О, £) = 0, дг(1, г)/дх + г{1,*) = О, ¿е[0,Т], где V* ф О - измеримая ограниченная функция, удовлетворяющая условию V* £ 1т, I*, где Г* : Ь2(0,1) -> ¿2(0,1) - оператор, задаваемый равенством /*[р](-) = г)[р](-,0), Р € £2(0,1), являющийся, очевидно, сопряженным к оператору I : £2(0,1) —> £г(0,1), задаваемому равенством /[?/](•) = а г]\р] - решение сопряженной задачи ду/дЬ + д2т]¡дх2 = 0, ф, 1) = р(х), х £ (0,1), дг}{0,г)/дх-г){0,г) =0, дт}(1^)1дх + т)(1^) = о, te[o,т].
Указанный выбор функции V* возможен, т.к. решения г] сопряженной задачи, как хорошо известно (см., например, [67, гл.III]), являются достаточно гладкими функциями. В силу простоты примера (и, в частности, в силу инъективности оператора 1, которая легко может быть установлена, например, на основе результатов [108], [121]), очевидно, в этом примере при д = 0 существует единственное допустимое, а, значит, одновременно и оптимальное управление щ(х, ¿) = 0.
Покажем, что оно не удовлетворяет принципу максимума. Действительно, если бы это было не так, то существовала бы пара (/¿о, у) 6 Я1 х £2(0), о > 0, (0.2.3) такая, что Г1 (/¿0Т/*Ы +4у){х,Щ)у{х)(1х >0 V vev = {и е £«»( 0,1) : и(ж) еУ п.в. на (0,1)}, т.е. элемент + ??[?/](•, 0) является опорным к выпуклому множеству V в точке
V = 0. Но это означает в данном случае, что + ??[у](-,0) = 0, т.к. конус нормалей к множеству Т> в точке V = 0 состоит лишь из нулевого элемента При этом в последнем равенстве цо — 0, т.к., по предположению, V* $ 1т I*. Таким образом, можно утверждать, что {[¿о,г)[у]) — 0, что, в свою очередь, на основании инъективности оператора I*, влечет равенство (/ло, У) — 0, противоречащее условию невырожденности пары множителей Лагранжа (0.2.3). Итак, мы показали, что оптимальное управление в данном примере при д — 0 не может удовлетворять принципу максимума.
Покажем одновременно, что конус нормалей Кларка 2Ус((0,0); epi /3) к надграфику функции значений /? в этой задаче при = 0 содержит лишь нулевой элемент (/3(0) = 0).
В силу инъективности оператора I, оператор I"1 : 1т I £-2(0,1) является линейным. Поэтому функция значений Р(д), задаваемая, очевидно, равенством р{д) = Г г/Ч*)/"1^) йх, д <Е 1т I,
Jo является линейной на 1т I и, значит, можно утверждать, что функция 0(д) является выпуклой на £2(0,1). Предположим, что конус нормалей ^с((0, 0); ерг ¡3) содержит ненулевой элемент, т.е. существует ненулевая нормаль ({, —а) £ 0, 0); ерг/3), а > 0, являющаяся в данном случае и нормалью в смысле выпуклого анализа, т.е. {(£, —а), (д, 7)) < 0 У(д, 7) € ерг/З, или ((,д) — осу < 0 У(д, 7) £ ерг/3, откуда, в свою очередь, следует, что
С?}-« у*^)1^]^)^ <° У 0. £ 1т I. «/0
Из последнего неравенства получаем ((, z[v](-, Т)) — a(v*,v) < 0 Vv £ Т>2, т.е. {??[£] — av*>v) ^ О Vtf £ Щ стало быть, r?[£] — av* = 0. Из последнего равенства, на основании опять же условия v* (fc Im I* и инъективности оператора I*, получаем, наконец, ((, —а) = 0. Очевидно, те же самые рассуждения можно провести для любого элемента q = z[v](-,T), если только управление v(;r) £ (—1,1) п.в. на (0,1). В то же время легко показать, что точки q = z[v]{-,T), при v £ V таких, что v(x) £ {—1,1} на множестве положительной меры, всюду плотно лежат в dorn ß и для каждой такой точки принцип максимума выполняется для оптимального управления задачи.
Эти, а также другие подобные примеры (естественно, число подобных разнообразных примеров молено неограниченно увеличивать) объединяет одно очень важное обстоятельство: выполнимость принципа максимума в них и, более того, регулярного принципа максимума (т.е. с ненулевым множителем, соответствующим функционалу качества) жестко связано с дифференциальными свойствами функций значений задач как функций параметра, аддитивно входящего в ограничение - наличие нормали в каком-либо естественном смысле к надграфику функции значений при некотором выбранном значении параметра гарантирует выполнимость в соответствующей задаче регулярного принципа максимума.
Сказанное выше служит мотивацией отказа в настоящей работе от традиционного требования выполнимости в задачах оптимального управления отмеченного выше обстоятельства (I) и рассмотрения, в контексте общей идеологии метода возмущений (см., например, [2, с.263]) задачи оптимального управления как элемента семейства задач, зависящих от параметра, аддитивно входящего в ограничение. Говоря конкретнее, мы рассматриваем задачу минимизации
Aq) J0(и) inf, h(u) £ М + q, u£V, q £ В - параметр, где V - полное метрическое пространство, В - равномерно выпуклое банахово пространство с дифференцируемой по Фреше нормой, J0 : V -»• R1 - непрерывный ограниченный снизу функционал, h : V В - непрерывный оператор, М С В - выпуклое замкнутое (вообще говоря, без внутренних точек) множество. В соответствии со сказанным основным "объектом", подлежащим " нахождению" является минимизирующая последовательность - минимизирующее приближенное решение в смысле Дж.Варги [18], т.е. последовательность элементов (будем называть их также управлениями) и1 £ V, г = 1,2,., такая, что для некоторых последовательностей неотрицательных чисел 5г, е\ г = 1, 2,., <$\ е! 0, i —} оо, где q) = ß+0(q) = lim ߀(q), ß<(q) = inf I0(u), ߀(q) = +oo, если V\ = 0,
V\ = {и £ V : p{h{u) - q, M) < e}, e > 0, p(-, M) - функция расстояния. Возникающая здесь функция (функционал) ß : В -» R1 U { + оо} называется функцией значений задачи (Л9) и для нее справедливо неравенство ß(q) < ßo(q) Vg £ В, где ß0 : В -»■ R1 - классическая функция значений. В связи с задачей (Aq), которая имеет вид абстрактной задачи минимизации с ограничением в банаховом пространстве, но аксиоматика которой нацелена лишь на задачи оптимального управления, и в связи с введенным понятием м.п.р. отметим следующие обстоятельства: a) м.п.р. всегда существует; b) функция значений ¡3, "согласованная" именно с понятием м.п.р. (а не с понятием классического оптимального управления) является всегда полунепрерывной снизу; c) использование понятия м.п.р. позволяет записывать все результаты для задачи (Л?) в терминах расширенной [18] задачи, если такое расширение возможно;
1) именно понятие м.п.р. существенно используется в теории численных методов оптимального управления, а также в теории задач оптимального управления с приближенно известными исходными данными; е) понятие м.п.р. несет в себе регуляризирующее начало; понятие м.п.р. является очень удобным с прикладной (инженерной) точки зрения [18], т.к. позволяет " приближаться" сколь угодно близко к нижней грани задачи без " обязательного" требования строгой выполнимости ее ограничений и, вообще говоря, использовать при этом лишь " релейные" управления.
Следует отметить, что различные аспекты теории оптимального управления, связанные с субоптимальностью и м.п., постоянно привлекали внимание исследователей [18, 86, 201, 202, 218, 220, 223, 225, 244]. Однако практически до последнего времени все результаты работ по минимизирующим последовательностям группировались лишь вокруг получения необходимых условий. Первыми работами, в которых для задач оптимального управления сосредоточенными и распределенными системами необходимые условия формулировались в терминах м.п., были, по-видимому, работы [122, 124, 126]. В них для ряда задач оптимального управления (без ограничений, с ограничениями типа равенства и неравенства) как обыкновенными системами [124, 126], так и уравнениями в частных производных (задача Гурса-Дарбу) [122] были получены необходимые условия на м.п. в форме так называемого возмущенного принципа максимума. Далее, вторым из авторов этих работ последовательно были получены необходимые и достаточные условия на м.п. и для других задач оптимального управления (в частности для задач с поточечными фазовыми ограничениями) сосредоточенными и распределенными системами [156, 163, 164]. В работе [26] на основе дискретных аппроксимаций непрерывных процессов были получены необходимые условия субоптимальности в форме так называемого принципа е-максимума (см. также [86]). В цикле работ (см., например, [220, 223]) изучались необходимые условия на м.п., а также вопросы сходимости м.п. для целого класса задач оптимального управления абстрактными полулинейными дифференциальными уравнениями в банаховом пространстве с терминальным ограничением и нефиксированным временем. Для того же класса задач в [225] были получены связанные с принципом максимума явные оценки уклонения произвольного управления от оптимального в некоторой естественной метрике. И, наконец, в самое последнее время интерес к проблеме необходимых условий субоптимальности и на м.п. был проявлен авторами работ [234, 235, 236], в которых были рассмотрены задачи оптимального управления распределенными системами, описываемыми нелинейными параболическими уравнениями.
Полунепрерывность снизу функции значений является наиважнейшим обстоятельством для теории оптимального управления, т.к. позволяет "подключить" к анализу оптимизационных задач интенсивно развивающийся в последние годы аппарат негладкого анализа, а, именно, анализа нормалей (проксимальных нормалей) для замкнутых множеств в банаховых пространствах и обобщенного дифференцирования негладких функций в банаховых пространствах. Различные важные результаты в этом направлении были получены в работах Р.Рокафеллара [247, 248, 249, 250], Ф.Кларка [55], Дж.Борвейна и Х.Строджуаса [208],
Б.Ш.Мордуховича [86, 87, 88, 237, 238], Б.Ш.Мордуховича и Й.Шао [239, 240] и ряда других авторов [227, 229, 230, 254]. Именно использование негладкого нормального анализа и теории обобщенного дифференцирования полунепрерывных снизу функций позволяет рассматривать каждую задачу оптимального управления " не изолированно", а как элемент семейства аналогичных задач и получать информацию "в целом" о семействе и, как следствие, во многих важных частных случаях о каждой конкретной задаче отдельно. Такой подход приводит к возможности изучения условий регулярности, нормальности, проблемы чувствительности для широкого класса задач оптимального управления, а также позволяет "сблизить" теорию необходимых условий (теорию принципа максимума) и теорию численных методов оптимального управления.
Следует отметить, что первые результаты в этом направлении были получены, по-видимому, Ф.Кларком [55, 214], Ф.Кларком и Ф.Ловеном [215] для задач оптимального управления системами обыкновенных дифференциальных уравнений с помощью теории перпендикуляров [55] к замкнутым множествам в конечномерном пространстве[55, 215] и с помощью проксимальных нормалей [208] к замкнутым множествам в рефлексивных пространствах [214]. В этих работах были получены полезные представления для обобщенных градиентов в смысле Кларка функций значений в терминах множителей Лагранжа. При этом рассматривались классические оптимальные управления и функции значений, а на задачи накладывались специальные условия для обеспечения полунепрерывности снизу классической функции значений в окрестности рассматриваемого фиксированного значения параметра.
Рассмотрение задачи (семейства задач) (Ая) дает возможность изучения широкого спектра различных классических вопросов теории оптимизации, к которым можно отнести: 1) необходимые и достаточные условия для м.п.р. (в частности, для обычных или обобщенных оптимальных управлений); 2) различные свойства регулярности, нормальности, их связь с множителями Лагранжа, с дифференциальными свойствами функции значений, с векторами Куна-Таккера; 3) свойства чувствительности; 4) сходимость м.п.; 5) численные методы оптимального управления; 6) методы решения задач с приближенно известными исходными данными, регуляризация в задачах оптимального управления.
В результате "расшифровки" абстрактных результатов для задачи в диссертации получаются конкретные результаты по указанным вопросам для распределенных задач оптимального управления системами, описываемыми линейными, полулинейными и квазилинейными параболическими, эллиптическими и гиперболическими уравнениями с различными функциональными и операторными ограничениями. При этом, несмотря на то, что целевое пространство задачи (Ая) является равномерно выпуклым, мы показываем как на основе этих результатов получаются результаты, связанные с перечисленными выше вопросами, также и для задач вида (Л?), но для случая целевых пространств с равномерной метрикой. Мы показываем также возможность распространения указанных результатов и на так называемые негладкие задачи оптимального управления.
Развиваемая в диссертации теория субоптимального управления оказывается полезной также и для теории численных методов оптимального управления, в которых понятие м.п.р. является, по сути дела, центральным. Здесь предлагаются алгоритмы решения задач оптимального управления, основанные на двойственности, доказывается их сходимость, показывается, что такие алгоритмы также теснейшим образом связаны с дифференциальными свойствами функции значений: наличие нормали к надграфику функции значений "порождает" численный алгоритм.
Кроме того, понятие м.п.р. оказывается чрезвычайно полезным и для теории задач оптимального управления с приближенно известными исходными данными, т.к. благодаря этому понятию многие из результатов, о которых шла речь выше переносятся и на такие важные с прикладной точки зрения задачи (в первую очередь это относится к принципу максимума). В то же время, использование в задачах с приближенными данными классического понятия оптимального управления встречает, как известно, принципиальные трудности.
Подытоживая сказанное, можно утверждать, что переход к рассмотрению м.п.р., представляющий собой в известном смысле "максимальное" расширение исходной задачи, находится в согласии с известным высказыванием Д.Гильберта [196] о том, что "каждая задача вариационного исчисления имеет решение, если слово " решение" понимать подходящим образом". Понимая под решением оптимизационной задачи м.п., мы показываем, что теория, основанная на этом понятии, обобщая традиционную, дает возможность получить новую полезную информацию о задаче. Такая ситуация вполне схожа с той, что возникает при переходе от обычных управлений к обобщенным в смысле [18, 27, 29, 183, 196, 224].
Цель диссертационной работы. Цель работы состоит в разработке методов теории субоптимального управления распределенными системами, предназначенных для решения вопросов указанной теории, связанных с необходимыми и достаточными условиями на минимизирующие последовательности, с различными свойствами регулярности и нормальности, с проблемой чувствительности, с негладкими задачами, с численными методами, с задачами с приближенно известными исходными данными.
Методы исследования. В диссертации использованы методы оптимизации, оптимального управления, негладкого анализа, обыкновенных дифференциальных уравнений и дифференциальных уравнений с частными производными, функционального анализа и теории функций действительного переменного.
Научная новизна. В диссертации разработана теория субоптимального управления системами с распределенными параметрами. Показано, что на основе этой теории получаются новые для оптимального управления результаты, относящиеся как к собственно теории, так и к теории численных методов. Все результаты диссертации (главы 1-7) являются новыми.
Степень обоснования результатов диссертации. Все научные положения и выводы диссертационной работы строго математически обоснованы. Результаты, полученные в диссертации, хорошо согласуются с работами других авторов как отечественных, так и зарубежных.
Теоретическая и практическая ценность. Работа носит теоретический характер. Полученные в ней результаты и методы могут быть применены в теории оптимального управления: 1) при теоретическом исследовании многих сложных конкретных задач с различного рода функциональными и операторными ограничениями; 2) при численном решении различных задач оптимального управления распределенными системами с помощью предложенных в диссертации двойственных численных методов.
Результаты диссертации вошли в отчет о НИР1, учебное пособие 2 и были включены в спецкурсы, читаемые для студентов Нижегородского государственного университета им. Н .И. Лобачевского.
Апробация работы. Результаты диссертации докладывались и обсуждались: на Международной конференции "Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде" (Екатеринбург, 2000); на Симпозиуме "Математическое моделирование в естественных и гуманитарных науках", посвященном 80-летию М.А.Красносельского (Воронеж, 2000); на Международной конференции, посвященной 90-летию со дня рождения Л.С.Понтрягина (Москва, 1998); на IV,VI,VII,VIII,IX,X,XI весенних воронежских школах "Понтрягинские чтения" (Воронеж, 1993, 1995, 1996, 1997, 1998, 1999, 2000); на Международной конференции ИФИП "Моделирование и оптимизация систем с распределенными параметрами с приложениями к инженерии" (Варшава, 1995); на III Всесоюзной школе "Понтрягинские чтения. Оптимальное управление. Геометрия и анализ" (Кемерово, 1990); на школе "Современные методы в теории краевых задач" (Воронеж, 1992); на XIV Всесоюзной школе по теории операторов в функциональных пространствах (Н.Новгород, 1991); на Первом Международном семинаре ЙФАК " Негладкие и разрывные задачи управления и оптимизации" (Владивосток, 1991); на 1,11 Международных конференциях "Математические алгоритмы" (Н.Новгород, 1994,1995); на Международной научной конференции "Экстремальные задачи и их приложения" (Н.Новгород, 1992); на Всесоюзной конференции "Негладкий анализ и его приложения к математической экономике" (Баку, 1991); на Научной школе-семинаре "Разрывные динамические системы" (Ужгород, 1991); на VII,IX Всесоюзных конференциях "Проблемы теоретической кибернетики" (Иркутск, 1985; Волгоград, 1990); на Всесоюзной конференции "Теория, методология и практика системных исследований" (Москва, 1985); на Итоговых научных конференциях Горьковского госуниверситета (1986-1990).
По теме диссертации были также сделаны доклады на семинаре по оптимальному управлению (ННГУ, рук. проф. В.И.Плотников, 1977-1988), на Волго-Вятском региональном семинаре по математической физике и оптимальному управлению (рук. проф. С.Ф.Морозов, 1990-1992), на семинарах в Московском государственном университете (рук. проф. Ф.П.Васильев, 1987, 1993, 2000; рук. проф. М.И.Зеликин, 2000; рук. проф. М.С.Никольский, 1988, 1990), на семинаре в Институте математики и механики УРО РАН (рук. акад. РАН Ю.С.Осипов, чл.-корр. РАН А.В.Кряжимский, 1991,1993), на семинаре в Институте проблем управления (рук. проф. В.И.Уткин, 1986).
Результаты диссертации на протяжении ряда лет являлись составной частью результатов работы, выполняющейся при финансовой поддержке различных научных Фондов:
1993- 1994 г.г. - грант Международного Научного Фонда (фонд Дж.Сороса) и Российской Академии Естественных Наук (РАЕН);
1993 - 1995 г.г. - грант Конкурсного центра при С.-Петербургском университете Госкомитета РФ по высшему образованию (проект А/о 93-1-71-19), тема "Теория оптимального
Теория оптимального управления распределенными системами: субоптимальность, минимизирующие последовательности, численные методы. Отчет о НИР по гранту Конкурсного центра при С.-Петербургском университете Госкомитета РФ по высшему образованию (А/°93-1-71-19), Л/о госрегистрации 01.9.40006443.1994, 74 с.
2Новоженов М.М., Сумин В.И., Сумин М.И. Методы оптимального управления системами математической физики. Учебное пособие. Горький: Изд-во ГГУ. 1986.-87 с. управления распределенными системами: субоптимальность, минимизирующие последовательности, численне методы" (Сумин М.И. - ответственный исполнитель);
1995-1997 г.г. - грант Российского Фонда Фундаментальных Исследований (проект А/о 9501-00701), тема "Теория субоптимального управления распределенными системами и функциональные вольтерровы уравнения" (Сумин М.И. - ответственный исполнитель);
1998-2000 г.г. - грант Российского Фонда Фундаментальных Исследований (проект А/о 98-01-00793), тема "Теория субоптимального управления распределенными системами: минимизирующие последовательности, операторные ограничения, граничные управления, численные методы" (Сумин М.И. - руководитель);
Публикации. Всего по теме диссертации опубликовано более 70 работ. Основные результаты диссертации опубликованы в следующих 36 работах (в скобках указаны номера по списку литературы):
1. ([122]) Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей в задачах управления системами с распределенными параметрами // Ж. вычисл. матем. и матем. физ. 1982. Т.22. А/о1. С.49-56.
2. ([123]) Плотников В.И., Сумин М.И. Необходимые условия в негладкой задаче оптимального управления // Матем. заметки. 1982. Т.32. А/о8. С.187-197.
3. ([124]) Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей // Дифференц. ур-ния 1983. Т.19. А/о4. С.581-588.
4. ([125]) Плотников В.И., Сумин М.И. Оптимальное управление объектами с распределенными параметрами, описываемыми негладкими системами Гурса-Дарбу с ограничениями типа неравенства // Дифференц. ур-ния. 1984. Т.20. А/о5. С.851-860.
5. ([156]) Сумин М.И. О достаточных условиях на элементы минимизирующих последовательностей // Ж. вычисл. матем. и матем. физ. 1985. Т.25. А/оД. С.23-31.
6. ([126]) Плотников В.И., Сумин М.И. Об условиях на элементы минимизирующих последовательностей задач оптимального управления // Докл. АН СССР. 1985. Т.280. А/о2. С,292-296.
7. ([89]) Морозов С.Ф., Сумин М.И. Об одном классе задач управления динамическими системаи с разрывной правой частью // Кибернетика. 1985. А/оЗ. С.59-65.
8. ([163]) Сумин М.И. О минимизирующих последовательностях в задачах оптимального управления при ограниченных фазовых координатах // Дифференц. ур-ния. 1986. Т.22. А/оЮ. С.1719-1731.
9. ([165]) Сумин М.И. Достаточные условия оптимальности в негладких задачах оптимального управления распределенными системами // Дифференц. ур-ния. 1986. Т.22. А/о2. С.326-337.
10. ([157]) Сумин М.И. Оптимальное управление системами с приближенно известными исходными данными // Ж. вычисл. матем. и матем. физ. 1987. Т.27. А/*о2. С.163-177.
11. ([90]) Морозов С.Ф., Сумин М.И. Оптимальное управление скользящими режимами разрывных динамических систем // Известия ВУЗов, Математика. 1990. А/о1. С.53-61.
12. ([166]) Сумин М.И. О функционале невязки принципа максимума в теории оптимального управления // Ж. вычисл. матем. и матем. физ. 1990. Т.30. А/о8. С.1133-1149.
13. ([158]) Сумин М.И. Оптимальное управление разрывными динамическими системами со скользящими режимами // Дифференц. ур-ния. 1988. Т.24. А/о 11. С.1911-1922.
14. ([160]) Сумин М.И. Оптимальное управление объектами, описываемыми квазилинейными эллиптическими уравнениями // Дифференц. ур-ния. 1989. Т.25. Л/о8. С.1406-1416.
15. ([161]) Сумин М.И. О первой вариации в теории оптимального управления системами с распределенными параметрами // Дифференц. ур-ния. 1991. Т.27. Л/о12. С.2179-2181.
16. ([162]) Сумин М.И. О необходимых условиях оптимальности в задачах оптимального управления системами с распределенными параметрами // Методы прикладного функционального анализа. Межвузовский сборник. Н. Новгород: Изд-во Нижегородского университета. 1991. С.88-94.
17. ([151]) Сумин М.И. Субоптимальное управление системами с распределенными параметрами. Труды первой Международной конф. "Математические алгоритмы", 1995. С.116-125, Изд-во Нижегородского ун-та, Н.Новгород.
18. ([152]) Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений // Ж. вычисл. ма-тем. и матем. физ. 1997. Т.37. N 1. С.23-41.
19. ([153]) Сумин М.И. Субоптимальное управление системами с распределенными параметрами: свойства нормальности, субградиентный двойственный метод" // Ж. вычисл. матем. и матем. физ. 1997. Т.37. N 2. С.162-178.
20. ([252]) Sumin M.I. Suboptimal control of systems with distributed parameters: minimizing sequences, value function, regularity, normality // Control and Cybernetics, 1996, V.25, No.3, P.529-552.
21. ([150]) Сумин В.И., Сумин М.И. Субоптимальное управление вольтерровыми функциональными уравнениями: минимизирующие последовательности, функция значений, регулярность, нормальность. Математическое моделирование и оптимальное управление, Межвузовский сборник научн. тр., 1996, С.23-31, Изд-во Нижегородского ун-та, Н.Новгород.
22. ([251]) Sumin M.I. Suboptimal control of systems with distributed parameters: minimizing sequences, value function, regularity, normality, Abstracts of IFIP Conf. "Modelling and optimization of distributed parameter systems with applications to engineering", Warsaw, Poland, 1995, Warsaw: System Research Institute, 1995, P.156-157.
23. ([159]) Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений, регулярность, нормальность, негладкие задачи, Нижегородский ун-т.- Н.Новгород, 1996. - 120с. Деп. в ВИНИТИ 08.01.97. N 62-В97.
24. ([167]) Сумин М.И. Субоптимальное граничное управление системами, описываемыми параболическими уравнениями. Тезисы докл. школы "Понтрягинские чтения - VII", Воронеж, ВГУ, 1996, С.172, Изд-во Воронежского ун-та, Воронеж.
25. ([168]) Сумин М.И. Субоптимальное граничное управление эллиптическими уравнениями с фазовыми ограничениями. В кн. " Современные методы в теории краевых задач "Понтрягинские чтения - VIII": Тезисы докладов школы, Воронеж, ВГУ (4-9 мая 1997)", Воронеж: ВГУ, 1997, С.146.
26. ([169]) Сумин М.И. Субоптимальное граничное управление параболическими уравнениями с операторными ограничениями, В кн. "Воронежская весенняя математическая школа, Современные методы в теории краевых задач, Понтрягинские чтения~1Х, Тезисы докладов (3-9 мая 1998 г.)", 1998, Изд-во Воронежского ун-та, Воронеж, С.192.
27. ([170]) Сумин М.И. Принцип максимума в теории субоптимального управления распределенными системами, В кн. "Международная конференция, посвященная девяностолетию со дня рождения Л.С.Понтрягина, Москва, 31 августа - б сентября 1998 г., Тезисы докладов, Оптимальное управление и добавления", 1998, Изд-во Московского ун-та, Москва, С.261-263.
28. ([154]) Сумин М.И. Субоптимальное управление распределенными системами I. Абстрактная задача минимизации с операторным ограничением в гильбертовом пространстве, Вестник Нижегородского государственного университета "Математическое моделирование и оптимальное управление", 1998, 2(19), Изд-во Нижегородского ун-та, Н.Новгород, С.152-165.
29. ([155]) Сумин М.И. Субоптимальное управление распределенными системами II. Параболическое уравнение, операторное ограничение, граничное управление, Вестник Нижегородского государственного университета "Математическое моделирование и оптимальное управление", 1999,1(20), Изд-во Нижегородского ун-та, Н.Новгород, С.138-153.
30. ([171]) Сумин М.И. Принцип максимума в параметрической задаче быстродействия для параболического уравнения с операторным ограничением в гильбертовом пространстве В кн. "Воронежская весенняя математическая школа, Современные методы в теории краевых задач, Понтрягинские чтения-Х, Тезисы докладов (3-9 мая 1999 г.)", 1999, Изд-во Воронежского ун-та, Воронеж, С.235.
31. ([172]) Сумин М.И. Принцип максимума в теории субоптимального управления распределенными системами с операторными ограничениями в гильбертовом пространстве. Итоги науки и техники. ВИНИТИ. Современная математика и ее приложения. Тематические обзоры. 1999. Т.66. С. 193-235.
32. ([253]) Sumin M.I. Optimal control of semilinear elliptic equation with state constraint: maximum principle for minimizing sequence, regularity, normality, sensitivity // Control and Cybernetics. 2000. V.29. No.2. P.449-472.
33. ([173]) Сумин М.И. Субоптимальное управление полулинейным эллиптическим уравнением с фазовым ограничением и граничным управлением // Дифференц. ур-ния. 2000. Т.36. А/о11.
34. ([174]) Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, I: принцип максимума для минимизирующих последовательностей, нормальность // Известия ВУЗов, Математика. 2000. А/об. С.33-44.
35. ([175]) Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, II: чувствительность, типичность регулярного принципа максимума // Известия ВУЗов, Математика. 2000. А/о8. С.
36. ([176]) Сумин М.И. Оптимальное управление параболическими уравнениями: двойственные численные методы, регуляризация, В кн. "Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде. Сб. докладов к Международной конференции (Екатеринбург, 30 мая - 2 июня 2000 г.)", 2000, Екатеринбург: Изд-во Ин-та математики и механики УрО РАН. С.66-69.
Из них: 22 статьи в центральных математических журналах, 1 - в периодическом издании ВИНИТИ "Итоги науки и техники", 4 - в научных сборниках ННГУ, депонированных работ - 1, в трудах конференций - 8.
Все результаты, вошедшие в диссертацию (главы 1-7), являются новыми и изложены в указанных работах. Результаты главы 1 содержатся в работах [154, 159], главы 2 - в работах [122, 124, 126, 150, 151, 152, 153, 155, 156, 159, 166, 167, 169, 170, 171, 172, 251, 252], главы 3 - в работах [151, 152, 153, 160, 161, 162, 163, 168, 173, 174, 175, 252, 253], главы 4 - в работах [122, 124, 156, 159], главы 5 - в работах [89, 90, 123, 125, 156, 159, 165], главы 6 - в работах [153, 166, 176], главы 7 - в работах [153, 157, 166, 176]. Все результаты диссертации целиком принадлежат автору диссертации.
В трех совместных с В.И.Плотниковым работах [122, 124, 126] рассматривались лишь необходимые условия, причем только для классических минимизирующих последовательностей, т.е. для последовательностей управлений, удовлетворяющих ограничениям в точном смысле. Из этих, по сути дела, первых работ по минимизирующим последовательностям в оптимальном управлении автором используется лишь общая идея перехода в распределенных задачах оптимального управления к рассмотрению в качестве "базового элемента" теории минимизирующей последовательности, а не оптимального управления. В диссертации же в качестве "базового элемента" используется минимизирующее приближенное решение в смысле Дж.Варги. Это позволило построить совершенно новую теорию субоптимального управления и рассмотреть при этом весьма широкий спектр оптимизационных вопросов, изучение которых было бы совершенно невозможно в рамках классических минимизирующих последовательностей.
В двух других совместных с В.И.Плотниковым работах [123, 125], а также в двух совместных работах с С.Ф.Морозовым [89, 90] авторами были предложены методы получения необходимых условий оптимальности в негладких (разрывных) задачах оптимального управления, одними из составных частей которых являются процедуры сглаживания исходных данных. Эти процедуры сглаживания, в равной мере принадлежащие авторам указанных работ, используются в главе 5 для изучения новых вопросов, совершенно не затрагиваемых в указанных совместных статьях.
В совместной с В.И.Суминым работе [150] содержатся результаты, иллюстрирующие эффективность предлагаемых в диссертации методов и показывающие возможность их применения и к такому достаточно широкому кругу задач субоптимального управления распределенными системами, как задачи, описываемые так называемыми вольтерровыми уравнениями, теория которых разрабатывается в работах В.И.Сумина. Все результаты [150], связанные со свойствами регулярности, нормальности, чувствительности и т.п., получены методами, разработанными автором диссертации. При этом, естественно, использовались результаты, связанные с существованием и устойчивостью решений указанных уравнений, принадлежащие В.И.Сумину.
0.3 Краткий обзор содержания диссертации
Первая глава диссертации посвящена изучению абстрактной задачи минимизации с аддитивно зависящим от параметра операторным ограничением типа включения в выпуклое замкнутое множество равномерно выпуклого банахова пространства с дифференцируемой по Фреше нормой. Вся аксиоматика этой абстрактной задачи нацелена лишь на изучение конкретных задач оптимального управления сосредоточенными и распределенными системами с различного рода ограничениями и на получение в них результатов, связанных с необходимыми и достаточными условиями на м.п., со свойствами регулярности, нормальности, чувствительности и т.п.
При получении абстрактных необходимых условий (суб)оптимальности и представлений для субдифференциалов функций значений указанная абстрактная задача каждый раз на определенном этапе трансформируется в задачу минимизации на некотором полном метрическом пространстве функционала типа максимума от конечного числа "обычных" (в смысле существования первых вариаций) функционалов. Поэтому п.1.1 посвящен доказательству обобщенного правила множителей для (суб)оптимальных элементов в задаче (в более упрощенной по сравнению с п.1.1 формулировке)
J$(u) = тах{Ф;(и) + (jd(u, fZ), j = 0,1,., ае} —у inf, и £ V, (0.3.1) где V - полное метрическое пространство элементов и, называемых также управлениями, : V R1 - непрерывные ограниченные снизу функционалы, > 0 - некоторые фиксированные числа, d - метрика на V, п £ V - некоторое фиксированное управление. Правило множителей для задачи (0.3.1) формулируется при определенных предположениях общего характера относительно "обычных" функционалов Ф, и метрики d. Использование в качестве множества допустимых элементов полного метрического пространства, а также наличие слагаемого с метрикой в каждой компоненте функционала J^ объясняется тем, что одним из основных инструментов в теории субоптимального управления является вариационный принцип Экланда [218]. Указанные выше условия общего характера (которые мы даем ниже в "укороченной" по сравнению с п.1.1 форме) предполагают наличие линейного пространства "параметров варьирования" М с элементами m и отвечающих каждому управлению и £ V "своих" выпуклого множества Ми С М, числа аи,т > 0 и непрерывного отображения - вариации управления Nu~ : [0, au,m] -» V, NU)m(0) = и, таких, что a) (аксиома существования первых вариаций функционалов Ф^) для некоторой функции С : [0,1] R+, с(0) = 0, <г(а) > 0 при а > 0, существуют пределы Vu £ V, m £ Mu
Ф>, m) = lim - (а)) - Ф»),
Vi £ M[J{(«)] = {j € {0,1,., ae} : Ф» + (Ди, ö) = Je(t»)}; b) (аксиома равномерной ограниченности производных чисел метрики, согласованных с вариацией управления) для некоторой постоянной L > 0 выполняется неравенство d(Nu v) - d(u, v) < U{a) V и, v £ V, m £ Mu, а € [0, а"'™]; c) (аксиома линейности первых вариаций функционалов Ф,)
Airrii + A2m2) = Aimx) + А2<5Ф^(и, m2), j £ M\J^{v)},
V« £ V, mi, m2 £ Mu, Ai > 0, A2 > 0, Хг + A2 < 1. При сформулированных условиях справедлива
Теорема 0.3.1, Пусть и £ V - 5-оптимадьный элемент в задаче (0.3.1), т.е. J^(u) < inf J^(v) +<£. Тогда существуют элемент us £ V, удовлетворяющий неравенству d(us, и) < vev б, и вектор множителей Лагранжа = (/4> . ,¿4) £ Rs+1, |\ = 1, ¡л{ > 0, fj,5k(J^(us) — Ф*(и<5) — ikd{u&, й)) = 0, k = 0,1,., as, такие, что ге
X) m) + 2L{(k + V^)) > 0 Vm £ Mu*. k=0
В п. 1.2 рассматривается абстрактная параметрическая задача (Лг), причем, как уже было сказано в п.0.2, в качестве "искомого" элемента выступает м.п.р. в смысле Дж.Варги [18]. Выбор в качестве целевого в задаче (Л9) равномерно выпуклого пространства с дифференцируемой по Фреше нормой обусловлен тем методом, который мы применяем для ее изучения. При этом, с одной стороны, т.к. равномерная выпуклость пространства обеспечивает его строгую нормированность [184, с.51], [35, с.496, упражнение 7], то проекция точки на выпуклое замкнутое множество в этом случае существует и единственна [177, с. 152, лемма 1], что в совокупности с дифференцируемостью нормы приводит к непрерывной дифференциру-емости по Фреше для любого выпуклого замкнутого множества М С В выпуклой функции (функционала) расстояния р(-, М) в окрестности любой точки д £ В такой, что р(д, М) > 0. С другой же стороны, равномерная выпуклость пространства В позволяет считать его также пространством Асплунда [200], что позволяет применять для изучения задачи (Ач) как эффективные методы негладкого секвенциального анализа для таких пространств, развитые в последние годы в работах Б.Ш.Мордуховича и Й.Шао [240], так и различные другие эффективные методы негладкого проксимального анализа для замкнутых множеств в банаховых пространствах [208].
Особо оговоримся, что часть основных результатов настоящей работы так или иначе используют понятия нормалей и субдифференциалов именно в смысле работ [86], [240], т.к., с одной стороны, в этих работах развито весьма полное и удобное субдифференциальное исчисление, а с другой, как известно [227], именно эти, вообще говоря, невыпуклые конструкции негладкого анализа являются, в известном смысле, наиболее "тонкими" по сравнению с другими аналогичными конструкциями.
Любой метод получения необходимых условий оптимальности предполагает прежде всего решение двух основных проблем. Одна из них заключается в эффективном вычислении первых вариаций функционалов оптимизационной задачи, другая же - в учете ограничений задачи. Можно утверждать, что предлагаемый в работе подход к получению необходимых условий для м.п.р. (условий (суб)оптимальности) и, как следствие, представлений в терминах множителей Лагранжа для субдифференциалов д/3(д), д°°^(д) в смысле [240], в своей основе для решения двух отмеченных проблем опирается на два хорошо известных в теории оптимального управления подхода. Для подсчета первых вариаций функционалов в конкретных задачах применяется идея В.И.Плотникова использования для этой цели линейных интегральных представлений их приращений [112]. Для учета же ограничений задач применяются различные модификации метода Ф.Кларка [217], заключающегося в сведении задачи с ограничениями к задаче минимизации функционала типа максимума вида (0.3.1) с применением вариационного принципа Экланда [218], необходимые условия в которой получены в п.1.1.
Также как и в случае задачи (0.3.1), аксиоматика задачи предполагает (в упрощенном здесь варианте) наличие линейного пространства "параметров варьирования" М с элементами т и отвечающих каждому управлению и £ V "своих" выпуклого множества Ми С М, числа аи,т > 0 и непрерывного отображения - вариации управления Ми,™ : [0, аи,т] V, |\|и>т(0) = и. Не имея здесь возможности в краткой форме изложить всю аксиоматику, остановимся лишь на ее главных моментах. Первые три аксиомы во многом напоминают аксиоматику задачи (0.3.1). Приняв обозначения Фо(^) = -^о(и), Фг(и,<?) = р(Ь(и) — д,Л4), запишем а) (аксиома существования первых вариаций) для некоторой функции ^ : [0,1] -» Я*, с(0) = 0, i(a) > 0 при а > О, существуют пределы 1
Ф0(«, m) = lim -т-г^Ми^а)) - Ф0(«)) V« £ V, т £ М„, 1
Фх(и,т;р) = lim ^(Фх(!Ми,т(а), g) - Фг(«, g)) Vw £ V, m £ Mu таких, что Фх(«, g) > О, где р = др(1г(и) - q,M); б) (аксиома равномерной ограниченности производных чисел метрики, согласованных с вариацией управления) для некоторой постоянной L > 0 выполняется неравенство
Nu,m(a), v) - d(u, v) < Lq(a) V и, v&V, m £ M„, a £ [0, a"'m]; в) (аксиома линейности первых вариаций)
5Ф0(и, Axmi + Л2т2) = Ах^Фо(«, mi) + А2£Фо(«, т2)
Vи £ V, mi, т2 £ M«, Äi > 0, Л2 > 0, Хг + А2 < 1, 5Фх(и, Aimi + Л2т2;р) = Ах<5Фх(«, тх;р) + А2<5Фх(и, т2;р) Уи £ V такого, что Фх(и, q) > 0, Vmi, m2 £ MU) Ax > 0, A2 > 0, Ai + A2 < 1.
Прежде чем переходить к обсуждению последних трех аксиом для задачи (Aq) остановимся кратко на аксиоме а). Ее главное отличие от аксиомы (а) для задачи (0.3.1), а также от аналогичных аксиом абстрактных схем других авторов [51, 52, 53, 80, 81, 191, 192, 193, 194, 195, 219] заключается в том, что в ней постулируется существование не предела
6h(u, m) = lim -^(Ii(Nu,m(a)) -Ii(ti)) etf
Q-+0 ца) как элемента целевого пространства В, а числового предела ¿Фх(«, т;р), в котором "учитывается" одновременно посредством функции расстояния /?(•, АЛ) и ограничение p(I\(u) — q, АЛ) = 0. В конкретных задачах с учетом дифференцируемости по Фреше функции расстояния /?(•, М) в окрестности точек q таких, что p(q, АЛ) > 0 (см. выше) вычисление первой вариации ¿Фх(«, т;р), как правило, существенно проще подсчета традиционного предела Sli(u, m). В то же время, градиент р = др{1\ (и) — q, A-f) в конечном итоге " трансформируется" в множитель Лагранжа (функциональный, если В - функциональное пространство), отвечающий операторному ограничению ii(«) £ АЛ + q.
Отдельно отметим, что п. 1.2 содержит также аналогичные альтернативные аксиомам а), б) условия, связанные с так называемым двухпараметрическим варьированием управлений и дающие возможность использования эффективных повторных предельных переходов при вычислении первых вариаций во многих конкретных оптимизационных распределенных задачах.
Далее, т.к. метод получения необходимых условий для м.п.р. в задаче (Aq) предполагает использование предельного перехода в семействах необходимых условий в некоторых промежуточных оптимизационных задачах, то следующие две аксиомы как раз и представляют собой аксиомы предельных переходов по и и q в семействах первых вариаций ¿Фо, <$Фх. Первая из них, которую можно назвать аксиомой сильного предельного перехода, постулирует непрерывность этих первых вариаций в метриках пространств V, В: сильная сходимость и1 и, д1 д, г оо в случае Фх(«,д) > 0 (для ¿Фх) и, как следствие, сильная сходимость р! = др(1\(иг) — д1, М) £ В* к р = др(1х(и) — д, М) € В*, влечет сходимость первых вариаций
Ф0, ¿Фъ
Вторая аксиома предельного перехода, которую условно можно назвать аксиомой слабого предельного перехода, постулирует возможность аналогичного предельного перехода при и1 и, дг д, г -у оо, в метриках РнКв случае Фх(ад, д) = 0, т.к. для таких (и, д) первая вариация ¿Фх вообще не определена. В этом случае рг = др(1\(и1) — д\ Л4) 6 В* сходится к некоторому элементу р £ В* лишь слабо и аксиома показывает как надо понимать предельный переход в семействе первых вариаций в ситуации когда и = и° является оптимальным управлением, удовлетворяющим равенствам /о(м°) = /?(<?)> — 9>-М) = 0.
И, наконец, последняя аксиома, которую можно условно назвать аксиомой компактности, предполагает, что оператор Д обладает свойством компактности образа в следующем смысле: множество {/г(и) : и £ V, 1о(и) < С} есть компакт в В при любом С, при котором оно не пусто. Это условие является очень естественным для задач оптимального управления и выполняется в большом числе наиболее интересных конкретных задач с различного рода ограничениями.
П. 1.3 посвящен доказательству первого результата для задачи (Ач) - необходимого условия для м.п.р. Этот и ему подобные абстрактные результаты для задачи (Ач) мы называем также абстрактными принципами максимума для м.п.р., т.к. именно в результате "расшифровки" таких абстрактных принципов максимума получаются принципы максимума для м.п.р. в конкретных задачах оптимального управления. Первый абстрактный принцип максимума доказывается при одном важном дополнительном условии на целевое множество Л4, обеспечивающем его достаточное "богатство". Для его формулировки напомним, что в случае гильбертова пространства В в соответствии с терминологией [219] множество Л4 С В называется множеством конечной коразмерности, если существует замкнутое подпространство Н С В конечной коразмерности такое, что множество ЛАС = П(сопуЛЛ) имеет непустую внутренность в Я, где П означает ортогональное проектирование В на Н. При условии достаточного "богатства" множества М абстрактному принципу максимума удовлетворяет любое м.п.р. в задаче
Теорема 0.3.2. Пусть в задаче (А%) выполняются хотя бы одно из следующих двух условий: 1) существует компакт ф С В такой, что множество + содержит внутреннюю точку; 2) пространство В является гильбертовым, множество М имеет конечную коразмерность.
Тогда, если ¡3(д) < +оо и последовательность управлений и/1 £ V, г = 1,2,.является м.п.р., то существуют м.п.р. г«1-1 € ¿{и^т1'*) < V?, < 1„Ю, (0.3.2) последовательность векторов множителей Лагранжа = (р.г0, ) € В?,
Н = 1> /4 > 0, 3 = 0,1, /4 = 0, если р{1х{ши) -д,М) = 0, (0.3.3) такие, что т) + ц[бУг(у/>г, т;рг) > ~У02Ь^? Ут £ Мш1,., (0.3.4) где г1 = /0(шг) — /?г.(д) < 5г + (/?(<?) — &•(?)), р1 = др(1х(/ш1'1) — д,М), причем произвольная слабая предельная в В1 х В* точка (/¿о, у) соответствующей последовательности пар цг0, « = 1,2,.удовлетворяет соотношениям + Ы\ фО, (у, z - m) < 0 Vz £ M, (0.3.5) где m Ç. Л4 - некоторая предельная точка, последовательности I\{w1'1) — q, г = 1,2,., (своя для каждой точки у).
Если же целевое множество Л4 не удовлетворяет свойствам 1), 2), то утверждение теоремы остается в силе, но выполнение соотношения невырожденности в (0.3.5) для предельной пары (щ,у) не гарантируется.
Замечание 0.3.1. В связи с формулировкой теоремы 0.3.2 следует пояснить одно обстоятельство, характерное для всей работы. Здесь и ниже нам удобно часто записывать необходимые условия на м.п. в терминах некоторой "близкой" к ней м.п. (см. (0.3.2)). В конкретных задачах это условие "близости" двух м.п. позволяет переписывать получаемые необходимые условия в терминах исходной м.п.
Замечание 0.3.2. Кроме того, важно отметить, что несмотря на равномерную выпуклость пространства В, благодаря последнему утверждению теоремы 0.3.2, она будет нами использована для получения необходимых условий и в задачах (Ач) с целевыми пространствами, которые не являются равномерно выпуклыми и, например, с пространствами В с равномерными метриками. В главах 3 и 4 мы показываем как это делается в случае задач (суб)оптимального управления для эллиптических и гиперболических уравнений с поточечными фазовыми ограничениями, в которых целевыми пространствами являются традиционные пространства непрерывных функций.
Замечание 0.3.3. Следствием сформулированного принципа максимума для м.п.р. и аксиомы слабого предельного перехода является абстрактный принцип максимума для оптимальных управлений.
Теорема 0.3.2, представляющая собой необходимые условия для м.п.р., доказана для любой точки q € domf5. Конечно, это оказалось возможным лишь благодаря дополнительным условиям 1), 2) на целевое множество М. В отсутствие таких дополнительных условий первое утверждение теоремы, вообще говоря, не верно (см. примеры 0.2.2, 0.2.3, а также примеры в п.п.2.3, 4.1). В то же время, в теории (суб)оптимального управления распределенными системами задачи с равномерно выпуклыми целевыми пространствами являются совершенно естественными и во многих случаях постановки задач именно с такими пространствами являются "единственно возможными".
Выше уже отмечалось, что принцип максимума для задач с операторными ограничениями с выпуклыми замкнутыми целевыми множествами, не обладающими какими-либо дополнительными свойствами типа свойств 1), 2) теоремы 0.3.2 и которые для краткости будем называть "бедными" множествами, вообще говоря, не верен (см., например, [11, 23, 225]). Одновременно, в ряде работ приводились различные дополнительные условия на исходные данные задач, которые позволяли в случае "бедных" целевых множеств все же формулировать необходимые условия в форме принципа максимума. Так, например, в [219] такими дополнительными условиями в случае задачи быстродействия по переводу в фиксированную точку гильбертова фазового пространства (являющуюся, очевидно, "бедным" множеством) для полулинейного абстрактного дифференциального уравнения (к которому сводятся многие конкретные распределенные системы) являются весьма жесткие условия на множество допустимых управлений и правую часть управляемой системы, обеспечивающие в процессе доказательства принципа максимума слабую сходимость последовательности множителей Лагранжа к неравному нулю предельному множителю. При этом в некотором смысле эти дополнительные условия напоминают условия 1), 2) на множество M. теоремы 0.3.2, но выполнимость их предполагается для некоторых множеств, записываемых в терминах правой части абстрактного уравнения, что, как уже отмечалось выше в п.0.2, "не соответствует" классическим постановкам задач с управлениями, принимающими свои значения в некотором компактном множестве.
В отличие от такого подхода., в п. 1.4 выполнимость аналогичного первой части теоремы 0.3.2 абстрактного принципа максимума для м.п.р. связывается с дифференциальными свойствами функции значений ß в данной точке q £ dorn ß, а, именно, либо с непустотой субдифференциала dß(q), либо с наличием ненулевого элемента в сингулярном субдифференциале dc°ß(q), где оба субдифференциала понимаются в смысле [240] (в [154, 155] те же обстоятельства связываются с субдифференциалами в смысле Кларка [55]). Более того, здесь показывается, что в задаче (Aq) всегда имеет место регулярный абстрактный принцип максимума (т.е. с ненулевым множителем, соотвествуюгцим целевому функционалу) для м.п.р., если только субдифференциал Фреше [240] dß(q) ф 0 или, другими словами, конус нормалей Фреше N((q, ß(q));epi ß) содержит элемент вида (£,—1).
Теорема 0.3.3. Если ß(q) < +оо, С £ dß(q) и последовательность управлений wk Ç. V, к = 1,2,., является м.п.р., то существуют м.п.р. w1,k £ d(wk, wl,k) < rk, ограниченная последовательность множителей Лагранжа ßk = (/¿o^îb 1/^*1 ф 0, ßк > 0, j = 0,1, последовательность точек qk £ В, — g|| < rk, ß\ = 0, если p(I\{wl,k) — qk,Jv\) = 0, такие, что
Фо(и»г,*,т) + /^(«/^m;?*) +rVo > 0 Vm £ Mwi,fcj pk = dp{h{wl>k) - q\ M), где rk > 0, rk ->■ 0, k oo; - некоторая последовательность чисел, a произвольная слабая в R1 х В* предельная точка (ßo,у) последовательности ,ßkpk), к = 1,2,.удовлетворяет соотношениям ßo = 1, (у, z — m) < 0 4z £ Jv\, m £ M - некоторая предельная точка последовательности I\{vjl'k) — q, k = 1,2,., (своя для каждой точки у).
Теорема 0.3.4. Пусть q £ В такая точка, что ß(q) < + со. Пусть также ( £ dß(q). Тогда существуют м.п.р. w! £ , г — 1,2,., ограниченная последовательность векторов множителей Лагранжа ß* = (l,ß\) £ R2, ß\ > 0, и последовательность точек s! £ В, % = 1,2,., ||s! — g|| < у, ß[ = 0, если p{I\{wl) — ss,M) = 0, такие, что
ФоК, m) + ß[6^>i(wt, m;р!) > - f Vm £ Мш;, y = где y - слабый предел в В* последовательности ß\pl, г = 1,2,.р1 = dp(I\(ws) — s1, M), ||рг|| = 1, г = 1,2,., при p(h(wl) - s1, M) > 0, (у, z - m) < 0 Vz £ M, m £ M - некоторая предельная точка последовательности /i(w£) — q, k = 1,2,7' > 0, 7* —> 0, 1 00.
Теорема 0.3.3, a также аналогичная теорема для случая С £ d°°ß(q), £ ф 0, с lim ßs0 = О
->00 подводят к важному понятию стационарной последовательности управлений в задаче (Лд), обобщающему соответствующее классическое понятие (см., например, [18]).
Определение 0.3.1. Последовательность wl £!),«' = 1,2,., называется стационарной в задаче (Aq), если для некоторой последовательности чисел ■у1 > 0, г = 1, 2,., уг О, i ->■ оо, выполняются включения wl £ V^', г = 1,2,., и существуют ограниченная последовательность векторов множителей Лагранжа р,1 = (р,г0,р,\) £ R2,
И/О, /¿<>0, ¿ = 0,1, и последовательность точек sl Е В, i = 1,2,.,
IIs' - ill < V» ¿4 = 0, если p(h(wl) - s\ М) = О, такие, что m) + /¿^(гг/, т;рг) > -У Vm £ Мш,, р! = др(1г(«;г) — s\ М), если p(h(wl) — s', М) > О, причем произвольная слабая предельная в R1 х В* точка (piо, у) соответствующей последовательности пар (рг0, р\р1), г = 1,2,. удовлетворяет соотношению ¡j,q + ||у|| ф 0.
П. 1.4 завершается получением полезных представлений для субдифференциалов в смысле [240] d0(q), d°°[3(q) в терминах множителей Лагранжа (предельных точек последовательностей множителей Лагранжа), имеющих важное значение, в частности, для решения проблемы чувствительности в задачах (суб) оптимального управления.
Теорема 0.3.5. Пусть fi(q) < +оо. Тогда справедливы равенства
Щя) = Щя) П М\, d™P(q) = d™p{q) П гдеМ; = Ь°9 U{0}s., M\^L\,
Lq = {—у £ В* : существует стационарная в задаче (Aq) последовательность, для которой соответствующая ей согласно определению 0.3.1 последовательность пар (//q, (¿\рг), г = 1,2,., имеет слабую предельную в R} х. В* точку (А, у)}, А = 0,1.
В п.1.5 на основе результатов п.п.1.3, 1.4 доказываются некоторые общие свойства регулярности, нормальности, чувствительности для абстрактной задачи {Aq).
Определение 0.3.2. Последовательность wl £ , i — 1, 2,., 7* > 0, 7' -> 0, г -> оо, являющаяся стационарной в задаче (Ач), называется нормальной (регулярной, анормальной), если все (существуют, не существуют) соответствующие ей (согласно определению стационарной последовательности) последовательности (р^, рь\р1), i = 1,2,.имеют (имеющие, имеющие) предельные точки (в слабом смысле для второй компоненты) (pto,у) лишь с компонентой (лишь с компонентой, с компонентой) ¿¿о > 0. Задача (Aq) называется нормальной (анормальной), если все ее стационарные последовательности нормальны (анормальны). Задача (Aq) называется регулярной, если в ней существуют регулярные стационарные последовательности.
Выделим здесь следующие результаты п.1.5.
Лемма 0.3.1. Пусть в задаче (Aq) fi(q) < +00, выполняются условия теоремы 0.3.2 (в случае конечномерного целевого пространства В эти условия выполняются автоматически) и М?° = {0}в, т.е. задача (Ач) нормальна. Тогда функция является липшицевой в некоторой окрестности Oq точки q с постоянной Липшица Cq = sup {|А| : А £ Mq}. q'eo9
Для формулировки других свойств, связанных с понятием регулярности задачи (Aq), нам потребуется дополнительно также следующее естественное и легко проверяемое в конкретных задачах условие е) если последовательности v\ ш' G D, « = 1,2,. эквивалентны, т.е. d(v\wl) 0, г оо, то последовательности Io{vl), Io(wl), » = 1)2,., имеют одни и те же предельные точки и из стационарности в задаче (Aq) одной из них следует стационарность в той же задаче и другой, причем множества всех предельных точек цо всевозможных последовательностей ¿iß> ¿ = 1,2,., из определения 0.3.2, отвечающих последовательностям v\ w\ i = 1,2,., совпадают.
Лемма 0.3.2. Пусть в задаче (Aq) выполняется и условие е), (С,—*?) € N({q, ß{q))\ерг ß) с г] > 0. Тогда в задаче (Aq) имеются регулярные м.п.р. и, стало быть, она регулярна, причем (¡г) £ Мц. Если же ((,—rf) есть нормаль в смысле Фреше к epi ß в точке (q,ß(q)) и г] > 0, то в задаче (Aq) регулярными стационарными последовательностями являются все м.п.р.
Следствие 0.3.1. Множество точек q G domß, для которых в задаче (Aq) все м.п.р. регулярны, всюду плотно в dorn ß.
С другой стороны, т.к. для локально липшицевых функций субдифференциал dß не пуст в каждой точке ее области определения [240]), то на основании леммы 0.3.2 можно утверждать, что справедлива
Лемма 0.3.3. Пусть выполняется условие е) и функция значений ß в задаче (Aq) липшицева в окрестности некоторой точки q. Тогда в каждой точке этой окрестности в задаче (Aq) существуют регулярные м.п.р.
Для формулировки другого достаточного условия регулярности задачи (Aq) введем предварительно важное понятие, обобщающее классическое понятие вектора Куна-Таккера. При этом мы рассмотрим достаточно представительный частный случай задачи (Aq), в котором
В = R* хВг, (0.3.6)
В\ — равномерно выпуклое пространство с дифференцируемой по Фреше нормой, М = {х = (a?i,., х*) £ R* : < 0,. ,хх < 0} х {0}Sl С В.
Определение 0.3.3. Вектором Куна-Таккера в задаче (Aq), в которой пространство В и множество A4 имеют вид (0.3.6), назовем элемент р = (А, г) € Л = {(Л', г') € R* х Вх : > 0,., Л^ > 0}, удовлетворяющий неравенству q) < /оИ + £ МАЛ«/) - Pi) + {г, J(w) - qi) Vw £ V, t=i где
Лемма 0.3.4. Если ^ = (А, г) £ Л есть вектор Куна-Таккера в задаче (Ая), удовлетворяющей условиям (0.3.6), то —¡л £ М* и —ц £ д(3(<?).
Здесь также устанавливается связь понятия нормальности задачи с существованием ненулевого зазора /Зо(<?) — /?(<?)•
Лемма 0.3.5. Пусть в задаче (Ач) выполняются условия теоремы 0.3.2, а также условие е). Если при этом имеет место неравенство ¡Зо{я) > Р(я)> то любая последовательность ъи1, г = 1,2,., удовлетворяющая соотношениям ою -> 1 £ \Р(я),Мя)], /оК) < Мя) + е Ц\ а > о, * 0, г -> оо, является стационарной, а в случае /3 £ [/?(#), Ро(я)) пе является нормальной стационарной последовательностью в задаче (Ая).
Следствие 0.3.2. Строгое неравенство < /?о(?) в задаче (Ач) при условиях леммы 0.3.5 не может выполняться, по крайней мере, в двух следующих случаях: 1) задача нормальна; 2) в задаче имеется нормальное м.п.р.
Заключительный п. 1.6 главы 1 посвящен так называемым экстремальным последовательностям. Понятие экстремальной последовательности обобщает классическое понятие [71] экстремального управления. С целью более компактного изложения мы предполагаем здесь, что В - гильбертово пространство.
Определение 0.3.4. Пусть множество {/!.(«/) : и) £ V} есть компакт в пространстве В. Последовательность управлений и' £ Т>, г = 1,2,., назовем экстремальной последовательностью (э.п.) для пары [Ъ,1\), если все предельные точки последовательности 1\{и8), i = 1, 2,., принадлежат границе множества X =
Здесь приводятся теоремы, связывающие выполнимость абстрактного принципа максимума для э.п. как с наличием проксимальной нормали в смысле [208] (в случае конечномерного В понятие проксимальной нормали совпадает с понятием перпендикуляра [55]) к множеству достижимости X в точке у = Ню 1\{и1) так и с наличием ненулевого элемента в нормальном ¿-»-ОО конусе Кларка Ыс(у\1\{Т))). В бесконечномерном случае отсутствие нормали в указанной точке может привести, вообще говоря, к невыполнимости принципа максимума для э.п. Факт возможной невыполнимости принципа максимума для классического экстремального управления при бесконечномерном В обсуждался, например, в [11].
Замечание 0.3.4. В силу условия компактности множества {/Дгс) : ии £ V}, из определения э.п., очевидно, следует, что в случае бесконечномерного гильбертова пространства В любая последовательность и1 £ Т), г = 1,2,., является экстремальной. Однако, вообще говоря, не для любой такой последовательности соответствующая последовательность образов 1х(и!), г = 1,2,., имеет своими предельными точки, в которых либо имеется проксимальная нормаль к множеству достижимости 1\{Т>), либо конус нормалей Кларка к этому множеству содержит ненулевой элемент.
Глава 2 посвящена рассмотрению на основе абстрактных результатов главы 1 задач (суб)оптимального управления параболическими уравнениями. Как уже отмечалось выше, некоторые результаты по необходимым условиям на м.п. в задачах оптимизации параболических уравнений (систем), могут быть найдены в [234, 235, 236, 220, 223]. В то же время, можно утверждать, что все рассматриваемые в главе 2 вопросы, связанные с необходимыми и достаточными условиями на м.п.р., а также с различными свойствами регулярности, нормальности, чувствительности в задачах оптимизации параболических уравнений, обсуждаются нами, по-видимому, впервые [150, 151, 152, 153, 155, 159, 167, 169, 170, 171, 172, 251, 252]. Следует отметить также, что везде в данной главе рассматриваются лишь линейные по фазовым переменным уравнения. Это связано не с существом дела, а только с желанием более компактного изложения результатов. Все эти результаты могут быть распространены и на случаи полулинейных и квазилинейных управляемых уравнений (см. ниже главу 3, посвященную эллиптическим уравнениям).
В п.2.1 рассматривается задача с нефиксированным временем без его варьирования и с ограничением типа включения в конечномерное множество
Pq) /о(яг,Т) -Mnf, /г(тг,Г) £ M + q, (тг,Т) G V, q£B==R*, где/1(ж,Т) = (/1(7г,Г),.,Л(тг,Т')),
Ji(w,T)= í Gl{x,z[7r,T](x,T),v{x),T)dxy г = 0,1,., ae, I0{n,T) = J0(rr,T), Ja w = (u,v) £ VT = VTX x I>2, Vf = [и £ LooÍQt) : «(яг,*) £ U п.в. на QT}, V2 = {v £ Loo(iï) : v(x) £ V п.в. на O}, U С Rm, V С R1 - компакты, О - ограниченная область в Rn, V = {(ît,T) : 7Г £ VT, Т > 0} - множество троек управляющих параметров, Л4 С Rx 1 п
- выпуклое замкнутое множество, z[w,T] £V2' (Qt) - соответствующее тройке (п,Т) слабое решение в смысле [67] первой краевой задачи для линейного параболического уравнения с дивергентной главной частью
Zt - —(ati}{x,t)z!c1) + bt(x, t,u(x,t))zx, + a(x, t,u(x,t))z + f(x, t, u(x, t)) = 0, (0.3.7) dx( z(x, 0) = x £ П, z(x, t) = 0, (x, t) £ St.
При некоторых естественных для теории оптимального управления предположениях здесь показывается, что для задачи (Рч) справедлива вся аксиоматика п. 1.2. В первую очередь здесь подробно рассматривается задача (Pq) с фиксированным временем. Примем обозначения п
H(x,t,z,p,u,ri) = -f](Y,bl(x,t,u)pl + a(x,t,u)z + f(x,t,u)),
Hk(x,z,vtT,r¡) ==r)v- Gk(x,z,v,T), к = 0,1,. .,as.
Т.к. целевое множество M имеет конечную коразмерность (по причине его конечномерности), то расшифровкой абстрактного принципа максимума для м.п.р. теоремы 0.3.2 является
Теорема 0.3.6. Пусть ж1 £ V, i = 1,2,., есть м.п.р. в задаче (Pq). Тогда существуют м.п.р. л-1'1 £ V*', ¿ = 1,2,. ф-\я-1,!) = meas{(x,t) £ Qt : ul(x,t) ф u2(x,t)} + meas {s £ fi : ф г>2(^)} < \fr¡,
Mir1*) < 70(тг1), и последовательность векторов ц1 € В?,
И = 1> ¿4 > °> к = 0,1, /4 = 0, если р{1г{я-1-*) - М) - О, такие, что эе тах{Н{х, рМп^Цх, 0 + /4 ЕрЫ^'К*. г))~
Я(ж, ^ «)»/4*7о[ТГМ](Ж, г) + ¿4 ¿рЫ^К*, ¿))} йх& < ЬТтеазО.^^ к=1 тахКЯо^, г;, 0)) + ^ ¿>1Я*(*, ф1'1]^, Т), г/, ^[тт1'1]^, 0))
Г), т[тг1'](х, 0)) - ^ £ &Нк(х, Т), ь1'(х), щ[пг%х, 0))} Ли < к-1
4га еая Пуид-у/г^,
8<?е г, = < * + (£(«)-&(«))» Р' = / г ЭДДОг1'')-^), «■»[«г1-*! есть решение при тг = тг1,г сопряженной задачи
-*к ~ +^(х,г,и(х^))г)) +а(х^,и(х,Ь))г} = 0, (0.3.8) ф.Г) = -^(ж), ж € П; г)(х,Ь) = 0, (х,«) 6 Бт, для ф{х) = 4НИ = Г), ф)).
Далее здесь последовательно "переписываются" в терминах данной конкретной задачи абстрактные результаты п. 1.5, связанные со свойствами регулярности, нормальности задачи и приводится одно легко проверяемое достаточное условие нормальности, непосредственно не вытекающее из результатов п.1.5.
Подробно в п.2.1 рассматривается важный частный случай задачи - задача с ограничениями типа равенства и неравенства: М. = АЛ- = {ж = (лгх,., х^) £ Я* : х\ < 0,., хХ1 < 0,^361+1 = 0,., Х& = 0}. Теорема 0.3.6, переписанная здесь в терминах исходного м.п.р. выглядит более компактно и привычно.
Теорема 0.3.7. Пусть ж1 £Т>,г = 1,2,., есть м.п.р. в задаче (Рч) со множеством М = М-. Тогда существуют последовательность чисел у1 > 0, г ~ 1,2,., "у* оо, г —>• оо, и последовательность векторов ¡л.* £ Пх+г, и = 1, /4>0, к = 0,1,.,аег, р?к(М**) - Як) > к= 1,.,аег, такие, что тах{£ г, *), г/, т\А{х> *))- (°-3-9) иЯт к=0 н{х, г, еН(х, иг{х, о, о))} < У, тах{£ &(Нк(х, г[ж'](х, Т),и, щ[ж%х, О))— Нк(х, гИ(я,Т), иг(х), 0)))} <1х < у.
JQT
Показывается, что в случае так называемой линейно-выпуклой задачи (Pq) с A4 = А4-(bt(x,t,u) = 6j(;r,i), a(x,t,u) = a(x,t), Gi(x,z,v) = Gj(x,z) + Gf(x,v), G} выпукла по z, i = 1,., aei, Gt(x, z, v) = G}(x)z + Gf(x> v), i = asi + 1,., ae) соотношения этой теоремы в случае ¿¿о > 7 > 0, ¿ = 1,2,., являются достаточными для того, чтобы данная последовательность была минимизирующей.
За определение стационарной последовательности в этом случае удобно принять
Определение 0.3.5. Последовательность пар жг £ V, ¿ = 1,2,., назовем стационарной последовательностью в задаче (Pq) с ЛЛ = A4-, если ж1 £ , У > 0, г = 1,2,., 7' -> 0, i -> оо, и существует ограниченная последовательность векторов р1 £ Я36"1"1, % — 1,2,.,
И 5й о, ^>0, А; = 0,1,.,ае1, /4(Л(тг') - g*) > -71, А = 1, 2,., аег, такая, что выполняются соотношения (0.3.9), причем последовательность г = 1,2,., имеет только ненулевые предельные точки.
Пусть е-* = (бТ^ТО) 1,0,., 0). Определим множества
Ц = {- £ ßjCJ eR* : ß = (iUo, A»1, • • •, /*») G ¿t ^ 0, = А, существует стациj=i онарная в задаче (Pq) с М = A4- последовательность пар, для которой соответствующая ей согласно определению 0.3.5 последовательность векторов ц1, ¿ = 1,2,., имеет вектор fj, своей предельной точкой}, А = 0,1; Mq = ¿®U{0}, Mq = Щ.
Следами соответствующих абстрактных результатов п.п.1.4, 1.5 в задаче (Pq) с A4 = АЛ-являются
Теорема 0.3.8. Пусть в задаче (Pq) точка q Е R* такова, что ß(q) < +00. Тогда dß(q) = dß(q) П Щ, d°°ß(q) = ff»ß(q) f|
Лемма 0.3.6. Если ß(q) <00 и Mq = {0}, т.е. задача (Pq) нормальна, то функция ß является липшицевой в окрестности точки q.
Лемма 0.3.7. Если ((,—г)) Е N((q, ß(q)); epi ß), причем r\ > 0, то в задаче (Pq) имеются регулярные м.п.р. Если же ((,—?)) £ N((q, ß(q)); epi ß), с t] > 0, то все м.п.р. в задаче (Pq) являются регулярными.
Следствие 0.3.3. Множество точек q £ domß, для которых в задаче (Pq) все м.п.р. регулярны, всюду плотно в dorn ß.
В то же время, можно утверждать, что в случае, если задача (Pq) с A4 = A4- не содержит ограничений типа равенства, то утверждение следствия 0.3.3 можно существенно усилить. А, именно, справедлива
Лемма 0.3.8. Если задача (Pq) с A4 = М- не содержит ограничений типа равенства, т.е. aei = ae, то при га.е. все м.п.р. в задаче являются регулярными, т.е., другими словами, свойство, согласно которому все м.п.р. в задаче с неравенствами регулярны, является свойством общего положения для q £ dorn ß.
Лемма 0.3.9. Если функция значений /? липшицева в окрестности точки д, то в каждой точке этой окрестности в задаче (Рч) существуют регулярные м.п.р.
Лемма 0.3.10. Если в задаче (Рч) имеет место неравенство /?(<?) < /?о(<?), то любая последовательность пар к1, г = 1,2,., удовлетворяющая соотношениям оИ р е \fiiq), Ш1 Ч*1) < Ш +£г. € > -> °> «' 00> является стационарной, а в случае (5 € [Р{я), Ро(д)) не является нормальной стационарной последовательностью в задаче (Ря).
Следствие 0.3.4. Строгое неравенство < /?о(?) в задаче (Р9) не может выполняться, по крайней мере, в двух следующих случаях: 1) задача нормальна; 2) в задаче имеется нормальная м.п.р. (ср. с [18, теорема У.3.4])А
Лемма 0.3.11. Если у Е Л есть вектор Куна-Таккера в задаче (Рч), то —/л ЕМ—/л Е Ш
И, наконец, завершим перечисление свойств нормальности задачи (Рд) с равенствами и неравенствами формулировками трех заключительных лемм, не вытекающих непосредственно из результатов п.1.5, первые две из которых являются обобщениями на случай субоптимального управления классических условий нормальности из математического программирования (речь идет об условиях Слейтера и линейности), а третья - связывает субдифференциал д/З(д) функции значений с векторами Куна-Таккера.
Лемма 0.3.12. Пусть в задаче (Рч) отсутствуют ограничения типа равенства, то есть ае = аех, а исходные данные имеют вид: Ьг(х^,и) = Ь{(х,1), г = 1,., п, а(х,Ь,и) = а(х, ¿), = С}(х,г) + С?(х,ь), г = 1,.,ае, функции О* выпуклы по г. Если при этом существует такая пара тг° £ V, для которой < ф, « = 1,.,ае, то задача (Рч) нормальна.
Лемма 0.3.13. Пусть в задаче (Р,функции Ьг(х, t, и), г = 1,., я, а(х, 1,и) такие же, как в предыдущей лемме, С{(х,г,ь) = С}(х)г + г = 1,.,аэ, и существует последовательность 7Г1 £ , ¿ = 1,2,., 7' > 0, 7г -> 0, ¿ -> оо, не являющаяся стационарной. Тогда задача (Ря) нормальна.
Лемма 0.3.14. Пусть задача (Ря) линейно-выпукла и нормальна. Тогда имеет место рал венство д/3(д) —Мч, где Мч - множество всех векторов Куна-Таккера задачи (Ря).
Изучение задачи (Рд) с фиксированным временем заканчивается рассмотрением конкретных иллюстративных примеров.
Здесь же для задачи (Рд) с М = М- вводится понятие особой минимизирующей последовательности, обобщающее классическое понятие особого оптимального управления, и обсуждается связь этого понятия с проблемой сходимости минимизирующей последовательности.
Далее в п.2.1 обсуждается задача (Рч) с нефиксированным временем и отмечается, что исследование такой задачи естественно усложняется. Однако и для нее оказываются справедливыми многие из полученных выше результатов и, в первую очередь, результаты, связанные с принципом максимума для м.п.р.
Т.к. в том случае, когда задача (Рд) с нефиксированным временем является задачей типа задачи быстродействия т, V, Т) = Т), принцип максимума в ней вырождается, то в заключение п.2.1 показывается как можно "исправить" эту ситуацию с помощью экстремальных последовательностей. Здесь показывается, что последовательность (тг',Т*), г = 1,2,., такая, что последовательность i = 1,2,., является м.п.р. в задаче быстродействия и Тг -> Т*, г -> оо, является одновременно экстремальной для пары (Т>т*, 1\{рт", Т*)) и, значит, к ней могут быть применены абстрактные результаты п. 1.6.
П.2.2 посвящен частному случаю задачи п.2.1 с нефиксированным временем, в котором, однако, оказывается возможным его варьирование. Здесь отсутствует начальное управление и сделан ряд других достаточно жестких предположений об исходных данных задачи, предназначенных именно для обеспечения предельных переходов, связанных с варьированием времени. Эти дополнительные предположения в теории оптимального управления распределенными системами весьма ограничительны, но без них подсчет первых вариаций функционалов при варьировании времени сталкивается с принципиальными трудностями, обусловленными " недостаточно хорошими" свойствами производных от решений прямых и сопряженных задач в случае "общих" условий на исходные данные. В п.2.2 последовательно проверяется справедливость аксиоматики "абстрактного" п.1.2 и формулируется принцип максимума для м.п.р., который благодаря вариации времени, в отличие от ситуации п.2.1, заведомо не вырождается в таком важном частном случае задачи, как задача быстродействия.
В отличие от п.п.2.1, 2.2, в п.2.3 рассматривается задача субоптимального управления параболическим уравнением с нефиксированным временем и с операторным ограничением типа включения в функциональное множество, а также с граничным управлением
Р<) /г(тг,Т) £М+д, (тг,Г) € Х>, д £ В = Ь2{О), где
0(тг,Г)= [ 0{х,г[тг,Т]{х,Т),у(х),Т)с1х + / Ф(гс, ги(х,«), Т) <1x3,1, Л(тг,Т) = г[ж,Т]{-,Т), ж = («,«,«/) е рт, 1>т = VI х т>2 х VI, VI = {« е Ьоо{Ят) ■ и{х,г) е и п.в. на дг}, V2 = {V £ Ьоо(^) : «(я) £ V п.в. на П}, = {w £ Ь^Бт) : %»{х,г) £ Ш п.в. на 5Г}, I/ С Вт, V С В} - компакты, С Я1 - выпуклый компакт, П ограниченная область в Кп с кусочно гладкой границей, V = {(тг,Т) : тг £ Vх, Т > 0} - множество четверок управляющих параметров, М С Ьг(^) - выпуклое замкнутое множество, ,г[тг, Т] £ У21,0((5т) -соответствующее четверке (тг,Т) слабое решение в смысле [67, гл.III] третьей краевой задачи для линейного параболического уравнения с дивергентной главной частью ~ + М;М»«(М))*х,- + + /(ж, Ь,и(х,г)) = О, дг г(х,0) = ь(х), х£П, + а{х,1)г = ю(х,г)г {х,г) £ Бт
При некоторых естественных для теории оптимального управления условиях на исходные данные задачи (Р?) здесь последовательно проверяется выполнимость абстрактной аксиоматики п.1.2 и затем формулируются соответствующие результаты, спектр которых, конечно, заметно уже по сравнению со случаем задач предшествующих пунктов с конечномерным целевым пространством. Выделим из них принцип максимума для м.п.р. (в терминал исходного м.п.р.), а также обычный принцип максимума в случае произвольного выпуклого замкнутого М при условии существования субдифференциала Фреше С £ д/3(д).
Теорема 0.3.9.[Принцип максимума для м.п.р.] Если ß(q) < +00, ( £ dß(q) и (irl,Tt), i — 1,2,., есть м.п.р. в задаче (Pq), то существуют ограниченная последовательность множителей Лагранжа // = |a¿'| Ф 0, fJ>j > 0, j = 0,1, и последовательность точек
Ч1 € В,
У - 4 < V, /4 = 0, если р(1г{ж\Т) - q\ М) = 0, такие, что тЫН(х^,£[7г\Г]{х,г),у,^г)0[7г\Т1](х,г) (0.3.10)
JQTi v&U
Н(х, t, Т](х, t), и\х, t), Г](х, t) + Тг;pl]{x,t))) ácdt f + ß^^v,^1 ,Т1;р1](х,0))- (0.3.11)
JQ v£V
Hvfi(x, ф»', Г](х, Г), t/1 (я), Т\ г)о[тг\ Г](х, 0)) - (v'(x),rh[n\Tl;pt}(x,0)))dx <У, шах / (^^Я^.о^^адЧ^О.^^о^^^^,«))«;^^)^- (0.3.12) wevf JsT< f¿[VwHWil(wl(s, t), rjt[irs, Т-,рг)(з, t))w(s, t)-^wHWio(s, t, wl(s, t),T\ Г)0[7Г\ r]{s, t))wl{s, t)-tiVvHv^isrf^fr^ip'lis^yw'is^fidsdt < y, где n
H(x,t,z,p,u, ri) = -r)(Y,bs(x,t,u)pt + a(x,t,u)z + f(x,t,u)), 1
Hvfi(x, z, v, T, r}) = r¡v- G0(x, z, v, T), Hv¿{v, rj) = rjv, Hwfi(x,t,w,T,r}) = rfw-Ф0(x,t,w,T), Hw>l{w,T]) = r¡w, ^=(z,Plí.,Pn), ü^,T](x,t) = (z[w,T](x,t),zXl[ir,T](x,t),.,zx„[w,T](x,t)), щ[ж\Т% 77i[7T 1,Тг]рг] - решения сопряженной задачи Q
-T]t - —-+ bj(x, t,u{x,t))r¡) + a(x,t,u(x,t))7? = 0, aXj rf{x,T) = -ф(х), x£Q; + o(x, t)r¡ = 0, (яг, í) € ST при ж = 7г% а также при ф(х) = VzG(x, г[к1 ,Т1](х,Т1),и'(х),Тг) и
М - ' - Ф\ТЧ(х,Т) - ql(x) - РГл<И7г',Т'](-,Г') - ¿(-))(s) ПХ) " Р ~ Т>) - <?'(•) - PvM(z[n',T'](-, Tl) - q'(•)))(•)II' соответственно. При этом рг = др(11(к\Тг) - q\M), 7* >0, 7' 0, i 00, некоторая последовательность чисел, а для произвольной слабой предельной точки (/¿а,у) последовательности пар (¡j.lQ, {i\pl), i = l,2,.справедливы соотношения = 1, (y,z —т) < 0 Wz £ М, где т £ ЛА - некоторая предельная точка последовательности Tl) — q, i — 1,2, —
Теорема 0.ЗЛО.[Принцип максимума] Пусть выполняются условия теоремы 0.3.9 и, кроме того, (ж°,Т°) - оптимальная четверка в задаче (Pq), т.е. 10(тг°,Т°) = ß(q). Тогда существует элемент у £ Ь2(й), у = -(, (y,z - (Ii(ir°,T°) - q)) < 0 Vz £ М, такой, что выполняются соотношения (0.3.10) - (0.3.12) с ¡il0 = р,0 = 1, /4 = 1, (л-\Тг) = (7г°,Т°), р% — у, у = 0.
Естественно, здесь остается в силе
Теорема 0.3.11. Множество тех элементов q £ domß, для которых в задаче (Pq) все м.п.р. являются регулярными стационарными последовательностями, всюду плотно в dorn ß.
Более того, здесь оказывается справедливым аналогичный результат и в случае задачи (Pq) типа задачи быстродействия (G(ar, z,v,T) = Т, Ф(x,t,w,T) = 0, М — {0}i2(o))
Теорема 0.3.12. В случае задачи быстродействия (Рг) по переводу в заданную функциональную точку для любой постоянной С > 0 множество тех элементов q £ ^U^ I\(VT,Т), для которых любое м.п.р. в задаче быстродействия (Pq) является стационарной последовательностью (удовлетворяет принципу максимума) с неравными нулю предельными множителями у, всюду плотно в U Ii(VT,T).
В отличие от задач с конечномерными целевыми пространствами в задачах с фазовыми поточечными ограничениями типа неравенства в случае равномерно выпуклых бесконечномерных целевых пространств условия типа условий Слейтера и линейности уже не являются, вообще говоря, условиями нормальности, т.к. в таких задачах сам принцип максимума может не быть справедливым. Однако указанные условия можно назвать условиями так называемой условной нормальности, что, например, в случае задачи (Pq) с фиксированным временем с М = {у £ £2^) : у(х) < Он.в. на О}, b{(x,t,u) = b{(x,t), a(x,t,u) = a(x,t), как показано в п.2.3, означает (применительно к условию Слейтера), что в ней существуют только нормальные стационарные последовательности, если существует такая тройка тг £ Vе, что выполняется условие Слейтера г[ж](х,Т) < 0 при п.в. х £ О.
В то же время, легко сообразить, что в задачах типа задачи (Pq) с бесконечномерным целевым пространством и с "бедным" множеством A4 нормальность задачи уже не влечет автоматически липшицевость функции значений. Здесь под "бедным" в случае целевого гильбертова пространства. В мы понимаем множество, не являющееся множеством конечной коразмерности.
В заключение п.2.3 приводятся примеры, иллюстрирующие приведенные выше факты, связывающие выполнимость принципа максимума с дифференциальными свойствами функции значений.
Наконец, следует подчеркнуть еще раз, что невыполнимость принципа максимума (в указанном выше смысле) в задачах подобных задаче п.2.3 представляет собой в случае "бедного" целевого множества вполне "естественное событие", являющимся в конечном счете следствием, вообще говоря, неотделимости двух выпуклых непересекающихся множеств в бесконечномерном пространстве. С невыполнимостью принципа максимума в каждой конкретной подобной задаче можно "бороться", по крайней мере, двумя способами: 1) заменить "бедное" целевое множество на более "богатое" и, например, имеющее внутреннюю точку; 2) существенно ужесточить условия на управляемое уравнение, функционалы, множество допустимых управлений (см., например, [219] и ряд других работ этого автора).
В главе 3 рассматриваются задачи субоптимального управления для квазилинейных и полулинейных эллиптических уравнений как с фазовыми, так и со смешанными ограничениями. При этом мы рассматриваем фазовые ограничения и в равномерно выпуклом пространстве (что представляется вполне естественным во многих задачах оптимального управления распределенными системами) и в "более привычном" для подобных задач пространстве непрерывных функций с равномерной метрикой.
Конечно, задачам оптимального управления с фазовыми ограничениями посвящено большое количество разнообразных работ. Среди них следует в первую очередь отметить ставшие уже классическими работы по фазовым и смешанным ограничениям в задачах оптимального управления обыкновенными дифференциальными уравнениями А.В.Арутюнова, А.В.Дмитрука, А.Я.Дубовицкого, А.А.Милютина и др. (см., например, [3, 4, 5, 6, 8, 40, 43, 199]). В последние 10 - 15 лет получила интенсивное развитие и теория задач оптимального управления с фазовыми ограничениями для распределенных систем (см., например, [198, 207, 228, 209, 210, 211, 245, 246]). Одновременно следует отметить, что нам неизвестны работы в которых изучались бы задачи оптимального управления эллиптическими уравнениями со смешанными ограничениями.
В то же время, условия на м.п. и связанные с этим вопросы регулярности, нормальности, чувствительности для задач оптимального управления параболическими и эллиптическими уравнениями с фазовыми ограничениями ранее никем, по-видимому, не рассматривались [173, 174, 175, 253]. Мы приводим здесь также иллюстративные примеры, говорящие о существенности получаемых результатов.
Обратим внимание здесь также и на то, что задачи оптимального управления эллиптическими уравнениями с фазовыми ограничениями встречаются в самых разнообразных приложениях (см., например,[205, 231]).
В п.3.1 изучается задача с фазовым ограничением
Р?) /о(тг) М, /г(яг) еМ+я, тг £ Р, Я £ В = ЬР(Х), где
10(тг) = / ^(л?,^]^),^^]^),'«^),«^))^, 7г(тг) = а(-,2[тг](-)),
V О
Л4 С ЬР(Х) - выпуклое замкнутое множество, 1 < р < 2п/(п — 2), X С Л - компакт, представляющий собой замкнутую подобласть ограниченной области П С Яп (в частности, X может совпадать с О), V = Т>\ х Х>2, Т>\ = {и £ Ь00(П) : и(х) € II п.в. на О}, Х>2 = € Ьоо(^) : к(х) £ V п.в. на О}, II С Пт - компакт, V С Я1 - выпуклый компакт, г[п] ЕИ^^) - соответствующее паре тг = (и,ь) £ V слабое решение в смысле [69, гл.1У] задачи Дирихле для квазилинейного эллиптического уравнения с дивергентной главной частью д> а{(х, г, гХ! г/(#)) + а(х, г, и(з;)) = 0, г(х) =0, х £ 5.
Замена целевого пространства Ь2(й) (см. аналогичную задачу для параболического уравнения в п.2.3) на ЬР(Х) с указанными границами изменения показателя р, связана, во-первых, с классическим фактом вложимости И^О^) в -^р(^) с р £ [1,2п/(п — 2)) и, во-вторых, с естественным желанием иметь существенно более широкий выбор возможных функций При этом важно отметить, что в подобного рода задачах оптимального управления, связанных с достаточно общими условиями на исходные данные, в качестве целевого пространства В, вообще говоря, не может быть взято пространство С(Х), т.к., как показано в [69, гл.1,§2], для эллиптических уравнений с общего вида условиями на порядки роста "коэффициентов" далеко не всегда является естественным требование принадлежности решений классам Са(Г2) с а > 0.
В п.3.1 при весьма общих условиях на порядки роста по г, гх функций, задающих исходные данные задачи (Ря), показывается выполнимость в задаче абстрактной аксиоматики п.1.2 и формулируются принципы максимума для м.п.р. (для оптимальных управлений), по своей сути вполне аналогичные принципам максимума п.2.3, в двух случаях: 1) множество гЫМ ф 0; 2) субдифференциал Фреше д@(д) ф 0.
В то же время, следует отдельно сказать о следующем важном обстоятельстве. В отличие от аналогичной задачи п.2.3 для параболического уравнения, здесь для подсчета первых вариаций функционалов Фг применяются так называемое двухпараметрическое импульсное (игольчатое) варьирование [161, 162] управления «(•) и соответствующие повторные предельные переходы, возможность применения которых заложена в альтернативных аксиомам а), б) (см. выше) условиях п.1.2, связанных именно с двухпараметрическим способом варьирования. Это объясняется достаточной общностью задачи и невозможностью при сделанных предположениях относительно исходных данных " вложить" решения прямой и сопряженных задач в "нужные" для традиционного вычисления первых вариаций гельдеровские классы Са(П) с а > 0.
В п.3.2 рассматривается формально частный случай задачи п.3.1 (Рч) 1о(и) тЛ, 1\(и) £ М + д, и£Т>, я£С(Х) = В — параметр, где = / Г{х>2[и](х)>ч(х))(1х, Д(») = <?(-, ф](-)),
•/О
М С С(Х) - выпуклое замкнутое множество всех непрерывных неположительных функций на X, X С - компакт, О - ограниченная область в й" с липшицевой границей, V = {и £ £оо(£2) : и(х) £ 17 п.в. на £2}, и С Я™ - компакт, г\и] бИ^К^) - соответствующее управлению и £ V слабое решение в смысле [69] задачи Дирихле для полулинейного эллиптического уравнения с дивергентной главной частью а^ + а(х, г, и(ж)) = 0, г(х) =0, х £ 3.
Условия на исходные данные задачи (Р9) традиционно обеспечивают существование и единственность решения г[и] для любого и € V, а также их вложимость в гельдеровский класс Са(0.) с а > 0. Однако принципиальное отличие этой задачи от предыдущей заключается в том, что целевое пространство в ней есть пространство С(Х), т.е. не является рефлексивным, а, стало быть, и равномерно выпуклым.
В связи с этим мы естественно не можем напрямую применить к этой задаче абстрактные результаты п.п.1.4 - 1.6. Тем не менее, мы показываем как абстрактные результаты этих пунктов могут быть использованы и при исследовании классических оптимизационных задач с нерефлексивными целевыми пространствами. Мы делаем это на основе двух подходов.
При первом из них мы, согласно общей идее работы [163], мы аппроксимируем задачу (Рч) с бесконечным числом функциональных ограничений последовательностью вспомогательных задач с конечным числом функциональных ограничений, в каждой из которых целевым пространством будет уже конечномерное пространство и, значит, в каждой из них может быть применена абстрактная теория главы 1. Такой подход подразумевает естественно предельный переход в семействе полученных в каждой из аппроксимирующих задач необходимых условий при стремлении к бесконечности числа аппроксимирующих ограничений. При этом подходе мы получим также и результаты, связанные с проблемой чувствительности в исходной задаче с фазовым ограничением.
Второй подход будет заключаться в переходе от исходной задачи (Рд) к некоторой " эквивалентной" задаче (при условии, что X - замкнутая область) с рефлексивным целевым пространством, получении в ней на основе абстрактных результатов главы 1 необходимых условий и " переписыванием" этих условий с помощью " перенормировки" множителей Лагранжа в терминах исходной задачи.
Итак, в основе первого подхода к исследованию задачи (Рч) лежит метод аппроксимации исходной задачи с фазовым ограничением или, другими словами, задачи с бесконечным числом функциональных ограничений, последовательностью задач с конечным числом функциональных ограничений
Ркк) 10(ад)1к(и) £ Мк + дк, u£V, ^ £ Я1" - параметр, где
Мк = {ук £ Я1к : у* < 0,., укк < 0}, 1к(и) = (1к(и),.,1кк(и)), /*(«) = 0{хк<, г[ч]{хк<)), л,,,л л л л
Хк= {х ' , • • •, х 'к} СХ - конечная 1/к сеть компакта X, ХкСХк+1, к = 1,2,., X - счетная всюду плотная сеть компакта X. Оказывается справедливой следующая аппроксимационная
Лемма 0.3.15. Пусть ¡3(д) < оо, д £ Тогда существует последовательность векторов дк £ И1*, к — 1,2,., такая, что Р(я)> к оо. В качестве такой последовательности может быть взята последовательность дк = (д^,., §? ), ^ =
Таким образом, в силу леммы 0.3.15 мы аппроксимируем исходную задачу задачами с конечномерными целевыми пространствами К1к, к каждой из которых могут быть применены все абстрактные результаты п.п.1.3 - 1.5 подобно тому как это было сделано в параболическом случае в п.2.1. На основе указанной аппроксимации и последующего предельного перехода в получаемых результатах при стремлении количества ограничений 1к к бесконечности получаются различные результаты, связанные необходимыми и достаточными условиями для м.п.р., с условиями регулярности, нормальности, со свойствами чувствительности в исходной задаче. Перечислим некоторые из них
Теорема 0.3.13.[Принцип максимума для м.п.р. в задаче с фазовым ограничением] Пусть (3{д) < оо и и$, в = 1,2,. есть м.п.р. в задаче (Р?). Тогда существуют последовательность чисел у* > 0, » = 1,2,.-4- 0, в оо, последовательность пар (ц^, Аг), > 0, А* 6 М(О), + = 1, с положительной мерой Радона Х!, сосредоточенной на множестве {х £ X : \0(х, г[«г](гс)) — д(ж)| < 7*}, такие, что шах{^о(Яо(ж, г[и5](ж), и, - Я0(ж, us(:r),rfo[г4s](:r))) + o Vеи
Н(х, V, - Н{х, *М(*), и*{х), Ах < где т?о[и5] бИ^г^) " решение сопряженной задачи д—(о^И^,) + У,а(х, и(х))ч = ¡л, 7)(х) = 0, х £ 3, р £ М{О) при и = us, ¡л, = —VzF(-, £[«*](•), «*('))> r7s[tts] о € \\,nf{n — 1)) - решение той же сопряженной задачи при и = us, ¡л, = —VZG(-, <?[«*](•)) Л5,
Hq(x, z, и, rf) = iqa{x,z, и) — F(x, z, и), H(x, z, и, rj) = r]a(x, z, и).
Замечание 0.3.5. Из теоремы 0.3.13 следует, что, если управление и0 £ Х>® таково, что Iq(u°) = ß(q), то оно удовлетворяет обычному принципу максимума (ц^ = ¡лц, \s = А, 7S = 7 = 0^. Несколько видоизменяя рассуждения доказательства теоремы 0.3.13, можно показать, что такой же обычный принцип максимума справедлив и для любого управления и0 £ 2?® такого, что /о(и0) = ßo(q)
В соответствии с общими определениями здесь также определяются стационарная последовательность, вводятся понятия регулярности и нормальности. Достаточными условиями нормальности в задаче с фазовыми ограничениями являются условия, которые также можно назвать условиями Слейтера и линейности.
Теорема 0.3.14, Пусть в задаче (Pq) функция а, задающая "правую" часть уравнения, имеет вид a(x,z,u) = ai(x)z + а2(х,и), а функция G, задающая фазовое ограничение, выпукла по z при всех х. Пусть также и0 £ V такое управление, что G(x, ,z[tt0](:r)) — q(x) < —7 Va> 6 X, 7 > 0; т.е. в задаче (Pq) выполняется условие Слейтера. Тогда задача (Pq) является нормальной.
Теорема 0.3.15. Пусть в задаче (Pq) функция а, задающая "правую" часть уравнения, такая же как в теореме 0.3. Ц, а функция G, задающая фазовое ограничение, аффинна по z при всех х : G(x,z) = Gi(x)z + G2(x). Пусть также существует нестационарная последовательность и1 £ T>J\ $ = 1,2,., у1 > 0, уг 0, г оо. Тогда задача (Pq) является нормальной.
Аналогично конечномерному случаю п.2.1 разрешается здесь и проблема чувствительности.
Теорема 0.3.16. Если задача (Pq) нормальна, то ее функция значений липшицева в окрестности q £ С(Х).
Эта теорема, в известном смысле, обратима.
Теорема 0.3.17. Пусть функция значений ß задачи (Pq) является липшицевой в окрестности точки q. Тогда в задаче (Pq<) при всех q' из этой окрестности существуют регулярные м.п.р.
В общей же ситуации, когда липшицевость функции значений ß(q), вообще говоря, не имеет места, справедлив следующий общий результат, который можно интерпретировать как результат, говорящий о том, что множество регулярных задач (Pq) "весьма богато", а, именно, справедлива
Теорема 0.3.18. Для любой точки q £ dorn ß и любой непрерывной положительной функции £ £ С(Х) для почти все точек q' на луче {q + : t > 0} в задаче (Pq>) все м.п.р. регулярны, т.е., другими словами, свойство, согласно которому любое м.п.р. в задаче (Pq+t%) с указанными q, £ регулярно, является свойством общего положения при t > 0.
Второй метод исследования задачи (Pq), о котором говорилось выше и состоящий в переходе к некоторой "эквивалентной" задаче с равномерно выпуклым целевым пространством подразумевает, что X С О есть замкнутая подобласть области П. В этом случае можно заметить, что в силу " заглаженности" решений z[u] (все они принадлежат классу С^П) с а > 0 и их нормы в этом классе равномерно по и £ V ограничены) в каждой точке q £ dorn ß (здесь ß - функция значений для исходной задачи с #=С(Х)) совпадает со значением ßs(q) функции значений "той же" задачи, но с целевым пространством LS(X), s > 1, и в случае q £ С(Х) любое м.п.р. в задаче (Рч) с фазовым ограничением, понимаемым в пространстве С(Х) является одновременно м.п.р. в той же задаче, но с фазовым ограничением, понимаемым в пространстве Lspf). Поэтому для записи принципа максимума для м.п.р. в задаче (Pq) с В = С(Х) мы можем записать сначала необходимые условия для м.п.р. в "той же" задаче с В = LS(X) (такие условия получены в п.3.1), а затем после некоторой так называемой "перенормировки" множителей Лагранжа получить принцип максимума для м.п.р. вида теоремы 0.3.13 в исходной задаче.
В заключение в п.3.2 показывается, что задача (Pq) на самом деле может быть расширена в смысле [18] и все результаты, полученные выше в терминах м.п.р., могут быть "переписаны" и в терминах обобщенных оптимальных (стационарных) управлений. В то же время, если принимать во внимание интересы приложений, то формулировки результатов в терминах м.п.р., состоящих из обычных измеримых управлений (которые часто можно считать просто "релейными" функциями) представляются более предпочтительными по сравнению с " теми же" формулировками в терминах обобщенных управлений - функций со значениями в пространстве абстрактных мер.
П.3.2 завершается рассмотрением ряда иллюстративных примеров.
В п.3.3 показывается, что абстрактное обобщенное правило множителей теоремы 0.3.1 может быть применено и для получения принципа максимума в задаче оптимального управления полулинейным эллиптическим уравнением с регулярным смешанным ограничением
Po) Io(u) inf, h(u) EM, uEV, где
0(и) = / P(:r,z[w](;E),w(s))cte, h(u) = G(-, ф](-), wi(-)), J о
V={u = К щ) Е Ьсо(П) : иф) е U1, ч2(х) Е U2 п.в. на Ü}, U1 = S^, Sp = {у Е Rmi : \у\ < L}, U2 Е Rm2 - компакт, mi + тог = т, U = U1 х U2, П С Rn - ограниченная область в Rn с липшицевой границей, М С ¿оо(^) - выпуклое замкнутое множество всех неположительных функций на Ct, z\u\ GM^I(О) - соответствующее управлению и £ V слабое решение в смысле [69] задачи Дирихле для полулинейного эллиптического уравнения с дивергентной главной частью (о8Ax)zK.) + а(х, z, и(х)) = 0, z(x) = 0, х Е S. dxi
Исходные данные задачи (Р0) удовлетворяют некоторым достаточно традиционным предположениям, из которых выделим условие выпуклости функции G по и\ при всех х, z, условие регулярности смешанного ограничения [3, 8]
VUlG(x, z, «i) ф 0, если G(x,z,u\) = 0.
Предполагается также выполнение строгого неравенства ||«?||oo,n < L, где и0 = (и?,«") -оптимальное управление в задаче (Р0). Обозначив через Мр С Lp(ü), р £ [1 ,п/(п — 2)), множество всех неотрицательных функций в Ьр(£1)} можно утверждать, что оптимальное управление и0 в задаче (Ро) является ¿¿-оптимальным в задаче
Зк(и) = тах{/0(и) - /0(и0) + 6к, /?(Д(и), Мр)} Ы, и£Т>, благодаря очевидному неравенству Л (и0) < ./*(«) + > 0, ->• 0, к —> оо. Функционал Зъ есть функционал типа функционала 3\ из п.1.1. Показывается, что он удовлетворяет аксиоматике п.1.1. Запись необходимых условий ¿¿-оптимальности в последней задаче и специальный предельный переход в них при приводит к следующему принципу максимума в задаче (Рч) с регулярным смешанным ограничением
Теорема 0.3.19. Существует пара с неотрицательными числом ро и функцией у £
МП), у(х) = 0, если С!(х, < О, удовлетворяющая условию нормировки
Ро + |Ы|оо,П ф О, такая, что
Я^ф^я),«,^«0;^)) - Нг(х, ф°](аг), «°(лг), щ[и0\!/](*)))} = 0 при п. в. х £ П,
7и10(гт, = 0 при п. в. х £ П, где и(х, г[ад°](л;)) = {и £ II : С(х, щ) < 0}, бИ^^) " решение краевой задачи
-—+ 2[и°](лг),г1°(ж))г/ = -ф{х), г}(х) = О, х £ 5, ох у при ф(х) = ий(х)), г?1.[м0;у] бИ^П) - решение той же краевой задачи при ф{х)=у{х)ЧгО(х,г[и\х),и1{х))
Но(х, г, и, г]) = щ(х, г, и) — г, и), Н\(х, г, и, г)) = г)а(х, г, и).
И, наконец, заключительный п.3.4 главы 3 посвящен исследованию задачи, аналогичной задаче п.3.2, но с граничным управлением
Рц) 1о(и) -»■ т£, /г(и) 6 М + <?, и £Т>, д £ С(Х) — параметр, где
10(и) = / Р (я, *[«](#)) ¿х + / Я1(дг,г[и](л;),«(гг;))сЬ, /г(и) = £(•, г[«](•)),
X С ^ - компакт, О С Я" - ограниченная область с липшицевой границей, 5 = <9П, V = {и £ ¿оо(«5') : и(х) £ II п.в. на 5}, II С Я1 - компакт, М С С(Х) - выпуклое замкнутое множество с непустой внутренностью, имеющее вид {у £ С(Х) : у(х) £ У (л;) Ух £ X}, ¥{х) = [Уг(:г),У2(:г)] С Я1, Ух(х) < ¥2{х), Ух : X -> Я1 и {-оо}, У2 : X ->■ Я1 и {+оо} - соответственно полунепрерывная снизу и полунепрерывная сверху функции, являющиеся непрерывными в каждой точке, в которой они конечны (возможны случаи У\(х) = —оо, У2(ж) = +°о), г[и] 6 И^КО) - соответствующее управлению и £Т> слабое решение в смысле [69] третьей краевой задачи (задачи Неймана при а(х) = 0) для полулинейного эллиптического уравнения с дивергентной главной частью а(х, г) = 0, ^ + а(х)г(х) = и(х), х £ 5.
Здесь, как и в п.3.2, при некоторых традиционных для подобного рода задач предположениях применяется метод [163] аппроксимации задачи с фазовым ограничением последовательностью задач с конечным числом функциональных ограничений, в результате чего формулируются и доказываются результаты в целом аналогичные результатам п.3.2 и связанные с принципом максимума, регулярностью, нормальностью, чувствительностью. Выделим среди них поточечный принцип максимума для м.п.р.
Теорема 0.3.20. Пусть /?(<?) < оо и и1, в = 1,2,., есть м.п.р. задаче Тогда существуют последовательность чисел 7* > 0, £ = 1,2,., 7* 0, в -> оо, последовательность троек (¿¿о, Л1, >0, А!, А+ £ М(П), +|А1| + |А1| = 1, с отрицательной и положительной мерами А1, сосредоточенными соответственно на множествах {х£Х: \Н(х,г[и*](х)) - д(х) - Уг(х)\ < }, {х £ X : | Н (х, г[и°](х)) - д(х) - У2(х)\ < 7*}, is s max{^(tf0(i, z[u*](t), v, m[us](t)) - H0(t, ф*](г), u°(t), т?оМ(*))) +
H(t, г., тf[us)(t)) - H(t, ф*](г), us(t), rfMW))} dt < Y, где t?o[ms] - решение сопряженной задачи д dxj atj(x)t}x,) -I- Vza(x, z[us](x))t} = -V,F(x, ф5](аг)), дЯ s[«5] - решение сопряженной задачи дГ>^ + <7(*)ф) = -V,Fi(a;^[«s](jj),ws(a7)), х £ S, ctij(x)rfXt) + Vsa(x,z[u](x))7) = fin, + сг(х)г}(х) - /is, х £ S, с ¡i = —VaG(-, ^[tiy](-))(Ai + A^.), fj, = hq + ßs, ßn - сужение меры /i на П, fis - сужение меры (л на S,
Но(х, z, и, г}) =щ- Fi(x, z, и), Н(х, z, и, rj) = щ.
Глава 4, состоящая из одного пункта, посвящена задачам субоптимального управления гиперболическими уравнениями. В качестве конкретной задачи здесь рассматривается задача субоптимального управления так называемой системой Гурса-Дарбу.
Pq) h{u) inf, Ji(«) £ М + q, u£V, q £ В, где V = {и£ Loo(П) : и(х, у) £U п.в. на П}, U С Rm - компакт, П = [0, а] х [0, b] С R2, а, Ь> О - заданные числа, М - выпуклое замкнутое множество всех неположительных функций в одном из двух пространств: £2(П) или С(П),
С 26
Jn j=1 h(u) = G(;;z[u](;-)), x3, yJ) £ П, j = 1,., ae, - заданный набор точек, z[u) - соответствующее управлению и £ V абсолютно-непрерывное решение векторного гиперболического уравнения с граничными условиями Гурса-Дарбу (задача Гурса-Дарбу) у = fix> У» ^х» zy> uix> У))> у) = <Му)> У € [о, 6], ф, 0) = фу(х), х £ [о, а], фх(0) = ^(0), с заданными липшицевыми функциями фх : [0,6] Rn, фу : [0, а] -> Я".
Различные задачи оптимального управления системой Гурса-Дарбу рассматривались с точки зрения получения необходимых условий оптимальности во многих работах (см., например, [116, 117, 139, 181]). Однако, можно, по-видимому, утверждать, что задача оптимального управления системой Гурса-Дарбу с фазовым ограничением изучалась лишь в [181]. Столь " малое" внимание к этой задаче связано с существом дела и объясняется ее достаточной сложностью, несмотря на "кажущуюся" простоту. Здесь, в отличие от [181], мы рассматриваем задачу (суб)оптимального управления системой Гурса-Дарбу с фазовым ограничением при существенно более слабых по сравнению с [181] условиях на исходные данные, а, именно, правая часть системы и интегрант функционала, а также их градиенты по z, zs, zy должны удовлетворять лишь традиционным условиям типа Каратеодори.
В п.4.1 предварительно показывается, что задача (Р?) с целевым пространством Б = .i/2(П) удовлетвоярет всем абстрактным условиям п.1.2 и, значит, в ней могут быть применимы, как и в предыдущих главах, результаты п.п.1.3, 1.4. Затем принцип максимума для м.п.р. для задачи (Pq) с целевым пространством 1/2 (П), согласно методу п.3.2, посредством "перенормировки" множителей Лагранжа преобразуются в принцип максимума для м.п.р. в задаче (Pq) с целевым пространством С(П). Здесь же формулируются и достаточные условия на м.п.р. Рассматриваемая задача, по форме близкая задаче п.3.2, имеет одно принципиальное с ней различие. Ее, вообще говоря, нельзя расширить в смысле [18] и по этой причине, по сути дела, единственным "инструментом" для решения подобных нелинейных задач оптимального управления является лишь принцип максимума для м.п.р. Это важное обстоятельство иллюстрируется в п.4.1 посредством конкретного примера задачи (Pq) с фазовым ограничением в С(П), в котором не существует обычного оптимального управления и для которого показывается невозможность расширения в смысле [18]. В то же время, м.п.р. в этом примере идентифицируется с помощью принципа максимума для м.п.р. В п.4.1 приводятся также примеры двух задач с целевым пространством Ьг(П), удовлетворяющих условию Слейтера, первая из которых не является нормальной, т.к. в ней не выполняется принцип максимума, а вторая таковой является. Эти примеры иллюстрируют высказанное в п.3.2 утверждение о том, что условия Слейтера и линейности в задачах с рефлексивными целевыми пространствами являются условиями лишь условной нормальности.
В главе 5 рассматривается так называемая негладкая задача субоптимального управления параболическими уравнениями, т.е. задача в которой функции, задающие исходные данные, являются лишь липшицевыми по фазовым переменным
Р„) /о(тг) -> inf, h(n)<EM + q, k£V, где íí - ограниченная область в Rn, V = {(и, v) — ir : w 6 Т>\ х V2}, Vi = {« € L^Qt) : it(s,t) e U п.в. на QT}, V2 = {v £ 1^(0) : v(x) £ У п.в. на П}, U С Rm, V С R1 компакты, М = {у £ В.* : уг < 0,., уХ1 <0, уХ1+\ = 0,., ух = 0},
78(?г) = / в1{х,г[ж](х,Т)}у{х))4ху « = 0,1,. ,ае, /0(?г) = 70(?г), 3 о о ч л г[п](х, ¿) - соответствующее паре п £ V обобщенное решение класса V 2 (Ят) первой краевой задачи для параболического уравнения с дивергентной главной частью и с однородным граничным условием г% — + М^МОМ))^, + а(х, и(х, *))* + /(я, £)) = 0, х) - ь(х), х£П, = 0, € 5Т.
Здесь рассматривается задача лишь с негладкими функционалами. Однако, тот же метод может быть эффективно применен и в задачах с негладкими "правыми частями" уравнений. Исходные данные задачи (Р9) удовлетворяют тем же условиям, что и в гладком варианте задачи в п.2.1, но градиент Ч^^ (х, г, ь) здесь понимается как первая обобщенная производная (в смысле С.Л.Соболева) в Я1 при п.в. х £ П для любого V £ V функции GJ(x,■,v) : Я1 -> Я1. Обычное для "гладкой" теории оптимального управления условие на градиент < Ы{М) Уг е = {у £ Я1 ■ М < М}, х £ а, V £ V, в нашем случае понимаемое как условие на обобщенную производную ЧgGj, эквивалентно локальной липшицевости по г
Ок(х,г2,ь)-Ок{х,г1,ь)\ < Ы(М)\г2 - г1\ V г1, г2 £ х £ С1, V £У.
Однако нам удобнее записывать последнее условие именно в терминах обобщенных производных из-за применяемого нами метода исследования негладкой задачи, связанного с усреднениями функций.
Основная цель данной главы состоит в том, чтобы показать, что многие результаты "гладкого" случая п.2.1 так или иначе переносятся и на негладкие задачи.
Из-за негладкости нашей задачи для ее решения нельзя напрямую воспользоваться абстрактной теорией главы 1 также, как мы это сделали в п.2.1. Однако, если нужным образом "сгладить" исходную задачу, то применение абстрактной теории главы 1 для исследования задачи (Рч) уже окажется возможным. Указанное "сглаживание" исходной задачи мы проводим, следуя разработанному в наших работах [123], [164], [125] методу. В этих работах был предложен общий подход к получению необходимых условий оптимальности для негладких задач оптимального управления как сосредоточенными, так и распределенными системами. В то же время, в них не рассматривались вопросы, связанные с субоптимальностью и минимизирующими последовательностями. Здесь же мы рассматриваем в терминах минимизирующих и стационарных последовательностей новые оптимизационные проблемы (дифференциальные свойства функции значений, регулярность, нормальность, векторы Куна-Таккера и т.д.) для негладких задач оптимального управления, которые совершенно не рассматривались в работах [123], [164], [125]. Впрочем, нам неизвестны и работы каких-либо других авторов, в которых изучались бы указанные вопросы для негладких задач оптимального управления.
Все результаты пятой главы формулируются в терминах обобщенных градиентов Кларка доцС}(х,г,у). В то же время, т.к. постановка негладкой задачи использует обобщенные производные в смысле С.Л.Соболева, а метод ее решения использует усреднение функций, то здесь устанавливается полезное представление обобщенного градиента Кларка липши-цевой функции /(х), х £ Пп, в терминах ее первых обобщенных производных в смысле С.Л.Соболева. Таким существенно используемым нами представлением является равенство дс!(х) = р) сШШ>/(А П о где Б(х,6) = {х : < ¿}, А есть множество всех точек Лебега функции О/ : Нп —> Лп, задаваемой равенством В$(х) = (РХ1/(л?),., Т>Хп}(х)), а = 1 ,.,«, - первая обобщенная производная С.Л.Соболева фунции / по Ху
Глава 6 посвящена двойственным численным методам в теории оптимального управления распределенными системами, основанным на использовании модифицированных (расширенных) функций (функционалов) Лагранжа. Как отмечено в [85], алгоритмы оптимизации, основанные на использовании расширенных лагранжианов, являются наиболее эффективными общими методами решения задач оптимизации с нелинейными функционалами и ограничениями. В то же время, анализ публикаций по численным методам двойственного типа для задач оптимального управления распределенными системами показывает, что в этом направлении делаются сейчас, по-видимому, только первые шаги [153, 166, 176].
В п.6.1 излагается общий метод нахождения м.п.р. в задаче п.2.1 для параболического уравнения с фиксированным временем
Ро) Мтг) Ы, 1г{1г) £ М^, ж £ V, где Д(л-) = (Л(тг),., Jш(ж)), а функционалы определены также как и в п.2.1.
Обозначим через £ = ¿>х х ¿>2 множество пар обобщенных в смысле [18] управлений (и, а;) со слабой нормой | • |ш, где ¿>х расширение в смысле [18] множества обычных управлений , ¿>2 - расширение в том же смысле множества Т>2- Метод предназначен для нахождения м.п.р. я-1 £ V, * = 1,2,., в задаче (Ро), которое без о.о. (в силу компактности в слабой норме | • 1«, множества 5) считается сходящимся в слабой норме | • |«/ к некоторой паре (вообще говоря, обобщенной) управлений в0 = {^¡ш0) : — б0^ 0, г ->■ оо, в0 £ ¿>0 = П ¿>о, где ¿>о - замыкание в слабой норме | • множества Ъ\. Заметим тут же, что несмотря на использование обобщенных управлений, расширения задачи (Ро) нам формально не требуется.
Предполагается, что задача (Р0) удовлетворяет условиям п.2.1 и дополнительно трем условиям: a) задача (Р0) нормальна; b) пара обобщенных управлений в0 является изолированной в том смысле, что в некоторой окрестности в0 нет других пар в, которые являлись бы предельными в слабой норме | • точками стационарных последовательностей задачи (Ро); c) задача (Р0) обладает вектором Куна-Таккера в том смысле, что существует вектор // £ Я®, Цз> 0, j = 1,., аех, такой, что
Р{0)<Ы*>Р) = 7о(гг)+Х>ДИ ЧкеЪпЩв»), 5,(0°) = {в £ 5 : \в - в% < е}.
1=1
Из этих трех условий "наиболее существенными" являютя условия (а) и (с). Задачи, в которых выполняются все три дополнительных условия "следует искать" в первую очередь среди так называемых линейно-выпуклых задач.
Излагаемый метод заключается в максимизации на множестве S(M°,a) = {у £ R* : р(у,М°) < а}, а > О, М° - множество всех векторов Куна-Таккера задачи (Ро), вогнутой функции значений для модифицированной функции Лагранжа
ВД = inf LMг, •) : S{M°,a) R1, w жешis.(*>) v ; V » / ' где (см. в [13])
Lc(rr>M)^Jo(rr) + ^-f:{[max{0,Mt + cJt(7r)}]2-pf}+ ± p,Jt(n) + | £ J?(ir), s=l i=aei+l ^ »'=»1+1 причем argmax {Vc(p), р 6 S'(M0,a)} = М°. Предлагается "явное" выражение для субградиента в смысле выпуклого анализа функции — К(-): d(-Vc{p)) = cMv{ lim (max{—pj/c, — 1., «i, = asi + 1., as) : я* £ V П ^(Ö0),
Йоо
Lc(k\p)-> inf LAw.a), i -f oo}.
Показывается, что для численного решений двойственной задачи и для одновременного нахождения искомого м.п.р. ж1, i = 1,2,., могут быть эффективно использованы хорошо разработанные методы негладкой (выпуклой) минимизации и, в частности, например, так называемый е^-субградиентный метод [36]. Доказывается сходимость метода в слабом смысле (в норме | • lu,), если в0 - пара обобщенных управлений и в смысле сходимости по мере, если в0 - пара обычных управлений. Здесь же обсуждается возможность оценки качества этой сходимости с помощью так называемого функционала невязки принципа максимума [166, 153] и результатов п.2.1, связанных с чувствительностью задачи.
В п.6.2 предлагается по сравнению с методом п.6.1 существенно более общий с точки зрения жесткости условий на исходные данные задачи численный метод ее решения. Для более компактного изложения общей идеи метода мы предполагаем, что, в отличие от задачи п.6.1, задача п.6.2 такова, что допускает расширение в смысле [18], однако, последнее требование при "желании" может быть опущено.
Принципиальное отличие метода от метода предыдущего п.6.1 заключается в том, что единственным существенным требованием для его реализации является лишь требование некоторой "регулярности" задачи в смысле непустоты субдифференциала Фреше dß(0). В связи с этим требованием здесь уместно напомнить, что регулярными в этом смысле задачами, согласно результатам п.2.1, заведомо являются задачи для значений параметра q £ R36 из плотного в dorn ß множества, а в случае отсутствия ограничений-равенств - для п.в. q £ dorn ß.
Пусть р £ dß(0). Тогда показывается, что для любого с > 0 и некоторого <5 = ¿(с) > О
0) < ß(q) - faq) + c\q\ Vq £ Sf = {y £ R* : \y\ < ¿}, Яф 0. и, значит, для некоторого С = С (с, S) > 0 в силу ограниченности ß(q) на dorn ß
0)<ß{q) + C\q\ VqER*.
Показывается, что последнее неравенство "порождает" точный недифференцируемый штрафной функционал в виде (см. также [13, Гл.4])
Рс(в) = Мв) + cf>t(0) + с± |J#)|, j=1 j-aei где д]~(в) = 0}, в £ 5 - множество допустимых обобщенных управлений из п. 6.1, а любое (вообще говоря, обобщенное) решение в0 исходной задачи (Ро) является строгим решением задачи "безусловной" минимизации
Рс(0)-)-тт, веБ.
Таким образом, можно утверждать, что результаты данного пункта подчеркивают еще раз важность исследования дифференциальных свойств функций значений не только с точки зрения вопросов, связанных с принципом максимума для м.п.р., со свойствами регулярности, нормальности, но и с точки зрения вопросов теории численных методов оптимального управления.
В заключительной седьмой главе диссертации показывается, что понятия субоптимальности и м.п. являются центральными для задач оптимального управления, исходные данные которых заданы лишь приближенно. В случае приближенно известных исходных данных само понятие классического оптимального управления как бы теряет смысл, т.к. в "возмущенной" задаче его просто может не существовать, а если оно и существует, то не вполне понятно какое "отношение" оно имеет к искомому оптимальному управлению. Ситуация кардинально меняется, если в качестве "базового элемента" теории мы рассматриваем м.п.р. [157].
В п.7.1 рассматривается задача для параболического уранения из п.2.3 с фиксированным временем
Р,) /о(я-) Д(*г) € Л4 + w£V = Vт, = Ь2(П).
Пусть 1 = {6,, г = 1,. ,п, а, /, а, О, Ф, М, II, V, Ш} означает набор исходных для задачи (Рд), для которого справедливы все условия на исходные данные, сформулированные в п.2.3:
1Мм,«)1> Км,«)1»1/(М,«)1 < к(м) едт,пе км)| < к е
V € О х ¿1 х
Ф(М,ш)|, ^Ф^,/,«/)! < Ы{М) е 5 х (0,Т) х Б1М, где ^ = \х\ < М}. Обозначим через ^ = {6°, = 1,. а0, <г°, в0, Ф°, М°, иУ°, УУ0}, Р = {й|, % = 1,., п, а\ /г, (7г, Ф\ М6, и\ ¥г, Ш&}, 8 (Е (0,«50], ¿о > 0 -некоторое число, наборы невозмущенных и возмущенных исходных данных соответственно, для которых справедливы оценки
Н < ¿м,т(М), \«6-Л I/' - /°1 < ММ) V(*,*,«) е п х (0,Т) х (0.3.13)
Ш*ГДГ, РмНз^г < Кг(М)&
- < г) V (х, <) е 5 X (о, т), ||<Чк5Г < кг8, - о% \чго6 - < V {х, е о х 51 х Б1М,
Ф& - Ф°|, IVгФ* - У2Ф°| < *,«/) € 5 х (0,Г) х
Subfir < Кг(М)6, х(М6,М°) < 8, х{и6,и°) < 8, < 8, < 8, где г > (п -f 2)/2, х(Д В) - расстояние между множествами А, В С X в смысле Хаусдорфа. Обозначим функционал /о, оператор Д, множества V, Vфункцию значений ß(q), соответствующие набору исходных данных fÄ, 6 G [0, <$0], через Iq, l{, V6, ßs(q) соответственно. Показывается, что если последовательность управлений тг1 е vs\ i —1,2,., такова, что
4V) - ß°(Q) о. * оо» ^ е vf'ai, и к тому же множество Л4° имеет конечную коразмерность, то эта последовательность удовлетворяет принципу максимума для м.п.р. из п.2.3 (при фиксированном Т), в котором следует лишь все исходные данные взять с индексом 6*.
В том же случае, когда множество Мй не является множеством конечной коразмерности, то аналогичный регулярный принцип максимума, как и в случае точных данных, справедлив, если dß(q) ф 0. Таким образом, как в первом, так и во втором случае принцип максимума для м.п.р. остается "без изменений" при переходе от задач с точными данными к задачам с данными, известными лишь приближенно.
В случае же достаточных условий на м.п.р. ситуация по сравнению с задачей с точными данными "существенно" изменяется. Так в случае линейно-выпуклой задачи с приближенно известными исходными данными показывается, что для того чтобы данная последовательность 7Г8 G Vq'01', « = 1,2,., была м.п.р. следует потребовать выполнения условия согласования S'/cf -> 0, i -*■ оо, и, естественно, выполнения принципа максимума для м.п.р. при условии, что " нулевой" множитель равномерно ограничен снизу некоторой большей нуля постоянной. Если же последнее не выполняется, т.е. 0, t ->■ оо, то этот множитель fix0 должен стремиться к нулю согласованно с точностью задания исходных данных <5!, с "точностью выполнимости" принципа максимума и с "точностью выполнимости" ограничения задачи.
И, наконец, остановимся кратко на результатах п.7.2. Здесь рассматривается важный частный случай задачи п.2.3 - задача минимизации сильно выпуклого функционала
Р,) 1о(тг) inf, Д(тг) eM + q, тг G £>, q£B = £,2(П), где
Ш = ИIjQr + Mio + INIao ад = ф](-,п
7г = (u,v,w) G Т>, М = {Л}, h G В', z[n] £ У2^{Ят) - соответствующее тройке ж слабое решение в смысле [67] третьей краевой задачи для линейного параболического уравнения q
Zi~ + a(x,t)z + (f(x,t),u(x,t)) = 0, (0.3.14) dz z(x,0) = v(x), x£Ü, — + cr(x,t)z = w(x,t), (x,t)eST, множество VT определено также как в п.2.3, а компакты U, V выпуклы (также как и W). Легко видеть, что эта задача всегда имеет решение ж°, если только ф 0.
Очевидно, сформулированная задача (Pq) является обратной задачей по нахождению нормального решения уравнения (0.3.14) при известном наблюдении h.
Как и в п.7.1, исходная задача с М° = {/г0} = {0} считается заданной здесь с ошибкой S
Pf - II«4 - II/4 " f°h,QT < 4 \\°6 ~ < Ь ||Ла||2,о < S.
Приводятся два метода решения или, другими словами, два метода регуляризации для рассматриваемой обратной задачи. Первый из них можно отнести к группе методов невязки [23]. В нем необходимо решать вспомогательную задачу
Р^) Io(w) inf, Js(n) = IIZs[w](; T)-hs- q\\lQ <a, ж <E V.
На основе результатов п.2.1, связанных со свойствами нормальности и чувствительности задач с конечномерным целевым пространством (в данном случае с одномерным) здесь показывается, что при выполнении условия согласования 62/а(6) 0, 5 ->- 0 выполняется предельное соотношение в(,) - ^0||2ЛГХОХ5Г "»О, 6-Ю, где решение задачи (Рд'а), т.е. показывается сильная сходимость регуляризованных решений к точному решению 7г° исходной задачи. Отметим при этом, что при каждом фиксированном а > 0 задача (Рд'а) удовлетворяет всем условиям, при которых была доказана сходимость двойственного численного алгоритма в п.6.1 и, значит, этот алгоритм может быть применен здесь для ее решения, а "оценка качества" решения может производиться с помощью функционала невязки принципа максимума.
Второй метод регуляризации можно отнести условно к группе методов типа алгоритма Удзавы [85, 190]. Он, по сути дела, является двойственным методом, аналогичным методам главы 6 и заключается в непосредственном решении двойственной к исходной задачи
V/(A)-MuP> А6Ь2(П), V/(A) = mmLj(7r,A),
Л) = /о(я-) + <А, Т) - AÄ - g), Ж ZV, AeL2(n).
Показывается, что функция значений V* дифференцируема по Фреше, ее градиент удовлетворяет условию Липшица, приводится " явное" выражение для этого градиента. Последние об-соятельства позволяют применить для максимизации функции Vs стандартные градиентные методы [23, 85]. Такая максимизация проводится с помощью обычного метода регуляризации А.Н.Тихонова [23], т.е. с помощью решения двойственной задачи V^A) — с*||А||2 шах, А £ £2(0), и согласования параметра регуляризации а с ошибкой измерения S. С помощью принципа максимума показывается, что выполнимость условия согласования 6/а(5) ->■ 0, 6 ->■ 0, приводит к сильной сходимости регуляризованных решений к точному решению исходной задачи где 7г*[А] - решение задачи Lsq(n, А) -» min, ж £ V, а - решение двойственной задачи.
0.4 Основные результаты диссертации
Автором получены следующие новые результаты:
1) Предложена ориентированная на задачи оптимального управления абстрактная схема исследования задачи оптимизации на полном метрическом пространстве функционала с аддитивно зависящим от параметра ограничением типа включения в выпуклое замкнутое множество равномерно выпуклого банахова пространства с дифференцируемой по Фреше нормой. "Базовыми" понятиями в этой схеме служат не оптимальные (как обычно), а м.п. элементов или, точнее, так называемые м.п.р. в смысле Дж.Варги.
Показана применимость предложенной схемы к широкому кругу конкретных разнообразных задач оптимального управления. Эта абстрактная схема может быть названа также методом возмущений в теории субоптимального управления распределенными системами.
2) Получены необходимые и достаточные условия для м.п.р. (принципы максимума для м.п.р.), трансформирующиеся "в пределе" в случае существования оптимального управления в "обычные" условия оптимальности, в задачах (суб)оптимального управления распределенными системами с различными ограничениями в конечномерном пространстве. Получены представления для субдифференциалов (в смысле Ф.Кларка, Б.Ш.Мордуховича) функций значений этих задач в терминах множителей Лагранжа, различные необходимые и достаточные условия регулярности, нормальности, связывающие эти понятия с дифференциальными свойствами функций значений. Изучена проблема чувствительности для таких задач. Показано, что регулярность задач оптимального управления является их весьма типичным свойством, заведомо имеющим место при всех значениях параметра из плотного множества в эффективном множестве функции значений, а в случае задач лишь с ограничениями типа неравенства, для "почти всех" имеющих смысл задач, т.е. для почти всех значений параметра из эффективного множества функции значений.
3) Доказаны необходимые и достаточные условия для м.п.р. в задачах оптимального управления параболическими, эллиптическими и гиперболическими уравнениями с ограничением типа включения в выпуклое замкнутое множество равномерно выпуклого пространства (Ьр, р £ (1,+оо)). Показано, что существование нормали в том или ином естественном смысле к надграфику функции значений влечет выполнимость регулярного принципа максимума в таких задачах и эта регулярность задачи заведомо имеет место для всех значений функционального параметра из плотного множества во множестве всех тех его значений, где задача имеет смысл.
4) Показано, что предложенная абстрактная схема оказывается пригодной и для исследования задач с нерефлексивными целевыми пространствами, а многие из результатов, связанных с условиями на м.п., со свойствами регулярности, нормальности, чувствительности и полученных для задач с конечномерными целевыми пространствами, переносятся и на задачи с поточечными фазовыми ограничениями, понимаемыми как ограничения в пространствах непрерывных функций с равномерной метрикой, с распределенными, начальными и граничными управлениями в случаях линейных и нелинейных (в частности, полулинейных и квазилинейных) управляемых уравнений.
5) Получен принцип максимума в задаче с регулярными смешанными ограничениями в случае управляемой задачи Дирихле для полулинейного эллиптического уравнения. Тем самым показана применимость предложенной абстрактной схемы и в распределенных задачах оптимального управления со смешанными ограничениями.
6) Показано, что "большая часть" результатов, связанных со свойствами нормальности, регулярности и чувствительности переносятся и на так называемые негладкие задачи оптимального управления распределенными системами, т.е. на задачи с негладкими (липшицевыми) по фазовым переменным "правыми частями" и функционалами.
7) Предложены два метода численного решения для задачи оптимального управления параболическим уравнением с конечным числом функциональных ограничений типа равенства и неравенства. Первый из них основан на максимизации функций значений модифицированного функционала Лагранжа (расширенного лагранжиана), доказана его сильная сходимость, обсуждена возможность оценки "качества" этой сходимости с помощью так называемого функционала невязки принципа максимума. Во втором методе все решения исходной задачи являются строгими решениями задачи " безусловной" оптимизации точного недифференцируемого штрафного функционала. Показано, что применение м.п.р. в смысле Дж.Варги позволяет эффективно распространить теорию необходимых условий оптимальности на задачи с приближенно известными исходными данными.
Установлено, что полученные "теоретические" результаты, связанные с условиями на м.п.р., нормальностью, чувствительностью могут быть эффективно применены в классической задаче приближенного нахождения нормального решения краевой задачи для параболического уравнения при известных приближенно коэффициентах и финальном наблюдении. Для этой обратной задачи предложены два численных метода - два метода регуляризации. Первый из них можно отнести к группе методов невязки, второй - заключается в непосредственном решении на основе метода регуляризации А.Н.Тихонова двойственной к исходной задаче.
1. Дубовицкий А.Я. Теоретико-функциональный аппарат общей задачи оптимального управления. Препринт ИХФ АН СССР. Черноголовка. 1975. 42 с.
2. Дубовицкий А.Я., Милютин A.A. Теория принципа максимума // Методы теории экстремальных задач в экономике. М.: Наука, 1981. С.6-47.
3. Егоров А.И. Оптимальные процессы в системах с распределенными параметрами и некоторые задачи теории инвариантности // Изв. АН СССР. Сер. матем. 1965. Т.29. Л/об. С.1205-1260.
4. Егоров А.И. Оптимальное управление тепловыми и диффузионными процессами. М.: Наука, 1978.
5. Егоров А.И. Об устойчивости и оптимизации систем с распределенными параметрами // Прикл. матем. 1984. Т.20. JVo4. С.95-100.
6. Егоров Ю.В. Некоторые задачи теории оптимального управления // Ж. вычисл. матем. и матем. физ. 1963. Т.З. Л/о5. С.887-904.
7. Егоров Ю.В. Необходимые условия оптимальности в банаховых пространствах // Матем. сб. 1964. Т.64(106). Л/ôl. С.79-101.
8. Зеликин М.И. Оптимальное управление и вариационное исчисление. М.: Изд-во МГУ, 1985.
9. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974.
10. Казимиров В.И., Плотников В.И., Старобинец И.М. Метод вариаций для экстремальных задач общего вида. Препринт ИПФ АН СССР, Л/о44 // ИПФ АН СССР. Горький. 1982.-22С.
11. Казимиров В.И., Плотников В.И., Старобинец И.М. Необходимое условие экстремума в гладких задачах с операторными ограничениями // Изв. вузов. Математика. 1983. Л/о8. С.21-26.
12. Казимиров В.И., Плотников В.И., Старобинец И.М. Абстрактная схема метода вариаций и необходимые условия экстремума // Изв. АН СССР. Сер. матем. 1985. Т.49. Л/о1. С.141-159.
13. Ким A.B., Короткий А.И., Осипов Ю.С. Обратные задачи динамики параболических систем // Прикл. матем. и мех. 1990. Т.54. Л/о5. С.754-759.
14. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.
15. Короткий А.И. К интегральному представлению G-предельных операторов // Докл. АН СССР. 1990. Т.310. Л/об. С.1296-1299.
16. Короткий А.И. Обратные задачи динамики управляемых систем с распределенными параметрами // Изв. вузов. Математика. 1995. Л/oll. С.101-124.
17. Колмогоров А.Н., Фомин C.B. Элементы теории функций и функционального анализа. М.: Наука, 1981.
18. Красносельский М.А., Забрейко П.П., Пустыльник Е.И., Соболевский П.Е. Интегральные операторы в пространствах суммируемых функций. М.: Наука, 1966.
19. Красовский H.H. Теория управления движением. М.: Наука, 1968.
20. Крейн С.Г. Линейные уравнения в банаховом пространстве. М.: Наука, 1971.
21. Кряжимский A.B., Осипов Ю.С. О моделировании управления в динамической системе // Изв. АН СССР. Техн. кибернетика. 1983. Л/о2. С.51-60.
22. Кряжимский A.B., Осипов Ю.С. Устойчивые решения обратных задач динамики управляемых систем // Оптимальное управление и дифференциальные игры. Труды МИАН. 1988. Т.185. С.126-146.
23. Куржанский A.B. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
24. Курант Р., Гильберт Д. Методы математической физики. T.I. М.: ГТТИ, 1933.
25. Ладыженская O.A., Солонников В.А., Уральцева H.H. Линейные и квазилинейные уравнения параболического типа. М.: Наука, 1967.
26. Ладыженская O.A. Краевые задачи математической физики. М.: Наука, 1973.
27. Ладыженская O.A., Уральцева H.H. Линейные и квазилинейные уравнения эллиптического типа. М.: Наука, 1973.
28. Левитин Е.С., Милютин A.A., Осмоловский Н.П. Условия высших порядков локального минимума в задачах с ограничениями // УМН. 1978. Т.33. Вып. 6. С.85-148.
29. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.
30. Лионе Ж.-Л. Оптимальное управление системами, описываемыми уравнениями с частными производными. М.: Мир. 1972.
31. Лионе Ж.-Л. Управление сингулярными распределенными системами. М.: Наука, 1987.
32. Лурье К.А. Оптимальное управление в задачах математической физики. М.: Наука, 1975.
33. Милютин A.A. Общие схемы получения необходимых условий экстремума и задачи оптимального управления // УМН. 1970. Т.25. Вып.5(155). С.110-116.
34. Милютин A.A. О квадратичных условиях экстремума в гладких задачах с конечномерным образом // В сб. "Методы теории экстремальных задач в экономике", М.: Наука, 1981. С.138-177.
35. Мордухович Б.Ш. Принцип максимума в задачах оптимального быстродействия с негладкими ограничениями // Прикл. математика и механика. 1976. Т.40. .Л/об. С.1014-1023.
36. Натансон И.П. Теория функций вещественной переменной. М.: Наука, 1974.
37. Никольский М.С. Первый прямой метод Л.С.Понтрягина в дифференциальных играх. М.: Изд-во МГУ, 1984
38. Новоженов М.М., Плотников В.И. Обобщенное правило множителей Лагранжадля распределенных систем с фазовыми ограничениями // Дифференц. ур-ния. 1982. Т.18. А/о4. С.584-692.
39. Осипов Ю.С. К теории дифференциальных игр в системах с распределенными параметрами // Докл. АН СССР. 1975. Т.223. А/об. С.1314- 1317.
40. Осипов Ю.С., Кряжимский А.В. О динамическом решении операторных уравнений // Докл. АН СССР. 1983. Т.269. А/оЗ. С.552-556.
41. Осипов Ю.С., Кряжимский А.В, Максимов В.И. Задачи динамической регуляризации для систем с распределенными параметрами. Препринт. Свердловск. Ин-т матем. и мех. УрО АН СССР, 1991.
42. Плотников В.И. Об оптимальном управлении системами с распределенными параметрами // ДАН СССР. 1967. Т.175. А/об. С.1238-1241.
43. Плотников В.И. О сходимости конечномерных приближений (в задаче об оптимальном нагреве неоднородного тела произвольной формы) // Журн. вычисл. матем. и матем. физ. 1968. Т.8. Л/о1. С.136-157.
44. Плотников В.И. Достаточные условия оптимальности для управляемых систем общего // Информ. материалы. Т.5(42). М.: АН СССР. Научн. совет по комплексной проблеме "Кибернетика", 1970. С.38-46.
45. Плотников В.И. Теоремы существования оптимизирующих функций для оптимальных систем с распределенными параметрами // Изв. АН СССР. Сер. матем. 1970. Т.34. Л/оЗ. С.689-711.
46. Плотников В.И. Необходимые условия оптимальности для управляемых систем общего вида // ДАН СССР. 1971. Т.199. А/о2. С.275-278.
47. Плотников В.И. Необходимые и достаточные условия оптимальности и условия единственности оптимизирующих функций для управляемых систем общего вида // Изв. АН СССР, сер. матем. 1972. Т.36. ЛГоЗ. С.652-679.
48. Плотников В.И. Теория оптимизации управляемых систем (с распределенными и сосредоточенными параметрами): Диссертация . доктора физ.-матем. наук. Горький: ГГУ, 1975.
49. Плотников В.И., Старобинец И.М. Об операторных включениях в гладких задачах на экстремум // Изв. вузов. Математика. 1985. Л/о12. С.42-48.
50. Плотников В.И., Старобинец И.М. Фазовые включения в задачах оптимального управления // 1986. Т.22. А/о2. С.236-247.
51. Плотников В.И., Сумин В.И. Оптимизация объектов с распределенными параметрами, описываемых системами Гурса-Дарбу // Ж. вычисл. матем. и матем. физ. 1972. Т.12. Л/ol. С.61-77.
52. Плотников В.И., Сумин В.И. Проблемы устойчивости нелинейных систем Гурса-Дарбу // Дифференц. ур-ния. 1972. Т.8. Л/о5. С.845-856.
53. Плотников В.И., Сумин В.И. О первой вариации и сопряженной задаче в теории оптимального управления // Функциональный анализ и его приложения. 1976. Т.10. Вып.4. С.95-96.
54. Плотников В.И., Сумин В.И. Оптимизация распределенных систем в лебеговом пространстве // Сиб. матем. ж. 1981. Т.22. А/об. С.142-161.
55. Плотников В.И. Теоремы единственности, существования и априорные свойства обобщенных решений // Докл. АН СССР. 1965. Т.165. Л/ol. С.33-35.
56. Плотников В.И. Энергетическое неравенство и свойство переопределенности системы собственных функций // Известия АН СССР. Сер. матем. 1968. Т.32. Л/о4. С.743-755.
57. Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей в задачах управления системами с распределенными параметрами // Ж. вычисл. матем. и матем. физ. 1982. Т.22. Л/ol. С.49-56.
58. Плотников В.И., Сумин М.И. Необходимые условия в негладкой задаче оптимального управления // Матем. заметки. 1982. Т.32. Л/о8. С.187-197.
59. Плотников В.И,, Сумин М.И. О построении минимизирующих последовательностей // Дифференц. уравнения 1983. Т. 19. Л/о4. С.581-588.
60. Плотников В.И., Сумин М.И. Оптимальное управление объектами с распределенными параметрами, описываемыми негладкими системами Гурса-Дарбу с ограничениями типа неравенства // Дифференц. ур-ния. 1984. Т.20. А/о5. С.851-860.
61. Плотников В.И. Сумин М.И. Об условиях на. элементы минимизирующих последовательностей задач оптимального управления //Докл. АН СССР. 1985. Т.280. Л/*о2. С.292-296.
62. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.
63. Потапов М.М. О сильной сходимости разностных аппроксимаций задач граничного управления и наблюдения для волнового уравнения // Ж. вычисл. матем. и матем. физ. 1998. Т.38. А/оЗ. С.387-397.
64. Пшеничный Б.Н. Необходимые условия экстремума. М.: Наука, 1982.
65. Розоноэр Л.И. Принцип максимума Л.С.Понтрягина в теории оптимальных систем. 1,11,III. Автоматика и телемеханика. 1959. Т.20, Л/оЛ/оЮ, 11,12. С.1320-1334, 1441-1458, 1561-1578.
66. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.
67. Сакс С. Теория интеграла. М.: И.Л., 1949.
68. Сиразетдинов Т.К. Оптимизация систем с распределенными параметрами. М.: Наука. 1977.
69. Смирнов В.И. Курс высшей математики. Том V. М.: ГИФМЛ, 1959.
70. Солонников В.А. Об общих краевых задачах для систем, эллиптических в смысле Даглиса-Ниренберга // Тр. Мат. ин-та АН СССР. 1966. Т.92. С.233-297.
71. Солонников В.А. Об оценках в Ьр решений эллиптических и параболических систем // Тр. Мат. ин-та АН СССР. 1967. Т.102. С.137-160.
72. Солонников В.А. Оценки решений нестационарной линеаризованной системы уравнений Навье-Стокса // Тр. Мат. ин-та АН СССР. 1964. Т.70. С.213- 316.
73. Срочко В.А. Условия оптимальности для одного класса систем с распределенными параметрами // Сиб. матем. журн. 1976. Т.17, Л/о5. С.1108-1115.
74. Срочко В.А. Вариационный принцип максимума и методы линеаризации в задачах оптимального управления. Изд. Иркутского ун-та. 1989.
75. Стейн И.М. Сингулярные интегралы и дифференциальные свойства функций. М.: Мир, 1973.
76. Сумин В.И. Об устойчивости существования глобального решения первой краевой задачи для управляемого параболического уравнения // Дифференц. ур-ния. 1986. Т.22. Л/о9. С. 1587-1595.
77. Сумин В.И. Функционально-операторные вольтерровы уравнения в теории оптимального управления распределенными системами // ДАН СССР. 1989. Т.305. А/о5, С.1056-1059.
78. Сумин В.И. Об обосновании градиентных методов для распределенных задач оптимального управления // Ж. вычисл. матем. и матем. физ. 1990. Т.30. Л/о1. С.3-21.
79. Сумин В.И. О достаточных условиях устойчивости существования глобальных решений управляемых краевых задач // Дифференц. ур-ния. 1990. Т.26. А/о12. С.2097-2109.
80. Сумин В.И. Функционально-операторные уравнения Вольтерра и устойчивость существования глобальных решений краевых задач // Укр. матем. журн. 1991. Т.43. А/о4. С.555-561.
81. Сумин В.И. Сильное вырождение особых управлений в распределенных задачах оптимизации // ДАН СССР. 1991. Т.320. Л/о2. С.295-299.
82. Сумин В.й. Функциональные вольтерровы уравнения в теории оптимального управления распределенными системами. Часть I. Вольтерровы уравнения и управляемые начально-краевые задачи. Монография. Н.Новгород: Изд-во ННГУ, 1992.
83. Сумин В.И. Сильное вырождение особых управлений в задачах оптимизации распределенных систем // Оптимизация. Сб. научн. тр. Л/о52 (69). Новосибирск: 1993, С.74-94.
84. Сумин В.И. О функциональных вольтерровых ур авнениях // Изв. вузов. Математика, 1995, Л/о9. С.67-77.
85. Сумин М.И. Субоптимальное управление системами с распределенными параметрами // Сб. докладов 1-й международной конф. "Математические алгоритмы" (Нижний Новгород, 14-19 августа 1994г.). Нижний Новгород: Изд-во ННГУ, 1995. С.116-125.
86. Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений // Журн. вычисл. матем. и матем. физ. 1997. Т.37. Mol. С.23-41.
87. Сумин М.И. Субоптимальное управление системами с распределенными параметрами: свойства нормальности, субградиентный двойственный метод // Журн. вычисл. матем. и матем. физ. 1997. Т.37. Мо2. С.162-178.
88. Сумин М.И. О достаточных условиях на элементы минимизирующих последовательностей в задачах оптимального управления //Ж. вычисл. матем. и матем. физ. 1985. Т.25. Mol. С.23-31.
89. Сумин М.И. Оптимальное управление системами с приближенно известными исходными данными // Ж. вычисл. матем. и матем. физ. 1987. Т.27. А/о2. С.163-177.
90. Сумин М.И. Оптимальное управление разрывными динамическими системами со скользящими режимами // Дифференц. ур-ния. 1988. Т.24. Moll. С.1911-1922.
91. Сумин М.И. Оптимальное управление объектами, описываемыми квазилинейными эллиптическими уравнениями // Дифференц. ур-ния. 1989. Т.25. Мо8. С. 1406-1416.
92. Сумин М.И. О первой вариации в теории оптимального управления системами с распределенными параметрами // Дифференц. ур-ния. 1991. Т.27. А/о12. С.2179-2181.
93. Сумин М.И. О минимизирующих последовательностях в задачах оптимального управления при ограниченных фазовых координатах // Дифференц. ур-ния. 1986. Т.22. Л/оЮ. С.1719-1731.
94. Сумин М.И. Задачи оптимального управления сосредоточенными и распределенными системами с дифференцируемыми и недифференцируемыми функционалами и функциями, задающими системы, Дис.канд. физ.-матем. наук, 1983, Горький: ГГУ.
95. Сумин М.И. Достаточные условия оптимальности в негладких задачах оптимального управления распределенными системами // Дифференц. ур-ния. 1986. Т.22. А/о2. С.326-337.
96. Сумин М.И. О функционале невязки принципа максимума в теории оптимального управления // Ж. вычисл. матем. и матем. физ. 1990. Т.30. Л/о8. С. 1133-1149.
97. Сумин М.И. Субоптимальное граничное управление системами, описываемыми параболическими уравнениями. Тезисы докл. школы " Понтрягинские чтения VII", Воронеж, ВГУ, 1996, С.172, Изд-во Воронежского ун-та, Воронеж.
98. Сумин М.И. Субоптимальное управление полулинейным эллиптическим уравнением с фазовым ограничением и граничным управлением // Дифференц. ур-ния. 2000. Т.36. Л/о11.
99. Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, I: принцип максимума для минимизирующих последовательностей, нормальность // Известия ВУЗов, Математика. 2000. Л/об. С.33-44.
100. Сумин M.И. Субоптимальное управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, II: чувствительность, типичность регулярного принципа максимума // Известия ВУЗов, Математика. 2000. Л/о8. С.
101. Тихомиров В.М. Некоторые вопросы теории приближений. М.: Изд-во МГУ, 1976.
102. Тонков E.JI. Линейная задача оптимального управления периодическими решениями // Дифференц. уравнения. 1976. Т.12. Л/об. С.1007-1011.
103. Тонков Е.Л. Динамическая система сдвигов и вопросы равномерной управляемости линейной системы // ДАН СССР. 1981. Т.256. Л/о2. С.290-294.
104. Троицкий В.А. Оптимальные процессы колебаний механических систем. Л. 1976.
105. Условия экстремума и конструктивные методы решения в задачах оптимизации гиперболических систем. Ред. Васильев О.В. Новосибирск: Наука, 1993.
106. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука. 1978.
107. Филиппов А.Ф. О некоторых вопросах теории оптимального регулирования. Вестник МГУ. Сер. матем. мех., 1959. Л/о2. С.25-32.
108. Функциональный анализ (серия "Справочная матемтическая библиотека"), под редакцией С.Г.Крейна. М: Наука, 1972.
109. Фурсиков A.B. О некоторых задачах управления и результатах, касающихся однозначной разрешимости смешанной краевой задачи для трехмерных систем Навье-Стокса и Эйлера // ДАН СССР. 1980. Т.252. Л/о5. С.1066-1070.
110. Фурсиков A.B. Задачи управления и теоремы, касающиеся однозначной разрешимости смешанной краевой задачи для трехмерных уравнений Навье-Стокса и Эйлера // Матем. сб. 1981. Т.115 (157). Л/о2. С.281-306.
111. Фурсиков A.B. Свойства решений некоторых экстремальных задач, связанных с системой Навье-Стокса // Матем. сб. 1982. Т.118 (160). Л/оЗ. С.323-349.
112. Фурсиков A.B. Оптимальное управление распределенными системами. Теория и приложения. Новосибирск: Научная книга, 1999.
113. Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы. М.: Мир, 1979.
114. Эрроу К.Дж., Гурвиц Л., Удзава X. Исследования по линейному и нелинейному программированию. М.: ИЛ, 1962.
115. Якубович В.А. Некоторые варианты абстрактного принципа максимума // ДАН СССР.1976. Т.229. Л/о4. С.816-819.
116. Якубович В.А. К абстрактной теории оптим ального управления I // Сиб. матем. журн.1977. Т.18. Л/оЗ. С.685-707.
117. Якубович В.А. К абстрактной теории оптимального управления II // Сиб. матем. журн.1978. Т.19. Л/о2. С.436-480.
118. Якубович В.А. К абстрактной теории оптимального управления III // Сиб. матем. журн. 1979. Т.20. Л/о4. С.385-410.
119. Якубович В.А. К абстрактной теории оптимального управления IV // Сиб. матем. журн. 1979. Т.20. Л/о5. С.1131-1159.
120. Янг JI. Лекции по вариационному исчислению и оптимальному управлению. М.: Мир. 1974.
121. Avdonin S.A., Ivanov S.A. Families of exponentials. The method of moments in controllability problems for distributed parameter systems. Cambridge. University Press. 1995.
122. Alibert J. J., Raymond J.P. Optimal Control Problems Governed by Semilinear Elliptic Equations with Pointwise State Constraints // Preprint. 1994.
123. Arutyunov A.V., Aseev S.M. Investigation of the degeneracy phenomenon of the maximum principle for optimal control problems with state constraints // SIAM J. Control Optim. 1997. V.35. No.3. P.930-952.
124. Asplund E. Fréchet Differentiability of Convex Functions // Acta Math. 1968. V.121. P.31-47.
125. Barbu V. Optimal Control in Variational Inequalities, Reserch Notes in Mathematics. V.100. Pitman, London, 1984.
126. Belov S.A., Slugin S.N. Necessary conditions for a domain optimization problem with various constraints // J. Optim. Theory. Appl. 1996. V.90. No.2. P.243-255.
127. Belov S.A., Slugin S.N. Necessary conditions of optimality in constrained planar domain optimization // Nonlinear dynamical systems: qualitative analysis and control, No.3, Computational Mathematics and Modeling. 1996. V.7. No.4. P.356-362.
128. Bermúdez A., Martinez A. An optimal control problem with state constraints related to the sterilization of canned foods // Automatica. 1994. V.30. No.2. P.319-329.
129. Bonans J.F., Casas E. Un Principe de Pontryagine pour le Contrôle des Systèmes Elliptiques // J. Differential Equations. 1991. V.90. P.288-303.
130. Bonans J.F., Casas E. An Extension of Pontryagin's Principle for State-Constrained Optimal Control of Semilinear Elliptic Equations and Variational Inequalities // SIAM J. Control Optim. 1995. V.33. No.l. P.274-298.
131. Borwein J.M., Strojwas H.M. Proximal Analysis and Boundaries of Closed Sets in Banach Space, Part I: Theory // Can. J. Math. 1986. V.38. No.2. P.431-452; Part II: Applications // Can. J. Math. 1987. V.39. No.2. P.428-472.
132. Casas E. Boundary Control of Semilinear Elliptic Equations with Pointwise State Constraints // SIAM J. Control Optim. 1993. V.31. No.4. P.993-1006.
133. Casas E. Pontryagin's Principle for State-Constrained Boundary Control Problems of Semilinear Parabolic Equations // SIAM J. Control Optim. 1997. V.35. P.1297-1327.
134. Clarke F.H. Maximum Principles without Differentiability // Bull. Amer. Math. Soc. V.81. No.l. P.219-222.
135. Clarke F.H. Thr Maximum Principle under Minimal Hypotheses // SIAM J. Control Optim. V.14. No.6. P.1078-1091.
136. Clarke F.H. Perturbed Optimal Control Problems // IEEE Trans. Automatic Control. V.AC-31. No.6. P.535-542.
137. Mordukhovich B.S., Zhang K. Dirichlet Boundary Control of Parabolic Systems with Point-wise State Constraints // Intern. Series of Numer. Math. Birkhauser Verlag, Basel. 1998. V.126. P.223-236.
138. Mordukhovich B.S. Complete Characterization of Openness, Metric Regularity and Lips-chitzian Properties of Multifunctions // Trans. Amer. Math. Soc. 1993. V.340. P. 1-36.
139. Mordukhovich B.S. Generalized Differential Calculus for Nonsmooth and Set-Valued Mappings // J. Math. Anal. Appl. 1994. V.183. No.l. P.250-288.
140. Mordukhovich B.S., Shao Y. Stability of Set-Valued Mappings in Infinite Dimensions: Point Criteria and Applications // SIAM J. Control Optim. 1997. V.35. No.l. P.285-314.
141. Mordukhovich B.S., Shao Y. Nonsmooth Sequential Analysis in Asplund Spaces // Trans. Amer. Math. Soc. 1996. V.346. No.4. P. 1235-1280.
142. Neustadt L.W. An Abstract Variational Theory with Applications to a Broad Class of Optimization Problems. II, Applications // SIAM J. Control. 1967. 5:1. P.90-137.
143. Osipov Yu.S. and Kryazhimskii A.V. Inverse Problems of Ordinary Differential Equations: Dynamical Solution. London: Gordon and Breach, 1995.
144. Osmolovskii N.P. Quadratic Conditions for Nonsingular Extremals in Optimal Control (A Theoretical Treatment) // Russian J. of Math. Physics. 1995. V.2. No.4. P.487-516.
145. Polak E., Wardi Y.Y. A Study of Minimizing Sequences // SIAM J. Control Optim. 1984. V.25. No.4. P.599-609.
146. Raymond J.P., Zidani, H. Pontryagin's Principle for State-Constrained Control Problems Governed by Parabolic Equations with Unbounded Controls // SIAM J. Control Optim. 1998. V.36. P. 1853-1879.
147. Raymond J.P., Zidani H. Pontryagin's Principles for Control Problems Governed by Semilinear Parabolic Equations // Appl. Math. Optim. 1999.V.39. P.143-177.
148. Rockafellar R.T. Directionally Lipschitzian Functions and Subdifferential Calculus // Proc. London Math. Soc. 1979. V.39. No.3. P.331-355.
149. Rockafellar R.T. Generalized Directional Derivatives and Subgradients of Nonconvex Functions // Can. J. Math. 1980. V.32. P.257-280.
150. Rockafellar R.T. The Theory of Subgradients and Its Applications to Optimization. Convex and Nonconvex Functions. Berlin: Heldermann 1981.
151. Rockafellar R.T. Proximal Subgradients, Marginal Values and Augmented Lagrangians in Nonconvex Optimization // Math. Oper. Res. 1981. V.6. P.424-436.
152. Sumin M.I. Suboptimal Control of Systems with Distributed Parameters: Minimizing Sequences, Value Function, Regularity, Normality // Control and Cybernetics. 1996. V.25. No.3. P.529-552.
153. Sumin M.I. Optimal control of semilinear elliptic equation with state constraint: maximum principle for minimizing sequence, regularity, normality, sensitivity // Control and Cybernetics. 2000. V.29. No.2. P.449-472.
154. Thibault L. On Subdifferentials of Optimal Value Functions // SIAM J. Control Optim. 1991. V.29. P.1019-1036.
155. Ward A.L. Differentiability of Vector Monotone Functions // Proc. London Math. Soc. 1935. V.32. No.2. P.339-362.