Математичекая теория субоптимального управления распределенными системами тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Сумин, Михаил Иосифович
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Нижний Новгород
МЕСТО ЗАЩИТЫ
|
||||
2000
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
На правах рукописи
X
СУМИН Михаил Иосифович
МАТЕМАТИЧЕСКАЯ ТЕОРИЯ СУБОПТИМАЛЬНОГО УПРАВЛЕНИЯ РАСПРЕДЕЛЕННЫМИ СИСТЕМАМИ
Специальность: 01.01.02 - Дифференциальные уравнения
Автореферат диссертации на соискание ученой степени доктора физико-математических наук
Нижний Новгород - 2000
Работа выполнена в Нижегородском государственном университете им. Н.И.Лобачевского
Официальные оппоненты:
Доктор физико-математических наук, профессор Ф.П.Васильев
Доктор физико-математических наук, профессор С.Н.Слугин
Доктор физико-математических наук, профессор А.В.Фурснков
Ведущая организация — Институт математики и механики Уральского Отделения РАН
Защита диссертации состоится "
вг/^ ^^ чя-г. на заседании диссертационного совета Д 063.77.07 по защите диссертаций на соискание ученой степени доктора физико-математических наук в Нижегородском государственном университете по адресу: 603600, Нижний Новгород, ГСП-20, пр.Гагарина, 23, корп.2.
С диссертацией можно ознакомиться в фундаментальной библиотеке ННГУ.
Автореферат разослан п - / п 9ппп г.
Ученый секретарь диссертационного совета Д 063.77.07,
кандидат физико-математических наук,
доцент г В.И.Лукьянов
Общая характеристика диссертации
Диссертация посвящена развитию математической теории субоптимального управления распределенными системами (т.е. системами, описывав емыми уравнениями с частными производными) или, другими словами, математической теории оптимального управления распределенными системами, в которой "базовым элементом" теории является не оптимальное управление (обычное, т.е. измеримое по Лебегу, или обобщенное1), а минимизирующая последовательность (м.п.) обычных управлений.
Актуальность темы. Центральный результат математической теории оптимального управления - принцип максимума Л.С.Понтрягина. После его открытия последовали всевозможные обобщения. Во первых, были созданы различные общие схемы получения необходимых условий экстремума в абстрактных задачах с ограничениями (А.Я.Дубовицкий и А.А.Милютин, В.Г.Болтянский, Р.В.Гамкрелидзе и Г.Л.Харатишвили, L.W.Neustadt и др.). В дальнейшем эти схемы постоянно развивались, с их помощью решались все более сложные задачи оптимального управления (А.В.Дми-трук, А.Я.Дубовицкий, А.А.Милютин, Н.П.Осмоловский и др.).
Одновременно с созданием абстрактных схем интенсивно развивается также и теория " собственно задач" оптимального управления разнообразными сосредоточенными и распределенными системами (A.B.Арутюнов, С.М.Асеев, В.И.Благодатских, А.Г.Бутковский, Ф.П.Васильев, С.А.Вах-рамеев, Р.Габасов, В.И.Гурман, В.Ф.Демьянов, А.И.Егоров, Ю.В.Егоров, М.И.Зеликин, А.Д.Иоффе, Ф.М.Кириллова, Ю.Н.Киселев, Н.Н.Красовский, В.Ф.Кротов, А.В.Кряжимский, А.Б.Куржанский, К.А.Лурье, Б.Ш.Морду-хович, М.С.Никольский, Ю.С.Осипов, В.И.Плотников, Л.И.Розоноэр, Т.К. Сиразетдинов, В.М.Тихомиров, Е.Л.Тонков, В.А.Троицкий, А.Ф.Филиппов, А.В.Фурсиков, F.H.Clarke, J.L.Lions, J.Warga, L.J.Young, и др.).
В то же время появляются и различные общие подходы к получению принципа максимума для систем с распределенными параметрами (Ю.В. Егоров, А.С.Матвеев, В.И.Плотников, В.А.Якубович, H.O.Fattorini и др.). Теория оптимального управления распределенными системами быстро развивается в самых разных направлениях (С.А.Авдонин, Л.Т.Ащепков, О.В. Васильев, Ф.П.Васильев, А.И.Егоров, С.А.Иванов, А.З.Ишмухаметов, A.B. Кряжимский, А.И.Короткий, В.И.Максимов, А.С.Матвеев, С.Ф.Морозов, Ю.В.Орлов, Ю.С.Осипов, М.М.Потапов, С.Н.Слугин, В.А.Срочко, В.И.Сумин, А.В.Фурсиков, В.А.Якубович, V.Barbu, H.O.Fattorini, H.Frankowska, B.S.Mordukhovich, J.L.Lions и др.).
'Здесь ■ iixi обобщено« управлевае, » также picnepiiit »адачв оптвмалкаого увравлеввв аоаамаетсв ■ смысле РЗ-Гаккреладее, Дж.Варгв:
[Г] Гамкрелвдэе Р.В. Освови оатваальвого увраалевав. Тбвласв: Им-во Тбал. уа-та, 1977.
[В] Варга Дж. Овтанальаое увравлеаае даффереваяальвыма в фувкавовальаына урвавеввкма. M.: Наука, 1977.
Диссертация посвящена различным аспектам теории субоптимального управления распределенными системами, связанным так или иначе с принципом максимума Л.С.Понтрягина, который для краткости мы будем называть ниже просто принципом максимума.
Как уже отмечено выше, существующие в теории оптимального управления абстрактные подходы (схемы) позволяют эффективно получать в различных сложных задачах оптимального управления с ограничениями условия оптимальности как первого, так и более высоких порядков, а также результаты так или иначе связанные с условиями оптимальности (принципом максимума). Однако все эти подходы предполагают наличие по крайней мере одного очень существенного обстоятельства
(I): существование оптимального элемента, каковым может являться как обычное, так и обобщенное управление.
Указанное обстоятельство обеспечивается в случае обычного оптимального управлепия во всех упомянутых выше схемах посредством постулирования факта существования (как известно2, именно это привело к возникновению словосочетания " наивная теория оптимального управления"), если на задачу не наложены дополнительные и, как правило, весьма жесткие условия существования оптимально!« элемента. При этом для задач опти-мальпого управления обыкновенными дифференциальными уравнениями, а также в случае управляемых уравнений из весьма широкого класса так называемых полулинейных уравнений в частных производных существование оптимальных обобщенпых элементов дается "практически даром".
В то же время, в теории оптимального управления распределенными системами несуществование обычного оптимального управления и одновременно невозможность расширения задачи в том или ином смысле (Р.В.Гам-крелидзе, Дж.Варга, А.Ф.Филиппов, Л.Янг) не является каким-либо редким и патологическим событием. Приведем для иллюстрации следующий продетой пример, связанный с одномерной задачей Гурса-Дарбу. Пример 1. Рассмотрим задачу оптимального управления
10(и) = £ £(г2(х,у) - и2{х, у)) йхйу Ы, и &Т>,
V = {и е ^{Щ : и(х,у) е [-1,1] п.в. наП}, П = [0,1] X [0,1],
хху = и(л:, у)гх + и(х,у), г(х,0) = г(0,у) = 0.
Специфика такой хорошо известной конструкции функционала такова, что в этой задаче нижняя грань равна —1. Очевидно, что она не достигается ни на каком обычном управлении. Т.к.
г[и](х, у) = /о*(ехР(£ и(6,6) ¿6) -
2(Я] Янг Л. Лиан 00 в»ря»ивоннон7 асчяслсню ■ т«ори опт малы ого хораимни. М.: Млр, 1974.
то можно заметить, что последовательность
иЧх «л^1 *е[0,1], i = 1,3.....2.-1,
у €(#,£), г €[0,1], i — 2,4,..., 2г, ¿=1,2,...
является минимизирующей и для нее выполняется предельное соотношение lo(u') —> —1, г —со, в то время как для последовательности
v'(x V^i1 х » е [0,1], j = 1, 3,. .., 2« — 1,
® У €[0,1], J =2,4.....2г', ¿ = 1,2,...
указанное предельное соотношение не выполняется. Можно утверждать также, что первая из отмеченных последовательностей удовлетворяет принципу максимума для м.п. [1], а вторая - нет. В то же время, обе эти последовательности управлений, как нетрудно заметить, сходятся (в слабой норме \ ■ |ш, см. [В], [Г]) к одному и тому же обобщенному управлению v(x,y) = +
Подобные примеры говорят о том, что в теории оптимизации распределенных систем в общей ситуации "единственным выходом" для получения "каких-либо" условий оптимальности является рассмотрение именно м.п. в качестве "базового элемента" теории.
Представляется целесообразным здесь также отметить и еще одно обстоятельство, с которым приходится неизбежно сталкиваться в теории оптимального управления системами с операторными ограничениями3. Оно связано с возможпой невыполнимостью принципа максимума4. Многие примеры задач оптимального управления с операторными ограничениями, в которых не справедлив принцип максимума, достаточно хорошо известны (см. также пример невыполнимости принципа Лагранжа в книге5, С.261). Одпим из них является ставший уже классическим пример Ю.В.Егорова6, С.42, другой может быть найден, например, в монографии7, п.5.6, С.313. Аналогичные примеры, связанные с простейшими задачами оптимальпого управления как для обыкновенного дифференциального уравнения, так и для уравнения теплопроводности с фазовым (полуфазовым) ограничением типа равенства, в которых в качестве целевого выступает пространство ¿г(0,1), можпо найти, например, в [28, 29, 31]. Эти, а также другие подобные примеры (естественно, их число можно неограниченно увеличивать) объединяет одно очень важное обстоятельство: выполнимость принципа
'Здесь ■ и ж же под операторный! ограничевиями ны поминаем ограниченна, задаваемые оператором с бесконечномерным
образом; н протяжном те случае ограниченна называем функциональными.
'Здесь речь ндет о том, что • задачах оптимального управлении с операторными ограниченнвми (для простоты рас-
сматриваем лишь случай огравкчений-равенств) Jo(u) min, /i(u) = 0, u e T>, где Jo : Т> -+ К1 - мвннмизируемый функционал, /1 : U -t В - оператор, задающий ограничение, V - множество допустимых управлений, В - бесковечвомерное бдя ахово пространстио, вообще говоря, не верва импликация, согласно коюро! оптимально« управление е V в задаче на услонный экстремум удовлетворяет прннцнцу максимума в задаче "безусловной минимизации" функционала Лагранжа Л0/„М + (Ai,/i(u)) min, u 6 Р, А0 > 0, А, е ß', (А0, А,) 0.
Б[АТФ] Алексееи B.M., Тихомиров В.М., Фомин С.В. Оптвмальное управлевве. М.: Наука, 1979.
®[В1] Васильев Ф.П. Методы решении экстремальных задач. М.: Наука, 1981.
7Балакрвшиан A.B. Прикладной функциональный анализ. М.: Наука, 1980.
максимума в них и, более того, регулярного принципа максимума (т.е. с непулевым множителем, соответствующим функционалу качества) жестко связано с дифференциальными свойствами функций значений задач как функций параметра, аддитивно входящего в ограничение - наличие нормали в каком-либо естественном смысле к надграфику функции значений при некотором выбранном значении параметра гарантирует выполнимость в соответствующей задаче регулярного принципа максимума.
Сказанное выше служит мотивацией отказа в настоящей работе от традиционного требования выполнимости в задачах оптимального управления отмеченного выше обстоятельства (I) и рассмотрения, в контексте общей идеологии метода возмущений (см., например, [АТФ], С.263), задачи оптимального управления как элемента семейства задач, зависящих от параметра, аддитивно входящего в ограничение. Говоря конкретнее, мы рассматриваем задачу минимизации
(Ач) 10(и) —> тГ, /1(11) € М + <7, и &Т>, д € $ — параметр,
где Т> - полное метрическое пространство называемых управлениями элементов и с метрикой В - равномерно выпуклое банахово пространство с дифференцируемой по Фреше нормой, /о : ТУ —¥ И1 - непрерывный ограниченный снизу функционал, 1\ : Т) —> В - непрерывный оператор, М С В - выпуклое замкнутое (вообще говоря, без внутренних точек) множество. В соответствии со сказанным основным "объектом", подлежащим "нахождению", является м.п. - мипимизирующее приближенное решение (м.п.р.) в смысле Дж.Варги [В], т.е. последовательность элементов и' <Е Т>, ¿ = 1,2,..., такая, что
/о(и') </?(?) + *',
для некоторых последовательностей сходящихся к нулю неотрицательных чисел &', е', г = 1,2,..., где
/З(я) = (3+0(ч) = А(?). Ш = ™ЪМи)'
/Зе(д) ее +оо, если Ц = 0, VI = {и 6 V : р{Ь{и) ~ч,М)< е}, е > О,
р(-,М) - функция расстояния. Возникающая здесь функция /3 : В —> И1 и {+00} называется функцией значений задачи (Лд) и для нее спра^ ведливо неравенство /?(д) < /?о(?) V? € В, где Ро : В -4 Я1 - классическая функция значений. В связи с задачей (Л,), которая имеет вид абстрактной задачи минимизации с ограничением в банаховом пространстве, но аксиоматика которой нацелена прежде всего на задачи оптимального управления, и в связи с введенным понятием м.п.р. отметим следующие обстоятельства: (а) м.п.р. всегда существует; (Ь) функция значений /3, " согласованная"
именпо с понятием м.п.р. (а не с понятием классического оптимального управления) является, в отличие от функции значений ßo, всегда полунепрерывной снизу; (с) использование понятия м.п.р. позволяет записывать все результаты для задачи (^4,) в терминах расширенной задачи, если такое расширение возможно; (d) именно понятие м.п.р. существенно используется в теории численных методов оптимального управления, а также в теории задач оптимального управления с приближенно известными исходными данными; (е) понятие м.п.р. несет в себе регуляризирующее начало; (f) понятие м.п.р. является удобным с прикладной (инженерной) точки зрения (подробности см., например, в [В]).
Следует отметить, что различные аспекты теории оптимального управления, связанные с субоптимальностью и м.п., постоянно привлекали внимание исследователей (Дж.Варга, Р.Габасов, Ф.М.Кириллова, Б.Ш.Морду-хович, V.Barbu, I.Ekeland, H.O.Fattorini и др.). Однако практически до последнего времени все результаты работ по м.п. группировались лишь вокруг получения необходимых условий. В цикле работ H.O.Fattorini (см., например, работу8) изучались необходимые условия для м.п., а также вопросы сходимости м.п. для целого класса задач оптимального управления абстрактными полулинейными дифференциальными уравнениями в банаховом пространстве с терминальным ограничением и нефиксированным временем. В самое последнее время интерес к проблеме необходимых условий субоптимальности и для м.п. был проявлен авторами работы9 (см. также ряд последующих работ тех же авторов).
Полунепрерывность спизу функции значений ß является наиважнейшим обстоятельством в теории оптимального управления, т.к. позволяет "подключить" к исследованию оптимизационных задач интенсивно развивающийся в последние годы аппарат негладкого анализа, а, именно, анализа нормалей (проксимальных нормалей) к замкнутым множествам в банаховых пространствах и обобщенного дифферепцирования негладких функций в банаховых пространствах. Различные важные результаты по негладкому анализу были получены в работах целого ряда авторов (Б.Ш.Мор-духович, J.M.Borwein, F.H.Clarke, A.D.Ioffe, P.D.Loewen, R.T.Rockafellar, Y.Shao, H.M.Strojwas и др.). Именно использование негладкого нормального анализа и теории обобщенного дифференцирования полунепрерывных снизу функций позволяет рассматривать любую задачу оптимального управления "не изолированно", а как элемент семейства аналогичных задач и получать информацию "в целом" о семействе и, как следствие, во мпо-
'Pattorini Н.О. Conrergence of euboptimal controli: the point target caje // S1AM J. Control Optim. 1990. V.28. No.2. P.320-341.
'Mordukhovich B.S., Zhang K. Exiitence, Approximation, and Suboptimalit? Conditioni for Minimal Control of I It at T; an lir r Syttemi with State Conitraintt // Lecture Notei in Pure and Applied Mathematics Mucel DcLker, New York. 1994. V l60. P.251-270.
гих важных частных случаях о каждой конкретной задаче отдельно. Такой подход приводит к возможности изучения условий регулярности, нормальности, проблемы чувствительности для широкого класса задач оптимального управления, а также позволяет "сблизить" теорию необходимых условий (теорию принципа максимума) и теорию численных методов оптимального управления. При этом важно подчеркнуть, что первые результаты в этом направлении были получены в работах таких авторов как F.H.Clarke, P.D.Loewen (см., например, монографию10 и статью11) для задач оптимального управления системами обыкновенных дифференциальных уравнений. В этих работах были получены полезные представления для обобщенных градиентов в смысле Кларка функций значений в терминах множителей Лаграпжа. Однако в них рассматривались классические оптимальные управления и функции значений, а на задачи накладывались специальные условия для обеспечения полунепрерывпости снизу классической функции значений в окрестности рассматриваемого фиксированного значения параметра.
Рассмотрение задачи (семейства задач) (/19) дает возможность изучения широкого спектра различных классических вопросов теории оптимизации, к которым можно отнести: 1) необходимые и достаточные условия для м.п.р. (в частности, для обычных или обобщенных оптимальных упраг влений); 2) различные свойства регулярности, нормальности, их связь с множителями Лагранжа, с дифференциальными свойствами функции значений, с векторами Куна-Таккера; 3) свойства чувствительности; 4) негладкие задачи; 5) числеппые методы оптимального управления; 6) методы решения задач с приближенно известными исходными данными, регуляризация в задачах оптимального управления и др..
В результате "расшифровки" абстрактных результатов для задачи (Л,) в диссертации получаются конкретные результаты по указанным вопросам для распределенных задач оптимального управления системами, описываемыми линейными, полулинейными и квазилинейными параболическими, эллиптическими и гиперболическими уравнениями с различными функциональными и операторными ограничениями. При этом, несмотря на то, что целевое пространство задачи (Aq) является равномерно выпуклым, мы показываем как на основе этих результатов получаются результаты, связанные с перечисленными выше вопросами, также и для задач вида (Aq) с нерефлексивными целевыми пространствами.
Подытоживая сказанное, можно утверждать, что переход к рассмотрению м.п.р., представляющий собой в известном смысле "максимальное"
10[К] К л • [J I ф. Оотшпэаяпя ■ иеглалкя! аяалпэ. М.: Hay", 1988.
"Clarke F.H., Lotwtn P.D. The Value Function in Optimal Control: Seniitivitj, Controllability and Time-Optimality // SIAM J. Control Optim. 1986. V.M, No.J. P.243-S63.
расширение исходной задачи, находится в согласии с известным высказыванием Д.Гильберта [Я] о том, что "каждая задача вариационного исчисления имеет решение, если слово "решение" понимать подходящим образом" . Понимая здесь под решением м.п., мы показываем, что основанная на этом понятии теория, обобщая традиционную, дает возможность получить новую полезную информацию о задаче, что вполне схоже с ситуацией, возникающей при переходе от обычных управлений к обобщенным [В], [Г].
Цель диссертационной работы. Цель работы состоит в разработке методов теории субоптимального управления распределенными системами, предназначенных для решения вопросов указанной теории, связанных с необходимыми и достаточными условиями на м.п., с различными свойствами регулярности и нормальности, с проблемой чувствительности, с негладкими задачами, с численными методами, с задачами с приближенно известными исходными данными.
Методы исследования. В диссертации использованы методы оптимизации, оптимального управления, негладкого анализа, обыкновенных дифференциальных уравнений и дифференциальных уравнений с частными производными, функционального анализа и теории функций действительного переменного.
Научная новизна. В диссертации разработаны основы математической теории субоптимального управления системами с распределенными параметрами. Показано, что на основе этой теории получаются новые для оптимального управления результаты, относящиеся как к собственно теории, так и к теории численных методов. Все результаты диссертации (главы 1-7) являются новыми.
Степень обоснования результатов диссертации. Все научные положения и выводы диссертационной работы строго математически обоснованы. Результаты, полученные в диссертации, хорошо согласуются с работами других авторов как отечественных, так и зарубежных.
Теоретическая и практическая ценность. Работа носит теоретический характер. Полученпые в ней результаты и методы могут быть применены в теории оптимального управления: 1) при теоретическом исследовании многих сложных конкретных задач с различного рода функциональными и операторными ограничениями; 2) при численном решении различных задач оптимального управления распределенными системами с помощью предложенных в диссертации двойственных численных методов.
Результаты диссертации вошли в отчет о НИР12, учебное пособие13 и
"Теория оптимального управления распределенными системами: субоптимальность, минимизирующие последовательяо-ств, чнслеввые методы. Отчет о НИР ио гранту Конкурсного центра прн С.-Петербургском уннверсвтете Госкомвтста РФ по высшему образованию (Л1о93-1-71-19), Л/о госрегистрации 01 9.40006443.1994, 74 с.
1эНовоженов ММ., Сумин В И., Сумин М.И. Методы оптимального управления свстемамн математической физвка. Учебное пособие. Горький: Изд-во ГГУ. 1986.-87 с.
были включены в спецкурсы, читаемые студентам Нижегородского государственного университета им. Н.И.Лобачевского.
Апробация работы. Результаты диссертации докладывались и обсуждались: на Международной конференции "Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде" (Екатеринбург, 2000); на Симпозиуме "Математическое моделирование в естественных и гуманитарных науках", посвященном 80-летию М.А.Красносельского (Воронеж, 2000); на Международной конференции, посвященной 90-летию со дня рождения Л.С.Понтрягина (Москва, 1998); на IV, VI, VII, VIII, IX, X, XI весенних воронежских школах "Понтрягинские чтения" (Воронеж, 1993, 1995, 1996, 1997, 1998, 1999, 2000); на Международной конференции ИФИП "Моделирование и оптимизация систем с распределенными параметрами с приложениями к инженерии" (Варшава, 1995); на III Всесоюзной школе "Понтрягинские чтения. Оптимальное управление. Геометрия и анализ" (Кемерово, 1990); на школе "Современные методы в теории краевых задач" (Воропеж, 1992); на XIV Всесоюзной школе по теории операторов в функциональных пространствах (Н.Новгород, 1991); на Первом Международном семинаре ИФАК "Негладкие и разрывные задачи управления и оптимизации" (Владивосток, 1991); на 1,11 Международных конференциях "Математические алгоритмы" (Н.Новгород, 1994,1995); на Международной научной конференции "Экстремальные задачи и их приложения" (Н.Новгород, 1992); на Всесоюзной конференции "Негладкий анализ и его приложения к математической экономике" (Баку, 1991); на Научной школе-семинаре "Разрывные динамические системы" (Ужгород, 1991); на Vil,IX Всесоюзных конференциях "Проблемы теоретической кибернетики" (Иркутск, 1985; Волгоград, 1990); на Всесоюзной конференции "Теория, методология и практика системных исследований" (Москва, 1985); на Итоговых научных конференциях Горьковского госуниверситета (1986-1990).
По теме диссертации были также сделаны доклады па семинаре по оптимальному управлению (ННГУ, рук. проф. В.И.Плотников, 1977-1988), на Волго-Вятском региональном семинаре по математической физике и оптимальному управлению (рук. проф. С.Ф.Морозов, 1990-1992), на семинарах в Московском государственном университете (рук. проф. Ф.П.Васильев, 1987, 1993, 2000; рук. проф. М.И.Зеликин, 2000; рук. проф. М.С.Никольский, 1988, 1990; рук. проф. А.В.Фурсиков, 2000), на семинаре в Институте математики и механики УРО РАН (рук. акад. РАН Ю.С.Осипов, чл.-корр. РАН А.В.Кряжимский, 1991,1993), насеминарев Институте проблем упра^ влепия (рук. проф. В.И.Уткин, 1986).
Результаты диссертации на протяжении ряда лет являлись составной частью результатов работы, выполняющейся при финансовой поддержке
различных научных Фондов:
1993 - 1994 г.г. - грант Международного Научного Фонда (фонд Дж.Сороса) и Российской Академии Естественных Наук (РАЕН);
1993 - 1995 г.г. - грант Конкурсного центра при С.-Петербургском университете Госкомитета РФ по высшему образованию (проект Л/Ь 93-1-7119), тема "Теория оптимального управления распределенными системами: субоптимальность, минимизирующие последовательности, численные методы" ;
1995 - 1997 г.г. - грант Российского Фонда Фундаментальных Исследований (проект А/о 95-01-00701), тема "Теория субоптимального управления распределенными системами и функциональные вольтерровы уравнения";
1998 - 2000 г.г. - грант Российского Фонда Фундаментальных Исследований (проект А/о 98-01-00793), тема "Теория субоптимального управлепия распределенными системами: минимизирующие последовательности, операторные ограничения, граничные управлепия, численные методы".
Публикации. Все результаты, вошедшие в диссертацию (главы 1 -7), являются новыми, изложены в работах [1] - [36] и целиком принадлежат автору диссертации. В трех совместных с В.И.Плотниковым работах [1, 3, 5] рассматривались лишь необходимые условия, причем только для классических м.п., т.е. для м.п. управлений, удовлетворяющих ограничениям в точном смысле. Из этих, по сути дела, первых работ по м.п. в оптимальном управлении автором используется лишь общая идея перехода в распределенных задачах оптимального управления к рассмотрению в качестве "базового элемента" теории именно м.п., а не оптимального управления. В диссертации же в качестве "базового элемента" используется м.п.р. в смысле Дж.Варги. Это позволило построить совершенно новую теорию субоптимального управления и рассмотреть при этом весьма широкий спектр оптимизационных вопросов, изучение которых было бы совершенно невозможно в рамках классических м.п..
В двух других совместных с В.И.Плотниковым работах [2, 4], а также в двух совместных работах с С.Ф.Морозовым [7, 11] авторами были предложены методы получения необходимых условий оптимальности в негладких (разрывных) задачах оптимального управления, одними из составных частей которых являются процедуры сглаживания исходных данных. Эти процедуры сглаживания, в равной мере принадлежащие авторам указанных работ, используются в главе 5 для изучения новых вопросов, совершенно пе затрагиваемых в указанных совместных статьях.
В совместной с В.И.Сумипым работе [21] содержатся результаты, иллюстрирующие эффективность предлагаемых в диссертации методов и показывающие возможность их применения и к такому достаточно широкому
»
кругу задач субоптимального управления распределенными системами, как задачи, описываемые так называемыми функциональными вольтерровыми уравнениями, теория которых разрабатывается в работах В.И.Сумина. Все результаты [21], связанные со свойствами регулярности, нормальности, чувствительности и т.п., получены методами, разработанными автором диссертации. При этом, естественно, использовались результаты, связанные с существованием и устойчивостью решений указанных уравнений, принадлежащие В.И.Сумину.
Структура и объем диссертации. Диссертация состоит из введения, 7 глав и списка литературы. Содержание изложено на 350 страницах, включая список литературы из 255 наименований.
Содержание диссертации
Во введении обсуждаются актуальность темы диссертации, новизна полученных результатов, их теоретическая ценность, а также кратко излагав ется содержание работы.
Первая глава диссертации полностью посвящена изучепию абстрактной задачи минимизации При получении абстрактных необходимых условий (суб)оптимальности и представлений для субдифференциалов функций значений указанная абстрактная задача каждый раз на определенном этапе трансформируется в задачу минимизации на некотором полном метрическом пространстве функционала типа максимума от конечного числа "обычных" (в смысле существования первых вариаций) функционалов. Поэтому п. 1.1 посвящен доказательству обобщенного правила множителей для (суб)оптимальных элементов в такой задаче.
В п.1.2 непосредственно рассматривается аксиоматика абстрактной параметрической задачи Использование в качестве множества допустимых элементов полного метрического пространства объясняется тем, что одним из основных инструментов в теории субоптимального управления является вариационный принцип Экланда14. Выбор в качестве целевого в задаче (Л,) равномерно выпуклого пространства с дифференцируемой по Фреше нормой обусловлен двумя моментами. Во-первых, т.к. равномерная выпуклость пространства обеспечивает его строгую нормирован-ность, то проекция точки на выпуклое замкнутое множество в этом случае существует и единственна, что в совокупности с дифференцируемостью нормы приводит к непрерывной дифференцируемости по Фреше для любого выпуклого замкнутого множества М С В выпуклой функции (функционала) расстояния р(-,М) в окрестности любой точки д £ В такой, что р(д,ЛЛ) > 0. Во-вторых, равномерная выпуклость позволяет нам считать В
"[Е] ЕЫи<| I. Он 1Ъе Угг1»Иов>1 Рпвйр|( // ]. Ма(Ь. Ап>1. Арр1. 1974. У.47. Ыо.З. Р.ЗМ-ЗЫ.
пространством Асплунда15, что, в свою очередь, позволяет применять для изучения задачи (Ая) как эффективные методы негладкого секвенциального анализа для таких пространств, развитые в последние годы в работах таких авторов как Mordukhovich В.S., Shao Y.(см., например, монографию16 и работу17), так и различные другие эффективные методы негладкого проксимального анализа для замкнутых множеств в банаховых пространствах. Особо оговоримся, что часть основных результатов настоящей работы так или иначе используют понятия нормалей и субдифференциалов именно в смысле работ [M], [MS], т.к., с одной стороны, в этих работах развито весьма полное и удобное субдифферепциальное исчисление, а с другой, как известно18, именно эти, вообще говоря, невыпуклые конструкции негладкого анализа являются, в известном смысле, наиболее "тонкими" по сравнению с другими аналогичными конструкциями (см. также19, С.90).
Любой метод получения необходимых условий оптимальности предполагает прежде всего решение двух основных проблем. Одна из пих заключи ется в эффективном вычислении первых вариаций функционалов оптимизм циопной задачи, другая же - в "учете" ограничений задачи. Можно утверждать, что предлагаемый в работе подход к получению необходимых условий для м.п.р. (условий (суб)оптимальности) и представлений в терминах множителей Лагранжа для субдифференциалов dß(q), dcoß(q) в смысле [М], [MS], в своей основе для решения двух отмеченных проблем стирается на два хорошо известных в теории оптимального управления подхода. Для подсчета первых вариаций функционалов в конкретных задачах применяется идея В.И.Плотникова20 использования для этой цели линейных интегральных представлений их приращений. Для учета же ограничений задач применяются различные модификации метода Ф.Кларка21, заключающегося в сведении задачи с ограничениями к задаче минимизации функ-циопала типа максимума с применением вариационного принципа Экланда [Е], необходимые условия в которой получены в п. 1.1.
Аксиоматика задачи (Aq) предполагает наличие линейного пространства "параметров варьирования" M с элементами m и отвечающих каждому управлению и G Т> "своих" выпуклого множества Ми С М, числа аи,т > 0 и непрерывного отображения - вариации управления Nu>m : [0, au,m] -+ Z>,
'*Напоивви, что пространством Асплунда ввтывается банахово пространство ва котором асякв! вепрерыввы! выпуклы! фувипвоиал всюду плотно дифференцируем по Фреше
1б[М] Мордукоиич Б.Ш. Методы аппроксимапи! в задачах оптимизации в упраялеиия. M : Натка, 1988.
17[MS] Mordukhovich B.S., Shao Y. Nonimooth Sequential Analyiit in Aiplond Spacei // TYant. Amer. Math. Soc. 1996. V.346. No.i. P.1235-1280.
18Ioffe A.D. Approximate Sub differential and Application!. I: The Finite Dimeniional Theory // Tr an i Amer. Math. Soc. 1984. V.281. P.389-Î16.
19Тихомнрои В M. Выпуклы! анализ // Итога пауки в техввкя. ВИНИТИ. Соиременяые проблемы математякв. фундаментальные иапраяленяя. 1987. Т.Н. C.5-101.
30Плотнвков В.И. Необходимые в достаточные условяв оптимальности и условвя едвнствеввости оптимизирующих фуик-чи! для упраиляемых систем общего ввда // Изв. АН СССР, сер. матем. 1972. Т.Эв. А^оЭ. С 652-679.
J1CI»rke P H A New Approach to Lagrange Multipliera // Math. Oper. Ree. 1976. V.l. No.2. P165-174.
N„,m(0) = и. Приняв обозначения Фо(и) = q) = p{Ii(u) — д,М),
запишем первую из аксиом - аксиому существования первых вариаций:
для некоторой функции с : [0,1] -> R\, с(0) = 0, ?(а) > 0 при а > О, существуют пределы
¿Ф0(и,т) = lim -i-(í0(Nu,m(a)) - Ф„(и)) Vu е V, т е MU) 69,(«, т;р) = lim -^-(í,(Nu,m(a)1?) - Ф,(в, д))
а->о <;(а)
Vu е Т> такого, что Фi(u,q) > 0, m 6 М„, р= dp(I\(u) — q,M). Ее главное отличие от аналогичных аксиом абстрактных схем других авторов (А.С.Матвеев, В.И.Плотников, В.А.Якубович, H.O.Fattorini и др.) заключается в постулировании факта существования не предела &1\ (и, т) = lim(/i(Num(a)) — /](и))/?(а) € В как элемента целевого пространства В, а числового предела ¿Ф](и, т;р), в котором "учитывается" одновременно посредством функции расстояния р(-,М) и ограничение p(/i(i¿) — q,M) — 0. В конкретных задачах с учетом дифференцируемости по Фреше функции расстояния р(-,М) в окрестности точек q таких, что p(q,M) > 0 (см. выше) вычисление первой вариации ¿Ф] (u, т; р), как правило, существенно проще подсчета традиционного предела SJi(u, m). В то же время, градиент р = др(1] (и) — q,Ai) в конечном итоге "трансформируется" в множитель Лагралжа (функциональный, если В - функциональное пространство), отвечающий операторному ограничению 1\(и) 6 М + q.
Вторая аксиома постулирует "нужные" и согласованные с варьированием управления дифференциальные свойства метрики d метрического пространства управлений (подобные аксиомы в схемах других авторов не использовались). Третья - обеспечивает традиционную "линейность" первых вариаций функционалов Фо, Ф1 по параметрам варьирования т.
Далее, т.к. метод получения необходимых условий для м.п.р. в задаче (Ая) предполагает использование предельного перехода в семействах необходимых условий для некоторых промежуточных оптимизационных задач, то следующие две аксиомы как раз и представляют собой аксиомы предельных переходов по и и q в семействах первых вариаций 5Фо, ¿Фь Первая из них, которую можно назвать аксиомой сильного предельного перехода, постулирует непрерывность первых вариаций в метриках пространств "D, В: сильная сходимость и' —> u, q' —> q, i 00 в случае Фi (и, q) > 0 (для ¿Фi) и, как следствие, сильная сходимость р' = др{1\(и') — q', М) б В* к р = др(1\(и) — q, Л4) б В*, влечет сходимость первых вариаций ¿Фо, ¿Фь
Вторая аксиома предельного перехода, которую условно можно назвать аксиомой слабого предельного перехода, постулирует возможность аналогичного предельного перехода при и' —>■ и, q' q, i оо, в метриках "D
и В в случае Ф1(11,17) — 0, т.к. для таких (и, g) первая вариация <5Ф] вообще не определена. В этом случае р' = др(1\(их) — q\M) Ç В' сходится к некоторому элементу р б В' лишь слабо и аксиома показывает как надо понимать предельный переход в семействе первых вариаций в ситуации когда и — и0 является оптимальным управлением, удовлетворяющим равенствам Jo(u») =/?(?), p(I1(u°)-q,M) = 0.
И, наконец, последняя аксиома (ее можно назвать аксиомой компактности) предполагает, что множество {/i(u) : и € 2?, /о(и) < С1} есть компакт в В при любом С, при котором оно не пусто. Это условие является естественным для задач оптимального управления и выполняется во многих наиболее интересных конкретных задачах с различными ограничениями.
П.п.1.3, 1.4 посвящены доказательству различных вариантов необходимых условий для м.п.р. в задаче (Ая). Эти и подобные им абстрактные результаты для задачи (Л?) мы называем также абстрактными принципами максимума для м.п.р., т.к. именно в результате их "расшифровки" получаются принципы максимума для м.п.р. в конкретных задачах оптимального управления. В частности, в п.1.3 показывается, что, если выпуклое замкнутое целевое множество M является достаточно "богатым", т.е. удовлетворяет некоторым дополнительным условиям (например, в случае гильбертова пространства В достаточно, чтобы M имело в соответствии с терминологией22 конечную коразмерность23), то любое м.п.р. в задаче (Л?) при q G dom/З удовлетворяет абстрактному принципу максимума. В то же время, в п.1.4, в свою очередь, в частности, показывается, что аналогичный принцип максимума, причем в регулярной форме (т.е. с ненулевым множителем, отвечающим функционалу качества) сохраняет свою силу для любого м.п.р. без дополнительных условий на М, но естественно не для любого q Ç dom/З, а лишь для тех из них, для которых не пуст субдифференцпал Фреше d/3(q), понимаемый в смысле [M], [MS]. Более того, здесь же получаются и представления для субдифферепциала df3(q) и сингулярного субдифферепциала d°°/3(q) в смысле [M], [MS] в терминах множителей Лагранжа (точнее, в терминах слабых предельных точек последовательностей таких множителей), связывающие дифференциальные свойства функции значений f3 с множителями Лагранжа.
В п.1.5 на основе результатов п.п.1.3, 1.4 доказываются различные общие свойства регулярности, нормальности, чувствительности для абстрактной задачи (Л,). И, наконец, заключительный п.1.6 главы 1 посвящен доказательству абстрактных принципов максимума для так называемых экстре-
"Fattorini И.О. A Unifled Theory of Nccctf ary Conditioni for Nonlinear Nonconrtx Control Syiteim // Appt. Math. Optim. 1987. V.15. Р.Ш-185.
"Мы говорвм, что ывожеетво M С В шест конечную кораемерность, если существует ваккнутое подпространство H с В конечно! коразмерности такое, что множество Jl^conuМ) выеет непустую ввутревность в Н, где П оекачаат ортогональное проектврованве В на И.
мальных последовательностей. При этом понятие экстремальной последовательности является естественным обобщением в случае субоптимальной теории такого классического понятия как экстремальное управление.
Глава 2 посвящена рассмотрению на основе абстрактных результатов главы 1 задач (суб)оптимального управления параболическими уравнениями [17] - [20], [22, 23], [25] - [31]. В п.2.1 рассматриваются задачи с фиксированным и нефиксированным временем (без варьирования времени) и с ограничением типа включения в конечномерное множество. Проиллюстрируем его результаты на примере классической задачи с равенствами и неравенствами (в упрощенной постановке)
(Pq) /0(и) inf, /i(u) € М + q, u€ V, q € ß = Rx, q - параметр,
где h{u) = (Ji(u),... , Jx(u)), q = (qu . .., qx),
Ji(u) = JnGi(x,z[u](x,T))dx, i= 0,1,...,ae, Ia{u) = J0{u),
D = {u€ Loo(Qt) ■ u(x, t) € U п.в. на <?т}> V С ßm - компакт, П - ограни-челная область в Л", М = М- = {х = (xj,..., хх) 6 R* : х\ < 0,..., xXl < O.Xa^+i = 0, ....Ха = 0), z[u] 6V2°(Qt) " соответствующее управлению и слабое решение в смысле24 первой краевой задачи для линейного параболического уравнения с дивергентной главной частью (считаем здесь без ограничения общности, что v 6 Ltx,(i2) фиксированная функция)
z, - ^~(a,j(x, t)zx>) + Ь,(х, t, и(х, t))zXl + а(х, t, и(х, t))z + f{x, t, u{x, t)) = 0,
(1)
z(x, 0) = v(x), x eil, z(x, t) = 0, (r, t) e ST.
При некоторых естественных для теории оптимального управления предположениях здесь показывается, что для задачи (Pq) справедлива вся аксиоматика п.1.2.. Обозначив Н(х, t, z,p, и, г/) = —ч(Ё bi(x,t,u)p, + a(x,t,u)z +
1=1
f(x, t, и)), введем
Определение 1. Последовательность и' € Т>, 1 = 1,2,..., назовем стационарной последовательностью (с.п.) в задаче (Pq) с М = М-, если и' € PJ* и существует ограниченная последовательность векторов ц' G R*+1, i = 1,2,..имеющая только ненулевые предельные точки
,4 > 0, ¿ = 0,1,...,»,, 4Ш«')~Як)> "У, ¿ = 1,2,...,аеь
такая, что ß[u] = (г[и]> гЛиШ
/ шах{(Я(х, t, t),v, г,[и'](х, t))-
jWt vzu
И[ЛСУ] Jluumiui O.A., Соловавков В.А., Уриши H.H. Jlinlliu ■ вва1алаа<|аы* урааааваа вараболачивого тваа. М.: Науаа, 1967.
Н{х, (, ¿), и'(х, «), ()))} ¿хМ < у, V > О, У О, I' оо,
О
где г?[и'] (Ят) решение при и = и' сопряженной задачи
- + и(х, ¿))г?) + а(г, и(х, ¿»т/ = О,
г?(г,т) = -£ ^УД^.фКх.Т)), г 6 П; 4(^,0 = о, (х, *) € 5Г.
*=о
Определение 2 С.п. в задаче (Рч) и* € "Щ, х = 1,2,..., У > 0, У -»■ 0, I —>• оо, называется нормальной (регулярной, анормальной), если все (существуют, не существуют) соответствующие последовательности ц\ I — 1,2,..., имеют (имеющие, имеющие) предельные точки (х лишь с компонентой ца ф 0 (лишь с компонентой уц ф 0, с компонентой цо ф 0 ). Задача (Рч) называется нормальной (регулярной, анормальной), если все ее (в ней существуют, все ее) стационарные последовательности нормальны (являющиеся регулярными, анормальны).
Следами соответствующих абстрактных результатов п.п.1.4, 1.5 в задаче (Рч) с М — М- являются, например, следующие результаты, для формулировки которых определим предварительно множества множителей
Ь\ = {-(¿£1,...,^) € Яж : (1 = (цо, Ш, е Яж+\ у. ф 0, ц0 = А,
существует стационарная в задаче (Р?) с М = М- последовательность управлений, для которой соответствующая ей согласно определению 1 последовательность векторов д', » = 1,2,..., имеет вектор /х своей предельной точкой}, Л = 0,1; = Ь\ и{0}, М\ = Ь\. Теорема 1 Любое м.п.р. в задаче (Ря) является с.п.. Пусть далее др(д), - соответственно субдифференциал, син-
гулярный субдифференциал и субдифференциал Фреше функции (5 в смысле [М], [МБ].
Теорема 2 Пусть /?(?) < +оо. Тогда
др(д) = др{ч)пм1 = М°я.
Лемма 1. Если < оо и = {0}, т.е. задача (Рч) нормальна, то функция Р является липшицевой в окрестности
Лемма 2. Если ф 0, то в задаче (Рч) имеются регулярные м.п.р..
Если же дР(д) ф 0, то все м.п.р. в задаче (Рч) являются регулярными. Лемма 3. Множество точек ц € ¿отр, для которыг в задаче (Рд) все м.п.р. регулярны, всюду плотно в ¿отр.
В то же время, можно утверждать, что в случае, если задача (Ря) с М = М- не содержит ограничений типа равенства, то утверждение леммы 3 можно существенно усилить. А, имепно, справедлива
Лемма 4. Если задача (Рч) с М = М,- не содержит ограничений типа равенства, т.е. ?В\ = ав, то при п. в. q € dorn ß все м.п.р. в задаче являются регулярными, т.е., другими словами, свойство, согласно которому все м.п.р. в задаче с неравенствами регулярны, является свойством общего положения для q £ domß.
Лемма 5. Если функция ß липшицева в окрестности q, то в каждой точке этой окрестности в задаче (Pq) существуют регулярные м.п.р.. Лемма 6. Если в задаче (Pq) имеет место неравенство ß(q) < ßo(q), то любая последовательность и', i = 1,2,..., удовлетворяющая соотношениям 1й(и') -)■ ß € [ß{q),ßo(q)l /о(«О < А>(?) + £*, и< 6 е' 0, : оо, является с.п., а в случае ß € \ß(q),ßo{q)) не является нормальной см. в задаче (Рч).
Следствие 1 Строгое неравенство ß(q) < А>(<?) е задаче (Pq) не может выполняться, по крайней мере, в двух следующих случаях: 1) задача нормальна; 2) в задаче имеется нормальное м.п.р..
Лемма 7. Если ц € Л = {А € R* : Ai > О,..., А*, > 0} есть вектор Куна-Таккера в задаче (Рч), т.е. ß(q) < Jo(u) + £ — ?*) Vu 6 Т>, то
И, наконец, завершим перечисление свойств регулярности, нормальности задачи (Pq) с равенствами и неравенствами формулировками трех заключительных лемм, не вытекающих непосредственно из результатов п.1.5, первые две из которых являются обобщениями на случай субоптимального управления классических условий нормальности из математического программирования (речь идет об условиях Слейтера и линейности), а третья -связывает субдифференциал dß(q) в смысле [М], [MS] функции значений с векторами Куна-Таккера и дает точное представление для него в терминах множителей Лагранжа в "линейно-выпуклой" задаче (Pq)-Лемма 8. Пусть в задаче (Pq) отсутствуют ограничения типа равенства, то есть ае = ав], а исходные данные имеют вид: bi(x,t,u) = bi(x,t), i = 1 ,...,п, а(х, t, и) = a(x,t), Gi(x,z) = Gj(x, z) + Gj(x), i= l,...,ae, функции G} выпуклы по z. Если при этом существует и0 6 "D, для которого Ji(u°) < qi, i = 1,..., ае, то задача (Pq) нормальна. Лемма 9. Пусть в задаче (Рч) функции bi(x,t,u),i = 1,...,п, a(x,t,u) такие же, как в предыдущей лемме, G;(х, z) = G](x)z+G?(х), i = 1,..., ае, и существует последовательность и' € fj , « — 1,2,..., У > 0, У -> 0, i оо, не являющаяся с.п.. Тогда задача (Рч) нормальна. Лемма 10. Пусть задача (Рч) линейно-выпукла (bi(x,t,u) — bi(x,t),i = 1,... ,n, a(x,t,u) = a(x,t), Gi{x,z) = G}(x,z) + Cftx), i = 1,...,аеь функции Gj выпуклы по z, Gi(x, z) = G}(x)z + G?(x), t = aej + 1,..., и Kop-
мальна. Тогда имеет место равенство d(3(q) — Mq — —Mq, где Mq -множество всех векторов Куна-Таккера задачи (Pq).
Изучение задачи (Рч) с фиксированным временем заканчивается рассмотрением конкретных иллюстративных примеров.
П.2.2 посвящен частному случаю задачи п.2.1 с нефиксированным временем, в котором, однако, оказывается возможным его варьирование. Здесь сделан ряд достаточно жестких предположений об исходпых данных задачи, предназначенных именно для обеспечения предельных переходов, связанных с варьированием времени. Эти дополнительные предположения в теории оптимального управления распределенными системами весьма ограничительны, но без них подсчет первых вариаций функционалов при варьировании времени сталкивается с принципиальными трудностями, обусловленными "недостаточно хорошими" свойствами производных от решений прямых и сопряженных задач в случае "общих" условий на исходные данные. В п.2.2 последовательно проверяется справедливость аксиоматики "абстрактного" п.1.2 и формулируется принцип максимума для м.п.р., который благодаря вариации времени, в отличие от ситуации п.2.1, заведомо не вырождается в важном частном случае задачи быстродействия.
В отличие от п.п.2.1, 2.2, в п.2.3 рассматривается задача (суб)оптималь-ного управления параболическим уравнением с нефиксированным временем, а также с операторным ограничением типа включения j3 функциональное множество и с граничным управлением
(Р„) /0(7r,T)-+inf, h(тг,T)eM + q, (тг,T)ev, яеВшЬ2(П),
где q - параметр,
/о(тг,Т) = jnG(x,z[*,T](x,T),v(x),T)dx + fs^(S,t,w(S,t),T) dsdt,
1г(ж,Т) = г[п,Т](;Т),
тг = (u,v,w) € VT, VT = Vj x V2 x Vj, Vf = {u 6 MQr) : u{x,t) 6 U п.в. на Qt}, V2 = {v е Loo(iî) : v(x) 6 V п.в. на fi}, Vj = {w 6 L^Sj) : w(x, t) e W п.в. на ST}, U С Rm, V С Л1 - компакты, W С R1 - выпуклый компакт, fi С R" - ограниченная область с кусочно гладкой границей, V = {(эт, Т) : 7г Ç VT, Т > 0} - множество четверок управляющих параметров, M С ¿г(^) - выпуклое замкпутое мпожество, г[тг,Т] G V2lfl(QT) - соответствующее четверке (ж, Т) слабое решение в смысле [ЛСУ] третьей краевой задачи для линейного параболического уравнения с дивергентной главной частью (1) с краевым условием третьего рода
dz
z(x, 0) = «(ж), х 6 fi, —+ о(х, t)z = ю(х, t), (r, t) G ST.
Здесь опять же при некоторых естественных для теории оптимального управления условиях на исходные данные задачи (Р?) последовательно проверяется выполнимость абстрактной аксиоматики п. 1.2 и формулируются соответствующие результаты, спектр которых, естественно, несколько сужается по сравнению с задачами с конечномерным целевым пространством. Здесь показывается, в частности, что любое м.п.р. (любая оптимальная четверка (7г°,Т°), /о(тг0,Т°) = ß{q)) в случае произвольного выпуклого замкнутого М при условии непустоты субдифференциала Фреше dß(q) ф 0 является регулярной с.п. (удовлетворяет регулярному принципу максимума). Множество же тех элементов q 6 dorn ß, для которых это имеет место, всюду плотно в dorn ß.
Более того, оказывается справедливым полностью аналогичный результат и в случае задачи (Pq) типа задачи быстродействия (G(x,z,v,T) = Т, Ф(x,t,w,T) = О, М = {0}i,j(n)): для любой постоянной С > 0 множество тех элементов q € U^/](Х>Т,Т), для которых любое м.п.р. в задаче быстродействия (Pq) удовлетворяет принципу максимума с неравным нулю предельным функциональным множителем Лагранжа (с неравным нулю функциональным множителем Лагранжа в случае существования отималь-ной четверки (7г°,Т0)), всюду плотно в ^U^ Ii(T>T,Т).
Здесь же отмечается, что в отличие от задач с конечномерными целевыми пространствами в задачах с фазовыми поточечными ограничениями типа неравенства в случае равномерно выпуклых бесконечномерных целевых пространств условия типа условий Слейтера и линейности, вообще говоря, уже не являются условиями нормальности, т.к. в таких задачах сам принцип максимума может не быть справедливым. Однако указанные условия можно назвать условиями так называемой условной нормальности, что, например, в случае задачи (Pq) с фиксированным временем с М — {у 6 ¿2(ß) : у{х) < 0 п.в. на fi}, b,(x, t, и) — b,(x, t), а(х, t, и) — а(х, t), как показано в п.2.3, означает (применительно к условию Слейтера), что в пей могут существовать только нормальные с.п., если существует такая тройка п G что выполняется условие Слейтера г[тг](х,Т) < 0 при п.в. г € П. В то же время, легко сообразить, что в задачах типа задачи (Pq) с бесконечномерным целевым пространством и с "бедным" множеством М нормальность задачи уже не влечет автоматически липшицевость функции значений. Здесь под "бедным", например, в случае целевого гильбертова пространства В понимается множество, не являющееся множеством конечной коразмерности. В заключение п.2.3, приводятся примеры, иллюстрирующие приведенные выше факты, связывающие выполнимость принципа максимума с дифференциальными свойствами функции значений.
В главе 3 рассматриваются задачи (суб)оптимального управления для
квазилинейных и полулинейных эллиптических уравнений как с фазовыми, так и со смешанными ограничениями. При этом мы рассматриваем фазовые ограничения и в равномерно выпуклом пространстве (что представ вляется вполне естественным во многих задачах оптимального управления распределенными системами) и в "более привычном" для подобных задач пространстве непрерывных функций с равномерпой метрикой. Конечно, задачам оптимального управления с фазовыми ограничениями посвящено большое количество разнообразных работ. Среди них следует в первую очередь отметить ставшие уже классическими работы по фазовым и смешанным ограничениям в задачах оптимального управления обыкновенными дифференциальными уравнениями А.В.Арутюнова, А.В.Дмит-рука, А.Я.Дубовицкого, А.А.Милютина и др.. В последние 10-15 лет получила интенсивное развитие и теория задач оптимального управления с фазовыми ограничениями для распределенных систем (А.С.Матвеев, J.J.Ali-bert, J.F.Bonnans, Е.Casas, J.P.Raymond и др.). В то же время, условия на м.п. и связанные с этим вопросы регулярности, нормальности, чувствительности для задач оптимального управления параболическими и эллиптическими уравнениями с фазовыми ограничениями ранее, по-видимому, не рассматривались [32] - [34], [36]. Здесь же приводятся иллюстративные примеры, говорящие о существенности получаемых результатов.
В п.3.1 изучается задача с фазовым ограничением
(Рч) /о(тг)inf, /1(7r)eM + q, ireV, q€B=Lp(X), q - параметр, где
/о(тг) = /п F(x, *[*](*), *.[*](*), «(я), v(s)) dx, 7,(тг) = G(-, *[*](•)),
M С Lp(X) - выпуклое замкнутое множество, 1 < р < 2п/(п — 2), X С íT - компакт, представляющий собой замкнутую подобласть ограниченной области ÍÍ С FC (в частности, X может совпадать с П), V = Т>\ X Т>2, V¡ = {и € Loo(fi) : u(.r) € U п.в. на fi}, V2 = {v е Loo(íi) : v(r) € V п.в. на П}, U С Rm - компакт, V С R1 - выпуклый компакт, z[ir] € - соответству-
ющее паре 7Г = (к, v) 6 "D слабое решение в смысле55 задачи Дирихле для квазилинейного эллиптического уравнения с дивергентной главной частью
-^-a.i(x,z,zx,v(x)) + a(x,z, zx, и{х)) = 0, z(x) = 0, х € S. axi
Замена целевого пространства Lj(fi) (см. аналогичную задачу для пара^ болического уравнения п.2.3) па LP(X) с указанными границами изменения показателя р, связана, во-первых, с классическим фактом вложимости
о
W^íí) в Lp(Sl) с р € [1,2п/(п— 2)) и, во-вторых, с естественным желанием
*f[ЛУ] Падыжеиская О.А., Уралынва 11.!! Лнвсйкыс в квазвлинейвыс гравневаа аллвптвческого твва. М.: Наука, 1973.
иметь существенно более широкий выбор возможных функций Р, в. Важно отметить, что в подобных задачах оптимального управления с достаточно общими условиями на исходные данные в качестве целевого пространства В, вообще говоря, не вполне естественно брать пространство С(Х), т.к., как показано в [ЛУ], Гл.1, §2, для эллиптических уравнений с общего вида условиями на порядки роста "коэффициентов" далеко не всегда является естественным требование принадлежности решений классам С°(П) с а > 0.
В п.3.1 при весьма общих условиях на порядки роста по г, гх функций, задающих исходные данные задачи (Ря), показывается выполнимость в задаче абстрактной аксиоматики п. 1.2 и формулируются принципы максимума для м.п.р. (для оптимальных управлений), по своей сути вполне аналогичные принципам максимума п.2.3, в случаях: 1) тЬМ ф 0; 2)
ьт Ф 0.
Отдельно следует сказать о следующем важном обстоятельстве. В отличие от аналогичной задачи п.2.3 для параболического уравнения, здесь для подсчета первых вариаций функционалов Фо> применяются так называемое двухпараметрическое импульсное (игольчатое) варьирование [15, 16] управления и(-) ж соответствующие повторные предельные переходы, возможность применения которых заложена в альтернативной аксиоматике "абстрактного" п.1.2, связанной именно с двухпараметрическим способом варьирования. Это объясняется достаточной общностью задачи и невозможностью при сделанных общих предположениях об исходных данных "вложить" решения прямой и сопряженных задач в "подходящие" для традиционного вычисления первых вариаций гельдеровские классы Са(П) с а > 0.
В п.3.2 рассматривается формально частный случай задачи п.3.1 {Рч) 1о(и)->М, Ы^еМ + я, иет>, деС(Х) = В, д - параметр, где
/0(и)= ¡пР(х,г[и]{Х),и{х))<1х, 1г(и) = 2[и](-)),
М С С{Х) - выпуклое замкнутое множество всех непрерывных неположительных функций па X, X С П - произвольный компакт, П - ограниченная область в Я" с липшицевой границей, Т> = {и Е ¿оо(^) : 6
о
и п.в. на Я}, и С Л"1 - компакт, г[и] €1Уз(П) - соответствующее управлению и € Т> слабое решение в смысле [ЛУ] задачи Дирихле для полулинейного эллиптического уравнения с дивергентной главной частью
,) + а(г, *,«(*)) = 0, г(х) = 0, х € 5. (2)
Условия на исходные данные задачи (Р„) традиционно обеспечивают существование и единственность решения г[и] для любого и 6 2?, а также их
вложимость в гельдеровский класс Са(П) с а > 0. Однако принципиальное отличие этой задачи от предыдущей заключается в том, что целевое пространство в ней есть пространство С(Х), т.е. не является рефлексивным, а, стало быть, и равномерно выпуклым.
В связи с этим мы естественно не можем напрямую применить к этой задаче абстрактные результаты п.п.1.4 - 1.6. Тем не менее, мы показываем как абстрактные результаты этих пунктов могут быть использованы и при исследовании классических оптимизационных задач с нерефлексивными целевыми пространствами. Мы делаем это па основе двух подходов. В основе первого подхода лежит метод [9] аппроксимации исходной задачи с фазовым ограничением или, другими словами, задачи с бесконечным числом функциональных ограничений, последовательностью задач с конечным числом функциональных ограничений
(P¿) /о(и) inf, Il(u) 6 Mk+q\ и 6 V, qk € & - параметр, где Мк = {ук € & : y¡ < 0,..., у» < 0}, 1к(и) = (1к(и),..., 1к(и)), Ik(u) ее
= {xk,i.. ,xk'lt} СХ - конечная 1 /к сеть компакта X, XkCXk+i, к — 1,2,. .., X - счетная всюду плотная сеть компакта X. Оказывается спра/-ведливой следующая аппроксимационпая
Лемма 11. Пусть (3(q) < оо, q 6 С(Х). Тогда существует последовательность векторов qk € R1', к = 1,2,..., такал, что Рк{як) /?(?)> к ~+ оо. В качестве такой последовательности может быть взята последовательность qk = ... ,qf ), qk = g(xk''), i = 1,...
Таким образом, в силу леммы 11, полезной и с точки зрения численных методов, мы аппроксимируем исходную задачу задачами с конечномерными целевыми пространствами R,k, к каждой из которых могут быть применены все абстрактные результаты п.п.1.3- 1.5 подобно тому как это сделано в параболическом случае в п.2.1. На основе указанной аппроксимации и последующего предельного перехода в получаемых результатах при стремлении количества ограничений к бесконечности получаются различные результаты, связанные необходимыми и достаточными условиями для м.п.р., с условиями регулярности, нормальности, со свойствами чувствительности в исходной задаче. Для перечисления некоторых из них введем следующее Определение 3. Пусть ¡3(q) < оо. Последовательность и' 6 Т>, з = 1,2,... назовем стационарной последовательностью (с.п.) в задаче (Ря), если и' е vf, з = 1,2,..., и существует ограниченная последовательность пар (fig, А'), цq > О, А* € M(il) = Со (П) fCo(Ü) - пространство всех непрерывных функций на Í1, зануляющихся на dílj, fiJ + |А'| ф 0, имею-
щая только ненулевые предельные (в *-слабом смысле для второй компоненты) точки (/¿о, А) Ф 0, с положительной мерой A', Jx{G(x, z[u*](x)) — q(x)) X'(dx) > —у', такая, что
JQ тах{Я(х, z[u'](x), v, i>'(x),fi'a) - H(x, 2[u'](x), u'(x), ф'{х), fi'0)} dx < 7',
где ф'(х) = = /^rfofii'Kx) + J?'[u'](x), Vo[u'] бИ^П) - решение
сопряженной задачи
Q
+ V,a(x, z[u](x), u(x))tj = fi, r?(x) = 0, x € 5, ц G AÍ(Í2)
при и = и',ц = -V^FÍ-.íMÍ-), «'(O), »?'H <r 6 [l,n/(n - 1)), -
решение той же сопряженной задачи при и = и', ц = — VzG(-,z[u'](-))A,; II(x, z, и, ц,ца) = z,u) - HüF(x, z, и), 7' > 0, -у* —)■ О, s -)■ оо. Теорема 3i Каждое м.п.р. в задаче (Рч) является с.п.. Определение 4 С.п. и' € ТУ?, з = 1,2,..., у* > 0, у' 0, а оо, «азовел« нормальной (регулярной, анормальной), если все (существуют, не существуют) соответствующие ей последовательности ({.i5,A*), s = 1,2,..., имеют (имеющие, имеющие) предельные точки (в *-слабом смысле для второй компоненты) лишь с компонентой цо > О (лишь с компонентой fio > 0, с компонентой fio > 0).
Достаточными условиями нормальности в задаче с фазовыми ограничениями являются условия, которые также можно назвать условиями Слейтера и линейности, являющиеся аналогами одноименных условий "конечномерного" случая п.2.1. Аналогично конечномерному случаю п.2.1 разрешается здесь и проблема чувствительности. "
Теорема 4 Если задача (Рч) нормальна, то ее функция значений липши-
цева в окрестности q € С(Х).
Эта теорема, в известном смысле, обратима.
Теорема 5 Пусть функция значений /3 задачи (Pq) является липшицевой в окрестности q. Тогда в задаче (Pq>) при всех q' из этой окрестности существуют регулярные м.п.р..
В общей же ситуации, когда липшицевость функции значений /3, вообще говоря, не имеет места, справедлив следующий общий результат, который можно интерпретировать как результат, говорящий о том, что множество регулярных задач (Рч) "весьма богато", а, именно, справедлива Теорема 6 Для любой точки q € dom/3 и любой непрерывной положительной функции £ € С(Х) для почти все точек q' на луче + : í > 0} в задаче (Pf) все м.п.р. регулярны.
Второй подход к исследованию задачи (Р5) состоит в переходе к некоторой "эквивалентной" задаче с равномерно выпуклым целевым простран-
ством. Он подразумевает, что X С П есть замкнутая подобласть области Я. В этом случае можно заметить, что в силу "заглаженпости" решений z[u] (все они принадлежат классу С°(П) с а > 0 и их нормы в этом классе равномерно по и 6 2? ограничены) в каждой точке q € dorn ß (здесь ß - функция значений для исходной задачи с ß=C(X)) совпадает со значением ß'(q) функции значепий "той же" задачи, но с целевым пространством L,(X), s > 1, и в случае q 6 С(Х) любое м.п.р. в задаче (Р?) с фазовым ограничением, понимаемым как ограничение в пространстве С(Х) является одновременно м.п.р. в той же задаче, но с фазовым ограничением, понимаемым в пространстве L,(X). Поэтому для записи принципа максимума для м.п.р. в задаче (Pq) с В = С(Х) оказывается возможным записать сначала необходимые условия для м.п.р. в"тойже" задаче с В = L,(X) (та>-кие условия получены в п.3.1), а затем после некоторой так называемой " перенормировки" множителей Лагранжа получить принцип максимума для м.п.р. в исходной задаче.
В заключение, в п.3.2 показывается, что задача (Р?) на самом деле может быть расширена в смысле [В], [Г] и все результаты, полученпые выше в терминах м.п.р., могут быть "переписаны" и в терминах обобщенных оптимальных (стационарных) управлений. В то же время, если принимать во внимание интересы приложений, то формулировки результатов в терминах м.п.р., состоящих из обычных измеримых управлений (которые, вообще говоря, можно считать просто "релейными" функциями) представляются более предпочтительными по сравнепию с "теми же" формулировками в терминах обобщенных управлений - функций со значениями в пространстве абстрактных мер. П.3.2 завершается рассмотрением ряда иллюстративных примеров.
В п.3.3 показывается, что абстрактное обобщенное правило множителей п.1.1 может быть применено для получения принципа максимума и в задаче оптимального управления полулинейным эллиптическим уравнением с регулярным смешанным ограничением
(Po) /0(u)->-inf, Ii(u)eM, ueV,
где
/„(«) = fnF{x,z[u]{x),u(*))dx, 1г(и) = 0(;2[и](-),щ(.)),
V = {и= («1, щ) € Loo(ß) : Kl(х) 6 т{х) 6 и2 п.в. на Я}, U2 С FC"* - компакт, Ш] + тг = m, il С й" - ограниченная область в R" с липши-цевой границей, М С 1/оо(Я) - выпуклое замкнутое множество всех неположительных функций на Я, z[u] бИ^Я) - соответствующее управлению u € V слабое решение в смысле [ЛУ] задачи Дирихле (2). Исходные данные задачи (Pq) удовлетворяют некоторым достаточно традиционным предпо-
ложениям, из которых выделим условие выпуклости функции G по uj при всех х, z, условие регулярности смешанного ограничения (см, например, монографию26): VUlG(x, 2, uj) ф 0, если G(x,z, щ) = 0. При сделанных предположениях оказалось возможным с помощью вариационного принципа [Е] " аппроксимировать" исходную задачу со смешанным ограничением последовательностью задач минимизации функционалов типа максимума из п.1.1 и получить аналогичный известным в теории оптимального управления обыкновенными дифференциальными уравнениями (см, например, цитированную выше монографию [А]) принцип максимума в исходной задаче со смешанным ограничением в результате предельного перехода в семействе вспомогательных принципов максимума.
И, наконец, заключительный п.3.4 главы 3 посвящен исследованию задачи, аналогичной задаче п.3.2, но с граничным управлением
(Рч) /о(и) inf, Ii(u)eM + q, и 6 V, q G С(Х), q— параметр,
где
/0(u) = /nF(r,2M(*))dr + ¿^(».zMW.uWJde, /,(и) = G(-,*[«](•)),
X С ii - компакт, il С Я" - ограниченная область с липшицевой границей, S — дй, D = {u£ ¿оо(^) : и(х) € U п.в. на 5}, U С Я1 - компакт, М С С(Х) - выпуклое замкнутое множество с непустой внутренностью, имеющее вид {у е С(Х) : у(х) € Y(x) Vx е X}, К(х) = [К,(г), ВД] С R1, Yi(x) < Г2(х), Г, : X Я1 U {-оо}, К2 : X R1 U {+оо} - соответственно полунепрерывная снизу и полунепрерывная сверху функции, являющиеся непрерывными в каждой точке, в которой они конечны (возможны случаи К](х) = — оо, Yi(x) = +оо), z[u] £ И^(П) - соответствующее управлению и € 2? слабое решение в смысле [ЛУ] третьей краевой задачи (задачи Неймана при сг(х) = 0) для полулинейного эллиптического уравнения с дивергентной главной частью
д dz(x)
~for(a'j(x)z*,) + z) ~ °> -qJJ- + а(хЫх) = "(*)> xeS.
Здесь, как и в п.3.2, при некоторых традиционных для подобного рода задач предположениях применяется метод [9] аппроксимации задачи с фазовым ограничением последовательностью задач с конечным числом функциональных ограничений, в результате чего формулируются и доказываются результаты в целом аналогичные результатам п.3.2 и связанные с поточечным принципом максимума, регулярностью, нормальностью, чувствительностью.
ät[A] А р fr юн о» A.B. Условна вастрсмума. Нориадыыс ■ вырожденные надави. М.: Им-во "Факторная", 1997.
Глава 4, состоящая из одного пункта, посвящена задачам (суб)оптималь-ного управления гиперболическими уравнениями. В качестве конкретной задачи здесь рассматривается задача субоптимального управления так называемой системой Гурса-Дарбу
(Pq) 70(u) -+ inf, Ii(u)eM + q, u€ V, q e B, q — параметр,
где V = {u G Ьоо(П) : u(x, y) € U п.в. на П}, U С Дт - компакт, П = [О, а] X [0,6] С R2, a, b > 0 - заданные числа, М - выпуклое замкнутое множество всех неположительных функций в одном из двух пространств В: ¿2(П) или С(П),
/о(u) = F(x, у, z[u](x, у), zx[u](x, у), zv[u](x, у), и(х, у)) dxdy+
Е Gj(z[u](xi, у»')), /,(«) ЕЕ G(; ., *[«](., О), i=l
(х}, у^) € П, j = 1,... , as, - заданный пабор точек, z[u] - соответствующее управлению и € 2? абсолютно-непрерывное решение векторного гиперболического уравнения с граничными условиями Гурса-Дарбу
= /(*> y,z,zx,zy,u{x,y))t *(0,») = <£*Ы, У 6 [0,6], г(*,0) = ¿„(х), х 6 [0,а], ¿,(0) = ¿„(0), с заданными липшицевыми функциями : [0,6] —^ Л™, фу : [0,а] —> R".
Различные задачи оптимального управления системой Гурса-Дарбу рассматривались с точки зрения получения необходимых условий во многих работах (О.В.Васильев, В.И.Плотников, В.И.Сумин, В.А.Срочко и др.). Однако, можно, по-видимому, утверждать, что задача оптимальпого управления системой Гурса-Дарбу с поточечным фазовым ограничением изучав лась лишь в монографии27 . Столь "малое" внимание к этой задаче связано с существом дела и объясняется ее достаточной сложностью, несмотря на "кажущуюся простоту". Здесь, в отличие от [У], мы рассматриваем задачу (суб)оптимального управления системой Гурса-Дарбу с фазовым ограничением при существенно более слабых по сравнению с [У] условиях на исходные данные, а, именно, правая часть системы и интеграпт функционала, а также их градиенты по z, zx, zv должны удовлетворять лишь традиционным условиям типа Каратеодори.
В п.4.1 предварительно показывается, что задача (Р,) с целевым пространством В = Ьг(П) удовлетвоярет всем абстрактным условиям п.1.2 и, значит, к ней применимы, как и в предыдущих главах, результаты п.п.1.3, 1.4. Затем принцип максимума для м.п.р. для задачи (Рч) с целевым пространством Li(П), согласно методу п.3.2, посредством "перенормировки"
37[У] у СЛОИ * штршун« ■ lOMtpjttlllUI ННОДЫ ptDIIII » 9UMU ОЛТ1111»Ц11 ПВ«рб0ЛВЧ«СЫХ C1CTCM. Р|Д. Ii I-сшн O.B. - KoiociSipci: Наук», 1993.
множителей Лагранжа преобразуется в принцип максимума для м.п.р. в задаче (Рч) с целевым пространством С(П). Здесь же формулируются и достаточные условия для м.п.р.. Рассматриваемая задача, по форме близкая задаче п.3.2, имеет одно принципиальное с ней различие. Ele, вообще говоря, нельзя расширить в смысле [В], [Г] и по этой причине, по сути дела, единственным "инструментом" для решения подобных нелинейных задач оптимального управления является лишь принцип максимума для м.п.р.. Это важное обстоятельство иллюстрируется в п.4.1 посредством конкретного примера задачи (Рч) с фазовым ограничением в С(П), в котором не существует обычного оптимального управления и для которого показывав ется невозможность расширения в смысле [В], [Г]. В то же время, м.п.р. в этом примере идентифицируется с помощью принципа максимума. В п.4.1 приводятся также примеры двух задач с целевым пространством /^(П), удовлетворяющих условию Слейтера, первая из которых не является нормальной, т.к. в ней не выполняется принцип максимума, а вторая таковой является. Эти примеры иллюстрируют высказанное в п.2.3 утверждение о том, что условия Слейтера и линейности в задачах с рефлексивными целевыми пространствами являются условиями лишь условной нормальности.
В главе 5 рассматривается так называемая негладкая задача субопти-мальпого управления параболическими уравнениями, т.е. задача в которой функции, задающие исходные данные, являются лишь липшицевыми по фазовым переменным. Сама негладкая задача по форме полностью повторяет задачу п.2.1. Ее исходные данные удовлетворяют тем же условиям (здесь рассматривается задача лишь с негладкими функционалами, однако, тот же метод может быть эффективно применен и в задачах с негладкими "правыми частями" уравнений), что и в "гладком" варианте задачи в п.2.1, но градиент VzGj(x,z) здесь понимается как первая обобщенная производная (в смысле С.Л.Соболева) в R1 при п.в. х € ÍÍ функции Gj(x,-) : R1 R1. Обычное для "гладкой" теории условие па градиент |V2Gj(r,z)| < N{M) Vz € Si, = {у 6 R1 : |у| < М}, х е П, в нашем случае понимаемое как условие на обобщенную производную V¡Gj, эквивалентно локальной липшицевости G¡ по z. Нам удобнее записывать последнее условие именно в терминал обобщенных производных из-за применяемого метода исследования негладкой задачи, связанного с усреднениями функций.
Основная цель данной главы - показать, что большая часть результатов "гладкого" случая п.2.1 так или иначе переносятся и на негладкие задачи. Все ее результаты формулируются в терминах обобщенных градиентов Кларка dczGj(x, z). В то же время, т.к. постановка негладкой задачи использует обобщенные производные в смысле С.Л.Соболева, а метод ее решения использует усреднение функций, то здесь устанавливается
полезное представление обобщенного градиента Кларка локально липши-цевой функпии в терминах ее первых обобщенных производных в смысле С.Л.Соболева. Из-за негладкости задачи для ее решения нельзя напрямую воспользоваться абстрактной теорией главы 1 также, как мы это сделали в п.2.1. Однако, если нужным образом ее "сгладить", то применение абстрактной теории для исследования задачи (Р}) уже оказывается возможным. Указанное "сглаживание" мы проводим, следуя разработанному в [2, 4] методу. В этих работах был предложен общий подход к получению необходимых условий оптимальности для негладких задач оптимального управления как сосредоточенными, так и распределенными системами. В то же время, в них не рассматривались вопросы, связанные с субоптимальностью н м.п.. Здесь же мы рассматриваем в терминах м.п. и с.п. новые оптимизационные проблемы (дифференциальные свойства функции значений, регулярность, нормальность, векторы Куна-Таккера и т.д.) для пе-гладких задач оптимального управления [25], которые совершенно не рассматривались в [2, 4]. Впрочем, пам неизвестны и работы каких-либо других авторов, в которых изучались бы указанные вопросы для негладких задач оптимального управления.
Глава 6 посвящена двойственным численным методам в теории оптимального управления распределенными системами, основанным на использовании модифицированных (расширенных) функций (функционалов) Ла-гранжа. Как отмечепо в монографии28, алгоритмы оптимизации, основанные па использовании расширенных лагранжианов, являются наиболее эффективными общими методами решения задач оптимизации с нелинейными функционалами и ограничениями. В то же время, анализ публикаций по численным методам двойственного типа для задач оптимального управления распределенными системами показывает, что в этом направлении делаются сейчас, по-видимому, только первые шаги [14, 23, 35].
В п.6.1 излагается общий метод нахождения м.п.р. в задаче п.2.1 при 5=0. Обозначим через £ множество обобщенных управлений и со слабой нормой |-|ш (см. [В]), являющееся расширением в смысле [В], [Г] множества обычных управлений V. Метод предназначен для нахождения м.п.р. и' € Т>, » = 1,2,..., в задаче (Ро), которое без ограничения общности (в силу компактности в слабой норме | • множества 5) считается сходящимся в слабой норме | • |ш к некоторому управлению (вообще говоря, обобщенному) и" : — -4 0, I оо, и" € = П^ где - замыкание в слабой
норме | • |„ множества ТУа. Заметим гут же, что несмотря на использование обобщенных управлений, расширения задачи (Ро) формально не требуется.
Предполагается, что задача (Ро) удовлетворяет условиям п.2.1 и допол-
И[М1] Мииу М. Математическое иротрамиирояавие. Теория и алгоритмы. М.: Наука, 1990.
нительно трем условиям:
(a) задача (Ро) нормальна;
(b) обобщенное управление vй является изолированным, т.е. в некоторой окрестности 5е(v°) = {v € S : — i/°\w < е} нет других управлений и, которые являлись бы предельными в слабой норме | • |ш точками с.п. задачи
(c) задача (Ро) обладает вектором Куна-Таккера ц 6 R*, т.е.
0(O)<Z*(u,M) = Jo(u) + f>,JÎ(u) VuÇVnSjyïj, N >0,j = l,...,«,.
1=1
Из этих трех условий "наиболее существенными" являютя условия (а) и (с), а задачи, в которых выполняются все три условия "следует искать" в первую очередь, конечно, среди так называемых линейно-выпуклых задач. Излагаемый метод заключается в максимизации на множестве S(M°,a) = {у € R* : р(у,М°) < а}, а > О, М° - множество всех векторов Куна-Таккера задачи (Ро), вогнутой функции значений для модифицированной функции Лагранжа (см. монографию29)
К(-) H inf Un,.) : S(M°, a)->R\ L.(u, ц) =
u €РП5, (v°)
+ f EitmaxiO.w + cJ.iu)}]2-,.2}-»- £ «.*(«)+| t
i=l i=ac,+l z ¡=ге,+1
причем argmax {Vc(/i), /î 6 S(M°, a)} = M0. В п.6.1 последовательно предлагается " явное" выражение для субградиента в смысле выпуклого анализа функции — Ус(-) и показывается, что для численного решений двойственной задачи и одновременно для нахождения искомого м.п.р. могут быть эффективно использованы хорошо разработанные методы негладкой (выпуклой) минимизации и, в частности, например, так называемый £*-субградиент-ный метод30. Доказывается сходимость метода в слабом смысле (в норме I • |ш), если и° - обобщенное управление и в смысле сходимости по мере, если Vй - обычное управление. Здесь же обсуждается возможность оценки "качества" этой сходимости с помощью так называемого функционала невязки принципа максимума [14, 23] и результатов п.2.1, связанных с чувствительностью задачи.
В п.6.2 предлагается по сравнению с методом п.6.1 существенно более общий, с точки зрения жесткости условий на исходные данные задачи, численный метод ее решения. Для более компактного изложения общей идеи метода предполагается, что, в отличие от задачи п.6.1, задача п.6.2 такова, что допускает расширение в смысле [В], [Г]. Однако, последнее требование "при желании" может быть опущено.
39[Б] Бертсекас Д. Условна* оптвнвэацвв в методы нвожвтелс! Паграажа. M.: Радао в св!)Ь, 1987.
30Демивов В.Ф., Васвльев ЛВ. Недвффсренцвргеиаа овтвмазацав. М.: Наука, 1981.
Его принципиальное отличие от метода предыдущего п.6.1 заключается в том, что единственным существенным требованием для его реализации является лишь условие некоторой "регулярности" задачи в смысле непустоты субдифференциала Фреше dß(0). Показывается, что данное обстоятельство " порождает" точный недифференцируемый штрафной функционал в виде (см. также [Б1, Гл.4) РсМ = Ja{v) + C Е gj(v) + C Е
>=i >=«i+i
где д^(у) = max{J¡(и), 0}, v £ S, S - множество допустимых обобщенных управлений из п.6.1, а любое (вообще говоря, обобщенное) решение i/° исходной задачи (Рц) является строгим решением задачи "безусловной" минимизации Pc(v) —► min, и € S. В связи с этим требованием здесь уместно напомнить, что регулярными в этом смысле задачами, согласно результат там п.2.1, заведомо являются задачи для значений параметра q & R" из плотного в dorn ß множества, а в случае отсутствия ограничений-равенств - для п.в. q G domß. Таким образом, можно утверждать, что результаты данного пункта подчеркивают еще раз важность исследования дифференциальных свойств функций значений не только с точки зрения вопросов, связанпых с принципом максимума для м.п.р., со свойствами регулярности, нормальности, но и с точки зрения теории численных методов оптимального управления.
В заключительной седьмой главе диссертации показывается, что понятия субоптимальности и м.п. являются центральными для задач оптимальпого управления, исходные данные которых заданы лишь приближенно. В случае приближенно известных исходных данных само понятие классического оптимального управления как бы теряет смысл, т.к. в "возмущенной" задаче его просто может не существовать, а если оно и существует, то не вполне попятно какое "отношение" оно имеет к искомому оптимальному управлению. Ситуация кардинально меняется, если в качестве "базового элемента" теории мы рассматриваем м.п.р..
В п.7.1 рассматривается задача для параболического уранения из п.2.3, но с фиксированным временем и с исходными данными b¡, i = 1,. . . ,п, а, /, er, G, Ф, Ai, U, V, W, известными лишь с некоторой погрешностью, величина которой "определяется" числовым параметром S > 0. Здесь поксозывается, что все результаты п.2.3, связанные с принципами максимума для м.п.р. как в случае конечной коразмерности множества М, так и без этого дополнительного условия (в случае dß(q) ф 0), практически полностью сохраняют свою силу. При этом в этих результатах следует лишь все исходные данные взять с соответствующим индексом 5. В случае же достаточных условий для м.п.р. ситуация по сравнению с задачей с точными данными " существенно" изменяется: для того чтобы данная последовательность была м.п.р. следует, вообще говоря, требовать согласованного
стремления к нулю точности задания исходных данных S, "точности выполнимости" принципа максимума, " точности выполнимости" ограничения задачи.
И, наконец, остановимся кратко на результатах п.7.2. Здесь рассматривается важный частный случай задачи п.2.3 - задача минимизации сильно выпуклого функционала
(Р?) /оМ-Mnf, JiMeM + î, тгех», qeB = L3(ty, где
M») = Н«1ВЛг + H\lft + IHIU. M*) = *М(-.П
п = (u, V, ш) 6 Т>, M = {/i}, h € ß; z[ir] €E V,2I,0(Qt) - соответствующее тройке 7г слабое решение в смысле [ЛСУ] третьей краевой задачи для линейного параболического уравнения
z(x, 0) = v(r), х 6 П, щ + ст(х, t)z = w(x, t), {х, t) G ST,
множество DT определено также как в п.2.3, а компакты U, V выпуклы (также как и И7). Легко видеть, что эта задача всегда имеет решение 7г°, если только ф 0. Очевидно, сформулированная задача (Pq) является обратной задачей по нахождению нормального решения уравнения (3) при известном наблюдении h. Как и в п.7.1, исходная задача с М° = {Л0} = {0}ь2(П) считается заданной здесь с ошибкой <5:
IIb? - Ь?1Ьл„ На' - «°11эд„ Wf* - f%,QT < S, b* - < s, ||Л'|Ь,п < s.
Приводятся два метода решения или - два метода регуляризации для рассматриваемой обратной задачи. Первый можно отнести к группе методов невязки [В1]. В нем необходимо решать вспомогательную задачу
(/*") /о(тг) inf, Js{n) = \\zl[n](;T) -h'- q\\lfl <a, ir 6 V.
На основе результатов п.2.1, связанных со свойствами нормальности и чувствительности задач с конечномерным целевым пространством (в данном случае с одномерным) здесь показывается, что при выполнении условия согласования <52/а(<5) 0, S —f 0 выполняется предельное соотношение - 7r5||2,QrXf)xSr 0, S -> 0, где тг*'а решение задачи (Pqi,a), т.е. показывается сильная сходимость регуляризованных решений к точному решению 7г® исходной задачи. Отметим при этом, что при каждом фиксированном а > 0 задача (Pq'a) удовлетворяет всем условиям, при которых была доказана сходимость двойственного численного алгоритма в п.6.1 и, значит, этот алгоритм может быть применен здесь для ее решения, а "оценка
качества" решения может производиться с помощью функционала невязки принципа максимума.
Второй метод регуляризации можно отнести условно к группе методов типа алгоритма Удзавы (см, например, монографию [Ml]). Он, по сути дела, является двойственным методом, аналогичным методам главы 6 и заключается в непосредственном решении двойственной к исходной задачи
V/(A)->sup, А G L2{Ü), vq'(А) = min ¿{От, А),
L*(тг, А) = /о(тг) + (А, *'[*](., T)-hs-q), n£V, А € L2(ii).
Показывается, что функция значений V* дифференцируема по Фреше, ее градиент удовлетворяет условию Липшица, приводится " явное" выражение для этого градиента. Последние обсоятельства позволяют применить для максимизации функции Vстандартные градиентные методы [Bl], [М1]. Такая максимизация проводится с помощью обычного метода регуляриза/-ции А.Н.Тихонова [В1], т.е. с помощью решения регуляризованной двойственной задачи Vf(\) — а||А||2 —тах, А 6 ¿2(ß), и согласования пара^ метра регуляризации а с ошибкой измерения S, Выполнимость условия согласования 6/а(8) —> 0, 8 0, приводит к сильной сходимости регуля-ризованных решений к точному решению исходной задачи
где тг^[А] - решение задачи Lq(n, А) min, 7г € Т>, а А^,а - решение двойственной задачи.
Основные результаты диссертации
1. Предложена ориентированная на задачи оптимального управления абстрактная схема исследования задачи оптимизации на полном метрическом пространстве функционала с аддитивно зависящим от параметра ограничением типа включения в выпуклое замкнутое множество равномерно выпуклого банахова пространства с дифференцируемой по Фреше нормой. "Базовыми" понятиями в этой схеме служат не оптимальные (как обычно), а м.п. элементов или, точнее, так называемые м.п.р. в смысле Дж.Варги. Показана применимость предложенной схемы к широкому кругу конкретных разнообразных задач оптимального управления. Эта абстрактная схема может быть названа также методом возмущений в теории субоптимального управления распределенными системами.
2. Получены необходимые и достаточные условия для м.п.р. (принципы максимума для м.п.р.), трансформирующиеся "в пределе" в случае существования оптимального управления в "обычные" условия оптимальности, в задачах (суб)оптимального управления распределенными системами
с различными ограничениями в конечномерном пространстве. Получены представления для субдифференциалов (в смысле Ф.Кларка, Б.Ш.Морду-ховича) функций значений этих задач в терминах множителей Лагранжа, различные необходимые и достаточные условия регулярности, нормальности, связывающие эти понятия с дифференциальными свойствами функций значений. Изучена проблема чувствительности для таких задач. Показано, что регулярность задач оптимального управления является их весьма типичным свойством, заведомо имеющим место при всех значениях параметра из плотного множества в эффективном множестве функции значений, а в случае задач лишь с ограничениями типа неравенства, для "почти всех" имеющих смысл задач, т.е. для почти всех значений параметра из эффективного множества функции значений.
3. Доказаны необходимые и достаточные условия для м.п.р. в задачах оптимального управления параболическими, эллиптическими и гиперболическими уравнениями с ограничением типа включения в выпуклое замкнутое множество равномерно выпуклого пространства (Ьр, р€ (1,+оо)). Показано, что существование нормали в том или ином естественном смысле к надграфику функции значений влечет выполнимость регулярного принципа максимума в таких задачах и эта регулярность задачи заведомо имеет место для всех значений функционального параметра из плотного множества во множестве всех тех его значений, где задача имеет смысл.
4. Показано, что предложенная абстрактная схема оказывается пригодной и для исследования задач с нерефлексивными целевыми пространствами, а многие из результатов, связанных с условиями на м.п., со свойствами регулярности, нормальности, чувствительности и полученных для задач с конечномерными целевыми пространствами, переносятся и на задачи с поточечными фазовыми ограничениями, понимаемыми как ограничения в пространствах непрерывных функций с равномерной метрикой, с распределенными, начальными и граничными управлениями в случаях линейных и нелинейных (в частности, полулинейных и квазилинейных) управляемых уравнений.
5. Получен принцип максимума в задаче с регулярными смешанными ограничениями в случае управляемой задачи Дирихле для полулинейного эллиптического уравнения. Тем самым показана применимость предложенной абстрактной схемы и в распределенных задачах оптимального управления со смешанными ограничениями.
6. Показано, что "большая часть" результатов, связанных со свойствами нормальности, регулярности и чувствительности переносятся и на так называемые негладкие задачи оптимального управления распределенными системами, т.е. на задачи с негладкими (липшицевыми) по фазовым пе-
ременным "правыми частями" и функционалами.
7. Предложены два метода численного решения для задачи оптимального управления параболическим уравнением с конечным числом функциональных ограничений типа равенства и неравенства. Первый из них основан на максимизации функций значений модифицированного функционала Лагранжа (расширенного лагранжиана), доказана его сильная сходимость, обсуждена возможность оценки "качества" этой сходимости с помощью так называемого функционала невязки принципа максимума. Во втором методе все решения исходной задачи являются строгими решепиями задачи "безусловной" оптимизации точного недифференцируемого штрафного функционала.
8. Показано, что применение м.п.р. в смысле Дж.Варги позволяет эффективно распространить теорию необходимых условий оптимальности на задачи с приближенно известными исходными данными.
9. Установлено, что полученные "теоретические" результаты, связанные с условиями на м.п.р., нормальностью, чувствительностью могут быть эффективно применены в классической задаче приближенного нахождения нормального решения краевой задачи для параболического уравнения при известных приближенно коэффициентах и финальном наблюдении. Для этой обратной задачи предложены два численных метода - два метода регуляризации. Первый из них можно отнести к группе методов невязки, второй - заключается в непосредственном решении па основе метода регуляризации А.Н.Тихонова задачи, двойственной к исходпой задаче.
Основные публикации по теме диссертации
[1] Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей в задачах управления системами с распределенными параметрами // Ж. вычисл. матем. и матем. физ. 1982. Т.22. Л/о1. С.49-56.
[2] Плотников В.И., Сумин М.И. Необходимые условия в негладкой задаче оптимального управления // Матем. заметки. 1982. Т.32. Л/о8. С.187-197.
[3] Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей // Дифференц. уравнения 1983. Т.19. Л/о4. С.581-588.
[4] Плотников В.И., Сумин М.И. Оптимальное управление объектами с распределенными параметрами, описываемыми негладкими системами Гурса-Дарбу с ограничениями типа неравенства // Дифференц. уравнения. 1984. Т.20. Л/о5. С.851-860.
[5] Плотников В.И., Сумин М.И. Об условиях на элементы минимизирующих последовательностей задач оптимального управления // Докл. АН СССР. 1985. Т.280. Л/о2. С.292-296.
[6] Сумин М.И. О достаточных условиях на элементы минимизирующих последовательностей // Ж. вычисл. матем. и матем. физ. 1985. Т.25. Nol. С.23-31.
[7] Морозов С.Ф., Сумин М.И. Об одном классе задач управления динамическими системаи с разрывной правой частью // Кибернетика. 1985. Л/ЬЗ. С.59-65.
[8] Сумин М.И. Достаточные условия оптимальности в негладких задачах оптимального управления распределенными системами // Дифференц. уравнения. 1986. Т.22. Яо2. С.326-337.
[9] Сумин М.И. О минимизирующих последовательностях в задачах оптимального управления при ограниченных фазовых координатах // Дифференц. уравнения. 1986. Т.22. Л/оЮ. С.1719-1731.
[10] Сумин М.И. Оптимальное управление системами с приближенно известными исходными данными // Ж. вычисл. матем. и матем. физ. 1987. Т.27. Л/о2. С.163-177.
[11] Морозов С.Ф., Сумин М.И. Оптимальное управление скользящими режимами разрывных динамических систем // Известия ВУЗов, Математика. 1990. Л/bl. С.53-61.
[12] Сумин М.И. Оптимальное управление разрывными динамическими системами со скользящими режимами // Дифференц. уравнения. 1988. Т.24. Л/о11. С.1911-1922.
[13] Сумин М.И. Оптимальное управление объектами, описываемыми квазилинейными эллиптическими уравнениями // Дифференц. уравнения. 1989. Т.25. .Л/о8. С.1406-1416.
[14] Сумин М.И. О функционале невязки принципа максимума в теории оптимального управления // Ж. вычисл. матем. и матем. физ. 1990. Т.ЗО. Л/о8. С.1133-1149.
[15] Сумин М.И. О первой вариации в теории оптимального управления системами с распределенными параметрами // Дифференц. уравнения. 1991. Т.27. Л/о 12. С.2179-2181.
[16] Сумин М.И. О необходимых условиях оптимальности в задачах оптимального управления системами с распределенными параметрами // Методы прикладного функционального анализа. Межвузовский сборник. Н. Новгород: Изд-во ННГУ. 1991, С.88-94.
[17] Сумин М.И. Субоптимальное управление системами с распределенными параметрами. Труды первой Международной конф. "Математические алгоритмы", Н.Новгород: Изд-во ННГУ, 1995, С.116-125.
[18] Sumin M.I. SuboptimaJ control of systems with distributed parameters: minimizing sequences, value function, regularity, normality, Abstracts of IFIP Conf. " Modelling and optimization of distributed parameter systems
with applications to engineering", Warsaw, Poland, 1995, Warsaw: System Research Institute, 1995, P.156-157.
[19] Sumin M.I. Suboptimal control of systems with distributed parameters: minimizing sequences, value function, regularity, normality // Control and Cybernetics. 1996. V.25. No.3. P.529-552.
[20] Сумин М.И. Субоптимальное граничное управление системами, описываемыми параболическими уравнениями. Тезисы докл. школы "Пон-трягинские чтения - VII", Воронеж: ВГУ, 1996, С.172.
[21] Сумин В.И., Сумин М.И. Субоптимальное управление вольтерровыми функциональными уравнениями: минимизирующие последовательности, функция значений, регулярность, нормальность. Математическое моделирование и оптимальное управление, Межвузовский сборник научи. тр., Н.Новгород: Изд-во ННГУ, 1996, С.23-31.
[22] Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений // Ж. вычисл. матем. и матем. физ. 1997. Т.37. Л/ol. С.23-41.
[23] Сумин М.И. Субоптимальное управление системами с распределенными параметрами: свойства нормальности, субградиентный двойственный метод" // Ж. вычисл. матем. и матем. физ. 1997. Т.37. Л/о2. С.162-178.
[24] Сумин М.И. Субоптимальное граничное управление эллиптическими уравнениями с фазовыми ограничениями. В кн. "Совремепные методы в теории краевых задач. Тезисы докладов школы "Понтрягинские чтения - VIII", Воронеж: ВГУ, 1997, С.146.
[25] Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений, регулярность, нормальность, негладкие задачи, Нижегородский ун-т,- Н.Новгород, 1996. - 120с. Деп. в ВИНИТИ 08.01.97. Л/о 62-В97.
[26] Сумин М.И. Субоптимальное граничное управление параболическими уравнениями с операторными ограничениями, В кн. " Воронежская весенняя математическая школа. Современные методы в теории краевых задач. Понтрягинские чтения - IX, Тезисы докладов", Воронеж: ВГУ, 1998, С.192.
[27] Сумин М.И. Принцип максимума в теории субоптимального управления распределенными системами, В кн. "Международная конференция, посвященная девяностолетию со дня рождения Л.С.Понтрягина, Москва, 31 августа - 6 сентября 1998 г., Тезисы докладов, Оптимальное управление и добавления", Москва: МГУ, 1998, С.261-263.
[28] Сумин М.И. Субоптимальное управление распределенными системами I. Абстрактная задача минимизации с операторным ограничением в
гильбертовом пространстве, Вестник ННРУ "Математическое моделирование и оптимальное управление", Н.Новгород: Изд-во ННГУ, 1998, 2(19), С.152-165.
[29] Сумин М.И. Субоптимальное управление распределенными системами II. Параболическое уравнение, операторное ограничение, граничное управление, Вестник ННГУ "Математическое моделирование и оптимальное управление", Н.Новгород: Изд-во ННГУ, 1999, 1(20), С.138-153.
[30] Сумин М.И. Принцип максимума в параметрической задаче быстродействия для параболического уравнения с операторным ограничением в гильбертовом пространстве В кн. "Воронежская весенняя математическая школа. Современные методы в теории краевых задач, Понтрягин-ские чтения-Х, Тезисы докладов", 1999, Воронеж: Изд-во ВГУ, С.235.
[31] Сумин М.И. Принцип максимума в теории субоптимального управления распределенными системами с операторными ограничениями в гильбертовом пространстве // Итоги науки и техники. ВИНИТИ. Современная математика и ее приложения. Тематические обзоры. 1999. Т.66. С.193-235.
[32] Sumin M.I. Optimal control of eemilinear elliptic equation with state constraint: maximum principle for minimizing sequence, regularity, normality, sensitivity // Control and Cybernetics. 2000. V.29. No.2. P.449-472.
[33] Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, I: принцип максимума для минимизирующих последовательностей, нормальность // Известия ВУЗов, Математика. 2000. ЛЬ6. С.33-44.
[34] Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, II: чувствительность, типичность регулярного принципа максимума // Известия ВУЗов, Математика. 2000. А/о8. С.52-63.
[35] Сумин М.И. Оптимальное управление параболическими уравнениями: двойственные численные методы, регуляризация, В кн. " Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде. Сб. докладе» к Международной конференции (Екатеринбург, 30 мая - 2 июня 2000 г.)", 2000, Екатеринбург: Изд-воИн-та математики и механики УрО РАН. С.66-69.
[36] Сумин М.И. Субоптимальное управление полулинейным эллиптическим уравнением с фазовым ограничением и граничным управлением // Дифференц. уравнения. 2000. Т.36. Л/о11.