Вопросы устойчивости и аппроксимации в задачах оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Корнев, Владимир Викторович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Саратов
МЕСТО ЗАЩИТЫ
|
||||
1992
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
ратовскии ордена трудового красного знамени госудам венный университет им. h. г.чершшевского
На правах рукописи КОРНЕВ Звдцикир Викторович
вопросы устойчивости и аппроксимации в задачах оптимального управления:
01.01.09 - Математическая кибернетика
â Bïop8§«paï.
диссертации на соискание ученой степени кант'Шага физико-матеиатачсскнз кауп
Саратов - 1992
Работа выполнен^ из ^ыадрлигельноы цинтре и кафедре дифферент ' циальных уравнений и прикладной математики Саратовского ордена Трудового Красного Знамени государственного университета им.Н.Г.Чер-нышевского
Научный руководитель - доктор физико-математических наук,
профессор А.Л.Хромов
Официальные оппоненты - доктор физико-матемаг.таеских наук,
профессор М.С.Никольский,
кандидат технических наук, старший научный сотрудник В.Б.Батурин
Ведущая организация - Воронежский государственный университет
«»Ленинского комсомола ¿>/ . { л
Защита состоится £ 1992 г. в /О час.
на заседании Специализированного совета К 063.74.04 по присуждению ученой степени кандидата физико-математических наук по спе -циальности 01.01.09 - Математическая кибернетика при Саратовском государственном университете им.Н.Р.Чернышевского по адресу: 410071, г.Саратов, ул.Астраханская, 83, Саратовский государственный университет, механико-матекатический факультет.
С диссертацией иожно ознакомиться е научной библиотеке Сара -товекого горуниверситета.
Автореферат разослан " Ал/л^л^ 1992 г.
Ученый секретарь Специализированного совета, '
кандидат физико-математических наук, доцент . у -
' П.Ф.Недорезов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОМ
Актуальность проблемы. Проблемы устойчивости решения, его не -прерывной зависимости от исходных данных в математике играв? фундаментальную роль. Для задач оптимального управления вопрос об устойчивости их решения приобретает оссбуо остроту, тая как в практических задачах исходная информация чаще всего известна с некоторой погрешность!), и, кроме того, в процессе решения сложные зависимости приходится аппроксимировать более простыми. Поэтому отсутствие устойчивости у исходной задачи может привести к существенному искажению истинного решения. Среди многообразия задач оптимального управления часто встречаются задачи с фиксированным временем, в которых концы допустимых траекторий жестко закреплены, что весьма затрудняет исследование устойчивости их решений. В данной работе изучается важный класс таких задач - линейно-выпуклые задачи, устойчивость юс решений относительно возмущений правого закрепленного конца. Это одна из рассмотренных в диссертации проблем. Другая проблема состоит в следующем. Задачи оптимального управления являются сложными математическими объектами и для них, как правило, невозможно выписать решение в явном въ^е. В связи с гаш возникает проблема аппроксимации, заключающаяся а том, чтобы тасодзгуи задачу оптимального управления заменить более простой »адачей, решение которой близко к искомому. Идеи аппроксимации гЬзволяют строить эффгктивнке численные методы решения задач оптимального управления. Белее того, с помощьо аппроксимации воз -!ожно качественное исследование сложных задач опт;- - ильного управ-гения, получение удобных необходимых условий экстремума. В дан-гай работе разработан метод аппроксимации для исследования зшмч шкшального управления со смешанными п^-раничениями на управляющие а фазовые переменные.
Объект исследования.' Объектов исследований являются линейно-ыпуклые задачи оптимального управления с закрепленными концами 1 гладко-выпуклые задачи со смешанными ограничениями типа нера-
■■ .а
г
згнсгв.
Лннейно-выпуклюш задачами называется следующий класс задач
¡Уа,X,и)^ тА ; (]
¿(±)=Р(ЦхШ * т.(±)> х(о) ;
; С
и(£)е V, ■ V
где £6 } С1 £ Я , 4/ - выпуклый компакт из Я . Предполагается, что компонента матриц и вектора ее суммируемые на[0} 1] функции; функция измерима пс и , непрерывна ло и>) , выпукла по и. Допустимыми управлениями в задаче (Л-(4) являются всевозможные измеримые век-торч$ункции и. (¿у % почти в году удовлетворяющие условию (4).
Гладко-выпуклыми задачами оптимального управления условно на-
зываются задачи Еида
/'/(¿,*,и)са + £ (х(0) тс-п ; -<£
¿(¿} =V*?, £&))+&(*, х(о)=х0 ; <£
Ш:&]) = о ; ('
лсбУе ; . (Е
О} - (£
где ~ £ - выпуклый компакг. В за
даче (5М9) функции /(¿¿Х;"-),/¿(х);
) дифференцируемы по X , 'измеримы по ^ и непрерывны пК1з:ле того, функции и выпуклы по и на множестве £/ . Допустимые управления - те же, что я в задаче- (1)-(4), причем каждому допустимому управлению (¿) соответствует единственная траектория , определенная на всем схрезке 1] и удовлетворяющая (6).
Цель работы. Исследование устойчивости решений-линеПно-выпук-льос задач (1)-(4) при возмущении правого концевого условия (3), нахождение достаточных условий устойчивости. Аппроксимация гладко-выпуклых задач (5)-(9) задачами с.более,простеми ограничениями, обоснованна сяеодимости по с ледоватедьности^ аппроксимирующих задач по функционалу и по управлению, получение на основе свойст аппроксимирующих задач необходимых условий экстремума для задач (5)-(9). ■ д
Методы исследования. В основе исследования устойчивости регш -ний линеПло-выпуклых задач лежит изучение вспомогательной экстремальной задачи с интегральными ограничениями -ипа равенств, получаемой с помощью формулы Коши для решений линейных дифференциальных систем. Для обоснования устойчивости по функционалу и по управлению используются методы функционального анализа и выпуклого анализа. Аппроксимация гладхо-вк.;унлых задач проводится, путем замены поточечных смешанных ограничений (9) конечным числом интегральных ограничений типа неравенств. Для доказательства сходимости последовательности аплргн-симирующих задач и получения необходимых условий экстремума привлекаются метода теории функций и общей теории экстремальных задач.
Научная новизна, практическая и теоретическая ценность. Установлено, что а общем случае решение линейно-внпукянх задач оптимального управления <I)-(41 с закрепленными концами является неустойчивым относительно возмущений концевых условий. Найдены простые достаточные условия в виде требований на область допустимых управлений, которые гарантируют для указанного класса задач ус -тойчивость по функционалу. Доказано, что если подынтегральная функция а функционале качества строга выпукла по управляющим переменным, то из устойчивости по функционалу вытекает и устойчи -вость по управлении в среднеквадратичной метрике. Для гладко-выпуклых задач оптимального управления со смешанными ограничениями (5)-(9) предложен метод аппроксимации более простыми задачами. Зо'основана сходимость этого метода по функционалу и по .управле -чип. На основе разработанного метода аппроксимации для задач (5)-[9) получены компактные необходимые условия экстремума типа приняла максимума для различных случаев: измеримого управления, ку-:очно-непрерывного управления, случая абсолютно непрерывных мер.
Все перечисленные результаты являются новыми. Они могут быть 1СПользованы как при разработке -численных методов решения, так и таи качественном исследовании задач оптимального управления. Ре -ультаты работа могут найти применение в спецкурсах и спецсемина-ах по специальности "прикладная математика" в Саратовском, Воро-ежском госуниверситетах и других вузах.
Апробация работы. Результаты диссертации докладывались на объ-циненном научном семинаре кафедр математической кибернетики и искретного анализа (под руководством академика профессора .М.Богомолова) Саратовского государственного университета, на
5
Всесоюзной конференции "Функционально^дифференциальные уравнения" (гЛ'-агнито горек, 1981 г.), на Ш, 1У и V Саратогских зкмних школах по теории Функций и приближений (1985, 1983 и 1990 гг.), на Все -соозноП конференции "Проблемы теоретической кибернетики" (г.Волгоград, 3 О г. ), на научном семинаре кафедры оптимального управле-ю<? '.под руководством доктора физико-математических: наук профессора М.С.Никольского) 1.!оско некого государственного университета (1992 г. 1, на научно;-', семин- • ? кафедры дифференциальных уравнений и прикладной математики СГУ (под руководством доктора физико-математических нарт профессора А.П.Хромова),
Публикации. Основные результате диссертации опубликованы б 4 работах автора, список которых приводится в конце автореферата.
Структура пкссертатдтп. Диссертационная работа состоит из вве -дения, трех глав, включа^оих десять параграфов, и списка литературы. Об'^нй обгем работы - 127 машинописных страниц. Библиогра -фня содержит 94 названия.
СОДЕРЖАЛ»® РАБОТЫ
Во введении обсуждается актуальность теш диссертации, приводится обзор соответствующих работ других авторов, дается описание объекта исследований к изложено краткое содержание работы.
Первая глава посвящена исследованию устойчивости 'решений ли -нейно-выпуклкх задач (1)-(4> относительно возмущений правого концевого условия (3). В § I приводится полное описание рассматриваемого класса задач и вводятся следующие определения. Задача (I)-(4) называется устоГдавой по Функционалу (относительно правого кошевого услоетя-), ссли
= (Ю)
где (¿\tjZj - оптимальное управление задачи (1)-(4) с условием хСО= 2 . Предполагается, что предел в соотношении (10) ищется по тем ^ , которые принадлежат множеству достижимости систем (2), Если имеет иесто равномерная сходимость оптимальных траекторий то задача (1)-(4). называется ус-
тойчиво"' по траектории. Можно такке говорить об устойчивости по управление, если одновременно с ^ —>- имеет гесто сходимость И ¿¿(^^о) в некоторой топологии.
Ео втором параграфе изучается устойчивость исходной задачи
б
(Р|~(4) по функционалу. Пначяло доказываемся ::сь;'а Т.Г о том» что если исходная .-задача имеет единственное реле»- "о, то из устоЛчи -вости по $ункц::оналу следует устоЯ'Шюсть по траектория. Затем в рассмотрение вводится вспомогательная экстремальная задача с ограничениями типа равенств
/ТЬ ^
J¿ и, (£)- и£ (¿) с/1: — лип ■ < ш
• I $ иг)
1-4 /у. У *
где К, - множество измеримых вектор-пункций и (£) , почти вао-цу удовлетворяющих условию (4); 0-У, - компоненты век-
гор-функций и и. С^) \ &(£) - фиксированная функ-
ция из ; ) - суммируемые на [0!]] функции; , у17-/... у
Мм. - произволыгые измеримые г^иксированние подмножества из
. Для зз„ачи (ПМ13) в лемме 1.2 доказывается непрерывная »эвисязиость ее оптимального значения от правых частей ограничений 12) в случае, когда £У представляет собой ■ Я- - мерный парад-[елепипед. Вспомогательная задача имеет важное значение, необходимость ее рассмотрения вызвана внутренними потребностям* дохаза-■ельства. С помощью леммы 1.2 устанавливается основной результат ;ервой главы, а именно :
. ТЕОРИ/А 1.1. Предположим, что в задаче (П-(4) . -ожество V сть образ с - мерного параллелепипеда
:1 при линейном отобраяения ' Я т , т.е.
I/■=■ Т V - в этом случае задача (1Ы4) будет устойчивой по •/националу при возмущении правого закрепленного конца.
Завершает зторой параграф теорема 1.2, согласно которой устой-ивость по функционалу везгда имеет место, если правый конец тра-ктории пркнадлеж'/т относительной внутренности множества
эстилимости системы (2)ч
В § 3 строится пример, п?, ;,-;ывавщиЯ, что для производного ву-пелого компакта и теорема 1.1 не верна и задача (1)-(4) мо -быть неустойчивой по функционалу. Контрпримером служит еле-тощая зада а ^
лгиг (14)
¿¿О = х¿thujt), x(o) = 0 ; (I5)
*('>*<>; сю
u(é)€ U, (I7)
где выпуклый компакт U представляет собой конус в пространстве Я3 с вершиной в точке О , основанием которох-о является круг единичного радиуса с центром в точке (О, i 7 íj , параллельный плоскости (Ui,U¿) , Правое граничное условие (16) возмущается по следующему правилу
где ^ J>K }K_t - последовательность положительных чисел, сходя-чак^я к нулю, а = Cf~j>k)z . При оптимальные зна-
чения задач (14), (15), (I?), (18) к нуль не стремятся, что свидетельствует о неустойчивости задачи (14)-(17) по функционалу.
В § 4 устанавливается связь между устойчивостью по функционалу и устойчивостью по управпению. Предварительно доказывается
ТЕОРЕУА 1.3. Пусть в банаховом пространстве, обладающем свойством Банаха-Сакса, задал полунепрерывный снизу функционал У* , который является строго равномерно в'-туклым на выпуклой оболочке элементов последовател; hocwí J 2fk , слабо сходящейся к
элементу , на котором / y(tí~0 )[< оо. Предположим, что
^Тогда последовательность Vk Jсходится к Vp сильно.
Эта теорема позволяет решить важный вопрос об устойчивости задачи (1)-(4)' по управления (теорема 1.4), а такке доказать теорему 2.2 из второй главы.
ТЕОРЕМА 1.4. Если задача (1)-(4) икеег единственное решение, устойчива по функционалу, а функция }№непрерывна и строго выпукла no LC на множестве С/ , то задача (1)-(4) будет устойчивой и по управлению в метрике пространства 1].
Лемма I.I и теорема 1.4 остаются справедливыми и для нелинейных систем веда (6). Кроме того, полученные в первой главе ре -эультатн можно перенести на случай переменной области управления
U(t).
Во второй главе (§ 5 - § 7) объектом исследования являются
. гладко-выпуклые задачи со смешанными ограничениями (5}-(9). Пол -ное описание этого класса задач дастся б пятом параграфе.
В шестом параграфе по исходно? задаче (5)-(9) строится последовательность аппроксимирующих задач, кшсдая из которых уже не со -дернит поточечной смешанных ограничений« Суть этого метода аппроксимации заключается в том, что отрезе.: [0} // разбивается (в простейшем случае - равномерно) точке»/'.! ¿o-0<íi<<i¡c~f и каждое из ограничений (9) заменяется на К интегральных ограничен:;!*.
Л, __ _
/ , (19)
Так получается к. - тая аппроксимирующая задача. Теоретическим обоснованием данного метода аппроксимации служит лежа 2.1.
ЛЕММА 2.1« Последовательность апплоксгалирутопщ: задач (5)-(6), (19) при А'->ог> сходятся к исходной задаче (5)~(9) по функционалу.
После ледгя* приводятся приоры, показгатщ'лс существенность требования выпуклости фулкц;.;} ^ и ^ упр^г.-^::;::-.! переменным для справедливости этой до!-«-». Основанием сходности ?того метода аппроксимации служат -г.»ьтз тсорамн 2.1 и 2.2.
ТЕОРЕ'Л 2.1. если ¿с(£),Х&) - единственное реление лйхгд-ной задачи (5)~(9), то поелздоЕят.чяъность оптпмальнкх траекторий
}задач (5)-(8), (19) равномерно сходится к Хк1) на
отрезке /0}1] , а соответствующая последовательность оптммллыпгх
управлений { и. к(£) J/t_/ слабо сходится к и в пространстве
ТЕОРЕМ 2.2. Если задача (5)-(9) имеет единственное решение,
а функция £ непрерывна и строго выпукла по ^ на множестве
Т Г 1 / к л
(у , то последовательность оптимальных управлений / и. (¿)/ _
д /
задач (5)-(8), (19) сходится к &(¿/ в среднем квадратично!/, на
ш.
Требование непрерывности + в теоремах 2,2.и 1.4 можно ослабить, заменив его кусочной непрерывностью по ^ при услог.;ч!, что односторонние предел?-; сохраняют строгую выпуклость по Ц. .
Изложенный в жестом плрагрг^ю метод аппроксимации гл.и;::о-глг-пуклкх задач сс сисшпитг-ш огрг!И!1по»п!я:-::: юу-.г-г бить :;<:нсг:,лов'Х! при раэрпботке численных методов, но в теоротнчоок^х яссл'.дт-
ниях болшне Еоог:с::;'!ости предоставляет сочетание этого метода с вариацкок'-ла прак: лпоа Экланда*. Аппрокс:"' -*!ИЯ задач со смешшшы-.та ограничения:':: на основе вариационного . .ищипа развивается в § 7. Б результате получается последовательность аппроксимирующих задач, описание езойств которой дается в теореме 2.3»
ТЕОРЕМ 2.3. Существует последовательность положительных чисел
/£ I , сходящаяся к нулю, такая, что для каждого
/ /7 /
найдется управление ¿С (¿7 € Ш , являющееся единственным решенк-
егл следующей экстремальной задачи
£ _
I 1 а) ¿Л V, (22)
к Ч-]
пои этом Л _ «
где и. - оптг'малы'ое управление задачи (5)-(9); 'Ы. - то же, что и в (13); р - метрика, заданная на ; = - .
Теорема 2.4 содержит нео ¿ходкие условия оптимальности для задач (20)—(22). Бнвод от/Я условий опирается на общий экстремальный г.рищип для абстрактных гладко-выпуклых задач .
В третьей главе (§ 8 - § 10) на основе аппроксимации, разработанной в § 7,'для гладко-выпуклых задач со смешанными ограничениями (5)-ч9> с помощью предельного перехода выводятся необходимые условия экстремума типа принципа максимума. В зависимости от априорной информации рассматривается три случая. „
Б § 8 изучается общий случай", когда относительно оптимального управления ничего не известно, кроме его измеримости. Основным результатом является следующий принцип максимума.
ТЕОРЕМА 3.1. Предположим, что вектор-пункция в задача (о)-(9) представима в вццё*
у*. * ^и^^^^сяд3" ВыяУ«лые заДачи и вариационные пробае-. . -лр, . ^
_ Иоффе АД., Тихомиров В.М. Теория экстремальных задач. -
Ю
причем функция ^^ непрерывна. Пусть - оптимальное уп -
равление, а х(б) - соответствующая 'оптимальная траектория для этой задачи. Тогда существуют неотрицательная Я0 , векторбе^ неубывающие функции ^Ли вектор-функция ограничен -
ной вариации , такие, что
р
1) Я, +161 + г (/л С/7 -) = / • (24)
2) функция при 0< / является ресеннсм интегрального уравнения
-£ } (25)
где + ; 0
3) почти при всех / €(¡2/) гл/полняется равенства
X(¿1 и) = //(£_, X(£), и-(о) , (26)
«ее __ '
где Н(1, х,и) = - х, и)ч < А&х.)и. > -
Кроме того, точки роста (£) ( ¿ = ) , если таковое существуют, обязаны принадлежать множеству
Часть доказательства теоремы вынесена в леммы 3,1, 3.2, 3.3. Теорема 3.1 по форме представляет собой обобн'^нис известного принципа максимума для задач с фазовыми ограничениями . В восьмом параграфе на примерз задачи со свободицм правьм концом также проводится исследование тех случаев, в которых формулировка полу -ченного принципа максимума является тривиальной, когда молзю заведомо указать такие , /*-(£) и ПР15 которых выполняются все условия Tcopci.ni 3.1, однако О и соотно-пекие кл'-гс^'уа (26) становится боссодергкатсльны-;. Соответствующие ус."о: "т цегурр^деттегп содержатся в теорег-та 3.2.
В 5 3 отпосктсшгэ оптимального управлямл и (О предпола-
ii
гается, что оно :гусочнп-непрзрчшо. Зл\> прсдпзлх^ннз делает из -пглнкк дополни-.: зз/дсе тргбование (23) к погсоляс? доказать принцип ка"с%у.:а (теор~га 3.3) для всего класса гладко- выпуклых задач (Ь)-(9), По он аналогичен теорсмо 3.1, но имеет насколько
уеклсн.-ае условия дополняющей ьежесгкости
(28)
3 легли 3.4 д^зтся правило доопределения подынтегральных функций б точк:.?: разрыва и. (£) в интегралах Лебега-Стилтьоса из соотно-агнкй (25), (28). Как и в общем случае, анализируются условия невырожденности доказанного принципа нзкк'лмума для задач с незак -реп лонным правил шгдом (теорема 3.4).
В § 10 рассмотрен важный для приложений вопрос о дифференцируемо сти кср, входящих в уравнения -ринципа максимума. Найдс.да простые достаточные условия (лсила 3.5) в виде априорных требований на оптимальную траекторию
теп /пах Х_, ¿с) £ - £ 6 у О , (29) иеХ/
при которых ые^-а! будут абсолютно непрерывными
и пр;..щип максимума принимает законченный вид.
ТЕ0РЕ!.'А 3.5. Пусть и (£) - оптимальное управление в задаче (5)-(9), а X (1:) - соответствующая оптимальная траектория, относительно которой предполагается, что она удовлетворяет ус-■!ля;ш (23). Тогда существуют неотрицательная константа , 'с-ктоо ^ , неотрицательные измеримые ограниченные функции 2Г({), — } (£) к абсолатно непрзрквная вектор-функиия р(гг/!1 'Такие, что . .
п л. + Шч- £ = 1 •
/=/ о
2) функция ¥(±) является реиением дифференциального уравнения '
с условием = - 4' (¿0))£
3) почта при всех ^«? (0} 1) справедливо соотношение
да р
4) почти рсюду на [0; /_/ выполняются условия дополняющей кенсс-?» кости
Д-Ь),¿Ш)=0} ¿-- ¿7-
Полученныз в третьей главе"необходимые условия экстремума справедливы' и для случая равномерно ограниченной выпуклой области управления , измеримой по £.
В заключение автор выраяает исхре::5;ш благодарность своему на-учгздму руководителю доктору физико-математических наук профессору Августу Пзтрос:гау Хромову за руководство работой, внимание я под-■деркяу„
Основное содержание ддассёртации опубликовано в следующих рабо-
тах автора ■ I; .
Г. Корней В.В. Корректность линейно-выпуклой задачи оптимального
г управления с закрепленным правым концом //Теория функций и приближений. Тр. 3-й Саратов, зимней школы. - Саратов, 1988. Ч. 2. - С. 108-110, •
2. Корнев В.В Метод аппроксимации и необходимые условия экстремума для одного класса задач оптимального управления со смешанными ограничениями /Саратов, ун-т. - Саратов, 1989. - 27 с. -Деп. в ВИНИТИ 24.10.89. № 6436-В89.
3. Корнев В.В. Аппроксимация одного класса задач оптимального управления со смешанными ограничениями //Проблемы теоретической кибернетики. Всесоюзная конференция. Тезисы докладов. Волго -град, 9-15 сенг. 1990 г. - Волгоград, 1990.4.1(1). - С. 60.
4. Корнев В.В, Аппроксимация гладко - выпук лых сз адач со смешанными ограничениями и исследование не вырожденно сти соответствующих необходимых условий экстремума /Саратов, ун-т. - Саратов, 1992. - 20 с. - Деп. в ВИНИТИ 17.06.92. * 1986-В92.
Ответственный за выпуск к.ф.-м.н. доцент В.С.Рыхяов
Заказ Зо3 Подписано**к печати
Объем I печ. диет. Тира* ICO экз. Типография издательства СГУ