Вопросы устойчивости и аппроксимации в задачах оптимального управления

Корнев, Владимир Викторович

Вопросы устойчивости и аппроксимации в задачах оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Корнев, Владимир Викторович АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Саратов МЕСТО ЗАЩИТЫ

1992 ГОД ЗАЩИТЫ

01.01.09 КОД ВАК РФ

Автореферат по математике на тему «Вопросы устойчивости и аппроксимации в задачах оптимального управления»

Автореферат диссертации на тему "Вопросы устойчивости и аппроксимации в задачах оптимального управления"

ратовскии ордена трудового красного знамени госудам венный университет им. h. г.чершшевского

На правах рукописи КОРНЕВ Звдцикир Викторович

вопросы устойчивости и аппроксимации в задачах оптимального управления:

01.01.09 - Математическая кибернетика

â Bïop8§«paï.

диссертации на соискание ученой степени кант'Шага физико-матеиатачсскнз кауп

Саратов - 1992

Работа выполнен^ из ^ыадрлигельноы цинтре и кафедре дифферент ' циальных уравнений и прикладной математики Саратовского ордена Трудового Красного Знамени государственного университета им.Н.Г.Чер-нышевского

Научный руководитель - доктор физико-математических наук,

профессор А.Л.Хромов

Официальные оппоненты - доктор физико-матемаг.таеских наук,

профессор М.С.Никольский,

кандидат технических наук, старший научный сотрудник В.Б.Батурин

Ведущая организация - Воронежский государственный университет

«»Ленинского комсомола ¿>/ . { л

Защита состоится £ 1992 г. в /О час.

на заседании Специализированного совета К 063.74.04 по присуждению ученой степени кандидата физико-математических наук по спе -циальности 01.01.09 - Математическая кибернетика при Саратовском государственном университете им.Н.Р.Чернышевского по адресу: 410071, г.Саратов, ул.Астраханская, 83, Саратовский государственный университет, механико-матекатический факультет.

С диссертацией иожно ознакомиться е научной библиотеке Сара -товекого горуниверситета.

Автореферат разослан " Ал/л^л^ 1992 г.

Ученый секретарь Специализированного совета, '

кандидат физико-математических наук, доцент . у -

' П.Ф.Недорезов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОМ

Актуальность проблемы. Проблемы устойчивости решения, его не -прерывной зависимости от исходных данных в математике играв? фундаментальную роль. Для задач оптимального управления вопрос об устойчивости их решения приобретает оссбуо остроту, тая как в практических задачах исходная информация чаще всего известна с некоторой погрешность!), и, кроме того, в процессе решения сложные зависимости приходится аппроксимировать более простыми. Поэтому отсутствие устойчивости у исходной задачи может привести к существенному искажению истинного решения. Среди многообразия задач оптимального управления часто встречаются задачи с фиксированным временем, в которых концы допустимых траекторий жестко закреплены, что весьма затрудняет исследование устойчивости их решений. В данной работе изучается важный класс таких задач - линейно-выпуклые задачи, устойчивость юс решений относительно возмущений правого закрепленного конца. Это одна из рассмотренных в диссертации проблем. Другая проблема состоит в следующем. Задачи оптимального управления являются сложными математическими объектами и для них, как правило, невозможно выписать решение в явном въ^е. В связи с гаш возникает проблема аппроксимации, заключающаяся а том, чтобы тасодзгуи задачу оптимального управления заменить более простой »адачей, решение которой близко к искомому. Идеи аппроксимации гЬзволяют строить эффгктивнке численные методы решения задач оптимального управления. Белее того, с помощьо аппроксимации воз -!ожно качественное исследование сложных задач опт;- - ильного управ-гения, получение удобных необходимых условий экстремума. В дан-гай работе разработан метод аппроксимации для исследования зшмч шкшального управления со смешанными п^-раничениями на управляющие а фазовые переменные.

Объект исследования.' Объектов исследований являются линейно-ыпуклые задачи оптимального управления с закрепленными концами 1 гладко-выпуклые задачи со смешанными ограничениями типа нера-

■■ .а

згнсгв.

Лннейно-выпуклюш задачами называется следующий класс задач

¡Уа,X,и)^ тА ; (]

¿(±)=Р(ЦхШ * т.(±)> х(о) ;

; С

и(£)е V, ■ V

где £6 } С1 £ Я , 4/ - выпуклый компакт из Я . Предполагается, что компонента матриц и вектора ее суммируемые на[0} 1] функции; функция измерима пс и , непрерывна ло и>) , выпукла по и. Допустимыми управлениями в задаче (Л-(4) являются всевозможные измеримые век-торч$ункции и. (¿у % почти в году удовлетворяющие условию (4).

Гладко-выпуклыми задачами оптимального управления условно на-

зываются задачи Еида

/'/(¿,*,и)са + £ (х(0) тс-п ; -<£

¿(¿} =V*?, £&))+&(*, х(о)=х0 ; <£

Ш:&]) = о ; ('

лсбУе ; . (Е

О} - (£

где ~ £ - выпуклый компакг. В за

даче (5М9) функции /(¿¿Х;"-),/¿(х);

) дифференцируемы по X , 'измеримы по ^ и непрерывны пК1з:ле того, функции и выпуклы по и на множестве £/ . Допустимые управления - те же, что я в задаче- (1)-(4), причем каждому допустимому управлению (¿) соответствует единственная траектория , определенная на всем схрезке 1] и удовлетворяющая (6).

Цель работы. Исследование устойчивости решений-линеПно-выпук-льос задач (1)-(4) при возмущении правого концевого условия (3), нахождение достаточных условий устойчивости. Аппроксимация гладко-выпуклых задач (5)-(9) задачами с.более,простеми ограничениями, обоснованна сяеодимости по с ледоватедьности^ аппроксимирующих задач по функционалу и по управлению, получение на основе свойст аппроксимирующих задач необходимых условий экстремума для задач (5)-(9). ■ д

Методы исследования. В основе исследования устойчивости регш -ний линеПло-выпуклых задач лежит изучение вспомогательной экстремальной задачи с интегральными ограничениями -ипа равенств, получаемой с помощью формулы Коши для решений линейных дифференциальных систем. Для обоснования устойчивости по функционалу и по управлению используются методы функционального анализа и выпуклого анализа. Аппроксимация гладхо-вк.;унлых задач проводится, путем замены поточечных смешанных ограничений (9) конечным числом интегральных ограничений типа неравенств. Для доказательства сходимости последовательности аплргн-симирующих задач и получения необходимых условий экстремума привлекаются метода теории функций и общей теории экстремальных задач.

Научная новизна, практическая и теоретическая ценность. Установлено, что а общем случае решение линейно-внпукянх задач оптимального управления <I)-(41 с закрепленными концами является неустойчивым относительно возмущений концевых условий. Найдены простые достаточные условия в виде требований на область допустимых управлений, которые гарантируют для указанного класса задач ус -тойчивость по функционалу. Доказано, что если подынтегральная функция а функционале качества строга выпукла по управляющим переменным, то из устойчивости по функционалу вытекает и устойчи -вость по управлении в среднеквадратичной метрике. Для гладко-выпуклых задач оптимального управления со смешанными ограничениями (5)-(9) предложен метод аппроксимации более простыми задачами. Зо'основана сходимость этого метода по функционалу и по .управле -чип. На основе разработанного метода аппроксимации для задач (5)-[9) получены компактные необходимые условия экстремума типа приняла максимума для различных случаев: измеримого управления, ку-:очно-непрерывного управления, случая абсолютно непрерывных мер.

Все перечисленные результаты являются новыми. Они могут быть 1СПользованы как при разработке -численных методов решения, так и таи качественном исследовании задач оптимального управления. Ре -ультаты работа могут найти применение в спецкурсах и спецсемина-ах по специальности "прикладная математика" в Саратовском, Воро-ежском госуниверситетах и других вузах.

Апробация работы. Результаты диссертации докладывались на объ-циненном научном семинаре кафедр математической кибернетики и искретного анализа (под руководством академика профессора .М.Богомолова) Саратовского государственного университета, на

Всесоюзной конференции "Функционально^дифференциальные уравнения" (гЛ'-агнито горек, 1981 г.), на Ш, 1У и V Саратогских зкмних школах по теории Функций и приближений (1985, 1983 и 1990 гг.), на Все -соозноП конференции "Проблемы теоретической кибернетики" (г.Волгоград, 3 О г. ), на научном семинаре кафедры оптимального управле-ю<? '.под руководством доктора физико-математических: наук профессора М.С.Никольского) 1.!оско некого государственного университета (1992 г. 1, на научно;-', семин- • ? кафедры дифференциальных уравнений и прикладной математики СГУ (под руководством доктора физико-математических нарт профессора А.П.Хромова),

Публикации. Основные результате диссертации опубликованы б 4 работах автора, список которых приводится в конце автореферата.

Структура пкссертатдтп. Диссертационная работа состоит из вве -дения, трех глав, включа^оих десять параграфов, и списка литературы. Об'^нй обгем работы - 127 машинописных страниц. Библиогра -фня содержит 94 названия.

СОДЕРЖАЛ»® РАБОТЫ

Во введении обсуждается актуальность теш диссертации, приводится обзор соответствующих работ других авторов, дается описание объекта исследований к изложено краткое содержание работы.

Первая глава посвящена исследованию устойчивости 'решений ли -нейно-выпуклкх задач (1)-(4> относительно возмущений правого концевого условия (3). В § I приводится полное описание рассматриваемого класса задач и вводятся следующие определения. Задача (I)-(4) называется устоГдавой по Функционалу (относительно правого кошевого услоетя-), ссли

= (Ю)

где (¿\tjZj - оптимальное управление задачи (1)-(4) с условием хСО= 2 . Предполагается, что предел в соотношении (10) ищется по тем ^ , которые принадлежат множеству достижимости систем (2), Если имеет иесто равномерная сходимость оптимальных траекторий то задача (1)-(4). называется ус-

тойчиво"' по траектории. Можно такке говорить об устойчивости по управление, если одновременно с ^ —>- имеет гесто сходимость И ¿¿(^^о) в некоторой топологии.

Ео втором параграфе изучается устойчивость исходной задачи

(Р|~(4) по функционалу. Пначяло доказываемся ::сь;'а Т.Г о том» что если исходная .-задача имеет единственное реле»- "о, то из устоЛчи -вости по $ункц::оналу следует устоЯ'Шюсть по траектория. Затем в рассмотрение вводится вспомогательная экстремальная задача с ограничениями типа равенств

/ТЬ ^

J¿ и, (£)- и£ (¿) с/1: — лип ■ < ш

• I $ иг)

1-4 /у. У *

где К, - множество измеримых вектор-пункций и (£) , почти вао-цу удовлетворяющих условию (4); 0-У, - компоненты век-

гор-функций и и. С^) \ &(£) - фиксированная функ-

ция из ; ) - суммируемые на [0!]] функции; , у17-/... у

Мм. - произволыгые измеримые г^иксированние подмножества из

. Для зз„ачи (ПМ13) в лемме 1.2 доказывается непрерывная »эвисязиость ее оптимального значения от правых частей ограничений 12) в случае, когда £У представляет собой ■ Я- - мерный парад-[елепипед. Вспомогательная задача имеет важное значение, необходимость ее рассмотрения вызвана внутренними потребностям* дохаза-■ельства. С помощью леммы 1.2 устанавливается основной результат ;ервой главы, а именно :

. ТЕОРИ/А 1.1. Предположим, что в задаче (П-(4) . -ожество V сть образ с - мерного параллелепипеда

:1 при линейном отобраяения ' Я т , т.е.

I/■=■ Т V - в этом случае задача (1Ы4) будет устойчивой по •/националу при возмущении правого закрепленного конца.

Завершает зторой параграф теорема 1.2, согласно которой устой-ивость по функционалу везгда имеет место, если правый конец тра-ктории пркнадлеж'/т относительной внутренности множества

эстилимости системы (2)ч

В § 3 строится пример, п?, ;,-;ывавщиЯ, что для производного ву-пелого компакта и теорема 1.1 не верна и задача (1)-(4) мо -быть неустойчивой по функционалу. Контрпримером служит еле-тощая зада а ^

лгиг (14)

¿¿О = х¿thujt), x(o) = 0 ; (I5)

*('>*<>; сю

u(é)€ U, (I7)

где выпуклый компакт U представляет собой конус в пространстве Я3 с вершиной в точке О , основанием которох-о является круг единичного радиуса с центром в точке (О, i 7 íj , параллельный плоскости (Ui,U¿) , Правое граничное условие (16) возмущается по следующему правилу

где ^ J>K }K_t - последовательность положительных чисел, сходя-чак^я к нулю, а = Cf~j>k)z . При оптимальные зна-

чения задач (14), (15), (I?), (18) к нуль не стремятся, что свидетельствует о неустойчивости задачи (14)-(17) по функционалу.

В § 4 устанавливается связь между устойчивостью по функционалу и устойчивостью по управпению. Предварительно доказывается

ТЕОРЕУА 1.3. Пусть в банаховом пространстве, обладающем свойством Банаха-Сакса, задал полунепрерывный снизу функционал У* , который является строго равномерно в'-туклым на выпуклой оболочке элементов последовател; hocwí J 2fk , слабо сходящейся к

элементу , на котором / y(tí~0 )[< оо. Предположим, что

^Тогда последовательность Vk Jсходится к Vp сильно.

Эта теорема позволяет решить важный вопрос об устойчивости задачи (1)-(4)' по управления (теорема 1.4), а такке доказать теорему 2.2 из второй главы.

ТЕОРЕМА 1.4. Если задача (1)-(4) икеег единственное решение, устойчива по функционалу, а функция }№непрерывна и строго выпукла no LC на множестве С/ , то задача (1)-(4) будет устойчивой и по управлению в метрике пространства 1].

Лемма I.I и теорема 1.4 остаются справедливыми и для нелинейных систем веда (6). Кроме того, полученные в первой главе ре -эультатн можно перенести на случай переменной области управления

U(t).

Во второй главе (§ 5 - § 7) объектом исследования являются

. гладко-выпуклые задачи со смешанными ограничениями (5}-(9). Пол -ное описание этого класса задач дастся б пятом параграфе.

В шестом параграфе по исходно? задаче (5)-(9) строится последовательность аппроксимирующих задач, кшсдая из которых уже не со -дернит поточечной смешанных ограничений« Суть этого метода аппроксимации заключается в том, что отрезе.: [0} // разбивается (в простейшем случае - равномерно) точке»/'.! ¿o-0<íi<<i¡c~f и каждое из ограничений (9) заменяется на К интегральных ограничен:;!*.

Л, __ _

/ , (19)

Так получается к. - тая аппроксимирующая задача. Теоретическим обоснованием данного метода аппроксимации служит лежа 2.1.

ЛЕММА 2.1« Последовательность апплоксгалирутопщ: задач (5)-(6), (19) при А'->ог> сходятся к исходной задаче (5)~(9) по функционалу.

После ледгя* приводятся приоры, показгатщ'лс существенность требования выпуклости фулкц;.;} ^ и ^ упр^г.-^::;::-.! переменным для справедливости этой до!-«-». Основанием сходности ?того метода аппроксимации служат -г.»ьтз тсорамн 2.1 и 2.2.

ТЕОРЕ'Л 2.1. если ¿с(£),Х&) - единственное реление лйхгд-ной задачи (5)~(9), то поелздоЕят.чяъность оптпмальнкх траекторий

}задач (5)-(8), (19) равномерно сходится к Хк1) на

отрезке /0}1] , а соответствующая последовательность оптммллыпгх

управлений { и. к(£) J/t_/ слабо сходится к и в пространстве

ТЕОРЕМ 2.2. Если задача (5)-(9) имеет единственное решение,

а функция £ непрерывна и строго выпукла по ^ на множестве

Т Г 1 / к л

(у , то последовательность оптимальных управлений / и. (¿)/ _

д /

задач (5)-(8), (19) сходится к &(¿/ в среднем квадратично!/, на

ш.

Требование непрерывности + в теоремах 2,2.и 1.4 можно ослабить, заменив его кусочной непрерывностью по ^ при услог.;ч!, что односторонние предел?-; сохраняют строгую выпуклость по Ц. .

Изложенный в жестом плрагрг^ю метод аппроксимации гл.и;::о-глг-пуклкх задач сс сисшпитг-ш огрг!И!1по»п!я:-::: юу-.г-г бить :;<:нсг:,лов'Х! при раэрпботке численных методов, но в теоротнчоок^х яссл'.дт-

ниях болшне Еоог:с::;'!ости предоставляет сочетание этого метода с вариацкок'-ла прак: лпоа Экланда*. Аппрокс:"' -*!ИЯ задач со смешшшы-.та ограничения:':: на основе вариационного . .ищипа развивается в § 7. Б результате получается последовательность аппроксимирующих задач, описание езойств которой дается в теореме 2.3»

ТЕОРЕМ 2.3. Существует последовательность положительных чисел

/£ I , сходящаяся к нулю, такая, что для каждого

/ /7 /

найдется управление ¿С (¿7 € Ш , являющееся единственным решенк-

егл следующей экстремальной задачи

£ _

I 1 а) ¿Л V, (22)

к Ч-]

пои этом Л _ «

где и. - оптг'малы'ое управление задачи (5)-(9); 'Ы. - то же, что и в (13); р - метрика, заданная на ; = - .

Теорема 2.4 содержит нео ¿ходкие условия оптимальности для задач (20)—(22). Бнвод от/Я условий опирается на общий экстремальный г.рищип для абстрактных гладко-выпуклых задач .

В третьей главе (§ 8 - § 10) на основе аппроксимации, разработанной в § 7,'для гладко-выпуклых задач со смешанными ограничениями (5)-ч9> с помощью предельного перехода выводятся необходимые условия экстремума типа принципа максимума. В зависимости от априорной информации рассматривается три случая. „

Б § 8 изучается общий случай", когда относительно оптимального управления ничего не известно, кроме его измеримости. Основным результатом является следующий принцип максимума.

ТЕОРЕМА 3.1. Предположим, что вектор-пункция в задача (о)-(9) представима в вццё*

у*. * ^и^^^^сяд3" ВыяУ«лые заДачи и вариационные пробае-. . -лр, . ^

_ Иоффе АД., Тихомиров В.М. Теория экстремальных задач. -

причем функция ^^ непрерывна. Пусть - оптимальное уп -

равление, а х(б) - соответствующая 'оптимальная траектория для этой задачи. Тогда существуют неотрицательная Я0 , векторбе^ неубывающие функции ^Ли вектор-функция ограничен -

ной вариации , такие, что

1) Я, +161 + г (/л С/7 -) = / • (24)

2) функция при 0< / является ресеннсм интегрального уравнения

-£ } (25)

где + ; 0

3) почти при всех / €(¡2/) гл/полняется равенства

X(¿1 и) = //(£_, X(£), и-(о) , (26)

«ее __ '

где Н(1, х,и) = - х, и)ч < А&х.)и. > -

Кроме того, точки роста (£) ( ¿ = ) , если таковое существуют, обязаны принадлежать множеству

Часть доказательства теоремы вынесена в леммы 3,1, 3.2, 3.3. Теорема 3.1 по форме представляет собой обобн'^нис известного принципа максимума для задач с фазовыми ограничениями . В восьмом параграфе на примерз задачи со свободицм правьм концом также проводится исследование тех случаев, в которых формулировка полу -ченного принципа максимума является тривиальной, когда молзю заведомо указать такие , /*-(£) и ПР15 которых выполняются все условия Tcopci.ni 3.1, однако О и соотно-пекие кл'-гс^'уа (26) становится боссодергкатсльны-;. Соответствующие ус."о: "т цегурр^деттегп содержатся в теорег-та 3.2.

В 5 3 отпосктсшгэ оптимального управлямл и (О предпола-

гается, что оно :гусочнп-непрзрчшо. Зл\> прсдпзлх^ннз делает из -пглнкк дополни-.: зз/дсе тргбование (23) к погсоляс? доказать принцип ка"с%у.:а (теор~га 3.3) для всего класса гладко- выпуклых задач (Ь)-(9), По он аналогичен теорсмо 3.1, но имеет насколько

уеклсн.-ае условия дополняющей ьежесгкости

(28)

3 легли 3.4 д^зтся правило доопределения подынтегральных функций б точк:.?: разрыва и. (£) в интегралах Лебега-Стилтьоса из соотно-агнкй (25), (28). Как и в общем случае, анализируются условия невырожденности доказанного принципа нзкк'лмума для задач с незак -реп лонным правил шгдом (теорема 3.4).

В § 10 рассмотрен важный для приложений вопрос о дифференцируемо сти кср, входящих в уравнения -ринципа максимума. Найдс.да простые достаточные условия (лсила 3.5) в виде априорных требований на оптимальную траекторию

теп /пах Х_, ¿с) £ - £ 6 у О , (29) иеХ/

при которых ые^-а! будут абсолютно непрерывными

и пр;..щип максимума принимает законченный вид.

ТЕ0РЕ!.'А 3.5. Пусть и (£) - оптимальное управление в задаче (5)-(9), а X (1:) - соответствующая оптимальная траектория, относительно которой предполагается, что она удовлетворяет ус-■!ля;ш (23). Тогда существуют неотрицательная константа , 'с-ктоо ^ , неотрицательные измеримые ограниченные функции 2Г({), — } (£) к абсолатно непрзрквная вектор-функиия р(гг/!1 'Такие, что . .

п л. + Шч- £ = 1 •

/=/ о

2) функция ¥(±) является реиением дифференциального уравнения '

с условием = - 4' (¿0))£

3) почта при всех ^«? (0} 1) справедливо соотношение

да р

4) почти рсюду на [0; /_/ выполняются условия дополняющей кенсс-?» кости

Д-Ь),¿Ш)=0} ¿-- ¿7-

Полученныз в третьей главе"необходимые условия экстремума справедливы' и для случая равномерно ограниченной выпуклой области управления , измеримой по £.

В заключение автор выраяает исхре::5;ш благодарность своему на-учгздму руководителю доктору физико-математических наук профессору Августу Пзтрос:гау Хромову за руководство работой, внимание я под-■деркяу„

Основное содержание ддассёртации опубликовано в следующих рабо-

тах автора ■ I; .

Г. Корней В.В. Корректность линейно-выпуклой задачи оптимального

г управления с закрепленным правым концом //Теория функций и приближений. Тр. 3-й Саратов, зимней школы. - Саратов, 1988. Ч. 2. - С. 108-110, •

2. Корнев В.В Метод аппроксимации и необходимые условия экстремума для одного класса задач оптимального управления со смешанными ограничениями /Саратов, ун-т. - Саратов, 1989. - 27 с. -Деп. в ВИНИТИ 24.10.89. № 6436-В89.

3. Корнев В.В. Аппроксимация одного класса задач оптимального управления со смешанными ограничениями //Проблемы теоретической кибернетики. Всесоюзная конференция. Тезисы докладов. Волго -град, 9-15 сенг. 1990 г. - Волгоград, 1990.4.1(1). - С. 60.

4. Корнев В.В, Аппроксимация гладко - выпук лых сз адач со смешанными ограничениями и исследование не вырожденно сти соответствующих необходимых условий экстремума /Саратов, ун-т. - Саратов, 1992. - 20 с. - Деп. в ВИНИТИ 17.06.92. * 1986-В92.

Ответственный за выпуск к.ф.-м.н. доцент В.С.Рыхяов

Заказ Зо3 Подписано**к печати

Объем I печ. диет. Тира* ICO экз. Типография издательства СГУ