Вариационный принцип максимума в задаче оптимального управления волновыми процессами тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Лутковская, Екатерина Александровна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Иркутск
МЕСТО ЗАЩИТЫ
|
||||
2012
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
На правах рукописи
4г]/
Лутковская Екатерина Александровна
ВАРИАЦИОННЫЙ ПРИНЦИП МАКСИМУМА В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ВОЛНОВЫМИ ПРОЦЕССАМИ
01.01.09 - дискретная математика и математическая кибернетика
Автореферат
диссертации на соискание ученой степени кандидата физико-математических наук
Иркутск - 2012
005046698
Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Иркутский государственный университет» Научный руководитель: Терлецкий Виктор Анатольевич кандидат физико-математических наук, доцент
Официальные оппоненты:
Потапов Михаил Михайлович
доктор физико-математических наук, доцент,
Московский государственный университет им. М.В. Ломоносова,
факультет вычислительной математики и кибернетики,
профессор кафедры оптимального управления
Сидоренко Геннадий Васильевич
кандидат физико-математических наук, доцент,
Байкальский государственный университет экономики и права,
факультет информатики, учета и сервиса,
доцент кафедры математики
Ведущая организация:
Институт динамики систем и теории управления Сибирского отделения Российской академии наук Защита состоится 11 апреля 2012 г. в 14:00 на заседании диссертационного совета Д 212.074.01 при Иркутском государственном университете по адресу: 664003, г. Иркутск, бульвар Гагарина, 20, Институт математики, экономики и информатики.
С диссертацией можно ознакомиться в библиотеке Иркутского государственного университета. Автореферат разослан 10 марта 2012 г.
Ученый секретарь диссертационного совета
Антоник Владимир Георгиевич
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Волновым уравнением описываются многочисленные физические процессы: колебания струны, продольные и крутильные колебания стержней и пружин, колебания давления в длинных газопроводах, колебания напряжения и силы тока в электрических проводах, длинные волны цунами и т.д.
Построение теории и методов решения задач оптимального управления волновыми процессами ввиду их большого разнообразия и сложности предполагает обычно конкретизацию вида волнового уравнения и граничных условий, что определяет в конечном итоге и общность полученных результатов. Подавляющее число работ как в отечественной, так и в зарубежной литературе посвящено исследованиям задач оптимального управления, в которых правая часть дифференциального уравнения либо равна нулю, а управляющие воздействия сосредоточены на границах, либо линейна по решению, либо содержит нелинейность конкретного вида. В настоящее время возникла необходимость обобщения соответствующих задач вместе с реализацией новых подходов к их изучению. В диссертационной работе рассматривается задача оптимального управления нелинейным волновым уравнением с нелинейными граничными условиями, которые являются обобщением условий первого, второго и третьего рода. Правая часть волнового уравнения нелинейна по решению и его первым частным производным по времени и пространственной переменной, которые описывают соответственно скорость смещения и упругую силу. В качестве управлений фигурируют два вида измеримых функций: распределенное управление и управле-
ния, сосредоточенные на границах. На управляющие функции наложены ограничения типа включения. Целевой функционал имеет нелинейные терминальную и интегральную составляющие. В рамках такой сравнительно общей постановки задачи оптимального управления проведено ее качественное и конструктивное исследование. Оно существенно использует расширенную, или продолженную систему четырех уравнений первого порядка, порожденную волновым уравнением. Плодотворность и эффективность этой системы проявлется как при построении обобщенного решения начально-краевой задачи, так и при исследовании задачи оптимального управления.
Общность постановки, оригинальность методики, направленность работы на получение как качественных результатов, так и конструктивных методов, а также большая прикладная значимость исследуемых задач оптимального управления свидетельствуют об актуальности данной темы.
Цели работы состоят в построении обобщенного решения волнового уравнения, удобного для исследования задач оптимального управления волновыми процессами, получении необходимых условий оптимальности в таких задачах и обосновании принципиальной возможности применения для рассматриваемой задачи известных численных методов, основанных на этих необходимых условиях оптимальности. Основными задачами работы являются • введение понятия обобщенного решения нелинейного волнового уравнения, позволяющего наиболее точно указать его свойства и привести к вариационному принципу максимума при исследовании задачи оптимального управления процессами, описываемыми этим уравнением;
• вывод необходимого условия оптимальности в виде вариационного принципа максимума в задаче оптимального управления волновыми процессами;
• построение итерационных методов решения задачи оптимального управления, основанные на вариационном, конечномерном и линеаризованном принципах максимума.
Методы исследования основаны на теории дифференциальных уравнений с частными производными, теории оптимального управления и численных методов. В работе применяются метод характеристик, метод последовательных приближений, проводится вывод и анализ формул приращения целевого функционала на различных типах вариаций управлений.
Основные результаты диссертации, выносимые на защиту:
1. Обоснование существования и единственности обобщенного решения нелинейного волнового уравнения с краевыми условиями первого, второго и третьего рода с получением точных оценок скорости роста решений относительно входных данных и выявлением основных свойств решения.
2. Необходимые условия оптимальности для задач оптимального управления волновым уравнением в виде вариационного, конечномерного и линеаризованного принципов максимума.
3. Численные методы, основанные на необходимых условиях оптимальности, обладающие свойствами релаксаци-онности и сходимости.
Научная новизна. Общая постановка волновой задачи с граничными условиями, охватывающими все три типа классических граничных условий, является новой. Нестандартной является идея определения обобщенного решения волнового уравнения как решения интегральной системы, полученной из эквивалентной исходному волновому уравнению гиперболической системы четырех дифференциальных уравнений первого порядка в инвариантах Римана. Для задач такого типа наряду с доказательством существования и единственности обобщенных решений впервые установлены точные оценки роста решения и его первых производных по времени и пространственной переменной относительно входных данных. Проведенный анализ динамики возмущений инвариантов Римана, вызванных вариациями распределенного управления вдоль характеристик и игольчатым варьированием граничных управлений, позволил вывести в задаче оптимального управления волновым процессом новое необходимое условие оптимальности в виде вариационного принципа максимума. Доказано, что конечномерный и линеаризованный принципы максимума являются следствиями вариационного принципа максимума. Разработаны итерационные методы, основанные на вариационном, конечномерном и линеаризованном принципах максимума.
Теоретическая и практическая значимость работы. Полученные в диссертации теоретические результаты вносят вклад в теорию управления волновыми процессами. Предлагаемые методы и подходы открывают новые возможности для эффективного решения прикладных задач оптимального управления волновым уравнением с управляемыми граничными условиями.
Результаты диссертации являются составной частью исследований, выполняемых в Иркутском государственном университете в рамках следующих НИР, в которых соискатель является официальным исполнителем: гранты Российского фонда фундаментальных исследований (проекты 08-01-00709-а на 2008-2010 гг. и 11-01-00713 на 2011-2013гг) и Федеральная целевая программа "Научные и научно-педагогические кадры инновационной России" на 2009-2013 гг.
Материалы диссертации используются в учебном процессе кафедры методов оптимизации Иркутского государственного университета (курсовые и дипломные работы, дисциплины специализации).
Апробация работы. Основные результаты диссертации докладывались на следующих конференциях и семинарах:
• III межвузовской зональной конференции, посвященной памяти проф. Б.А. Бельтюкова, "Математика и проблемы ее преподавания в вузе" (Иркутск, 2007);
• школе-семинаре "Нелинейный анализ и экстремальные задачи" (Иркутск, 2008);
• XIV Байкальской международной школе-семинаре "Методы оптимизации и их приложения" (Иркутск, 2008);
• международной конференции "Оптимальное управление: теория, методы и приложения", посвященной 70-летию со дня рождения профессора О.В. Васильева (Иркутск, 2009);
• XV Байкальской международной школе-семинаре " Методы оптимизации и их приложения" (Иркутск, 2011);
• семинаре отделения методов управления и исследования
операций Института динамики систем и теории управления СО РАН (Иркутск, 2012). Публикации и личный вклад автора. По теме диссертационной работы опубликовано 7 работ, в которых отражено ее основное содержание. В число указанных работ входят 3 статьи [1]-[3] в журналах из Перечня рецензируемых научных журналов ВАК РФ (редакция 2011 г.), статья в научном журнале [4], 3 полных текстов докладов [5-7] в материалах всероссийских и международных конференций. Работы [1], [3], [5]-[7] выполнены в нераздельном соавторстве с научным руководителем.
Структура и объем работы. Диссертационная работа состоит из введения, трех глав и списка литературы, содержащего 82 наименования. Общий объем диссертации составляет 151 страницу, включая 26 рисунков.
СОДЕРЖАНИЕ РАБОТЫ Во введении обосновывается актуальность темы диссертации, проводится обзор литературы и дается краткое изложение содержания работы.
В первой главе рассматривается нелинейное волновое уравнение с начальными и граничными условиями первого, второго и третьего рода:
хи - а2(з)хев = /(ж, хи х8, 5, г), (5,4)еП = 5хТ, (1) х(я, ¿о) = хг(з, ¿о) = ^(з), 5 6 £ = (в0, ¿1), (2)
х3{з1}г) = я1(х{з1,г),I), гет= (г0,к). 1 ;
На параметры задачи наложены следующие предположения: а — а (в) - гладкая на 5 функция, удовлетворяющая ограничениям 0 < ао < а(з) < аоо < +оо; функции / =
f(x,xt,xs,s,t) и дг = г = 0,1, непрерывны по Лип-
шицу по фазовым переменным (ж, Е И.3 при (в, £) е П
и суммируемы по Лебегу в П и Т со степенью р > 1 при фиксированных значениях фазовых переменных; функции
Х°, X0', X1 Е Ьр(8), т.е. суммируемы по Лебегу со степенью р-
Иследование волновой задачи проводится путем сведения ее к эквивалентной системе из четырех дифференциальных уравнений первого порядка, которая, в свою очередь, приводится к системе в инвариантах Римана. Представлены два варианта эквивалентных инвариантных систем.
Далее вводится понятие характеристик волнового уравнения. Характеристиками, проходящими через точку (£, т) 6 П, являются решения в = т; £) обыкновенных дифференциальных уравнений с^/сЙ = ±а(в). Для произвольной точки
Е П начальной точкой характеристики £ = залегающей на границе <911 прямоугольника П, будем считать точку ¿), ^(з, ¿)) Е <ЭП, < t, а конечной точкой
характеристики - точку ¿), ^(з, ¿)) € дП, ¿^(в, £) >
Отличительной особенностью инвариантных систем является тот факт, что дифференциальные операторы в левой части каждого уравнения системы можно рассматривать как производную одного из инвариантов Римана по направлению, определяемому характеристикой. Проинтегрировав уравнения системы в инвариантах вдоль соответствующих характеристик, получим равносильную интегральную систему уравнений типа Вольтерра.
Это позволяет ввести понятие обобщенного решения волнового уравнения как решения системы интегральных уравнений, которая эквивалентна исходной дифференциальной за-
даче на гладких (классических) решениях.
Затем с помощью метода последовательных приближений доказывается существование и единственность обобщенного решения и устанавливаются точные (неулучшаемые) оценки роста решения х и инвариантов Римана rT = xt ± a(s)xs относительно входных данных задачи. Они имеют вид
\x(s,t)\ < C{|x°(á-(s,i))| + №+М)) 1+ +
+ 1x1(01 + 1^(01)^ +t+rV(0,r)|dr+
s+(s,t) t0
+ ¿ f't} №(0, r)\dr + И |/(°)(0,0, 0, T)\d£dT},
KM)| ^Cd^Cá-ís.í))! +'|x1(á+(s,í))| + \x°'(s-(s,t))\ + + / I? (0, r)\dr + f J¡g1(0,T)¡dr+
W i o
+ í))| + T^VíOI + l*°(OI + 1^(01
+ \q°(P,t+(s,t))\ + \q\0,i-(s,t))\ + H |/(°)(0,0, 0, r)\d^dr+
G(s,t¡
+ /(l/(O)(0, o, 0, í; r), r)| + |/(°)(0,0,0, s-(s, t; r), r)\)dr},
to
где С - константа, зависящая от конкретного выбора входных данных задачи (1)-(3) только через константу Липшица и константы ао,^; G(s,t) - область определенности для произвольной точки (s,t) € П : G(s,t) = {(£, т) € П : max{so, s+(s, t; г)} < £ < min{s~(s, í; г), si}, г € (¿o, ¿)}.
Далее вводятся дифференциальные операторы
D±T±{8,t) = [±r*{st{s,t]T),T)] U.
Обосновывается дифференцируемость вдоль характеристик инвариантов Римана г± и указываются функциональные классы, которым принадлежат решение волнового уравнения
х и инварианты Римана г^. В завершение главы для любой односвязной области Q е П с кусочно-гладкой границей 8Q обосновывается формула интегрирования по частям:
/ ^D^dsdt = / C±r±dsTC±ar±di-/ (D^^a'^dsdt.
Q OQ Q
Во второй главе рассматривается задача оптимального управления:
xtt - a2(s)x.3S = f(x, хи x3, и, s,t), (s,t) 6П = S x T, (4) i0) = z°(s)> xt(s, h) = x\s), seS. (5)
xt(s0,t) = q°(x(s0,t),v°,t), ^
xs(sut) = ql(x(si,t),v1,t), t e T.
u{s,t) € U, v*(t) G V*, ¿ = 0,1, (7)
J(u,v) = I <p(x, xt, xs, v, s, t)doj+
OT (8) + / Ф(х, xt, xs, u, s, tjdsdt min,
с распределенным управлением и и граничными управлениями г>°, v1 из класса измеримых и существенно ограниченных функций.
Здесь функции (f — tp(x,xt, x3,v,s,t), Ф = Ф(x,xt,xs,u,s,t) непрерывны по совокупности своих переменных вместе с частными производными по фазовым переменным x,xt,xs\ в функционале (8) первое слагаемое является интегралом первого рода по границе <9П прямоугольника П, dto = \/ds2 + dt2; и для любого набора допустимых управлений u,v°, vl существует ограниченное в П решение х, имеющее ограниченные производные xt,xs почти всюду в П.
и
Так же, как и в первой главе, исследование задачи оптимального управления проводится на основе сведения исходной задачи к эквивалентной гиперболической системе четырех уравнений:
= £)±г± = д(Х,Г~,Г+,и,8,{), (9)
х(з, ¿о) = ¿о) = ж1^) =р а(з)ж0'О), вей', (10)
г+(в0, ¿) = -г-(а0, ¿) + 2д°(х(в0, ¿), г;0, г), , ,
где Г* = ХгТ ах3, д = /(ж, (г" + г+)/2, (г- - г+)/2а, и, 5, ¿) -а'(г~ - г+)/2.
Далее путем анализа формулы приращения целевого функционала на игольчатых вариациях выводится сопряженная задача:
± о!ф± = -\НХ\ £)±С± ± а'С* = -Яг±, (з,*) € П,
-(<Аг[зо,г] Н- [«о, - а(50)С+(5о,^)))/а(з0),
= -С+Оо,£) - -^г+[во,<])/а(во),
С+(яь0 = - (уг-[зь+ <л-+[51,г])/аЫ, г е т.
(12)
Здесь и далее для сокращения записи используются обозначения <£>[м] = дг[«г-,£] = дг'(:фг-,£), ?/(:£),*), г = 0,1.
Оценки роста обобщенного решения волнового уравнения относительно входных данных задачи, полученные в пер-
вой главе, позволяют определить структуру сильных вариаций управлений, приводящих к вариационному принципу максимума. Для его вывода исследуется приращение целевого функционала на вариациях распределенного управления вдоль характеристик и игольчатых вариациях граничных управлений в начале этих характеристик. При этом малость приращений управлений определяется малостью меры множеств их варьирования. Для формулировки вариационного принципа максимума вводятся в рассмотрение два семейства задач оптимального управления обыкновенными дифференциальными уравнениями, в которых каждая задача строится на произвольном допустимом процессе по точке (£,т) Є П, играющей роль параметра соотвествующего семейства. Эти задачи имеют вид
у = д{х, г~, у, й, , т; і), і), і Є т), т)), (і+л _ І г+(з+(£,т-,і0),і0), ¿+(£,т) = ¿0,
) \ -г-(з0,ї+) + 2д°(х,у°,ї±), ї+(ї,т) > іо, і = д( х, г, г+, и, і+; і), і Є т), і і),
г{І+) = у(і+) + 2а{8і)д1(х, Vі, т)),
й(і) ЄІ7, і € т), ¿+(£, г)), Є У0, (13)
Щи, V0) = -«+</?(>, г", у, у0, в0, ї+)~ -р+ір(х, г~, у, т; ¿і), £і)аО+(£, т; ¿і))--(1 - у, и1, яі, £+)-
-(1 - /3+)<р(х, г, г+, £+; іі), £і)а(в-(ві, ¿+; ¿і)+
¿і
+ / Я(0, 0, С+, Ж, я, г+, и, 5, І)а(в)|8=в-(ЯІ1^;І)Л тах,
У = д(х, у, г+, й, г; £), і), і Є (£"(£, г), £"(£, т)), /г-ч = І і~{£,т) = г0,
і = д(х, г~, г, и, 5+(й0, ¿), і), і Є (¿~(£, т), ¿і), г(І~() = -у(І-) + 2д°(х,ь°,І-),
й(і) Є 17,.і Є (Г(Є,г),£-(<Є,т)), і;1 Є Vі, (14) (й, и1) = -а~ір(х, у, г+, й1, 5Ь ~Р~ір(х, у, г+, т; £і), £і)а(я~(£, г; ¿і))--(1 - Р~)ч>{х, у, г+, V0, 80, і~)~ -(1 - /3~)ір(х, г~, г, в+(в0, £~; ¿і), іі)а(в+(во, і"; ¿і))+
+ V Я(0, О, С+, х, у, г+, й, і)а(з)|в=в-(?іТ;0гі£+ + / О, С", 0, х, г~, г, и, з, ¿)а(в)|8=в+(в0іг-;і)Л тах.
Здесь
0, = і0, 3±=\1, ^(Є.Т) = ¿ь
1, > ¿о, Р 1 0, т) < ¿і,
функции ■0і, С1*1 являются решениями сопряженной задачи (12).
Теорема 2.1. (вариационный принцип максимума) Пусть управления и* и V* оптимальны в задаче (4)-(8). Тогда для почти всех (£, г) Є П функция й(і) — т; £), £)
и число V0 = доставляют максимум функцио-
налу в задаче оптимального управления (13), а функция й(Ь) — т; і), і) и число Vі = т)) доставляют
максимум функционалу І[Т в задаче оптимального управления (14)-
Из вариационного принципа максимума выводится конечномерный путем применения к задачам (13),(14) принципа максимума Понтрягина.
Теорема 2.2. (конечномерный принцип максимума) Если в задаче (4)-(8) множества V1 выпуклые, а функции и (р -:непрерывно-дифференцируемы по управлению уг, г = 0,1, то для оптимального управления и* почти всюду в П справедливо неравенство
н(ф*,с,х*,г*,и*,з,г) - н{ф*, С, х*, г*, и, з,г) > о \/и е и,
(15)
а для оптимальных управлений V* почти всюду в Т выполняются неравенства
— V0*) > 0 \/и° <Е V0, Н^и1 -Vй) > 0 Уи1 е V1,
где
= 2(у>г+[яо, - а(в0)С+(яо, *))д°о(ж(я0, £), и£) + <*РуО[во, £],
Н\1 = 2а(81)(93г-[в1, ¿]-а(51)С_(зь ¿))^1(ж(зь £), и1, £)+<£„ фъ £].
С помощью контр-примера, в котором управления и, V удовлетворяют конечномерному принципу максимума, но бракуются вариационным принципом максимума, показывается, что вариационный принцип максимума является более сильным необходимым условием оптимальности, чем конечномерный принцип максимума.
Наконец, из конечномерного принципа максимума традиционным способом выводится
Теорема 2.3. (линеаризованный принцип максимума) Пусть управления и* и V* оптимальны в задаче (4)-(8), а функции х,^ и гф±,(>± являются решениями задач (9)-(11)
и (12). Пусть дополнительно функции ql дифференцируемы по v\ / дифференцируема по и, множества U, Vг - выпуклые, i = 0,1. Тогда распределенное управление и* почти всюду на П удовлетворяет линеаризованному (дифференциальному) принципу максимума
Ни(ф*, С, х\ г*, и*, s, t)(u -и*)< 0, и е U, (17)
а граничные управления v* - условиям (16) почти всюду на Т.
Третья глава посвящена численным методам улучшения допустимых управлений. Вначале строятся процедуры на основе вариационного принципа максимума. Идея и общая схема таких методов известны1. Нестандартными являются конструкции, которые позволяют использовать данные методы для решения задач оптимального управления волновыми процессами. Обоснование сходимости методов использует дополнительные предположения. Для методов, основанных на сильных вариациях (вариационного и конечномерного принципов максимума) необходимо считать, что функции /, ip, Ф непрерывны по Липшицу по переменным x,xt,xs вместе со своими частными производными по этим переменным.
Приведем конструкции, которые позволяют описать численные методы решения, основанные на вариационном принципе максимума.
В силу того, что решения й, v задач (13),(14) вариационного принципа максимума не меняются, если в них точку (£, т), играющую роль параметра семейства задач (13),(14), заменить на любую другую точку (£, f) той же характери-
1Васильев О-В. Методы оптъмизации и их приложения. 4.2. Оптимальное управление!О-В. Васильев, В.А Срочко, В.А Терлецкий. — Новосибирск: Наука., 1990. — 151 с.
стики, для нахождения этих решений нужно указать правило выбора точки (£, т) так, чтобы оно позволяло выделять каждую характеристику соответствующего семейства один и только один раз. Например, таким "континуальным номером" характеристики можно считать значение т 6 Т. При этом вторая координата £(т) вычисляется по т так, чтобы точка (^±(т),г) принадлежала соответствующей диагонали прямоугольника П, то есть £+(т) = вх — — ¿о), £~(г) = +С?"— ¿о)- Таким образом, вместо обозначений функционалов, введенных в рассмотрение в задачах (13),(14), можно использовать упрощенную запись = Решения задач (13),(14) с функционалами обозначим за По совокупности решений сформируем распределенное й± = ¿) и граничное Ъ — у(£) управления, положив
= <(£), г е Т, £ е (^(тХтУ^Нт),^), у°(Ще(т),т)) = у°т, те ^(¿"(Г(г),т)) = т е (Г,^).
Здесь ¿^ есть соотвественно корни уравнений ¿о; —
£+(£), и 1,£о;£) = £"(£)■ Понятно, что при т < ^ характеристика й = 5±(^±(т), г; £) берет начало на нижней границе прямоугольника П, а при т > - на левой (правой) границе.
Определим функции = положив для т еТ
<„)(г) = «г) " ^(«(^(^(т), Г, •), -)^№(т), г))).
Очевидно, ЧТО ПО построению > 0, £ € Т. Причем,
если почти всюду на Т и (£) = 0, и — 0, то вари-
ационный принцип максимума для базового (проверяемого)
управления (и, v) выполнен. В этом смысле числа
= —l—- Juf v)(t)dt
il — 4) T
естественно трактовать как величины невязки вариационного принципа максимума, соответственно, для семейств задач (13),(14). Если ^(и, v) > 0, то управление (u,v) не оптимально. Опишем схему его улучшения. Пусть е G [0, ¿1 — i0] - числовой параметр. Рассмотрим семейства Т^ ^ (е) измеримых подмножеств отрезка Т со свойствами
T±v)(e) С Т, mes T^v){e) =е, ее [0, h - i0].
С помощью множеств определим однопараметриче-
ское семейство управлений (и£, vE) следующим образом:
„±(ч л = J й±(3>5 = S±(^(T)' *)> * е
\u{s,t), s = s±(^±(r),r;i), reT\T^v)(e), (,s,t) € П,
_ j v°(t), t = i+(C+(r), r), r € T^v)(s) П h), W 1 v°(t), t = i+(e+(r), r), r G T \ T(lv)(e), v1+(t) = w1(i), i £ T,
«1-гл = IDl(t)'1 = T e n (*"' £i)>
£ W ji^f), i = r(r(r),r),reT\TH(£), ^°-(t) = u°(t), t € T.
При сделанных предположениях на параметры задачи последовательности управлений {г^}, {?/"'}, генерируемые методом вариационного принципа максимума, релаксационны и сходятся в смысле /ik{uk, wfc) ■—> О, А; —> сю.
Далее на основе конечномерного принципа максимума строятся алгоритмы, которые являются модификациями ме-
тодов последовательных приближений. Обосновывается сходимость алгоритмов к выполнению необходимых условий оптимальности.
Затем излагаются методы, базирующиеся на линеаризованном принципе максимума для распределенного и граничных управлений. Эти методы являются модификациями метода условного градиента.
Наконец, предлагается метод, использующий одновременно и сильное и слабое варьирование.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в журналах, рекомендованных ВАК
1. Лутковская Е.А. Обобщенное решение нелинейного волнового уравнения с нелинейными граничными условиями первого, второго и третьего рода / Е. А. Лутковская, В.А. Терлецкий // Дифференциальные уравнения,- 2009 - Т. 45,- N 3,- С. 403-415.
2. Лутковская, Е. А. Условия оптимальности для нелинейного волнового уравнения / Е. А. Лутковская // Вестник Бурятского государственного университета,- 2010 - Вып. 9.- С. 48-53.
3. Лутковская Е.А. Вариационный принцип максимума в задаче оптимального управления нелинейными волновыми процессами / Е. А. Лутковская, В.А. Терлецкий // Известия Иркутского гос. ун-та. Сер. "Математика".- 2010-Т.З.- N3.- С. 105-117.
Прочие публикации
4. Лутковская Е.А. Вывод обобщенного решения волнового уравнения методом последовательных приближений / Е. А. Лутковская // Известия Иркутского гос. ун-та. Сер. "Математика",- 2007,- Т.1.- N1- С. 175-187.
5. Лутковская Е.А. Принцип максимума в задаче оптимального управления волновым уравнением / Е. А. Лутковская, В.А. Терлецкий // Труды III межвузовской зональной конференции, посвященной памяти проф. В.А. Бельтюкова- Иркутск: Изд-во Иркут. гос. пед. ун-та,
2007,- С. 116-118.
6. Лутковская Е.А. Условия экстремума в задаче оптимального управления нелинейным волновым уравнением / Е. А. Лутковская, В.А. Терлецкий // Труды XIV Байкальской международной школы-семинара "Методы оптимизации и их приложения".- Иркутск, ИСЭМ СО РАН,
2008.- Т. 2 .- С. 193-201.
7. Лутковская Е.А. О численном решении задач оптимального управления упругими колебаниями / Е. А. Лутковская, В.А. Терлецкий // Труды XV Байкальской международной школы-семинара "Методы оптимизации и их приложения".- Иркутск: РИО ИДСТУ СО РАН, 2011.Т. 3 .- С. 137-142.
Научное издание
Лутковская Екатерина Александровна
ВАРИАЦИОННЫЙ ПРИНЦИП МАКСИМУМА В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ВОЛНОВЫМИ ПРОЦЕССАМИ
Автореферат
Подписано в печать 06.03.12. Формат 60x90 1/16 Усл. печ. л. 1,2. Тираж 100 экз. Заказ 17
Издательство ИГУ 664003, Иркутск, бульвар Гагарина, 36; тел. (3952) 24-14-36
61 12-1/934
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Иркутский государственный университет»
На правах рукописи
Лутковская Екатерина Александровна
ВАРИАЦИОННЫЙ ПРИНЦИП МАКСИМУМА В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ВОЛНОВЫМИ ПРОЦЕССАМИ
01.01.09 - дискретная математика и математическая кибернетика
Диссертация
на соискание ученой степени кандидата физико-математических наук
Научный руководитель кандидат физико-математических наук,
доцент В.А. Терледкий
Иркутск - 2012
Оглавление
Введение 3
1 Обобщенное решение нелинейного волнового уравнения и его свойства 24
1.1 Постановка задачи................................................................24
1.2 Сведение начально-краевой задачи для волнового уравнения к смешанным задачам для гиперболических систем....................................27
1.3 Характеристики..................................................................34
1.4 Интегральный эквивалент инвариантной системы............................36
1.5 Обобщенное решение ............................................................39
1.6 Метод последовательных приближений........................................40
1.7 Свойства обобщенного решения................................................65
2 Условия оптимальности в задаче оптимального управления нелинейными волновыми процессами 70
2.1 Постановка задачи................................................................70
2.2 Эквивалентная задача............................................................73
2.3 Сопряженная задача ............................................................76
2.4 Характеристические вариации и вариационный принцип максимума ... 84
3 Численные методы 119
3.1 Методы вариационного принципа максимума................................120
3.2 Методы конечномерного принципа максимума................................126
3.3 Градиентные методы ............................................................133
3.4 Комбинация методов ..............................137
Введение
Задачи оптимального управления процессами, описываемыми обыкновенными дифференциальными уравнениями, на настоящий момент изучены намного глубже, чем задачи оптимального управления системами с распределенными параметрами. Однако, уравнения в частных производных имеют более интересные практические приложения. Например, для описания поведения сплошной среды (газ, жидкость, твердое тело) в теоретической физике используются различные модели, которые в большинстве случаев приводят к нелинейным дифференциальным уравнениям с частными производными. Ясно, что задачи управления распределенными системами или уравнениями с частными производными гораздо тяжелее с математической точки зрения, чем задачи с обыкновенными дифференциальными уравнениями. Поэтому большинство авторов рассматривают их не в общей постановке, а для конкретных вариантов. Например, ограничиваются только одним типом уравнения в частных производных, частным случаем начально-краевых условий, рассматривают линейные или квазилинейные процессы. В диссертационной работе рассматривается задача оптимального управления нелинейным волновым уравнением с нелинейными граничными условиями, охватывающими одновременно все три типа граничных условий, обычно рассматриваемых для такого уравнения. В правой части
волнового уравнения предполагается нелинейность не только по функции решения, но и по ее первым частным производным по временной и пространственной переменной. Целевой функционал, описывающий качество управляемого процесса, тоже взят в общем виде: с нелинейными функциями в терминальной и интегральной частях. Прикладная значимость работы определяется прежде всего широким спектром приложений. Волновым уравнением описываются процесс колебаний струны, продольные колебания стержней и пружин, крутильные колебания длинных стержней, колебания давления в длинных газопроводах, колебания напряжения и силы тока в электрических проводах, длинные волны цунами и т. д. Причем нелинейность правой части волнового уравнения позволяет охватить существенно большее число приложений. Так, при моделировании колебаний струны, только при дополнительных предположениях о малости амплитуд колебания можно рассматривать линейные уравнения. Явная зависимость правой части от первых частных производных по времени, описывающих скорость смещения, и по пространственной переменной, описывающих упругую силу, также важна. И наконец, включение управляющих воздействий в правую часть волнового уравнения, в граничные условия и в целевой функционал, дает возможность всеми этими процессами управлять. Таким образом, актуальность и новизна диссертационной темы связана как с богатыми возможностями приложений, так и со степенью общности поставленной задачи.
В обзоре в первую очередь остановимся на тех работах, которые наиболее близко примыкают к рассматриваемой теме и позволяют указать место предлагаемого исследования по отношению к имеющимся.
Исследования задач управления одномерными упругими колебаниями начались с работ Бутковского [Бутковский, 1965]. Затем, в начале 70-х годов, с работ Лионса [Lions] и Балакришнана [Балакришнан]. Егоров [Его- . ров, 1986] предложил учитывать волновую природу колебательного процесса при решении задачи гашения колебаний, описываемых волновым уравнением, системой телеграфных уравнений и в задаче управления колебаниями газа в длинном трубопроводе. В работах Ильина проблемы граничной управляемости колебаниями, описываемыми стационарным волновым уравнением (с нулевой правой частью), были детально проработаны с учетом функциональных свойств начального и финального состояния системы, и в явном аналитическом виде получены граничные управления, задающие краевые условия первого рода, которые решают задачу управляемости с минимальными энергозатратами. Исследование только стационарного волнового уравнения, т.е. уравнения с нулевой правой частью, с одной стороны, позволило выписать решение в явном виде, а с другой стороны, существенно сузило круг практического применения решения. С физической точки зрения оно описывает волновой процесс при отсутствии каких-либо внешних воздействий, где управление сосредоточено только на границах.
В работах Знаменской Л.Н. решаются задачи управляемости и наблюдаемости для объектов, процесс колебаний которых описывается волновым уравнением или системой телеграфных уравнений с краевыми условиями первого, второго и третьего рода. Управляемостью называется возможность перевода системы из любого заданного начального состояния в любое желаемое состояние за конечный промежуток времени, выбирая соответ-
ствующим образом управляющее воздействие. Соответственно наблюдаемостью называется возможность восстановления начального состояния системы по некоторой наблюдаемой линейной операции над ее выходом. Методы исследования основаны на априорных оценках классических решений различных типов краевых задач для волнового уравнения, с помощью которых доказываются теоремы существования обобщенных решений в том же классе, что и в работе [Ильин, 1960].
В работах [Потапов, 1996, 1998а,Ь, 2006 а,Ь, 2007а,Ь,с,а, 2009] рассматриваются задачи управления и наблюдения для стационарного волнового уравнения с переменными коэффициентами. Автор строит устойчивый вычислительный алгоритм для отыскания приближенных решений таких уравнений в случае регулярных и нерегулярных управлений. В частности, в работе [Потапов, 2009], этот метод применяется при решении тестовых задач граничного Дирихле-управления для волнового уравнения с постоянными коэффициентами.
Волновое уравнение тесно связано по своей природе с несколько более простым дифференциальным уравнением, в котором старшая производная является смешанной. В этой связи отметим задачи управления системами Гурса-Дарбу:
Хдь = 1{хз, и, е и, (й, г) е п = 5 х т,
ха(з,го) = /^(й,^),«1,«), и1 (в) е С/ь = [во,51], ^(50, ¿) =/2(фо,*),^2,*), и2(*)еЕ/2, Эволюцию идей здесь можно проследить по работам Егорова [Егоров, 1964] (метод приращений, доказательство принципа максимума с сопряженной системой в дифференциальной форме), Плотникова и Сумина [Плотников,
Сумин, 1972] (вопросы существования, единственности и устойчивости решения, общая схема получения принципа максимума, операторная форма представления сопряженной системы), Ахмедова, Ахиева [Ахмедов, Ахи-ев, 1972], Бигуапагауапа [Бигуапагауапа, 1973] (модификация метода приращений, принцип максимума с сопряженной задачей интегрального типа), Васильева [Васильев, 1972, 1976, 1978, 1981] (серия необходимых условий оптимальности особых управлений, методы последовательных приближений). Общим моментом указанных исследований является варьирование распределенного управления £) в окрестности конечного числа точек прямоугольника П = 5 х Т. Таким образом, необходимые условия оптимальности в этих работах получены в виде поточечного или конечномерного условия (принципа) максимума некоторого аналога функции Понтря-гина.
Необходимое условие оптимальности в виде вариационного принципа максимума было впервые получено Срочко [Срочко, 1983] для задач оптимального управления каноническими системами гиперболических уравнений:
00- ^ {^ОС ^ ОС 2 у 5 ^ ;
х\ = и(з,г) е и, (й,£) е П = 5 х т,
х1(в, ¿о) = 9г(и1, з), и1 (в) £ £/ь 565 = [во, йх],
В дальнейшем этот результат был распространен на системы Гурса-Дарбу и полулинейные системы [Васильев, Срочко, Терлецкий; Дыхта; Терлец-
кий, 2005]:
xt + A(s, t)x8 = f(x, u, s, i), «(s, t) EU, (s, t) G П = 5 x T,
x(s, t0) = X°(s), s e S = [s0, Si],
x+(s0,t) - x-(sbi) = t e T = [io.il],
где A(s,i) - диагональная матрица, - решения, соответствующие положительным диагональным элементам матрицы Л(s,t), х~ - решения, соответствующие ее отрицательным диагональным элементам. Вариационный принцип максимума основан на вариациях управления вдоль характеристик того или иного семейства, и он является более сильным условием оптимальности, нежели принцип максимума конечномерный. Дальнейшее развитие теории вариационного принципа максимума связано с усложнением рассматриваемых задач.
При изучении задач оптимального управления, в которых связь между состоянием и управлением задана в дифференциальной форме, классическое понятие решения самих дифференциальных задач существенно ограничено в своем применении. Объясняется это в основном жесткими требованиями к гладкости функций, описывающих дифференциальные уравнения и начально-граничные условия, или, коротко, к входным данным задач. Обременительность жестких предположений на параметры задачи зачастую делает не только неудобным, но и принципиально неприемлемым само понятие классического решения, что и объясняет актуальность определения решения в обобщенном смысле.
Пожалуй, наиболее точно пространство обобщенных решений для волнового уравнения было описано в работе [Ильин, 1960]. Оно представляет собой совокупность функций, непрерывных в замкнутом прямоугольнике
и имеющих обобщенные частные производные первого порядка по времени и пространственной переменной. В более поздних работах академиков Ильина и Мосеева и их учеников, эти результаты были использованы при решении задач оптимального управления упругой силой на концах струны (см., например, [Ильин, Моисеев 2005, 2006 ]) и колебаниями неоднородного стержня (например, [Ильин 2010, 2011]) и др. В работе [Моисеев, Хо-ломеева] изучена задача оптимального граничного управления смещением на одном конце струны при наличии заданного режима силы на другом конце. В работах [Беликов, 2010, 2011] исследуется граничное управление смещением на одном конце неоднородного стержня, имеющего два участка разной плотности и упругости, при закрепленном или свободном втором его конце в случае совпадения времени прохождения волны по каждому из этих участков неоднородности. Дается явный аналитический вид граничного управления смещением, переводящего изначально покоящийся стержень в заданное финальное состояние, характеризующееся заданными финальными смещением и скоростью. В работе [Блошанская, Смирнов] рассматривается краевая задача для волнового уравнения с заданными начальными условиями и с граничными условиями второго рода на одном конце струны и первого рода на другом конце струны.
В работах Ильина, Моисеева и их учеников обобщенное решение строится по Соболеву [БоЬо1еу; Ладыженская], то есть определяется с помощью интегральных тождеств для функций из пространства Соболева.
В диссертации же используется подход к конструированию обобщенного решения, который успешно применялся ранее для аналогичных целей в обыкновенных дифференциальных уравнениях [Коддингтон, Левинсон],
а также в гиперболических системах дифференциальных уравнений первого порядка [Рождественский, Яненко; Терлецкий, 1999]. Он основан на использовании интегрального эквивалента дифференциального уравнения. Построение такого интегрального эквивалента для волновой задачи предполагает сведение исходного волнового уравнения к гиперболической системе четырех дифференциальных уравнений первого порядка, приведение ее к инвариантному виду, и, наконец, интегрирование инвариантной системы методом характеристик. Обобщенное решение определяется как набор функций, включающий решение волнового уравнения и его частные производные по времени и пространственной переменной, который удовлетворяет интегральной системе, эквивалентной исходной задаче на гладких решениях. В рамках описанного подхода оказалось возможным дополнительно к свойствам решения, выявленным Ильиным, обосновать существование следов решения на произвольных кривых в области существования решения, не совпадающих с направлениями характеристик волнового уравнения. Кроме того, удалось доказать абсолютную непрерывность специальных линейных комбинаций первых частных производных решения вдоль характеристик соответствующих семейств. Помимо этого отметим, что в случае построения обобщенного решения по Соболеву, остается открытым вопрос с точечными оценками роста решения относительно входных данных. Однако именно такие оценки требуются для изучения задачи оптимального управления с помощью эффективного и хорошо изученного метода приращений. Предлагаемый в диссертации подход лишен этого недостатка. Методом последовательных приближений устанавливаются не только существование и единственность обобщенного решения, но
и строятся поточечные оценки его роста, причем для произвольных вариантов смешанных условий.
Предварительное сведение исходной начально-краевой задачи для волнового уравнения к соотвествующей гиперболической системе дифференциальных уравнений первого порядка оказалось весьма эффективным и при исследовании задачи оптимального управления. Здесь тоже прослеживается аналогия с обыкновенными дифференциальными уравнениями. Действительно, изучение задач оптимального управления, в которых фазовая траектория подчинена дифференциальным уравнениям с производными порядка выше первого, может осуществляться как непосредственно в терминах этих исходных уравнений, так и с помощью их предварительного сведения к некоторой системе дифференциальных уравнений первого порядка. Второй подход безусловно доминирует, когда речь идет об обыкновенных дифференциальных уравнениях. Уравнение п—го порядка переписывается в форме некоторой системы из п обыкновенных дифференциальных уравнений первого порядка. Главное достоинство данного приема заключается не только и не столько в большей компактности и универсальности последующих выкладок и результатов. Существенно более важным обстоятельством, по-видимому, является простая и симметричная по отношению к управляемой системе запись сопряженной задачи: она также имеет вид системы из п обыкновенных дифференциальных уравнений первого порядка. Напротив, попытка построения сопряженного уравнения в той же форме, что и исходное дифференциальное уравнение п—го порядка, как правило, заканчивается неудачей. Исключением является, пожалуй лишь случай линейных уравнений с независящими от управления коэффициента-
ми. Действительно, соответствующее сопряженное уравнение корректным образом можно записать, вообще говоря, только в форме интегрального уравнения Вольтерра п—го порядка. Понятно, что такая сопряженная задача существенно сложнее дифференциальной и менее удобна при построении как теории, так и численных методов решения задач оптимального управления.
Описанная дилемма имеет место и при изучении задач оптимального управления системами уравнений с частными производными. Разумеется, отмеченные выше проблемы с формой записи сопряженной задачи в них те же самые. Наиболее простым и исторически, по-видимому, первым примером этого служат задачи оптимального управления системой Гурса-Дарбу [Егоров, 1964; Ахмедов, Ахиев; Плотников, Сумин]. Полученная в [Егоров, 1964] сопряженная задача в дифференциальной форме некорректна. Это отмечалось и в [Плотников, Сумин], где она записана уже в интегральной форме.
Поэто