Условия устойчивости, аппроксимация и численное решение задач оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Ишмухаметов, Альберт Зайнутдинович
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1996
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
1Г5 ОД
- ШШй государственный университет
им. м.в.ломоносова факультет вычислительной математики и кибернетики
На правах рукописи
ИШМУХАМЕТОВ АЛЬБЕРТ ЗАЙНУТДИНОВИЧ
УДК 519.6
УСЛОВИЯ УСТОЙЧИВОСТИ, АППРОКСИМАЦИЯ и ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Специальность: 01.01.09 - математическая кибернетика
автореферат диссертации на соискание ученой степени доктора физико-математических наук
Москва 1996
Работа выполнена в Институте высокопроизводительных вычислительных систем РАН.
Официальные оппоненты: доктор физико-математических наук,
профессор В.В. Дикусар
доктор физико-математических наук, профессор A.A. Злотник
доктор физико-математических наук, профессор А.И. Прилепко
Ведущая организация: Институт математики и механики Уральского отделения РАН
Занята состоится " ii " 4О 1ЭЗ£ годз s /{ часов КЗ заседании диссертационного совета Д 053.05.38 при Московском государственном университете им. М.В. Ломоносова (факультет вычислительной математики и кибернетики) по адресу: 11Э899, Москва, ГСП, Ленинский гори, МГУ, факультет ЕМиК, ауд. .
С диссертацией можно ознакомиться в библиотеке факультета ВМиК МГУ.
Автореферат разослан " И " 09 19Э6 г.
Ученый секретарь диссертационного совета, профессор
Н.П. Трифонов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. При моделировании, разработке методов и численном решении прикладных задач оптимального управления, как и в других областях вычислительной математики, возникает проблема выяснения близости двух математических моделей, одна из которых рассматривается как возмущенная по отношения к другой. При этом важно априори знать, является ли рассматриваемая задача устойчивой по отношению к возмущениям и иметь оценки скорости сходимости уклонения решений. Основы теории и методов устойчивости и аппроксимации экстремальных задач заложены в работах Б.М.Будака, Ф.П.Васильева, В.В.Васина, Р.Ф.Габасова, В.В.Дикусэра, А.Дончеза,
A.И.Егорова, Ю.М.Ермольева, В.Г.Карманова, Ф.М.Кирилловой,
B.Б.Колмановского, А.И.Короткого, П.С.Краснощекова, А.В.Кряюмс-кого, Е.С.Левитина, Ж.Л.Лионса, В.И.Максимова, К.Н.Моисеева, Ю.С.Осипова, В.И.Плотникова, А.И.Прилепко, Т.К.Сиразетдинова, А.Н.Тихонова, В.М.Тихомирова, Р.П.Федоренко, В.В.Федорова, Ф.ЛЛерноусько и многих других. По данной тематике опубликованы монографии и большое число научных статей отечественных и зарубежных авторов, например, Ш-И7]*'1 и многие другие.
Большое многообразие задач автоматического управления, оптимального проектирования и управления системами с сосредоточенными и с распределенными параметрами вызывает необходимость в описании и в систематизации классов задач, которые являются устойчивыми по возмущениям, в получении оценок устойчивости, необходимости конструирования устойчивых аппроксимаций для них. Имеющиеся в настоящее время метода исследования устойчивости и аппроксимаций задач оптимального управления, в основном, разрабатывались применительно к системам с сосредоточенными параметрами. Для систем с распределенными параметрами, даже в линейном случае, вопросы устойчивости и аппроксимации исследованы недостаточно. Для численного решения устойчивых задач важно выбрать, сконструировать эффективные методы и аппроксимации, с целью сокращения времени вычислений. Последнее особенно актуально при разработки систем управления с обратной связью и работающих в режиме реального времени.
Здесь используются обозначения: [•] - ссылка на список литературы; {•> - ссылка на список основных работ автора.
Целью работы является разработка методов исследования устойчивости и построение устойчивых аппроксимаций для задач оптимального управления, которые были бы эффективно применимы как в системах с сосредоточенными параметрами, гак и в системах с распределенными параметрами, описать и систематизировать классы устойчивых задач.
Метод исследования использует математический аппарат теории оптимизации, функционального анализа, численных методов решения дифференциальных уравнений с частными производными.
Научная новизна. В диссертация построена схема исследования условий устойчивости и аппроксимаций задач оптимального управления, которая применима для систем с сосредоточенными и распределенными параметрами, при регулярных и сингулярных возмущениях, конечно-разностных и других способов аппроксимаций. Выделены классы задач, которые устойчивы по функционалу, по управлению (в слабой и в сильной норме) и получены оценки скорости сходимости. Основные результаты диссертации.
1. Построен математический аппарат, который позволяет системати-зированно и единообразно исследовать устойчивость разнообразных задач оптимального управления, конструировать устойчивые аппроксимации для них.
2. Для абстрактных задач минимизации в гильбертовых пространствах получены условия сходимости по функционалу, слабой и сильной сходимости по управлению, выведены соответствующие оценки скорости сходимости. При этом используются также возмущения градиентов функционалов и сопряженных операторов для отображений "управление/состояние" системы. Условия устойчивости и оценки по управлению в сильной норме выведены для классов задач:
- с компактными множествами допустимых элементов;
- со строго равномерно выпуклыми функционалами;
- со строго равномерно выпуклыми множествами допустимых элементов;
- с нормально разрешимыми операторами "управление/состояние" системы.
3. На основе обобщенного метода моментов предложены сходящиеся аппроксимации для квадратичных задач, получены оценки скорости сходимости.
4. Описаны классы устойчивых задач для систем со сосредоточенными
параметрами и для гиперболических систем с регулярными, сингулярными и конечно-разностными возмущениями. 5. Проведено математическое моделирование задачи оптимального управления колебанием упругой пластины.
Теоретическая и практическая ценность работы состоит в применимости ее результатов для математического моделирования конкретных систем управления с сосредоточенными и с распределенными параметрами, а также при конструировании аппроксимаций, разработке численных методов и соответствующего программного обеспечения.
Аппробация работы. Результаты диссертации докладывались на следующих семинарах и конференциях:
- кафедры математической физики факультета ВМиК МГУ (рук. проф. Ф.П.Васильев) - январь 1992 г.;
- отдела математических методов моделирования Института проблем кибернетики РАН (рук. проф. Е.А.Гребеников) - январь 1992 г.;
- на международной математической школе в Институте математики им. Банаха (г. Варшава) - март 1992 г.;
- отдела прикладной математики Института проблем кибернетики РАН (рук. проф. В.Г.Карманов) - ноябрь 1992 г.;
- Института математики и механики Уральского отделения РАН (рук. проф. В.В.Васин, проф. А.В.Кряжимский) - февраль 1993 г.;
- на международной математической школе "Понтрягинские чтения - IV" (г. Воронеж) - май 1993 г.;
- Вычислительного Центра РАН (рук. проф. Ю.Г. Евтушенко) - январь 1994 г.;
- кафедры математического анализа механико-математического факультета МГУ (рук. проф. А.И.Прилепко) - март 1994 г.;
- кафедры прикладной математики Московского энергетического института (рук. проф. Ю.А.Дубинский) - май 1994 г.;
- кафедры общих проблем управления механико-математического факуль-• тета МГУ (рук. проф. А.В.Фурсиков) - октябрь 1994 г.;
- Института высокопроизводительных вычислительных систем РАН (рук. академик В.С.Бурцев) - ноябрь 1994 г.;
- кафедры оптимального управления факультета БМиК МГУ (рук. проф. М.С.Никольский) - декабрь 1994 г..
Публикации. По теме диссертации опубликовано 34 работы, в том числе монография (22} и обзорная статья (24). Основные
результаты содержатся в работах СО - £26).
Структура и объем работы. Диссертация состоит из введения, четырех глав, приложения и списка литературы, содержащего 174 наименования. Объем работы - 297 страницы.
СОДЕРЖАНИЕ РАБОТЫ
Во введении дан обзор работ по вопросам устойчивости, аппроксимации задач оптимального управления и кратко изложено содержание диссертации.
Управляемые системы можно описать с помощью отображений G: Н - W, где В - пространство управлений, W - пространство состояний (фазовых траекторий) системы. Элементами а> = Gu € V в конкретных системах являются, например, решения дифференциальных уравнений, их производите или значения в конечный момент времени. Задачи автоматического управления, оптимального проектирования, математического программирования можно формулировать как задачи минимизации некоторого функционала качества Ф, зависящего от состояния системы vi = Gu и от управления и из некоторого множества допустимых управлений U:
J(u) = Ф{Си,и) - Inf, и € U s Н. (1)
Решением задачи (1) является минимальное значение функционала
J* = int J(u) иф
и множество оптимальных элементов, на которых достигается нижняя грань функционала
U* = |it € U: J(u) = J* j-.
Возмущенные задачи можно представить в виде последовательности аналогичных задач минимизации
JW(U) = Ф^и.и) - Inf, u € UN с ня, N=1,2,..., (2)
где UH - приближенные множества из аппроксимирующего пространства
Нн; G[f: HN - 17^ - приближенные отображения. Параметр ¡V определяет
возмущения, связанные с приближенностью или аппроксимацией модели и исходных данных задачи. Эти возмущения могут быть вызваны неточностью информации о коэффициентах уравнений, малостью некоторых параметров в уравнениях, аппроксимацией уравнений и функций, задающих множество допустимых управлений.
Проблема устойчивости и аппроксимации заключается в исследовании предельного перехода при N - <» решений задач (2) к решениям задачи (1). А именно: близость приближенных решений задач (2), т.е. последовательности и* е ип, N=1,2,... (приближенные оптимальные элементы) такой, что
- « < Ш ^(и) = 4 < ^(ир $ ^ н- еы, - О, N - 00,
к решениям задачи (1) по функционалу
- ,7*. ^ - N - со; (3)
и по аргументу
и* - и*, N « (4)
(ТИП И СМЫСЛ СХОДИМОСТИ в (4) нжэ уточняется).
В прикладных задачах элементы пространств Ни могут быть как внутренними аппроксимациями элементов из Н (Я^ £ Я), так и внешними (Яя ф Я). В связи с этим возникает необходимость введения
понятия близости элементов е Н;[, N=1,2,... к и е Я, ко множеству (I я Н ж близости множеств и}Г N=1,2,... к и. В теории приближенных решений дифференциальных, интегральных уравнений, задач математического программирования и оптимального управления эти вопросы решаются с помощью введения "связывающих" операторов дискретизации Я - Я^ или продолжения рк: Ны - Я, N=1,2,...
(И ],Г2],[4Ы6]Д8] и др.).
В главе 1 данной работы развивается и исследуется математический аппарат, связанный с этими вопросами. Рассматриваются два определения сходимости. Первое определение связано с линейными ограниченными операторами дискретизации: Я - Нн, N=1,2.....
Определен и е 1. Элемента и^ е Я^, гг=1,2,... сходятся к и е Я сильно, если
N ' ЗА ~ 0. N - со и слабо, если - <и,и>0, N - со, для любых и £ Я, е Я^,
N=1,2,... таких, что ví¡ - v, N - <» сильно.
Второе определение связано с линейными ограниченными операторами продолжения: р : Ям - Я, N=1,2.....
Определение 2. Элементы ин € Я , N=1,2,... сходятся к и € Я сильно, если
IРцин ' и1о* - 00 и слабо, если <ри"у.к>0 - <и,у>0, У - со, V и € И.
Ниже пространства Н, й\ Н , 17Н, N=1,2,... считаются гильбертовыми . Скалярные произведения и нормы в них обозначаются, соответственно, через <-,о0, <->->(0}. <-'->н> <•••>&) и I" 10 -
'■'сог '''л' .....Нормы операторов обозначаются че-
рез |.|.
Понятия сходимости, в смысле определений 1 или 2 в общем случае различны, однако при выполнении некоторых условий они совпадают. В § 1.1 главы 1 показывается, что при выполнении аксиом:
1°. зир |р | < о; n "
2°. - и\0 - О, № - », V и € Я;
3°. и = ЧяР1ги, V и € Ня, N=1,2,...; 4°. |рАи - и|0 - О, N - со, V и 6 И.
определения 1 и 2 эквивалентны. В этом случае будем говорить просто о сильной или слабой сходимости элементов ин е Ия, N=1,2,... к элементу ц. е Н. Так как
1<?Хи ~ и\0 = таг | »> - <и,и> \ , V и € Я,
то аксиома 2° означает сходимость скалярных произведений равномерно по одной переменной и поточечно по другой. Примерами операторов ри, дя являются:
- в случае внутренних аппроксимаций, рн - тождественные операторы, дя - операторы проектирования на подпространства Н}{;
- в случае внешних аппроксимаций и конкретных пространств: Н = Щ,
Н!{ = или Я = Е1п, Нн = н'пЯ {Щ, н'п - Лебегово и Соболевское
пространства), операторами ря, q¡¡ могут быть, соответственно,
операторы кусочно-постоянного или кусочно-линейного продолжения, интегральной или точечной дискретизации.
В § 1.2 в пространствах состояний систем (7Я, N=1,2,...
вводятся "связывающие" операторы продолжения к дискретизации ря' й^ - иг, ;У - й^, N=1.2,..., удовлетворяющие тем же условиям 1° - 4°, и понятия сходимости,' аналогичные определениям 1,2. Это позволяет определить понятие сходимости отображений <3^ ~ й,
N -* СО.
Определение 3. Отображения С^: Яя - РГ , 1,2,... сильно (слабо) {слабо-сильно} сходятся к отображению С: Я - >У, если для любых - и, К - <» сильно (слабо) (слабо) сходящихся образы -Си, ¿V - со сильно (слабо) (сильно) сходятся.
В прикладных задачах, в случае линейности отображений, при выводе оценок могут использоваться различные типы, более сильной (операторной) сходимости, а именно: сходимость к нулю норм
ШАн ~ - ^ I ■ ~ ЪР\. \% -
В данном параграфе доказывается, что сходимость к нулю первой из этих норм является самой сильной, из нее следует сходимость к нулю второй и третьей нормы, а последняя является самой слабой. Причем показывается, что других импликаций между этими сходимостями нет. Наряду со сходимостями операторов С^, N=1,2,... к (? рассматриваются аналогичные операторные сходимости сопряженных операторов й* С, N - со. Устанавливается связь между различными сходимостями исходных и сопряженных операторов.
В последующих §§ 1.3 - 1.5 главы 1, введенные абстрактные понятия сходимости элементов и отображений конкретизируются и уточняются для систем дифференциальных уравнений с регулярными (5 1.3), с конечно-разностными (§ 1.3) и с сингулярными (§ 1.5) возмущениями. В главе 3 эти конструкции используются при исследовании устойчивости задач оптимального управления этими системами.
В § 1.3 для системы
х = /(г,ц,1), ^ £ < Т, х{г0) = х°, и € Я (5)
рассматриваются регулярные возмущения
х = /я{х,и,г), г0 ^ г < т, ха0) = х°я, и е ня. N=1,2..... (6)
где х°, х° из и - управление. Для (5),(6) в зависимости от за-
дания целевых функционалов указываются соответствующие пространства и отображения (7, N=1,2.....Б случае, когда-функционал зависит от конечного значения и от всей траектории
Ли) = Ф{х(Т),х{-),и), (7;
«Ту (и) = Фк{х{Т),х{-),и). N=1,2,..., (8;
полагаются
Ои=(х(Т;и),х(-;и)} € V, и е Н, • ;и)) € Й^, и €
= IV = N=1,2,..*.
В системах (5),(6) в качестве пространств И, Н}Т могут быть, в
частности, пространства Ег или
В данном параграфе описываются условия, при которых для этих отображений имеет место слабая, сильная и слабо-сильная сходимости. Если системы (5),(6) линейны, то
Си = ёи + и € Н, О^и = + и е Нц, N=1,2.....
где 0, - линейные ограниченные операторы, в £ Я, 8Я £ <?1Г
Для операторов 6, бу и сопряженных к ним 6", 6* выводятся условия
и оценки операторной сходимости.
В § 1.4 рассматривается система (5) с конечно-разностными возмущениями, получаемой с помощью явной схемы Эйлера
х^1) = /„(хШ.и.П, х(0) = х°, 1=0,1.....Я-1. и € (9
где хг(1) = ДГ^ {х(Ы)-хЩ), Д^ = - гг 1= 0,1.....N-1,
t < t1 < ... < < tN = Т ~ узловые точки разбиения отрезка
х(-) = (х(0),...,х(Ю). Здесь для функционалов, аналогичных (8), пространства УУ^ и операторы Ск имеют вид:
= ЕМ^СММ), = (х(К;и),х(-;и)), и е ня.
В пространствах Щао,Т), ) в качестве операторов дн и
можно использовать, соответственно, интегральные дискретизации и кусочно-постоянные продолжения. В конечно-разностной системе (9) в качестве пространств Н.. могут быть, в частности, пространс-
тва £Г или 1^(0,N-1). Для отображений О, N=1,2,... доказывается слабая, сильная и слабо-силькая сходимость. В случае линейности систем (5) и (9) для операторов д, &я и сопряженных к ним 6* б*, как и при регулярных возмущениях, выводятся условия и
оценки операторной сходимости.
В § 1.5 рассматривается линейная система обыкновенных дифференциальных уравнений с сингулярными возмущениями. Для малого параметра (3^ > О, рд. - О, N ~ оо система имеет вид
х = + 4(г)У + + = (,0)
р^у = + 4(г)у + в*(Пи + ^(п, уц0) = у£, и 6 V
Для нее предельной является система, дифференциальная по медленным переменным х и функциональная по быстрым переменным у
х = + А2а)у + В1^)и + я' >. г(^) = (11)
о = л3а)х + л4{г)у + вга)и + и «
В случае, когда функционал зависит от конечного значения, от всей траектории медленной и быстрой переменной
Ли) = Ф(х(Т),х(-),у{-),и), (12)
«уи) = Фм{х(Т),х(-).у('),и), N=1,2,..., (13)
полагаются
би = (х(Г;и),л:(.;и),у(-;и)) € № = £n*H1n(t0,T)^^L™(t0,T), и е Я,
СдЦ = (х(Г;и),г(.;и).у(.;и>) € ^ = ,Т), и €
В данном параграфе приводятся условия когда для этих отображений
и сопряженных операторов 6*, С*, N=1,2,... имеют место сильные и
слабые сходимости. Доказаны оценки сильной сходимости. Так, в частности,
" Си\(0> 4 СК + % + IРА " "Iо + + Ау] •
где величины
= \4 ~ 4'¡2 + 14 ~ + '4 - а2\* +
+ |4 - л4\а + - в'рхУ1 + - д2р ,,
= lejr - в' i2 +■ ¡4 - e2^ + l3» - s°l •
Относительно малого параметра эта оценка имеет порядок Установлена ее неулучшаемость по порядку. В отличие от регулярных и конечно-разностных возмущений, при сингулярных возмущениях сходимость 6 , N=1,2,... к G в операторной норме, в общем случае, отсутствует.
Глава 2 является основной в данной работе. В ней для абстрактных задач (1) и (2) в гильбертовых пространствах доказаны теоремы существования решений, условия сходимости по функционалу (3) слабой и сильной сходимости по управлению (4), выведены оценки скорости сходимости по функционалу и сильной сходимости по управлению.
В § 2.1, используя результаты главы 1, вводятся различные условия близости множеств UN, N=1,2,... к U, типы сходамостей
функционалов Ф^, N=1,2,... к Ф и градиентов Ф^, N=1,2,... к Ф'.
В § 2.2 рассматриваются свойства близости для строго равномерно выпуклых множеств
U = | u е Н: <р4(и) « О, i~1,2,.. .1 }, (14)
UN = { и € И/. ф^(и) ^ О, {=7,2,...I N=1,2,..., (15)
где <р1(и) и (pff(u), (=1,2, —l - строго равномерно выпуклые, дифференцируемые функционалы, соответственно, в Н и в
Далее, в последующих §5 2.3 - 2.5 дается описание условий,
гарантирующих J* >-<*>, U* * 0, устойчивость задач (1),(2) по функционалу снизу ( § 2.3 )
ТШ J* < ГШ J„{u*) ^ J*; Н-ко К-*» л д
сверху ( § 2.4 )
lim J„{u*) > lim J* Z J\
сходимость по функционалу (3) и по управлению (4) в слабой норме ( § 2.5 ). Приведем одну из таких теорем, которая получена объединением условий теорем сходимости по функционалу снизу (три условия теоремы) и сверху (три предположения теоремы).
Теорема 1. Пусть в задачах (1) и (2) выполняются следующие условия:
- - (?, N - со слабо (сильно) [слабо-сильно];
- существует минимизирующая в задаче (1) последовательность ик е II, к=1,2,..., т.е. оо, такая, что р^^.и^) - о,
¿V - оо, к=1,2,... слабо (сильно) [слабо];
- Фя - Ф, снизу слабо (сильно) [сильно] по ц>, слабо (сильно)
[слабо! по и. А также хотя бы одно из следующих предположений.
I. - 0, N - оо слабо (слабо-сильно); существует ограниченная
и* € N=1,2,...: р(р^и*;£7) - О, ЛГ - со слабо; - <£, Я - со
сверху слабо (сильно) по т, слабо по и.
II. в слабо Сслабо-сильно) непрерывно; - С, N - оо слабо
Сслабо-дильно}; существует ограниченная и* е ия, N=1,2,...: р(рми*;У) - О, ЛГ - оо слабо; Ф^ ^ Ф, N - оо сверху равномерно
слабо (сильно) по ш, слабо по и.
III. Сд. - б, ЯГ - оо равномерно сильно; существует ограниченная
и* € ин, N=1,2,...: р(рми*;[/) -О, N - со сильно; Фя ~ Ф, N - оо
сверху равномерно сильно по (ш,и). Тогда имеет место сходимость по функционалу (3). Причем, если выполнено
- предположение I, то «Г* > - » и и* ^ 0, для ограниченной и* е и*,
N=1,2,...: рфуи^-.и) ~ О, ¿V - со слабо, имеет место (4) в слабой норме;
- предположение II и У слабо замкнуто, то /*>-<» и и* ф 0, для ограниченной и* е £/*, N=1,2,..., удовлетворящей р(р^и*;У) - О,
' N - оо слабо имеет место (4) в слабой норме;
- предположение III, О слабо (слабо-сильно) непрерывно, (/ слабо замкнуто и функционал Ф(ш,п) полунепрерывен снизу слабо (сильно) по ш, слабо по и, то «Г* > - <» и и* ^ 0; для ограниченной и* € N=1,2,..., удовлетворяющей р(рыи'г;11) - 0, № - оо сильно, имеет место (4) в слабой норме.
Здесь и далее используются следующие обозначения и терминология :
- "p(qNu;UN) - О, N - со слабо (сильно)", если для этого ti ( !/ существуют vN е UH, N=1,2,...: vN - q^u -» О, N - оо слабо (сильно);
- "p(p};uN;U) -»О, ff - и слабо (сильно)", если существуют vH е U, N=1,2vN - Pjju - О, N ~ со слабо (сильно);
- "р(р u^i/) - О, ff - оо слабо", если всякий слабо предельный элемент к последовательности uN £ N=1,2,... содерзкится в U.
Для функционалов сходимость Ф^, N=1,2,... к Ф слабо (сильно) по V), слабо (сильно) то и означает, что
lim. [ф (u/N,uN) - Ф(а>,и)] = О,
ГС-*со
для всех wN е И^, а» € uN € UN, и'е U": ws - w, N - со слабо (сильно), uM - и, ff - от слабо (сильно). Для сходимостей снизу, сверху выполняются, соответственно, неравенства
Ш [ф„(ш„,и„) - Ф(и>,и)1 $ О, lim [ф„(тп,и„) - Ф(ю,и)1 Z 0.
н^о я-«»
В §§ 2.3 - 2.5 также доказаны теоремы, аналогичные теореме 1, при различных других предположениях: дифференцируемости, выпуклости, вогнутости функционалов и др., причем в случае дифференцируемых функционалов условия аппроксимации формулируются в терминах близости градиентов Ф^ - Фу, N - со. Эти теоремы применимы для
широкого класса задач оптимального управления системами как с сосредоточенными, так и распределенными параметрами. Отметим, что условия сходимости по функционалу работ И],[2М1П близки к третьему условию и условию равномерной сходимости Фн -» Ф, ff - <» в
предположении III теоремы 1, а условия работы [6] близки к третьему условию и условию сходимости сверху Ф^ - Ф, ff - оо в предположении I.
Оценки скорости сходимости по функционалу исследуются в § 2.6. Они выводятся при выполнении двух типов предположений:
- операторной сходимости G - G, ff - со и условии Липшица
\Ф(ю,и) - фя(т,и) | < С<|5 - РдЛ»\(0) + |u - piVu|0 + 9у); (1в) - выпуклости и дифференцируемости функционалов J(u), JN(u), N=1,2,...; сильной сходимости операторов 6W - G, G*f - G", ¿V - ю; условии (16) и условии Липшица для градиентов |<Г(ю,й) - PÄ(®.")|f0J + ü) - p^tt(».u)|0 * (17)
$ С(|ш - р^\(0) + \й - рни\0 + §к).
Теорема 2. Пусть в задачах (1) и (2) отображения G, Gn, N=1,2,... аффинны; U, U}J, N=¡,2,... равномерно ограниченные
множества; функционалы Ф, Фя, N=1,2,... такие, что выполняются
неравенства (16). Тогда справедлива следующая оценка
- J'l + IJ/u*; - «ГИЛpji*) - « C(9W +■ \pNGH - GpH\ +
+ + p<pA;U} + 1РЛ ~ s\(0)+ - J'+ sw)'
где о € U, k=1,2,... - минимизирующая последовательность в задаче (1).
Теорема 3. Пусть в задачах (1) и (2) отображения G, Gn> N=1,2,... аффинны; множество U замкнуто, выпукло, U, U}J,
N=1,2,... равномерно ограничены; функционалы Ф, Ф[Г N=1,2,... выпуклы, дифференцируемы по (ти,и) и удовлетворяют (16) и (17). Тогда Ü* ф 0 и справедлива оценка
Kr <H+IVUP - J*l < C(V V + lPÄ~ s\(0f s)'
где u* e U* и величины
гм(и\ир = pfu*;p}pN) + + - Ш'(и*л0
+ |U*- P^u'lo + K^&T + | (Pjpu4u - G)ti*l(or
Теорема 2 использует операторную сходимость и не требует выпуклость функционала, она применима к системам с сосредоточенными параметрами и к системам с распределенными параметрами, причем в последнем случае при дополнительных предположениях на гладкость допустимых управлений. Теорема 3 требует выпуклость функционала,
только сильную сходимость операторов G[r и сопряженных к ним; она может быть использована в системах с распределенными параметрами без дополнительных предположений на гладкость допустимых управлений управлений и в системах с сингулярными возмущениями. Отметим, что в отличие от оценки теоремы 3, которая является новой, оценки теоремы 2 выводились в работах [5],[9] для конкретных систем с сосредоточенными параметрами.
Вопросы сильной сходимости последовательности приближенных
оптимальных элементов и* е UN, N=1,2,... ко множеству U*, а также
оценки скорости сходимости рассмотрены в §§ 2.7, 2.8. В § 2.7 на основе результатов §§ 2.2-2.6 формулируются утверждения о сильной сходимости в задачах (1) и (2) для трех классов задач:
- множество допустимых элементов U компактно;
- функционал J(u) строго равномерно выпуклый;
- множество U является строго равномерно выпуклым и множество оптимальных элементов содержится на ее границе
U* с dU. (18)
Так для второго и третьего классов задач доказаны следующие два утверждения.
Теорема 4. Пусть в задачах (1) и (2) U выпукло, замкнуто, U, 17я, N=1,2,... равномерно ограничены, G, GN, N=1,2,...
аффинны; Ф, ФN, N=1,2,... дифференцируемы, выпуклы по (ш,и), удовлетворяют (16),(17); J, Jw(u) N=1,2,... сильно выпуклы, причем константы сильной выпуклости удовлетворяют условию
inf р. > О. (19)
N "
Тогда наряду с оценкой из теоремы 3 имеет место следующая оценка скорости сходимости к единственному оптимальному элементу и"
| pNu; -и* |§ < + + rN(u';up + eN + - g\(0)].
Теорема 5. Пусть в задачах (1),(14) и (2), (15) выполняется (18), Gw - G, N ~ со сильно (слабо); d> - Ф, N - « снизу
сильно (слабо) по (w,u), а также хотя бы одно из следующих предположений :
- GN - G, N - со слабо (слабо-сильно) и Ф - Ф, N - <ю сверху слабо
(сильно) по и>, слабо по и;
- G слабо (слабо-сильно) непрерывно, GY - G, N - со слабо (слабо-сильно) я Ф ~ ф, N - оо сверху равномерно слабо (сильно) по w, слабо по и;
- G слабо (слабо-сильно) непрерывно, Ф полунепрерывен снизу слабо (сильно) по ш, слабо по и; Gn - G, N - « равномерно сильно и Фн - Ф, N - со сверху равномерно сильно по (ш.и).
Тогда J* > - оо, имеет место сходимость по функционалу (3), U* ¿ 0
и для произвольной и* € Уд, N=1,2,... имеет место (4) в сильной норме.
Условие (18) выполняется, например, в задачах с линейными, вогнутыми функционалами и в задачах с квадратичными функционалами, в которых множество глобальных оптимальных элементов пусто или оно не содержится во внутренности множества (14)
¿7* П int U = 0. (20)
Далее, в § 2.8 рассматриваются аффинные системы G: Н - /У, при
нормальной разрешимости оператора G. Условия компактности множества U и строгой равномерной выпуклости функционала J(u) заменяются,
соответственно, на условия компактности оператора G и строгой разномерной выпуклости функционала Ф(ю,и) по переменной tu. Соответствующее утверждение в сильно выпуклом случае имеет вид.
Теорема 6. Пусть в задачах 11),(14) и (2),(15) функционал Ф = Ф(ш) дифференцируем и Ф, <р, (р^, 1=1,2,... Л, N=1,2,...
сильно выпуклы, отображения G, GN, N=1,2,... аффинны, G нормально
разрешим, функционалы Ф, Фя, N=1,2,... удовлетворяют условию (16). Тогда справедлива оценка
р2<Pwt£;Cr)+|J£ - ~ + - J*\ < C[9jv + eN +
+ »Р?Лг + IPA " 81 (0)+ К" ló/2+ ) • u* € Г,
где величиш o^., N=1,2,.., определяются из предположения близости
mas зир - ф'сиЛ = о О, N - <*>.
i vtuu ид Л
В § 2.9 рассматривается обобщенный метод моментов. В этом методе задача минимизации квадратичного функционала
J{u) = IGu - g\z(0) - Inf, и € и = Н (21:
и возмущенная к ней
J„(u) = \Gji - g„ - inf, И?,, s ff,r
ii ti к ÜW i' i«
преобразуются, соответственно, к следующим рядам 00 ?
= EJ<u,<pfe> - 8к\ - in/, iieff,
СО
JN(u) = £ |<u,qj£> - g£|2 - inf, и € UN, N=1,2,..., t
где последовательности <pk = ф^ = g = <g,efc>,
g^ = <g1J,e^>N, h=1,2,..., системы ек и k=1,2,... - ортонорми-
рованные базисы пространств W и WN..
Задача (21) является более общей, чем задача точного перевода системы из одного заданного начального состояния в другое заданное конечное. Исследование задач точного перевода с помощью разработанного H.H. Красовским метода моментов проводилось в работах (3],[10J,[16] и в других. Для аппроксимирующих задач
«уи) = 2 |<м£> - g£l2 - inf, и. € üs, N=1,2,... (22 k= 1
можно провести достаточно полное исследование сходимости по функционалу, управлении и вывести оценки скорости сходимости, а в случае множеств
[Г={и € Я: |и|0 « я}, yN={u 6 Н^: |u|ff ^ Я^}, RN R, N - <п (23
получить эффективный численный метод решения 122). В частности, при ср£ = cpfe, g^ = gk, к = 1,2,... справедливо утверждение.
Теорема7. Пусть в задачах (21) и (22) U замкнутое выпуклое ограниченное множество, а [7 , N=1,2,... равномерно ограничены. Тогда имеет место сходимость по функционалу (3), множество U* £ 0 и для всякой последовательности приближенных оптималь-
о + а/~ +
ных элементов и* € II справедливо (4) в слабой норме. Причем справедлива следующая оценка скорости сходимости по функционалу и; - .г\±ин(и;) - <Г| < с[\ряЧ^ - и*|0 + ая + +
+ р{и;-,я>Х) + ( 2 <и\<у'>п)'/г + ( 2 \8,\г)1/г 1, и* <£ и\
¿=N+1 }
В случае множеств (14) и (15) эта оценка принимает вид ~ Г| + |<уир - $ С[|рлдми* - и*|
+ (2 <и',<р>р'/2 + ( 2 1в,1г>,/2 + е ),
если кроме того, выполнено (20), то для и* € {Г , N=1,2,... сходимость в (4) выполняется в сильной норме.
В главе 3 результаты глав 1 и 2 применяются к задаче оптимального управления для систем обыкновенных дифференциальных уравнений (5),(7) с регулярными (6),(8), с конечно-разностными (8), (9) и с сингулярными возмущениями (10)-(13). При этом используются свойства, которые получены для них в §§ 1.3 - 1.5. Для регулярных и конечно-разностных возмущений существенным является компактность невозмущенного отображения, слабо-сильная сходимость возмущенных отображений, а в случае линейных систем операторная сходимость. Эти свойства имеют место и в регулярном и в конечно-разностном случаях. Поэтому условия устойчивости и аппроксимации у них близки. Эти возмущения рассматриваются совместно в § 3.1. Отметим следующее утверждение этого параграфа.
Теорема 8. Пусть в задачах (5), (7), (14) и (8),(9), (15) выполнены условия
/(!(.),«,.) € х(-) € Спа0,Т], и € Я;
х(-) = х(-;и) е И1 а0,Т), и € Я; вир вир |х(-;и)|ш < со,
я
где с Нм - равномерно ограниченные мнетестзз;
- х°, N - со;
р№Г1У(ггг(-),ич, •) - и, •), ¿V - со сильно (слабо) в ¿з-
для и^ - и, ¿V ~ оз сильно (слабо) в Я и р^Ху х, N ~ т равномерно на «Рд. ~ Ф, ¡V - оо в по слабо в Я по и.
Тогда J" > - со, имеет место сходимость по функционалу (3), и* * 0,
ттпа лг\ли'5Т5ЛП1илЛ гглл паттпоо'паттг.гтг'гптдг гттдг"? гггггуацггичл оттттло гтх.ихг'У"
ментов и* € и имеет место слабая, а если выполнено условие (18),
сильная сходимость в (4).
Здесь рн - соответственно, кусочно-постоянные и кусочно-
линейные продолжения, а Ы ^ - норма в нУ^. В случае линейных
систем и при Ф = Ф(х{Т)) сильная сходимость в данном утверждении имеет место и без условия (18). Аналогичное утверждение справед- -ливо и для регулярных возмущений. Отметим, что здесь в дополнение к результатам работ [11,(2],СП] доказана сильная сходимость по управлению, а также получена оценка скорости сходимости по управлению.
В § 3.2 рассматриваются задачи оптимального управления для линейных систем с сингулярными возмущениями (10)-(13). В этих задачах операторы продолжения ря и дискретизации равны тождественным, оператор (3, в общем случае, не компактен и не является нормально разрешимым, также нет операторной сходимости - С,
N - со, так как у быстрых переменных в невозмущенной задаче отсутствует компактность ("запас гладкости"). Поэтому для этих задач применимы только утверждения главы 2, использующие сильную, слабую сходимости операторов д[Г N=1,2,... к О в норме Я^»!" и схо~ дамость сопряженных операторов б*, N=1,2,... к 5*. В связи с этим,
условия для аппроксимации и устойчивости в системах с сингулярными возмущениями носят, естественно, более жесткий характер по сравнению с регулярными и конечно-разностными возмущениями. Отметим следующую оценку скорости сходимости по функционалу, полученную в данном параграфе.
Теорема 9. Пусть в задаче (10)—(13) и замкнуто и выпукло, (I, и{Г N=1,2,... равномерно ограничены, Ф, Ф>1{, N=1,2,...
выпуклы и дифференцируемы по (г,х,у,и) и удовлетворяют (16),(17). Кроме того элементы матриц
(А4а)г,,сА4а)Г!А-3т,(А4а)Г'Агта),(А4а)Г,82а) « н' (2.4)
и существуют и* € и' такие, что
(Л4а))~1 (В2и')а),Ф'у(2(и'),х(-;и.'),у(--,и"),и') а Н1п(10,Т). (25) Тогда справедлива оценка
I*7» " «П + " <
■ = ея + ея + + + + рГи'.-р^ + рГи£; д^; +
Если кроме того с/, .Г (и), N=1,2,... сильно выпуклы, причем выполнено (19), то для единственного оптимального элемента и' 1РЛ-и*1о
Сильная сходимость по управлению имеет место также для задач на множествах (14),(15) при условии (18). Отметим, что оценки скорости сходимости порядка по функционалу при некоторых других, более жестких, условиях на исходные'данные задач получены в [9].
Устойчивость и аппроксимация различных задач оптимального управления для систем с распределенными параметрами рассматривались в работах Ф.П.Васильева, А.И.Егорова, А.И.Короткого, М.А.Ку-ржанского, О.А.Кузенкова, А.В.Разгулина, Ф.В.Лубышева, Ж.Л.Лион-са, М.М.Потапова, М.Р.Рахимова, Т.К.Сиразетдинова, В.М.Плотникова, Т.К.Тагиева, М.И.Сумина, В.И.Сумина, Т.Ю.Шамеевой, А.Д.Юрия и многих других. Общие результаты главы 2 особенно эффективны при применении к исследованию различных конкретных систем с распределенными параметрами и они упрощают их исследование. В главе 4 эти результаты применяются к гиперболическим системам, которые описывают различные процессы колебаний, например, колебания струн, стержней, мембран, пластин и т.п.. Многие задачи оптимального управления для них можно рассматривать как задачи минимизации функционала
Ли) = Ф(ш{Т)Ж (Г),шЫЖМ,и) (26)
на решениях задачи Коши для дифференциально-операторного уравнения второго порядка
+ в(t)w• + Л(Пш + си)ш = /({), г0 $ г И Т, (27) и>и0) = <р°, = <р', (28)
с управляющим воздействием
f(t)=(Fu)(î) + fit), t0 «ç t ¡S T, v. z U с H, (29)
где F - оператор, действующий из пространства убавлений И з £-,(t0,T;¡v°). Предполагается, что выполнено предположение 1:
- операторы Alt), t í Ct0,TJ самосопряжекны з с независящими от t плотной областью определения DC.4) и таковы, что
oKt)iMJ>0< ^ v е DU)', С = const > 0;
- операторы B(t), C(t) заданы на DU'/2¡ и удовлетворяют условиям
B(t)A~'/2(t), C(t)A~'/2(t) € A(fJ;ïï°); - <B(t)v,v>0t < V e D(B(t)), С = const > 0;
- <B(t)v,A(t)v>0tr < у € DU), С = C0Ti3t > 0.
Здесь <'1,>0ж. I~ соответственно, скалярное произведение и
норма в гильбертовом пространстве ïï°.
В данной главе для системы (26)-(29) рассматриваются возмущения в одном пространстве с исходной задачей, а именно: с регулярными (5 4.2) и с сингулярными возмущениями (§ 4.4), а также с возмущениями, получаемые конечно-разностным методом и методом прямых (§ 4.3). Рассматриваются также применения к конкретным краевым системам второго и четвертого порядков, з которых управляющее воздействие (29) может быть распределенным, зависящем только от времени или только от пространственных переменных. В § 4.5 обобщенный метод моментов применяется к задаче с граничным управлением колебаниями струны.
В § 4.1 для задачи оптимального управления (2В)-(29), описываются соответствующие функциональные пространства, приводятся теоремы существования и единственности решений уравнений. Для применения результатов главы 2 вводится отображение
G: H - V = w'*W°*lz{t0,T;W1)*L2(t0,T;W°),
Gu = (ш(Г;и),!У' (T;u),ш(• ;u)Ж (su)), где w(-) - решение (27)-(29), a ïï1 - пространство со скалярным произведением
«Р.в>,, = <A,/2(t0)ip,A1/2{t0)g>0t.
Тогда, представляя задачу (26)-(29) в виде задачи (1), выводятся градиент функционала J'(u) и сопряженный оператор О*.
Для задач с функционалами, зависящими только от конечного состояния траектории
j"(u) = <í(w(T),tv' (T)) ~ tnf, и a и s н (за;
отображение G имеет вил
G: H - И = > v'i'tV0, Си = (v(T;u.) ,'■!>'(.?•,и)). Для также задач можно выделить случаи, когда оператор G является нормально разрешимым. Для этого достаточно исследовать системы
Фй = где ek, k=i,2,... - ортокормирозакный Оазис з ¡7, на существование подсистемы, являющейся Оазисом Рисса. При
3{t)w = b(t)w, (si )
где b(t) - скалярные функции, эти системы следующие:
%,t = F*Pb,f Ы0'и ..........(32>
ГД9 Рк,о = К'%.о * '0<-T)h,f Pfe.i = 3 h,с h,, -
решения сопряженного урззкения
ф' ' - (В*(t)ф)' + ЖПф н- С"(ПФ = /(i), t0 < t « (33)
ф(Т) = ф°, ф'СГ) = ф', (.34)
при / г о и, соответственно, <р° = Х~г/ггк, ф' = 0; ф0 = 0, фг =
zh, к=1,2.....Здесь величины Xk и элементы zfe ç W3, ft =1,2,... -
последовательности, соответственно, собственных значений и собственных функций оператора A(tQ). При распределенном управлении (Н =
LP{t0,T\W°)), тождественности оператора F система (32) является
базисом Рисса в замыкании своей линейной оболочки. Более того в случае (31), если оператор F нормально разрешим, то оператор G также нормально разрешимым.
В данном параграфе ставится также задача оптимального управления для уравнения колебаний струны с управлением на границе:
p(x)wtt(x,t) - la(x)wjx,t))s = f(x,t), (x,î) e (0,1)>(0,:П; (35) wJO.t) = u(t), w(l,t) = 0, t 6 (0,24; (38)
w(x,0) = ф°(х), ш4(х,0) = фг(аг), li (О,П. (37)
В ней отображением G является G: И = L2(t0,T) - ¡7 = H' (0,l)*L2(0,l), Gu = (ш( • ,Г) ( • ,Г) ), где w(x,t) - решение (35)—(3*7)_ Из результатов работы (23) следует, что оператор G для данной задачи нормально разрешим. В § 4.2 вводятся возмущенные семейства задач Коши ш" * BN(t) W .у t)w +• CN(t)w = fN(t), t0$ t (38)
w(t0) = <pO, »'(t0) = (33)
jyt) = (Fnu)(t) + :°(t), t0 $ Î ^ T, u € UN С Hs. N=1,2..... (40)
где линейные ограниченные операторы действуют из пространств Я в L2(t0.F;Jf°); функции ш = u>N(t), /£(£). f € (¿о'2^ имеют значения
в пространстве ïï°. Здесь для линейных операторов ^N(t), 3N(t), Cw(t), t ç Сf] выполняются условия предположения 1, причем неравенства равномерно по If. На решениях (38)-(40) рассматриваются семейства задач
JN{и) = ^(ш(Г).ш,(Г),ш(.),ш,(-),и(-)) - in/, ueUNcHN. (41) Используя условия близости коэффициентов и начальных данных
= №ZTjBw(i)-S(i)|| -I- mzrlAlf(t)-A(t)l + mrj(yt)-C(t)| - О,
l<Pj}-<P°l,. + "О, N- со,
доказываются теоремы о слабой, сильной и операторной сходимости Sj-G, N ~ <а.
Сходимость по функционалу и слабая сходимость по управлению для рассматриваемых в данном параграфе задач получены применением общих теорем главы 2. {(роме того выведены оценки скорости сходимости по функционалу. Первая оценка использует операторную сходимость и применима в случае гладкости допустимых управлений.
T е о р е м а 10. Пусть в задачах (26)-(29) и (38)-(41) операторы A(t), Bit), cet), Âs(t), Bs(.t), cw(t), N=1,2,... дважды непрерывно-дифференцируемы и удовлетворяют предположению 1 ; выполнено условие (16); множества
R(U) = Си = Fa, и € U) с L2(t0.T-,V/°, (42)
R(US) = iv = Fnu, и € 1Г„) с I2(t0,2';№0.ff0), N=1,2,... (43) равномерно ограничены. Тогда справедлива оценка
lJN - -HH-W " J*\ + \~ J*l < C(6N + lpw - +
+ P'VPi/V + P(PNun;U) + % + + J(ub> - J* + eJ' где u e У, k=1,2,... - минимизирующая последовательность в задаче (26)-(2Э).
Вторая оценка применима в случае выпуклых функционалов; а управления могут не удовлетворять условиям (42),(43).
Теорема!!, Пусть в задачах (26)-(29) и (38)-(41) операторы Ait), B(t), G(t), A^(t), Bw(t), tyt), N=1,2,... и сопряженные к ним непрерывно-дифференцируемы и удовлетворяют предпо-
ложению 1; множество U замкнуто, Еыпукло; множества U, Ц ,
N=1,2,... равномерно ограничены; функционалы <D(x,y,v,z,u), <$n(x,y,v,z,u) выпуклы, дифференцируемы и удовлетворяют условиям
(16),(17). Кроме того выполняется условие существования гладких оптимальных управлений
F[U") П L2(t0,T;:/!°,Ylo) ?t 0. Тогда справедливо неравенство
" «П+l VV - * ^[VVS^ ' pH(I - PA^VV
+ 1F; - qjjri+pru'.-p/jJ+pruJ.-q^+Kr - q^J' (u*) |0+ ^ + г J,
где и* € If": Fu* € l2(t0,T\W°.
Отметим, что устойчивость по функционалу с управлением из L.,
в коэффициентах уравнения и из на границе области доказана в
работах А.И. Короткого. В них, в случае компактности допустимых управлений в Ь2, показана устойчивость по управлению в L3 слабо
в w'2 и неустойчивость в В последнем случае используется
метод регуляризации А.Н.Тихонова.
Результаты §5 2.7, 2.8 о сильной сходимости по управлению применимы для задач (26)-(29) и (38)—(41). Эти утверждения аналогичны соответствующим утверждениям, которые получены для конечно-разностных аппроксимаций. Некоторые из них будут сформулированы ниже.
В § 4.3 на отрезке tt0,TJ задается сетка tj=t0+jx, j=0,...,M,
tM=T, М=2,3,... и рассматриваются следующие аппроксимирующие
(26)-(29) задачи:
JN(u) = <$N(w(M),wt(U-l)M-),wt(-),u) - inf, (44)
' wltU) + BL{J)VtU) + ALU)®U+1) + CLUMf+1) = SNU), (45)
w(1) = ф®, !ft(0) = (46)
/Я(Л = (PYu)(/) + /£(./), J=1,...J-1, (47)
u € s Hw, if = (!,»), L,¡1=2,3..........(43)
Эта аппроксимация в конкретных краевых задачах может быть получена методом прямых или конечно-разностным методом.
Вводятся операторы дискретизации и продолжения qN, g,(, p;f,
р , N=1,2,..., которые удовлетворяют условиям 1° - 4° главы 1. При
аппроксимации конечно-разностным методом уравнений второго порядка в качестве этих операторов можно взять интегральные, точечные дискретизации и кусочно-постоянные, кусочно-линейные, кусочно-квадратичные продолжения. Используя условие близости операторных коэффициентов уравнений, доказываются теоремы сходимости решений исходной и сопряженной систем. На основе этих теорем доказывается слабая и сильная сходимость отображений
GjjU. = (ю(М;и) ,wt(l(-1 ;и) • ;и) ,v>t (•;")>.
операторная сходимость и сходимость сопряженных операторов.
Для описания условий сходимости по функционалу и слабой сходимости по управлению применяются теоремы и следствия § 2.5 главы Теорема 12. Пусть в задачах (26)-(29) и (44)-(48) оп раторы Л(t), 3(t), C(t) и сопряженные к ним непрерывно-дифференцируемы и удовлетворяют предположейию 1; дискретные операторы 4l(J), BL(j), CLU), j=1,2,... ,M удовлетворяют аналогичным предаю
ложению 1 условиям, а также следующим:
C,l<PlJX < g2Wjl- Ф € К' J = °>1;
М^г*. « \hUWoL* Ф € Iff, j=1.....М-Ц
max ¡(A1/2U))J $ Щ". тх (¡ВЛЛ1 + ЦСЛЛР ^ ц,:
= mrI(p°e^)(t)-B(t)| + + lp1L-p°i +
t ь
^^(pOc^ttJ^CtJI+lpOp^-FI + II-p^l+II-p^l - О, Я - со;
йу = IPM - А* + IPK - - о. У - »•
Кроме того выполнены следующие условия:
- существует минимизирующая ufc е U, к=1,2,...: р(q^j. iU^) - О, W - оэ сильно (слабо), для k=1,2,...;
- Фы - Ф, N - оо снизу сильно (слабо) по (ш,и);
- существует ограниченная u* € UN, №=1,2,...: p(pNu*;U) - О, N -слабо;
- Ф№ - Ф, N - со сверху слабо по (ш,и).
Тогда имеет место сходимость по функционалу (3), множество U* # $г и для ограниченной u* е U , N=1,2,...: р(рИи*;17) - О, /V - со слабс
справедливо (4) в слабой норме.
Здесь Г - тождественный оператор, а д^ и р*: - 1У{,
1=0,1,2 - линейные равномерно ограниченные операторы дискретизации, удовлетворяющие 1°- 4°.
Оценка скорости сходимости по функционалу для гладких допустимых управлений получается из теорем § 2.6. В частности, для уравнения второго порядка с конечно-разностной аппроксимацией справедлива оценка
- гм.уи*; - + - «Г| < - ЙЭД"
+ (-с + п)1/г + + р(рл;уж) + [7(\) - г}'
где ик - произвольная минимизирующая последовательность в задаче (26)-(29).
Для гладких выпуклых функционалов справедливы следующие оценки скорости сходимости.
Теорема 13. Пусть в задачах (26)-(29) и (44)-(48) выполнены условия теоремы 12 и условие
тах <1В'(Л)1 + ¡В^Ш! + |с;(Л|)
Г ^ 1
и замкнутое, выпуклое; У, У , N=1,2,... равномерно ограничены; Ф, Ф , N=1,2,... выпуклы и дифференцируемы по (ш.и), удовлетворяют
(16),(17). Тогда и" £ 0 и справедлива оценка
- Г] +■ |<Г/ир -ГИ СС^(и-;ир, и* в и",
= р(и*;р/„Н р^д^УН йу- в^^-р^и*\0 +
+ 1 <Р/Агс,и"1 го;+! (и<) IО-
Если кроме того Л"(и), ^(и) сильно выпуклы и константы сильной
выпуклости удовлетворяют условию (19), то имеет место оценка скорости сходимости по управлению к. единственному оптимальному элементу и"
Для задач на строго равномерно выпуклых множествах (14),(15) из теоремы § 2.7 главы 2 вытекает сильная сходимость произвольной
последовательности и* е (I , N=1,2,... ко множеству У".
Теорема 14. Пусть в задачах (14),(26)-(29) и (15), (44)-(48) выполнены условия теоремы 13 и условие (18). Тогда всякая и* е У , N=1,2,... сильно сходится ко множеству У*.
В случае, когда функционал зависит только от конечного состо-
яния траектории, т.е. имеет вид (30) с аппроксимацией:
J1!Ш = - гпГ, и € с Яд..' (4
при нормальной разрешимости оператора Р сходимость по управлению оценка скорости сходимости для строго равномерно выпуклого функц нала Ф на множествах (14),(15) получается из теоремы 6, а именно
Теорема 15. Пусть в задачах (14),(27)-(30) и (15), (45)-(49) выполнены условия теоремы 14; оператор Т нормально раз решим, Ф, <р, ф*. 1=1,2,...,! сильно выпуклы и выполняется (16). Тогда справедлива оценка
«Г|+|<уир - «П + иГр^ - Г| «
^ + I? - рра+ V оу- IV - о1/2 + 6К]. У С £Г
Отметим, что конечно-разностные аппроксимации для гиперболических систем с управлением в коэффициентах уравнений рассматриЕЕ лись в работах Р.К. Тагиева. В них-доказана устойчивость по функционалу, а для сходимости по управлению использовался метод регу; ризации А.Н. Тихонова.
В § 4.4 рассматриваются сингулярные возмущения уравнения (2?
ш1 • + в»* + + = гнт, г0 $ г < т, (5с
вкг0) = <р£. ю'(^) = фд. ...... рн > О, Рн - О, У - со. (51
Предельное уравнение является параболического типа
ш* + Ли)ш + си)ш = /(Г), ^ I 4 Т, (52
ш(^) = <р°. (53
На решениях систем (50),(51) и (52),(53) при управляющих воз действиях, соответственно, (40) и (29) рассматриваются задачи минимизации функционалов
<7н(и) = ФЯ№Т)М-),»'(■).«(•)) - «я/, и^^с ян, (54
<7(и) = Ф(ш(Т),ш(-),ю' (•),"(•)) - <п/, и ч II <= Н, (55
Здесь отображения О, Си, N=1,2,... имеют вид
С: Я - ^^и^.ТДМ^ид.Г;!^), Ои=(ш(Т) ,ш( •) Ж (•));
Я^ (У=Й,0"12(10,Г;ЙГ,)«12({С),Г;№0), О^иЧдуГ),) •)) •
Для них справедливо утверждение о слабой сходимости при
- ф°, N - со слабо в ¡7', вир < оо (56
N
И СИЛЬНОЙ СХОДИМОСТИ при
ф° - ф°, К - СО сильно В 0„ф'г - О, /Г - 00, (57
а также сильная сходимость для сопряженных операторов G*, G*. N=1,2,.... Поэтом/ к рассматриваемым задачам применили теоремы главы 2, не использующие предположения об операторной сходимости. Кроме того справедлива оценка теоремы 3.
Теорема 16. Пусть в задачах (40),(50),(51),(54) и (29),(52),(53),(55) операторы A(t), B[t), C[t) и сопряженные к ним непрерывно-дифференцируемы и удовлетворяют предположению 1 ;
линейные операторы FN - F, N - оо сильно; ср°, ср^ € ÏÏ1, N=1,2,...:
- cpVtf - «о в IT'; ф^ € ¡Л N=1,2,...: р^ - 0. ÎT - « в
U замкнуто,, выпукло; У, ьг , N=1,2,... равномерно ограничены;
Ф, Фи, N=1,2,... выпуклы, дифференцируемы по (w,u) и удовлетворяют
(16),(17). Тогда U* ? 0 и справедлива оценка
| J* - J>| JN(up - J*| < С[9iY+ê;/+siY+pfи;Pwty+p(u;;qJ(i/)+
+ly - Pi/WIfS- - - -
+ \(q;flN - I)J'(v) |0 ), w € 1Г.
Утверждения о сходимости приближенных оптимальных управлений в сильной норме получаются для строго равномерно выпуклых функционалов с оценкой теоремы 4, для задач на компактных множествах и для задач на строго равномерно выпуклых множествах при выполнении условия (18).
Отметим, что вопросы, связанные с введением малого параметра в системах с распределенными параметрами для задач оптимального управления с целью регуляризации, рассматривались в работах Я.Л. Лионса. В них для сильно выпуклых функционалов доказана сильная сходимость по управлению.
В § 4.5 результаты применяются к задаче оптимального управления колебаниями струны (35)-(37) с энергетическим функционалом
J(u) = J-l{a(x)|t!> (г,Г) - у°(х)\г + р(з:)|ш.и,Г) - у'(х)\2)<1х. о
С помощью обобщенного метода описывается численный метод решения задачи без ограничений и с ограничениями (23). Используя свойства
базисности Рисса системы Q=G*(ek Q,0)=-a(0)zk(0)co3[wk(T-t)),
<рк r=G*(0,efe j)=-a{0)zk{0)3iniwk(T-t)], к=1,2,..., доказывается
сильная сходимость по управлению.
В приложении рассматривается задача определения внешней управляющей нагрузки, которая переводит круглую упругую пластину из одного заданного начального состояния как можно ближе к другому заданному конечному состоянию. Такие задачи находят применения цр! разработки и проектировании различных лазерных и оптических систег Задача ставится как задача минимизации терминального энергетического кзадратичного функционала качества на решениях линейного ура; нения, описывающего колебания пластины с управлением в правой час уравнения. Оптимальное управление определяется в форме синтеза.
Для решения рассматриваемой задачи необходим метод, который сочетался бы с методом разложения по собственным формам колебаний, Это сочетание дает используемый обобщенный метод моментов. Метод предполагает известными (заранее вычисленными) параметры собственных колебаний пластины: собственные частоты и формы колебаний. Зет характеристики системы являются независимыми от процесса оптимизации. Их вычисление выделяется в отдельную разовую (не входящую в контур обратной связи) вычислительную процедуру. Отметим, что системы автоматического управления с обратной связью требуют от ЭВМ работы в реальном масштабе времени, а это налагает на вычислительный процесс, кроме точности, определенные, зачастую довольно жесткие, ограничения на время счета. Например, для адаптивной лазерной системы это время может быть долями секунда. Этот фактор необходимо учитывать при выборе, разработке и реализации математических методов.
В описываемой методике оптимальное управление вычисляется в виде ряда. Коэффициенты разложения определяются из решения системы линейных алгебраических уравнений порядка 2Н, где N - число учитываемых гармоник в аппроксимации исходной задачи. Если задача рассматривается с ограничением на полную энергию, то решение задачи состоит в последовательном решении систем линейных алгебраических уравнений порядка 2ДГ.
Основные результаты диссертации опубликованы в следующих работах:
1. Ишмухаметов А.З. Применение градиентного метода для решения одной задачи оптимального управления. // Вопросы оптимизации и управления - М.: Изд-во МГУ, 1979.
2. Ишмухаметов А.З., Потапов М.М. О согласовании параметра регуляризации с шагом разностной сетки. // Вестк. РЛГУ.Сер. 15. Вы-числ. мат. и киберн. - 1980, а 3, С. 66-68.
3. Ишмухаметов А.З. Об условиях аппроксимации и регуляризации в
экстремальных задачах. // Прикл. мат. и мат. обеспеч. ЭВМ. -М.: Изд-во МГУ, 1981, С. 25-27.
4. Ишмухаметов А.З. Оптимальное управление поперечными колебаниями стержня. // Вестн. МГУ.Сер. 15. Вычисл. мат. и киберн. -1981, J6 4.
5. Ишмухаметов А.З. Обобщенная проблема моментов в задаче управления квадратичным функционалом на решениях линейной системы. // Числ. анал.: методы, алгоритмы, программы. - М.: Изд-во МГУ, 1983, С. 59-70.
6. Ишмухаметов А.З. Разностная аппроксимация задачи оптимального управления поперечными колебания»® стержня. // Вычисл. мет. и программир. - 1983, 39, С. 155-165.
7. Ишмухаметов А.З. Задача быстродействия для гиперболических систем. // Численный анализ - Изд-во МГУ, 1983.
8. Ишмухаметов А.З. Задача оптимального управления начальным состоянием системы, описываемой гиперболическим уравнением. // Оптимизация и управление - Изд-во МГУ, 1983.
9. Ишмухаметов А.З. Корректность задачи минимизации энергии для волновых процессов. // Соврем, пробл. мат.моделир. - М.,1984, С. 16-22.
10. Ишмухаметов А.З. Регулярный метод решения одного класса выпуклых экстремальных задач. // Современные проблемы мат. моделирования - 1984.
11. Васильев Ф.П., Ишмухаметов А.З., Потапов М.М., Солодкая М.С. Обобщенный метод моментов в задаче управления параболической системой. // Методы и алгоритмы в численном анализе - М.: Изд-во МГУ, 1984.
12. Ишмухаметов А.З. Синтез оптимального управления для систем,
" описываемых гиперболическими уравнениями. // Дифференц. уравнения. - 1985, 21, » 4, С. 597-604.
13. Васильев Ф.П., Ишмухаметов А.З., Мратова Л.А., Потапов М.М. Разностный аналог обобщенного метода моментов в линейной задаче оптимального управления с квадратичным функционалом. // Математические вопросы нелинейного анализа и управления динамическими системами - М.: Изд-во МГУ, 1985.
14. Ишмухаметов А.З., Першеев Д.В. Вычислительные аспекты обобщенного метода моментов в задаче управления колебаниями пластин. // Числ. мет. решения краевых и начальных задач для дифференц. уравн. - М., 1986, С. 123-129.
15. Ишмухаметов А.3.,Першеев Д.В..Потапов М.М. Аппроксимация про-
блемы моментов в параболической задаче оптимального управления. // Числ. мет. решения краевых и начальных задач для диф-ференц. уравн. - М., 198S, С. 117-122.
16. Васильев Ф.П., Ишмухаметов А.З., Уварова 0.1. Применение обобщенного метода моментов к задаче оптимального управления гиперболической системой с линейными ограничениями. // Вестн. МГУ. Сер. 15. вычисл. мат. и киберн. - 198S, £ 2.
17. Ишмухаметов 1.3. Обобщенный метод моментов в задаче с управлением, зависящем только от пространственных переменных. // Ста: дартные программы и числ. решение задач волновой физики. - М. 1986.
18. Ишмухаметов А.З. Об аппроксимации гиперболических дифференциально операторных уравнений второго порядка. // Ж. Вычисл. ма1 и мат. физ. -1987, 27, Л 8, С. 1154-1165.
19. Ишмухаметов А.З. О гладкости решений задачи Коши для гиперболического дифференциально-операторного уравнения второго по-• рядка. // Дифференц. уравнения. - 1987, 23, Jé 3, С. 493-499.
20. Васильев Ф.П., Ишмухаметов А.З., Потапов М.М., Ячимович М. Об общенная проблема моментов в задаче управления интегральным квадратичным функционалом на решениях линейной системы. // Пр: кладные методы нелинейного анализа - М.: йзд-во МГУ, 1987,
С. 72-86.
21. Ишмухаметов А.З. Вопросы аппроксимации и регуляризации задач оптимального управления гиперболическими системами. // Вычисл мет. и системы обраб. данных на ЭВМ. - М., 1988, С. 4-18.
22. Васильев Ф.П., Ишмухаметов А.З., Потапов М.М., Обобщенный мет моментов в задачах оптимального управления. - М.: Изд-во МГУ, 1989, 143 с.
23. Авдонин С.А., Иванов С.А.,Ишмухаметов А.З. Квадратичная задач оптимального управления колебаниями струны. Докл. АН СССР 1991 , 316, JÉ 4, С. 781-785.
24. Ишмухаметов А.З. Моделирование процессов управления линейными системами: устойчивость и аппроксимация. // Итоги науки и тех ники. ВИНИТИ: Вычисл. науки. 1991, Т. 7, С. 3-88.
25. Ишмухаметов А.З. Условия аппроксимации и устойчивости задач минимизации. // Ж. вычисл. матем. и матем. физ. 1993, т. 33, № 7, С. 1012-1029.
26. Ишмухаметов А.З. Условия аппроксимации и устойчивости в задачах оптимального управления гиперболическими системами. // Ж. вычисл. матем. и матем. физ. 1994, т. 34, Jé 1, С. 12-28.
Литература
1. Будак Б.М., Беркович Е.М., Соловьева E.H. О сходимости разнос-
тных аппроксимаций для задач оптимального управления // Ж. Вычисл. мат. и мат. физ. - 1S69. - 9, ИЗ. - С. 522-547.
2. Будак Б.М., Васильев Ф.П. Некоторые вычислительные аспекты за-
дач оптимального управления. - М.: Изд-во МГУ, 1975, 171 е..
3. Бутковский А.Г. Метода управления системами с распределенными
параметрами. - М: Наука, 1975, 563 е..
4. Вэйникко Г.М. Анализ дискретизационных методов. - Тарту: Изд-
во Тартуского ун-та, 1976, 160 с..
5. Васильев Ф.П. Численные методы решения экстремальных задач. -
М.: Наука, 1988, 549 е..
6. Васин В.В. Устойчивая дискретизация экстремальных задач и ее приложения в математическом программировании. // Мат. заметки. - 1982, 31, № Z, С. 269-280.
7. Габасов Р.Ф., Кириллова Ф.М. Качественная теория оптимальных процессов. - М.: Наука, 1971, 507 е..
8. Гловински Р., Лионе Ж.Л., Тремольер Р. Численное исследование вариационных неравенств. - М.: Наука, 1979, 575 е..
9. Дончев А. Системы оптимального управления. Возмущения, приближения и анализ чувствительности. - М.: Мир, 1987, 156 е..
10. Егоров А.И. Оптимальное управление тепловыми и диффузионными процессами. - М.: Наука, 1978, 463 е..
11. Ермольев D.M., Гуленко В.П., Царенко Т.И. Конечно-разностный метод в задачах оптимального управления. - Киев: Наукова думка, 1978, 164 е..
12. Карманов В.Г. Математическое программирование. - М.: Наука, 1980, 256 е..
13. Красовский H.H. Теория управления движением. - М.: Наука, 1968, 475 е..
14. Лионе Ж.Л. Оптимальное управление системами, описываемыми уравнениями с частными производными. - М.: Мир, 1972, 414 е..
15. Осипов Ю.С., Крязкимский A.B., Максимов В.И. Задачи динамической регуляризации для систем с распределенными параметрами. -Свердловск, 1991, 104 е..
16. Сиразетдинов Т.К. Оптимизация систем с распределенными параметрами. - М.: Наука, 1977, 480 е..
17. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. - М.: Наука, 1986, 286 с..
ППП .Патент* Зак. ZW