Исследование некоторых классов задач оптимального управления и разработка алгоритмов их решения тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Чуркин, Евгений Борисович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1997
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В. ЛОМОНОСОВА
ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ Р г б ОД и КИБЕРНЕТИКИ
') !< * -
На правах рукописи ЧУРКИН Евгений Борисович
ИССЛЕДОВАНИЕ НЕКОТОРЫХ КЛАССОВ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ И РАЗРАБОТКА АЛГОРИТМОВ ИХ РЕШЕНИЯ
Специальность 01.01.02—дифференциальные уравнения
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
МОСКВА - 1997
Работа выполнена на факультете Вычислительной математики и кибернетики Московкого государственного университета им. М.В. Ломоносова.
Научный руководитель - кандидат физико-математических наук,
доцент Ю.Н. Киселев.
Официальные оппоненты - доктор физико-математических наук,
профессор A.B. Арутюнов, доктор физико-математических наук, профессор A.A. Белолипецкий.
Ведущая организация - Математический институт РАН
им. В.А. Стеклова
_ 30
Защита состоится "¿У » 3eic£U)/PJ- 199?г. в часов
на заседании диссертационного совета К.053.05.087 по математике в Московском государственном университете им. М.В. Ломоносова по адресу: 119899, г. Москва, Воробьевы горы, МГУ, 2-й учебный корпус, факультет вычислительной математики и кибернетики, аудитория 685.
С диссертацией можно ознакомиться в библиотеке факультета ВМиК МГУ.
Автореферат разослал "_"_199 г.
Ученый секретарь диссертационного совета доцент
В.М. Говоров
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Важное место в теории обыкновенных дифференциальных уравнений занимают управляемые динамические системы. Исследование таких систем представляет большой интерес для приложений. Управляемые системы и задачи оптимального управления стали предметом изучения математической теории оптимальных процессов, научной дисциплины, оформившейся в середине XX столетия. Центральным результатом этой теории является принцип максимума Л.С. Пон-трягина. Значительное место в теории занимают задачи оптимального управления для систем обыкновенных дифференциальных уравнений, которые линейно зависят от управления (диссертация посвящена исследованию некоторых таких задач). Этот класс управляемых систем и задач включает такие важные объекты, как билинейные управляемые системы, системы с инвариантной нормой, системы с интегральным инвариантом и т. д. Получение новых результатов для них представляет интерес с теоретической точки зрения. Линейные по управлению системы обыкновенных дифференциальных уравнений достаточно часто встречаются и в приложениях: в экономике и экологии, биологии и медицине, технике и производстве. Поэтому разработка точных и приближенных методов решения задач оптимального управления для таких систем является актуальной проблемой.
Цель работы.
1. Построение точного решения нелинейной задачи оптимального управления на бесконечном полуинтервале времени при отсутствии ограничений на управление в случае, когда в интегральном критерии качества подынтегральная функция является полной квадратичной формой относительно фазового вектора и управления с коэффициентами, зависящими от фазовой переменной.
2. Получение точного решения некоторых задач оптимального управления для нелинейных управляемых систем с интегральным инвариантом.
3. Разработка программного обеспечения для численного решения задачи синтеза для нелинейной задачи быстродействия размерности 2 с линейным входом по управлению. Выполнение расчетов для некоторых конкретных задач.
4. Получение аналитическими средствами выражения для критиче-
ского момента времени, после которого множество достижимости из заданной начальной точки для одной плоской билинейной управляемой системы с гладкой областью управления теряет свойство выпуклости.
Научная новизна работы определяется полученными в ней результатами:
1. В 1-ой главе для нелинейной задачи оптимального управления с неограниченным управлением, на полупрямой t € [0, +оо), вида
х = f(x) + В(х)и, /(0) = 0, х(0) = 10, z(+oo) = 0, х, / е R", и G Rr,
L(u) = +J°[xTQ(x)x + 2uTH(x)x + итД(х)и] dt -»• min рассмотрен случай полной "квазиквадратичной" формы относительно вектора (хт, ит) в интегральном критерии качества: Н(х) ф 0. В более ранних работах1 рассматривался случал Н(х) = 0. При определенных предположениях построено оптимальное управление в форме обратной связи с привлечением вспомогательного матричного алгебраического уравнения Риккати, найдено оптимальное значение функционала и доказана теорема о существовании и единственности оптимального решения.
2. Во 2-ой главе построено оптимальное управление и найдено оптимальное значение интегрального критерия качества в терминах опорной и дистанционной функций выпуклой области управления в ряде задач для управляемых систем с интегральным инвариантом. Эти системы характеризуются аддитивным вхождением управления и согласованностью формы области управления с динамической нелинейностью и подынтегральной функцией в интегральном функционале. Ранее аналогичные задачи были рассмотрены в более частном случае, для систем с инвариантной нормой, в работах М. Атанса, П. Фалба, Р. Лакосса2 и
1 Banks S.P., Mhana K.J. Optimal Control and Stabilization for Nonlinear Systems. // IMA Journal of Mathematical Control and Information. 1992. N 9. P. 179 - 196;
Rchbock V., Teo K.L., Jenniga L.S. Suboptimal Feedback Control for a Class of Nonlinear Systems using Spline Interpolation. // Discrète and Contlauous Dynamical Systems. 1995. Vol. 1. N 2. P. 223 - 236;
Киселев Ю.П. Аналитическое конструирование регуляторов для нелинейных управляемых систем. // Вестник Моск. ун-та. Сер. 15, Вычисл. матем. и киберн. 1997. N 2. С. 28 -31.
2Атанс М., Фалб П. Оптимальное управление. - М.: Машиностроение, 1968;
Aihana M., Falb P.L., and Ьасозз R. T. Time-, Fuel-, and Energy-Optimal Control of Nonlinear Norm-Invariant Systems // IEEE, Transactions on Automatic Control. 1963. Vol. 8. N 3. P. 196 - 202;
Aihans M., Falb P.L. Time-Optimal Control for a Class of Nonlinear Systems // IEEE, Transactions on Automatic Control. 1963. Vol. 8. N 4. P. 379.
A.M. Летова3; задача быстродействия была исследована Ю.Н. Киселевым4.
3. В 3-ей главе
а) дано описание работы графического пакета СИНТЕЗ-2.0 для решения задачи синтеза по быстродействию для нелинейной 2-мерной системы с линейным вхождением управления, перед которым стоит зависящая от фазовой переменной матрица-множитель В(х). Этот пакет появился в результате проделанной автором диссертации программистской работы над пакетом СИНТЕЗ-1.0, ранее разработанным на кафедре оптимального управления факультета ВМиК МГУ и позволявшим исследовать только системы с постоянной матрицей В;
б) для конкретной плоской билинейной управляемой системы с гладкой областью управления получена точная формула для первого момента времени, после которого множество достижимости из заданной ненулевой начальной точки для одной плоской билинейной управляемой системы с гладкой областью управления становится невыпуклым.
Общая методика исследования. При обосновании содержащихся в диссертации утверждений используются факты из теории оптимального управления, обыкновенных дифференциальных уравнений, выпуклого анализа, линейной алгебры.
Практическая ценность работы. Результаты, полученные в диссертации, носят в основном теоретический характер и могут найти применение при аналитическом исследовании задач оптимального управления. Диссертационный материал может быть частично использован в спецкурсах для студентов вузов, обучающихся по специальности "прикладная математика". Описанный в 3-ей главе графический пакет СИНТЕЗ-2.0 хорошо зарекомендовал себя при численном исследовании плоских задач синтеза по быстродействию. Результаты расчетов на пакете представляются в удобной графической форме: имеется 2- и 3-мерная графика, возможность масштабирования изображения, на экране можно рисовать до четырех графиков. Пакет позволяет пользователю получать изображение, как всех расчитываемых экстремальных по быстродействию траекторий в целом, так и изображение каждой такой траектории по отдельности; в ряде случаев удается нарисовать границу множества управля-
3JIemoe A.M. Динамика полета и управление. - М.: Наука, 1969.
4 Киселев Ю.Н. Системы управления с иптегральвым инвариантом. // Дифференциальные уравнения. 1996. Т. 32. N 4. С. 477 - 483.
емости. Результаты расчетов хранятся в виде таблицы чисел, которую пользователь может просмотреть, сохранить на диске или распечатать на принтере. По сравнению с предыдущей версией пакета (СИНТЕЗ-1.0) расширился круг задач, которые можно исследовать с его помощью.
Апробация работы. По результатам диссертации делались доклады на специальных семинарах кафедры оптимального управления факультета ВМиК МГУ "Линейная теория управления" под руководством к.ф.м.н. доцента Ю.Н. Киселева, "Дифференциальные игры" под руководством д.ф.м.н. профессора М.С. Никольского и д.ф.м.н. профессора Н.Л. Григоренко, на Международной конференции студентов и аспирантов "Ломоносов-96" (Москва, МГУ, 1996 г.); были представлены тезисы докладов на 8-й Саратовской зимней школе "Современные проблемы теории функций и их приложения" (Саратов, 1996 г.), на Понтрягинских чтениях-УШ Воронежской весенней математической школы "Современные методы в теории краевых задач" (Воронеж, 1997 г.).
Публикации. Основные результаты диссертации опубликованы в восьми работах автора, две из которых являются совместными. Список этих работ приведен в конце автореферата.
Структура и объем работы. Диссертационная работа состоит из введения, трех глав, заключения и списка литературы. Общий объем работы - 171 машинописная страница, из которых в общей сложности 13 страниц отведены на 25 рисунков и 8 страниц - на список литературы, содержащий 87 названий работ.
СОДЕРЖАНИЕ РАБОТЫ
Введение содержит краткое описание исследуемых в диссертации управляемых объектов, перечисление основных результатов, полученных для них, а также обзор работ, связанных с рассматриваемыми в диссертации задачами оптимального управления. Изложение материала в каждой главе ведется независимо от изложения в других главах. Каждая глава начинается с пункта-введения, в котором кратко описывается ее структура, исследуемая задача и некоторые результаты, полученные для этой задачи в данной главе и в работах других авторов.
В пункте 2 главы 1 дана постановка исследуемой в этой главе нелинейной задачи оптимального управления с неограниченным управлением
и на полупрямой £ 6 [0, +оо):
х = /(х) + В(х)и, /(0) = 0, х(0) = х0, х(+оо) = 0, (0.1)
+00
Ь{и) = I [хтд(х)х + 2итН(х)х + итЯ(х)и] ей ш . (0.2)
Здесь х 6 К" — фазовый вектор, и Е 11г — управление; вектор-функция / и матрицы В, ф, Л, Я достаточно гладко зависят от х; начальное состояние хо 6 11" задано. Блочная матрица
е К(»+г)х(п+г) (0.3)
Ят(х)
н(х) ад
предполагается симметричной и положительно определенной для всех х £ В.". Значит, матрицы £}(%) и Д(х) также симметричны и положительно определены. Функцию /(х), удовлетворяющую условию /(0) = 0, можно записать в "квазилинейной" форме
/(«) = А(х)х, А{х) <= Кпхп, (0.4)
где А(х) 6 Л"*" — матрица, гладко зависящая от х.
Решение задачи (0.1)—(0.2) ищется в классе К допустимых управлений, состоящем из гладких функций и(х) : II" н-♦ 11г (стационарная обратная связь), которые удовлетворяют следующим требованиям:
1) v(0) = 0; следовательно, и(х) представима в "квазилинейной" форме ь(х) = К{х)х, К(х) е Я"*";
2) при любом начальном состоянии хо € И" и управлении у(х) 6 К решение х(£;хо,и) задачи Копш
х = /(х) + В(х) ь(х), *(0) = х0
(0.5)
определено при всех < > 0 и удовлетворяет условию х(£; хо, и) —► 0 при * -* +оо;
3) для любой пары функци {х(Р,хо,у), и(х)}, где V £ 1С, несобственный интеграл I [хт<Э(х)х +2г;т(х)Я(х)х + г;т(х)Л(х)1;(х)] ¿1 сходится.
Из 1), 2), 3) следует, что точка х = 0 является асимптотически устойчивым положением равновесия замкнутой системы (0.5). Значит, любое управление ь(х) из класса К. стабилизирует неуправляемую систему
х = /(х), для которой положение равновесия х = 0 может и не быть устойчивым.
Пункт 3 посвящен эвристическому выводу с помощью метода динамического программирования основных результатов для задачи (0.1), (0.2), которые сформулированы в теореме 6.1 (см. пункт 6). Однако такой вывод нельзя считать обоснованным, так как отрезок времени, на котором рассматривется задача, бесконечен. Пункты 4-7 главы 1 фактически посвящены обоснованию этих результатов. Как и в статье Ю.Н. Киселева5, рассуждения проводятся прямым методом, без привлечения задачи на конечном отрезке времени, в двух предположениях, аналогичных тем, которые делаются в этой статье.
В пункте 4 сформулированы эти два предположения.
Предположение 1. При любом х G R" существует симметричное положительно определенное гладко зависящее от х решение П(х) матричного алгебраического уранения Риккати (МАУР)
(Q(x) - Hr{x)R~1{x)H(xfj + П(х) (А(х) - B(x)R~\x)H(xj)+
+{ä(x) - B(x)R-\x)H(x)Y П(х) - П(х)£>(х)П(х) = 0, D = BR~1BT;
(0.6)
Предположение 2 о росте функции
V(x) = j2ахтП(о:х)х da = хг ^JП(7*х) d-yj x : (0.7)
m(g) —► +oo при ß —► +oo, где
Кроме того, в этом пункте сфорулирован и доказан ряд свойств функции V(x), F(x) > 0, х ф 0, V(0) = 0, в том числе, свойства об устройстве множества уровня t[h) = {i € R" : V(x) < h}, h > 0, этой функции: свойство 4)° о его монотонном расширении с ростом h: £(h) С int ¿(h+e),
*Киселев Ю.Н. Аналитическое конструирование регуляторов для нелинейных управляемых систем. // Вестпик Моск. ун-та. Сер. 15, Вычисл. матем. и кибери. 1997. N 2. С. 28 -31.
е > 0; и лемма 4.1 о его ограниченности при любом конечном значении h > 0.
Пункт 5 главы 1 носит вспомогательный характер. Здесь, опираясь на достаточно простые свойства матриц и матричных функций (леммы 5.1-5.3, теорема 5.1), в лемме 5.4 выписаны две двусторонние оценки, которые затем используются при доказательстве основного утверждения, теоремы 6.1 в пункте 6.
Теорема 6.1. В задаче (0.1)-(0.2) в Предположениях 1, 2 оптимальная обратная связь существует, единственна и определяется равенством
ut(x) = -R-^x) (ят(х)П(х) + Н(х)) х, (0.9)
где П(х) — симметричное положительно определенное решение МАУР (0.6). При начальном состоянии xq оптимальное значение функционала определяется с помощью "кпазиквадратичной" формы V(x), см. (0.7):
L(u.) = У(х0). (0.10)
Таким образом, решение задачи (0.1), (0.2) сводится к нахождению симметричного положительно определенного решения МАУР (0.6).
Весь 7-ой пункт посвящен доказательству этой теоремы. Обоснование состоит из доказательства пяти вспомогательных лемм. В лемме 7.1 доказано, что градиент функции V(x) допускает представление
V'(x) = 2П(х)х; У(х) ф 0 при х ф 0, (0.11)
где П(х) — решение МАУР (0.6). Используя равенство (0.11), легко доказывается
Лемма 7.2. Производная функции V(x) в силу замкнутой системы (0.12)
х = f(x) + B(x)ut(x) (0.12)
может быть представлена в следующих формах:
V(x){0.12) = -хТ { (Q(x) - HT{x)R-\x)H(x)) + П(х)£>(х)П(х) } х;
(0.13)
^И(0.12) = - { ят<Э(ф + 2и1(х)Н(х)х + и1(х)Н(х)и.(х) }. (0.14)
Отсюда в силу положительной определенности блочной матрицы ¿Г(х), см. (0.3), следует, что У(х) является функцией Ляпунова замкнутой системы (0.12), см. также лемму 7.3. Далее, в лемме 7.4 установлено, что управление и*(х) является допустимым, областью притяжения асимптотически устойчивого положения равновесия х = 0 замкнутой системы (0.12) служит все фазовое пространство, стремление к нулю нормы решения ж(<;хо,и*) замкнутой системы (0.12) при I —» +оо является экспоненциальным, доказано равенство (0.10). Доказательство основного утверждения завершает
Лемма 7.5. (О полном квадрате). Интегральный функционал (0.2) допускает представление
+0О
Цу) = ь(и,)+ / (Кг/) - <у)]Тп{у) [«(2/) - «*(г/)1 л (0.15)
о
где и* — закон управления (0.9), у — г/(0) = хц — траектория системы (0.1), отвечающая управлению V.
В силу положительной определенности матрицы Я(у) для любого у 6 Я" из леммы 7.5 следует оптимальность управления и*(х) и единственность оптимального управления.
Заключительный пункт 9 главы 1 разбит на четыре подпункта. Подпункты 9.1 и 9.3 являются вспомогательными. В подпункте 9.2 сформулированы и обоснованы две теоремы (теоремы 9.2 и 9.3) о достаточных условиях оптимальности в задаче (0.1), (0.2). Приведем формулировку одной из них.
Теорема 9.3. Пусть для задачи (0.1), (0.2) выполнены все условия Предположения 1. Пусть существуют (достаточно большое) число М > 0, (достаточно малое) число е > 0 и число 8 > 0 такие, что Ух 6 Б.", ||х|| > М
Аго;„(П(х))> %|Г2, (0.16)
где Ат,„(П(х)) — наименьшее собственное значение матрицы П(х). Тогда определенная равенством (0.8) функция т(д) —*■ +оо при д —» +оо. Таким образом, Предположение 2 будет выполнено и оптимальная обратная связь существует, единственна и определяется равенством (0.9), а оптимальное значение функционала —равенством (0.10).
. В подпункте 9.4 представлено подробное решение десяти конкретных задач вида (0.1), (0.2). Для них решение вспомогательного МАУР (0.6) удается построить аналитически.
Цель главы 2 — получить точные решения задач оптимального управления вида
х = /(х) + и, х(0) = х0 ф 0, х(Т) = 0, х,/ G R", и £ U С R", 0 G int U,
(0.17)
U = {и: d(u) < 1}, (0.18)
т
L(u) = /g(d(-x), d(u))dt (0.19)
в которых согласованы динамическая нелинейность /(х), форма области управления U и вид подынтегральной функции в интегральном критерии качества так, что неуправляемая система х = /(х) имеет первый интеграл d(—x) = const > 0, а функция d(x) : R" н-+ R1 является дистанционной функцией множества U. Класс допустимых управлений Уи состоит из кусочно-непрерывных функций, принимающих при t £ [0, Т] значения из множества U.
Эти управляемые объекты называются системами с интегральным инвариантом. В пункте 5 главы 2 получено точное решение задач (0.17)-(0.19) для пяти конкретных функций д. В более частном случае, когда d{x) = ||х||, эти задачи были рассмотрены ранее в работах М. Атан-са, П. Фалба, Р. Лакосса, A.M. Летова. Пункт 2 содержит результаты, полученные этими авторами для систем с инвариантной нормой, именно так называются эти системы, так как неуправляемая система обладает свойством сохранения нормы своего решения: ||x(f)|| = const.
Рассуждения в пункте 5 проводятся с использованием метода динамического программирования (пункт 3) и основных свойств поляры и дистанционной функции (пункт 4).
Материал пунктов 3 и 4 главы 2 является вспомогательным.
В пункте 3 главы 2 приведены необходимые (теорема 3.1) и достаточные (теорема 3.2) условия оптимальности в методе динамического программирования, которые затем применяются в пункте 5 при обосновании оптимальности решения некоторых задач на нефиксированном отрезке времени.
В пункте 4 главы 2 изложены необходимые для решения задач из пункта 5 сведения из выпуклого анализа о поляре и дистанционной функции выпуклого компакта U, содержащего 0 в качестве внутренней точки.
Определение. Полярой (или полярным множеством) множества U С R", О G int U, называется множество U° = {ф 6 R" : c(U, ф) < 1}, где c(U, 4>) = с{Ф) — max(u, гр) — опорная функция множества U.
При этом поляра является выпуклым компактом и содержит точку О в качестве внутренней.
Определение. Дистанционной функцией d{x) выпуклого компакта U С R", 0 £ int U, наливается опорная функция его поляры: d(x) = d(U,x) = c(U°,x) = тах(ф,х), х е R".
При решении задач пункта 5 активно используются неравенство Юнга и
Теорема 4.2. Пусть градиенты с!{ф) и d'(x) существуют и непрерывны в R" \ {0}. Тогда для любого выпуклого компакта U С Rn, 0 £ int U, имеют место тождества:
</(d'(a:)) = z/d(x), c(d'(x)) = 1 Vx е R" \ {0}; (0.20)
d'(c'W) = ф/с{ф), d{c'{4>)) = 1 VV>6R"\{0}- (°-21)
В пункте 5, являющимся основным пунктом главы 2, найдены решения задач оптимального управления (0.17)-(0.19) для пяти конкретных функций g в функционале (0.19). В задачах 5.1, 5.2, 5.3, 5.5 конечное время Т нефиксировало. В них предполагается, что управление объектом осуществляется до первого попадания им в конечную точку 0. Оптимальные обратная связь и*, время перехода Т* и значение функционала L* — L(u*) имеют следующий вид:
в задаче 5.1: L(u) = f g(d(—xfjdt —► min , T нефиксировано, g{y) > 0 Vy > 0:
u*(i) = -x/d{-x), T* = d(-x0), L* = d{T0)g{t)df, в случае задачи быстродествия (g = 1) имеем:
и*(х) = -x/d(-x), Т* = L* = d(—xo);
т
в задаче 5.2: L(u) = / d(u)dt min , Т нефиксировано: о и(-)е>£/
U*(s) = -/3(í) • x/d(-x), L* = d(-®0), T* = Tp, где Tp > d(-z0), /J(t) G [0,1] при t G [0,2>I, = d(-xо);
в задаче 5.3: L¡ = ¡ jfc • g(d(—xfj + dt —> min , T нефиксировано, A; = const > 0, g(y) > 0 Vy > 0:
u*(ac) = -x/d(-x), T* - d(~x0) , L* = к ■ $~xa) g(t)dt + d(-x0);
T
в задаче 5.5: L(u) = / {fc -f ¿ • cP(u)} dt —> min , T нефиксировано, к = consí > 0:
u*(x) = -x/d(-x), T* = d(-x0) ,L* = (k +1/2) • d(-x0) при к > 1/2; u*(x) = -x • T* = d(-x0)/y/2k, L* = d(-x0) • \/2к при
к < 1/2;
т
В задаче 5.4: La = J I ■ d2(u)dt —> min , T фиксировано,
0 1 w «(-)ov' решение существует при условии, что заданное время Т не меньше времени быстродействия: Т > d(—хо). При этом и*(х) = -X . d(-xо) / [Т ■ d(-x)], L* = d®(-x0) / (2Г).
Кроме того, для каждой задачи отдельно вынисаны выражения для оптимальных значений u*, Т*, L* в том случае, когда область управления является эллипсоидом: U — {u G R" : urQu < 1}, где Q - симметричная положительно определенная (n х п)-матрица. Дистанционная функция такого множества имеет вид: d(x) = d(U, х) = yJxTQx.
Глава 3 посвящена изложению материала, связанного с графическим пакетом СИНТЕЗ-2.0 для численного решения задачи синтеза для нелинейной 2-мерной задачи быстродействия с линейным входом по управлению. Дана постановка задачи, описан численный алгоритм ее решения, реализованный в пакете СИНТЕЗ-2.0, представлены результаты расчетов для конкретных управляемых систем в виде рисунков, выполненных на пакете (пункт 3). Программа СИНТЕЗ-2.0 была разработана автором диссертации на основе программы СИНТЕЗ-1.0, ранее созданной на кафедре оптимального управления факультета ВМиК МГУ.
Кроме того, в главе 3 проводится исследование выпуклости множества достижимости одной плоской билинейной системы с гладкой областью управления (пункт 5).
В пункте 2 даны определение гладкого выпуклого компактного множества и формулировки нескольких основных его свойств.
Определение. Выпуклое компактное множество U С R" будем называть гладким выпуклым компактом (обозначение U G r(R")), если его опорная функция c(U, ф) = max(tt, ф) — max £ щфи Ф G R", удовлетворяет следующим требованиям:
1) существуют непрерывные частные производные функции c(U, ф) по координатам вектора ф = (ф\... фп)1 ДО второго порядка включительно для любого ф G R"\{0};
2) rg d'(U, ф) = п - 1 для любого ф G R"\{0}.
В левой части записан ранг матрицы из вторых частных производных функции c(U, ф) по координатам вектора ф. Штрихи означают дифференцирование по аргументу ф.
В подпункте 3.2 пункта 3 описан численный алгоритм решения задачи синтеза для нелинейной задачи быстродействия следующего вида (формулировка дана в подпункте 3.1):
X = fix) + В{х) ■ и, х(Т) = X/; X G Rn, и G U С Rn; Т min .
и()еУи
(0.22)
Вектор-функция f(x) G R" и (п х п)-матрица В(х) гладко зависят от х. Предполагается, что detß(x) ф 0 Vx G R". Область управления U - гладкий выпуклый компакт в R". Класс допустимых управлений Уи состоит из n-мерных непрерывных функций u(t) со значениями из множества U. Предполагается возможность продолжения решения уравнения (0.22) при любом допустимом управлении u(t) на заданном отрезке времени [0, Г]. Требуется построить в фазовом пространстве R" экстремальные траектории, приходящие в заданную точку х/, т. е. траектории, удовлетворяющие принципу максимума Понтрягина6.
Алгоритм построения семейства экстремальных по быстродействию траекторий заключается в решении задачи Коши, полученной из уравнений принципа максимума при переходе к обратному времени т — Т — t и нормировке сопряженной переменной х = WIMI1
dx/dr = -f(x) - В(х) ■ cf(U,Br{x) ■ х),
Г9(/(х) + В(х) • tt)lT
d*'iT<E-m)
дх
■ X, (0.23)
u=c<(U,BT(x).x)
®1г=о = ®/> xlr=o=P€5 = {^: М = 1}, 0 <т<Т.
еПонтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. - М.: Наука, 1983.
Решив эту задачу Коши для всевозможных значений р из единичной сферы 5, мы построим все экстремальные по быстродействию траектории, приходящие в момент времени Т (в прямом времени) в терминальную
точку x/.
Отметим, что в силу того, что множество и является гладким выпуклым компактом, а матрица В{х) - невырожденной, условие максимума выделяет единственное экстремальное управление и = ¿(1/, Вт(х) • х)-
Так как принцип максимума является только необходимым условием оптимальности, то построенные экстремальные траектории не всегда оптимальны в смысле быстродействия.
Технический прием нормировки сопряженной переменной оказывается очень эффективным с вычислительной точки зрения.
Если в задаче (0.22) вместо терминального условия х(Т) = х/ берется условие х(Т) € М, где М — гладкий выпуклый компакт, то начальное условие а;|г_о — Xf в задаче (0.23) заменяется условием х^д = 6(А/, —р).
При выполнении численных расчетов вектор р пробегает значения из некоторой дискретной сетки на единичной сфере 5.
В 2-мерном случае описанный выше алгоритм реализован в графическом пакете СИНТЕЗ-2.0, см. подпункт 3.4. Пакет позволяет строить графики расчитываемых траекторий. Он имеет ряд возможностей для представления и просмотра результатов расчета, задания параметров и т. д. При работе программы СИНТЕЗ-2.0 численное интегрирование уравнений (0.23) осуществляется методом Рунге-Кутта 4-го порядка или методом Рунге-Кутта-Фельберга с автоматическим выбором шага по желанию пользователя. Программа СИНТЕЗ-2.0 может работать только со множествами £/ и М, которые являются эллипсами или многоугольниками с конечным числом вершин, причем в случае многоугольника она работает с гладкой аппроксимацией соответствующего множества, позволяя пользователю регулировать степень сглаживания. Процедуры сглаживания включены в общую схему решения.
Краткое описание возможностей графического пакета СИНТЕЗ-2.0 дано в подпункте 3.5. Более детальное описание содержится в [4]. В подпункте 3.6 приведены полученные на пакете СИНТЕЗ-2.0 рисунки, содержащие результаты расчетов для конкретных плоских систем.
В подпункте 3.3 отмечена важность изучения замкнутой кривой ¿(г), образованной в каждый момент времени т правыми концами траекторий х(т,р), являющихся решениями системы (0.23) при всевозможных
значениях р Е 5 = {р : ||р|| = 1}:
Ь(т)= и Ыт,р)}. (0.24)
11Р11=1
Для плоских задач графический пакет СИНТЕЗ-2.0 позволяет приближенно строить эти кривые. В случае линейной задачи быстродействия кривая 1/(т) всегда является границей дZ(T — т) множества управляемости Z(T — т), которое является выпуклым компактом. В нелинейном случае это, вообще говоря, не так, но, тем не менее, для некоторых систем при малых значениях т граничные и выпуклые свойства: все же могут иметь место. Так, в пункте 5 показано, что при рассмотрении в прямом времени билинейной управляемой системы
Г ¿1 = х2щ-х1и2, х(о) = х° Ф о, х = (хих2)т, иеиег(в?)
\ Х2 = -Х1Щ - х2и2,
(0.25)
в случае произвольной гладкой выпуклой области управления и кривая, аналогичная кривой (0.24), является границей множества достижимости X(*) из заданного начального состояния хо при достаточно малых значениях I. Экстремальные по быстродействию управления для системы (0.25) являются постоянными управлениями со значениями в точках границы множества С/. Это показано в работе [5]. В пункте 5, опираясь на понятие кривизны плоской кривой, получена точная формула для критического момента времени Т*, после которого множество достижимости Х{£) теряет свойство выпуклости. Используя явную интегрируемость системы (0.25) при постоянных управлениях и возможность параметризации границы гладкого выпуклого компакта V через градиент его опорной функции, получена параметризация скалярным параметром (3 £ [0,2тг] границы дХ{£) множества Х(Ь), которая позволяет выписать формулу для кривизны в любой точке кривой дХ{£). Из нее следует, что при < < Т*, где
Т* ~~ шах (Яс/О?) • втр) '
Яи(Р) 6 (0,+оо) - радиус кривизны в точке £ ди,
д((3) = (соэ/3, зт/3)т, во всех точках кривой дХ(Ь) кривизна имеет один и
тот же знак, а при I > Т* существуют точки как с положительной, так и
с отрицательной кривизной. Отсюда вытекает, что множество достижимости является выпуклым при * < Т*, а после момента времени Т* оно становится невыпуклым. Из формулы (0.26) следует, что величина Т* не зависит от расположения начальной точки х° (х° ф 0) и области управления и на плоскости, а определяется только кривизной ее границы в точках {¿(11, Р С (О]71")} С ди. В пункте 5 выписаны также формулы для Т* в случае, когда область управления ¡7 является кругом радиуса Я: Т* = 1/Д; и эллипсом I/ = {и й В2 : иЦа2 + иЦЪ2 < 1, а > 0, Ь > 0} (см. пример 5.1):
если 2Ь2 < За2,
а _
Зл/3(Ь2 - а2) П12 о ,
у к 2-если 2Ь2 > За .
Пример 5.2 пункта 5 демонстрирует, насколько существенным является гладкое устройство границы области управления XI для выпуклости множества достижимости системы (0.25). Известно7, что в случае негладкой области управления в виде квадрата V = {|и,-| <1, г = 1,2} множество достижимости невыпукло для любого Т > 0 (т. е. в этом случае критический момент Т* = 0); то же самое касается и любой прямоугольной области управления вида
II = {и £ К2 : ах < щ < а2, А < и2 < /?2}, «1 < <*2, < А>-В примере 5.2 показано, что при аппроксимации этой области гладкими областями управления в виде суммы двух эллипсов, критический момент времени Т*, действительно, стремится к нулю.
Рассуждения в пункте 5 опираются на свойства кривизны плоской кривой и, в частности, на свойства границы плоского гладкого выпуклого компакта, см. пункт 4 главы 3.
(0.27)
Автор выражает благодарность своему научному руководителю кандидату физико-математических наук Ю.Н. Киселеву за постановку задач, руководство работой и постоянное внимание к работе.
7 Ли Э.Б., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972, с. 282.
Оснорные результаты диссертации опубликованы в следующих работах:
[1] Чуркин Е.Б. Задача оптимального управления на полупрямой; / МГУ. — М., 1997. 62 с. Рукопись депонирована в ВИНИТИ от 18.01.97 N 130-В97.
[2] Чуркин Е.Б. Оптимальное управление системами с интегральным инвариантом. / МГУ. — М., 1997. 61 с. Рукопись депонирована в ВИНИТИ от 11.04.97 N 1202-В97.
[3] Чуркин Е.Б. Управляемые системы с интегральным инвариантом. // В сб.: Понтрягинские чтения-УШ на Воронежской весенней математической школе "Современные методы в теории краевых задач". Тезисы докладов. 4-9 мая 1997 г. С. 195. —Воронеж, 1997.
[4] Киселев Ю.Н., Орлов М.В., Чуркин Е.Б. Графический пакет "СИНТЕЗ. Версия 2.0". / МГУ. — М., 1996. 76 с. Рукопись депонирована в ВИНИТИ от 14.06.96 N 1987-В96.
[5] Чуркин Е.Б. Пакет "СИНТЕЗ-2.0". Примеры исследования выпуклости множеств достижимости некоторых управляемых систем. / МГУ. — М., 1996. 39 с. Рукопись депонирована в ВИНИТИ от 04.06.96 N 1838-В96.
[6] Орлов М.В., Чуркин Е.Б. Численное решение задачи синтеза для задачи быстродействия с линейным входом по управлению. Пакет СИНТЕЗ-2.0. // Вестник Моск. ун-та. Сер. 15, Вычисл. матем. и киберн. 1997. N 2. С. 35 - 39.
[7] Чуркин Е.Б. Графический пакет "СИНТЕЗ-2.0". // В сб.: Современные проблемы теории функций и их приложения: Тезисы докладов 8-й Саратовской зимней школы. 30 января - 6 февраля 1996 г. С. 123. — Изд-во Саратовского ун-та, 1996.
[8] Чуркин Е.Б. Графический пакет "СИНТЕЗ-2.0" для задачи быстродействия. //Веб.: Ломоносов-96. Материалы Международной конференции студентов и аспирантов по фундаментальным наукам. Выпуск 2. Тезисы докладов. 12-14 апреля 1996 г. С. 29. — М.: Изд-во Моск. ун-та, 1997.