Анализ задач оптимального управления с учащающимися переключениями инвариантно-групповыми и численными методами тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Наумов, Георгий Васильевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2005
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
Введение
СОДЕРЖАНИЕ
1. Оптимальный синтез в двухмерной задаче оптимального управления с несимметричными ограничениями на управление и функционалом, зависящим от параметра.
1.1.Постановка задачи.
1.2.Принцип максимума.
1.3.Метод динамического программирования.
1.4.Ограничения разного знака.
1.5.Ограничения одного знака.
2. Численное построение кривой переключения для задач оптимального управления с учащающимися переключениями.
2.1.Постановка задачи.
2.2.Принцип максимума.
2.3.Уравнение Беллмана.
2.4.Алгоритм численного определения параметров кривой переключения.
2.5. Алгоритм построения интегральной поверхности уравнения
Беллмана.
2.6.Алгоритм определения параметров кривой переключения при наличии режима с особой дугой первого порядка.
2.7.Пример ы.
3. Инвариантно-групповой анализ уравнения Беллмана в трехмерной задаче Фуллера.
3.1.Постановка задачи.
3.2.Анализ на основе метода динамического программирования и оптимальный синтез задачи.
3.3.Определение параметров кривой переключения инвариантного цикла и построение функции Беллмана на ней.
В настоящей диссертащи! рассматриваются инвариантно-групповые и численные подходы к анализу задач оптимального управления с учащающимися переключениями.Режимы с учащающимися переключениями [1-14] (так называемые четтеринг режимы) являются одними из интересных режимов, встречающихся в задачах оптимального управления. При таких режимах управление, будучи релейным, подвергается бесконечному (счетному) числу переключений на конечном интервале времени. При этом моменты переключений имеют точку сгущения либо внутри, либо на границе интервала времени, на которОхМ рассматривается задача.Любая задача с учащающимися переключениялн! характеризуется некой кривой (или поверхностью - в зависилюсти от размерности задачи), называемой кривой (поверхностью) переключения, на которой управляющий параметр испытывает разрыв (происходит переключение управления).Хотя режимы с учащающилтся переключения\п1 на практике не реализуемы и в реальных условиях приходится ограничиваться режимами управления с конечным числом переключений, тем не менее, практическая кваз1юптимальная реализация таких режимов предполагает построение неких приближений режимов с учащающимися переключения\п1, что делает изучение четтеринг режимов крайне важным для теории оптимального управления.Задачи, в которых возникают режимы с учащающимися переключениями, люжно найти во многих источниках, и в частности хотелось отметить работы Фуллера (Fuller А.Т.) [15-20], Маршала (Marshal ) [24-26], Осипова Н. и Формальского A.M. [10]. Обширное и системное исследование четтеринг режимов приведено в работе [1] Зеликина М.И. и Борисова В.Ф., а также монографии [42] Борисова В.Ф. Первым, и наиболее известным, примером задачи управления с учащающимися переключениями, является двухмерная задача Фуллера [15-20]: х(0) = ./,Я0) = / , Н < 1 ^^ '^ ^ j[u] = \х^(t)dt —> min /0.2) о Физический смысл данной задачи, возникшей в области радиоэлектроники, состоит в таком погашении шумов, возникших в радиоэлектронной системе, при котором интегральная ошибка будет лн1нимальной.Метод, при помощи которого Вонэм решил задачу (0.1, 0.2), основан на определении структуры функщ1и Беллмана данной задачи исходя из существования у задачи некой группы инвариантности: группы преобразований, переводящей уравнения движения (0.1) в себя же, приводя при этом к простому масштабированию функционала (0.2), т.е. возникновению некого положительного множителя перед ним, при сохранении его структуры.Вслед за появлением задачи Фуллера, была рассмотрена ее модификация, отличающаяся от исходной задачи тем, что на управляющий параметр накладываются несимметричные, но разные по знаку, ограничения. Данная задача была решена Маршалом [24-26]. Было показано, что при любых ограничениях на управляющий параметр (но разного знака) имеет место режим с учащающимися переключениями и что асимметрия ограничений на управляющий параметр влечет за собой асимметрию кривой переключения относительно начала координат.Еще одним примером задачи, в которой возникают режимы с учащающимися переключениями, является задача о наибыстрейшем повороте манипулятора [10], решенная Осиповым Н. и Формальским A.M. При решении данной задачи численно было установлено, что оптимальным режимом управления для данной задачи является режим, предполагающий учащение переключений управления с наличием точки сгущения переключений, т.е. четтеринг режим.Подробную информацию о четтеринг режимах, условиях их существования и примеры задач, в которых возникают данные режимы, можно найти в [1].Как уже говорилось выше, в настоящей работе рассматриваются инвариантно-групповые и численные подходы к анализу задач оптимального управления с учащающимися переключениями. При помощи инвариантногрупповых методов решены задачи, приведенные в первой и третьей главах. Во второй главе приведен алгоритм численного определения параметров кривых переключения для ряда задач с учащающимися переключениями.Особенностью данной задачи и ее отличие от задач Фуллера и Маршала является асимметричный функционал. Асимметрия функционала порождает асимметрию кривой переключения даже при симметричных ограничениях на управляющий параметр. Но основной особенностей данной асимметризации задачи является качественная перестройка режима управления при значительных изменениях параметра L : при определенных изменениях параметра режим с учащающимися переключениями сменяется режимом с не более чем двумя переключениями и особой дугой первого порядка.Существование режима с учащающимися переключениями при одних соотношениях между параметрами задачи с возникновением режима с особой дугой первого порядка при конечных изменениях этих соотношений является принципиально новым фактом, не встречавшимся в других задачах оптимального управления.1 1 3.2. При значениях параметра 7 /Г л "'^'^^'^ место режим с особой дугой первого порядка: оптимальный режим включает участок движения вдоль особой дуги (рис. 5). В данном случае приведенные ограничения на параметр L имеют простую геометрическую интерпретацию: как только соотношение между параметралш задачи становится таким, что полупарабола X = -2Ly , у = sign{b) оказывается внутри области управляемости, имеет место режим с особой дугой первого порядка.Обоснование указанных режимов дается с помощью метода динамического профаммирования. Инвариантно-групповой анализ уравнения Беллмана позволяет построить функцию Беллмана для задачи и определить параметры кривой переключения.Приведенный алгоритм реализован в системе MAPLE: на вход программы подается уравнение Беллмана задачи и результатом расчетов программы являются параметры кривой переключения. Реализация произведена для случаев, когда кривая переключения является параболой (а = 2), но легко может быть модифицирован для расчета параметров кривой переключения для любых значений а.В силу центральной симметрии задачи (0.11), (0.12) поверхность переключения задачи также обладает центральной симметрией. Центральная симметрия задачи подразумевает, что при замене X -> —X, у —> —у, Z —> —Z, и -^ —11 уравнения движения (0.11) переходят сами в себя и значение функционала (0.12) не меняется при этом.Для нахождения параметров кривой переключения инвариантного цикла используются условия непрерывности функции Беллмана, ее частных производных: V^{x\/,l) = V-{x\/,\) v;{x\/,\) = v;{x\/,\) В системе (0.15) не записано условие непрерывности производной ^ , следующее из условий непрерывности функции Беллмана и ее производных по переменным х, у, а также условие переключения, являющееся следствием уравнения Беллмана и непрерывности частных производных функщт Беллмана.Решение системы (0.15) позволяет определить параметры х ,у кривой переключения и параметры функции Беллмана и, в конечном итоге, построить как кривую переключения, так и функцию Беллмана на ней.Результаты, выносимые на защиту На защиту выносятся следующие результаты: 1. Построен оптимальный синтез для задачи управления с несимметричными ограничениями на управление и функционалом, зависящим от параметра: 1.1. показано, что при определенных соотношениях между napaMCTpaNHi задачи имеет место режим с учащающимися нереключенияли!; построен данный режим 1.2. показано, что режим с учащающимися переключениями сменяется режимом с НС более чем двумя переключениями и особой дугой первого порядка, при конечных изменениях соотношений между параметрами задачи; построен данный режим 1.3. при помощи инвариантно-группового анализа построена функция оптимального результата задачи: определена ее структура, содержащая две неизвестных константы, численно определены данные константы и дано обоснование вышеуказанных режимов 2. Построен и реализован алгоритм численно-аналитического построения кривой переключения для ряда задач оптимального управления с учащающимися переключениями 3. Построен и реализован алгоритм численно-аналитического построения кривой переключения для задач с не более чем двумя переключениями и особой дугой первого порядка 4. Построена кривая переключения инвариантного цикла для трехмерной задачи Фуллера и определено значение функции Беллмана на ней Доклады II публикации по теме диссертации Результаты данной диссертации опубликованы в [43-53] и представлены автором на следующих семинарах и конференциях: - Доклад «Анализ уравнения Беллмана в однопараметрическом семействе задач с учащающимися переключениями»// XLII научная конференция МФТИ. Москва-Долгопрудный: МФТИ, ноябрь 1999 - Доклад «Бифуркация фазового портрета в од1Юпараметрическом семействе задач оптимального управления»// XLIII научная конференция МФТИ. Москва-Долгопрудный: МФТИ, ноябрь 2000 (совместно с А.А.
Меликяном) - Доклад «Phase portrait bifurcation in one-parameter family of optimal control problems»// 5'*' IFAC Symposium "Nonlinear Control Systems", July 4-6, 2001, St. Petersburg, Russia (совместно с А.А, Меликяном) Доклад «Оптимальный синтез в двумерной задаче со знакоопределенным управлением»// XLIV научная конференция МФТИ. МоскваДолгопрудный: МФТИ, ноябрь 2001 Доклад «Оптимальный синтез в двумерной задаче с несимметричными ограничениями на управление»// XLV научная конференция МФТИ. Москва-Долгопрудный: МФТИ, ноябрь 2002 Доклад «Оптимальный синтез в двумерной задаче с несимметричны\и1 ограничениями на управление»// семинар кафедры проблем управления механико-математического факультета МГУ. Москва: МГУ, ноябрь 2002 Доклад «Аналитические и численные методы решения задач оптимального управле1П1я с учащающимися переключениями»// семинар кафедры управляемых и гироскопических систем ИПМ РАН. Москва: ИПМ РАН, ноябрь 2002 Доклад «Алгоритм численного построения кривой переключения в задачах управления с учащающилтся переключеннямн»// XLVI научная конференция МФТИ. Москва-Долгопрудный: МФТИ, ноябрь 2003 Доклад «Определение поверхности переключения для трехмерной задачи Фуллера инвариантно-групповым методом»// XLVII научная конференция МФТИ. Москва-Долгопрудный: МФТИ, ноябрь 2004 (совместно с А.Р.
Ахметжановым) Доклад «Анализ задач оптимального управления с учащающимися переключениями инвариантно-групповыми и численными методами»// семинар кафедры управляемых и гироскопических систем ИПМ РАН. Москва: ИПМ РАН, апрель 2005 Доклад «Анализ задач оптимального управления с учащающимися переключениями инвариантно-групповыми и численными методами»// семинар кафедры оптимального управле1Н1я факультета ВМиК МГУ им.М.В. Ломоносова. Москва: МГУ им. Ломоносова, апрель 2005 ГЛЛВЛ1 ОПТИМАЛЬНЫЙ СИНТЕЗ в ДВУМЕРНОЙ ЗАДАЧЕ С НЕСИММЕТРИЧНЫМИ ОГРАНИЧЕНИЯМИ НА УПРАВЛЕНИЕ И ФУНКЦИОНАЛОМ, ЗАВИСЯЩИМ ОТ ПАРАМЕТРА В данной главе рассматривается двумерная задача оптимального управления с нефиксированным временем окончания процесса и интефальным функционалом, зависящим от параметра. На управляющий параметр наложены несимметричные ограничения. Исследуются два случая: ограничения одинакового знака и офаничения разных знаков. В случае офаничений разных знаков при выполнении определенных соотнощений между параметрами задачи имеет место режим с учащающимися переключениями, сменяющийся режимом с двумя переключениями и особой дугой первого порядка при нарушении этих соотношений. В случае зпакоопределенного управления область управляемости - часть плоскости, 0фа1И1ченная двумя полупараболами. Здесь оказываются возможными три режима, два из которых соответствуют выходу на фаницу области управляемости и движению по ней, а третий - режим с особой дугой первого порядка. При изменении параметров задачи фазовый портрет претерпевает эволюцию и один из этих трех режикюв сменяется другим.Обоснование оптимальности упомянутых режимов дается с полющью метода динамического профаммирования.Режимы с учащающимися переключениями (четтеринг режимы) характеризуются тем, что управляющий парамеф за конечное время претерпевает счетное число переключений, причем моменты переключений сгущаются к некоторой точке. Как уже отмечалось, впервые явление четтеринга было обнаружено Фуллером при исследовании проблемы погашения шумов в электронных устройствах. Данная проблема была сведена к задаче минимизации функционала, имеющего смысл интефального квадратичного отклонения и обладающего определенной симметрией [15-20].Подобная симметрия в некоторых случаях может отсутствовать. За период, прошедший с появления классической задачи Фуллера, были рассмотрены такие ее модификации, как задача Маршалла [24-26] и трехмерная задача Фуллера [41]. В частности в задаче Маршалла на управляюшпй параметр наложены несимметричные ограничения. В рассматриваемом здесь случае асимметрия содержится также и в функционале, имеющем смысл интегрального квадратичного отклонения, взятого с некоторым весом. Принципиально новым фактом в задаче с несимметричным функционалом является появление особых режимов первого порядка, не возникавших в других модификациях задачи Фуллера.
1. Zelikin M.1., Borisov V.F. Theory of Chattering Control with Applications to Astronautics, Robotics, Economics and Engineering. Boston: Birkhauser, 1993
2. Борисов В.Ф. Четтерииг режимы в теории оптимального управления //Диссертация на соискание ученой степени кандидата физико-математических наук по специальности 01.01.02 дифференциальные уравнения. М.: МГУ, 1989
3. Борисов В.Ф. Построение оптимального синтеза при наличии четтеринг-режгша //ДАН СССР, 1988 Т. 302, №4 - С. 785-789
4. Борисов В.Ф. Достаточные условия оптимальности четтеринг режимов //Функциональный анализ и его приложения к теории вероятностей и механике. М.: изд-во МГУ, 1984. С. 3-5
5. Борисов В.Ф. Феномен Фуллера Обзор //Итоги науки и техники, серия Современная математика и ее приложения, тематические обзоры. Динамические системы-8. Т.55. Москва, ВИНИТИ, 1999
6. Борисов В.Ф., Зеликин М.И. Режимы с учащающимися переключениями в задаче оптимального по быстродействию управления роботом //ПММ, 1988. — Т. 52, вып. 6. С. 934-946
7. Борисов В.Ф., Зеликин М.И. Режимы учащающихся переключений в задачах механики //7-я всесоюзная конференция по управлению в механических системах. Свердловск, 1990.-С. 41-42
8. Зеликин М.И., Борисов В.Ф. Релсимы учащающихся переключений в задачах оптимального управления //Труды МИАН СССР, 1991. Т. 197. - С. 85-167
9. Зеликин М.И., Борисов В.Ф. Оптимальный синтез, содерэ1сащий траектории учащающихся переключений //Межд. Семинар «Негладкие и разрывные задачи управления и оптимизации», Владивосток. Тезисы докладов. Минск, 1991. - С. 4850
10. Осипов С.Н., Формальский A.M. Задача о быстрейшем повороте манипулятора //ПММ, 1988, Т. 52, Вып. 6. - С. 929-933
11. Kupka, I. The ubiquity of Fuller's phenomenon //Nonlinear Controllability and Optimal Control. Monograph Textbook, Pure Appl. Math. № 133 (ed. By H. Sussman). -N.Y.: Dekker, 1990. P. 313-350
12. Kupka, I. Fuller's phenomenon //Perspectives in Control Theory (Sielpia, 1988). — Progr. Systems Control Theory, 2 Boston: Birkhauser, 1990. - P. 129-142
13. Kupka, I. Geometric theory of extremals. Fuller phenomenon //Proc XXIV Conf. Decision and Control. Lauderdale, Fl., 1985. - P. 711-713
14. Zelikin M.I. The Fuller phenomenon in problems of vibration of two linked oscilators //Dynamical Systems, 1. J. Matn. Sci., 1996 V. 78. - № 5. - P. 626-631
15. Фуллер A.T., Оптимизация релейных систем регулирования по различным критериям качества //Труды I конгресса ИФАК (Москва, 1960). М.: Наука, 1961. -Т. 2. - С. 584-605
16. Fuller А.Т. Study of an optimum non-linear control system //Journal of Electronics and Control., 1963. V.15. №1
17. Fuller A.T. Absolute optimality of non-linear control system with integral-square error criterion //Journal of Electronics and Control, 1964. V. 17, № 3. - P. 301-317
18. Fuller A.T. Constant-ratio trajectories in optimal control systems //Internat. J. Control, 1993. V. 58, №6. P. 1409-1435
19. Wonham W.M. Note on a problem in optimal non-linear control //Journal of Electronics and Control., 1963. V.15. №1
20. Беллман P. Динамическое программирование //M.: Ил. 1960. 400 с.
21. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление //М.: Наука, 1979
22. Понтрягин JI.C., Болтянский В.Г., Гамкерлидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов //М.: Наука, 1976
23. Marshal, С. Chattering arcs and chattering controls //J. Optimizat. Theory and Appl., 1973.-V. 11, №5. p. 441-446
24. Marshal С. Second-order tests in optimization theory //J. Optimizat. Theory and Appl., 1975.-V. 15, №5.-P. 633-666
25. Marshal C. Theoretical research in deterministic optimization //ONERA publ., 1971. -№139
26. Габасов P., Кириллова Ф.М. Особые оптимальные управления. M: Наука, 1973
27. Берщанский Я.M. Сопряжение особых и неособых участков оптимального управления //Автоматика и телемеханика, 1979, № 3, - С. 5-11
28. Берщанский Я.М. Аналитическое исследование оптимальных траекторий в точках выхода на особый участок //Исследование и оптимизация многосвязных систем. М.: Наука, 1979. - С. 59-70
29. Борисов В.Ф., Зеликин М.И. Синтез в задачах оптимального управления, содерэ1сащий траектории с учащающимися переключениями и особые траектории второго порядка //Депонир. В ВИНИТИ СССР 27.06.89, № 4226-В89, 41 с.
30. Зеликин М.И., Борисов В.Ф. Синтез в задачах оптимального управления, содержащий траектории с учащающимися переключениями и особые траектории второго порядка //Мат. заметки, 1990 — Т. 47, вып. 1. — С. 62-73
31. Зеликин М.И., Борисов В.Ф. Поля оптимальных траекторий, содерэ!сащие особые экстремали второго порядка и экстремали с учащающимися переключениями //ДАН СССР, 1989. Т. 304, № 5. - С. 1050-1053
32. Манита JI.A. Поведение экстремалей в окрестностях особых режимов и негладкие функции Ляпунова в задачах оптимального управления //Фундаментальная и прикладная математика, 1996. Т. 2, Вып. 2. - С. 449-485
33. Borisov, V. Singular extremals of order 3 and chattering // Proceedings of Symposia in Pure Mathematics. Differential Geometry and Control, 1998. V.64. - P. 135-147
34. Borisov, V. Hamiltonian systems in a vicinity of singular solutions of local order //Международная конференция, посвященная девяностолетию со дня рождения Л.С. Понтрягина. Тезисы докладов. Оптимальное управление и добавления. М.: МГУ, 1998.-С. 54-57
35. Kelley, H.J., Kopp, R.E., Moyer H.G. Singular extremals //Topics in optimization (ed. By G. Lcitmann). N.Y.: Acad. Press, 1967. P. 63-103
36. Kopp, R.E., Moyer H.G. Necessary conditions for singular extremals //AIAA J., 1965 -V. 3,№8.-P. 1339-1344
37. McDannell, J.P., Powers, W.F. Necessary conditions for joining optimal singular and non-singular subarc //SIAM J. Control and Optimizat., 1971. V. 9, № 2 - P. 161-172
38. Melikyan, A.A. Generalized Characteristics of First Order PDEs: Application in Optimal Control and Differential Games //Birkhauser. Boston. 1998
39. Zelikin, M.I., Borisov, V.F. Optimal synthesis containing chattering arcs and singular extremals of second order //Nonlinear synthesis. Proc. IIASA Workshop Sopron. Hungary, 1989. In: Prog. Syst. Control Theory., 1991. V. 9. - P. 283-296
40. Fuller, A.T., Grensted, P.E. Minimization of integral square error for non-linear control system of third and higher order //Internal. J. Control, 1965. V. 2, № 1. - P. 3373
41. Г.В. Наумов, А.Р. Ахметжанов. Определение поверхности переключения для трехмерной задачи Фуллера инвариантно-групповым методом //Тезисы докладов: XLVII научная конференция МФТИ. Москва-Долгопрудный: МФТИ, 2004, часть III, с. 177-179
42. Г.В. Наумов. Алгоритм численного построения кривой переключения в задачах управления с учащающимися переключениями //Тезисы докладов: XLVI научная конференция МФТИ. Москва-Долгопрудный: МФТИ, 2003, часть III, с. 40
43. Г.В. Наумов. Построение кривой переключения для задач оптимального управления с учащающимися переключениями //Известия РАН «Теория и системы управления». № 3. с.46-51
44. Г.В. Наумов. Оптимальный синтез в двумерной задаче с несимметричными ограничениями на управление // Прикладная Математика и Механика. Т. 67. Вып. 2. с. 199-211
45. Г.В. Наумов Оптимальный синтез в двумерной задаче с несимметричными ограничениями на управление// Тезисы докладов: XLV научная конференция МФТИ. Москва-Долгопрудный: МФТИ, 2002, часть III, с. 33
46. Г.В. Наумов Оптимальный синтез в двумерной задаче со знакоопределенным управлением// Тезисы докладов: XLIV научная конференция МФТИ. Москва-Долгопрудный: МФТИ, 2001, часть III, с. 69
47. Ю.В. Алдакимов, A.A. Меликян, Г.В. Наумов Перестройка режима в однопараметрическом семействе задач оптимального управления// Журнал "Прикладная математика и механика", 2001, т.65, вып.З, с.400-407
48. A.A.Melikyan, G.V.Naumov Phase portrait bifurcation in one-parameter family of optimal control problems// Proceedings of 5th IFAC Symposium "Nonlinear Control Systems", July 4-6, 2001, St. Petersburg, Russia, Vol.4, pp. 1286-1291
49. Г.В. Наумов, A.A. Меликян Бифуркация фазового портрета в однопараметрическом семействе задач оптимального управления// Тезисы докладов: XLIII научная конференция МФТИ. Москва-Долгопрудный: МФТИ, 2000, часть III, с. 26
50. Г.В. Наумов Автомодельные решения уравнения Беллмана для семейства задач оптимального управления// Некоторые проблемы фундаментальной и прикладной математики" М., 1999 ISBN 5-7417-0124-8, Стр. 127-139