Достаточные условия оптимальности в задачах управления

Ананьев, Виктор Владимирович

Достаточные условия оптимальности в задачах управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Ананьев, Виктор Владимирович АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Ленинград МЕСТО ЗАЩИТЫ

1984 ГОД ЗАЩИТЫ

01.01.09 КОД ВАК РФ

Диссертация по математике на тему «Достаточные условия оптимальности в задачах управления»

Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Ананьев, Виктор Владимирович

Некоторые используемые обозначения

Введение

Глава I. Неавтономные управляемые системы

§1.1. Поднятие экстремалей в 7**1РП'

§1.2. Поток на лагранжевом грассманиане А ("к,)

Основные результаты

§1.3. Исследование потока на ЛМ

§1.4. Семейства лагранжевых многообразий

§1.5. Аналог необходимого условия оптимальности Якоби

§1.6. Вариационные задачи с линейными ограничениями на скорость

§1.7. Доказательство теоремы I.I

Глава II. Автономные управляемые системы

§2.1. Гамиль тонов фазовый поток и аналог уравнения в вариациях.

§2.2. Кусочно гладкие лагранжевы многообразия и достаточные условия оптимальности

§2.3. Траектории с самопересечениями

§2.4. Исследование потока v^ . Доказательство теоремы 2.2.

§2.5. Поток у* и лагранжевы конусы. Доказательство теоремы 2.3.

§2.6. Задача оптимального управления с функционалом

Лагранжа

§2.7. Пример.

§2.8. Доказательство теоремы 2.

§2.9. Оптимальность траекторий, удовлетворяющих принципу максимума с постоянной & - 0 . •

Глава III. Особые оптимальные траектории

§3.1. Подмногообразие 2 * . Гамиль тонов поток в окрестности .П

§3.2. Построение кусочно гладкого лагранжева многообразия

§3.3. Достаточные условия оптимальности

§3.4. Пример.

Введение диссертация по математике, на тему "Достаточные условия оптимальности в задачах управления"

В работе построен аналог теории Якоби достаточных условий оптимальности управляемых процессов, описываемых обыкновенными дифференциальными уравнениями. Теория сопряженных точек по Якоби обобщается на задачи оптимального управления, в которых не выполняются классические предположения этой теории.

В настоящее время можно выделить 3 основных подхода к построению достаточных условий оптимальности в теории оптимального управления: обобщение метода Beйерштрасса [l6,I7], основанного на использовании поля экстремалей, метод динамического программирования [l3-I5,29,39] и основанный на нем метод регулярного синтеза [14,15] и достаточные условия 2-го порядка, полученные в рамках принципа Лагранжа [30,36,lJ . В данной работе предлагается новый геометрический подход, основанньй на привлечении теории лагранжевых многообразий и симплектической геометрии. Для иллюстрации предлагаемого метода и его связи с методами поля экстремалей и динамического программирования рассмотрим два примера.

I. Рассмотрим задачу минимизации функционала

ФОН!№ о в классе С -кривых J/г [4, У lf\ К с фиксированными концами /ft>)=*o, = функция Jtofa&j), fc е принадлежит классу С f ^^ фиксированы. Для простоты будем предполагать, что выпукла по Ш при фиксированных (x7i) и матрица вторых частных производных д fto/dtidci положительно определена при всех (х, i) t

Теория Якоби достаточных условий минимума функционала (4-) основывается

1,11,11, 22] на привлечении понятия поля экстремалей. Поле экстремалей определяется как семейство решений задачи

Коши х = i/(X,4r) ? x(i0) = (*)' для некоторой окрестности W0 с (p* точки xv и некоторой

С ^—функции V : W^ Й?"', где множество W с IE*** $ открыто и \)(/0 K-J-toJcl^. На функцию V накладывается дополнительное требование, состоящее в том, что интеграл Гильберта (ft(x,*J)-(£•*) Л (3) X зависит тсяько от концов Х(1')? X{i") кривой X • [■£', i"J —If?*; ( X Ш} i) е [Л/ "] . Условие Вейерптрасса

-£>(*>»>*)-a-v) выполняется в рассматриваемом случае автоматически, поскольку функция $0 foe, и., У выпукла по и, .

Если гладкую кривую J/ : \Ь0> У ^ можно включить в поле экстремалей (2.) , т.е. ft (Ь) -V(ft ft),то кривая ft доставляет локальный минимум функционалу (1) [*f0, ki\ . Достаточные условия Якоби есть не что иное, как условия, при которых кривая ft может быть включена в поле экстремалей. В данной работе мы поступаем аналогично, но в качестве исходного объекта, вместо поля экстремалей, мы используем лагранжевы многообразия. Фактически лагранжевы многообразия уже использовались неявно Л.Янгом [^о]. Необходимые сведения о лагранжевых многообразиях и связанных с ниш понятиях содержатся в [3,1/, 2 33, Некоторые из них мы будем приводить по ходу изложения в удобной для' нас форме.

Пользуясь терминологией механики, будем называть кокасатель-ное расслоение T^fR*1 фазовым пространством. Через у будем обозначать координаты в Т* , двойственные к координатам х. в /в этих координатах значение и/i/ кокасательного вектора W е Т* If?*1 с координатами у*) на касательном векторе есть + Выбором этих координат пространство отождествляется с ^ =

Z=(i,x)7 y = Г- Т обозначим проекцию, ЗГ- »-> * . На пространстве Т* ^ определены каноническая I-форма 00i= %dx и симплектическая структура со2- = ctw1 = dy л dx .

Определим гамильтониан Н: ( ^P^xlR и{+во}

Будем предполагать, что функция Н конечна на Т* . Тогда Н принадлежит классу . Пусть С ^-кривая у: удовлетворяет уравнениям Эйлера-Лагранжа р/0] . Определим поднятие ff : [i0fij -т Т* fK5^ кривой ^ форьделой

Тоща, как хорошо известно ["fyO] , кривая ff удовлетворяет уравнениям Гамильтона и обратно, если С ^-кривая является решением уравнений Гамильтона (*/) , то ее проекция Jfj' • ^ удовлетворяет уравнениям Эйлера-Лагранжа.

Будем для простоты считать, что произвольное решение системы (к) может быть продолжено на всю вещественную ось. Обозначим через <р* : T^JR^—» J*R*1 двупараметрическое семейство диффеоморфизмов, порожденное системой Of) , т.е. при произвольных фиксированных ге 7*11?^ кривая ij (Ц = уt £ есть решение задачи Коти для системы (Ь) с начальным условием у (s) = 2 . В] . Отметим, что отображения ^ симплектические, т.е. сохраняют симплектическую структуру [3] , (fs)*003" =

Предположим теперь, что кривую ft можно включить в поле экстремалей (I) для некоторого поля направлений Определим подмногообразие L ^ Г*IR*1 * Р формулой = И ы (х> I е •

Мы будем рассматривать L также, как семейство подмногообразий Lt=L(\ с т*^ , ie(R. Подинтегральное выражение в (3) есть не что иное, как значение I-формы = у dx -- Ai на векторе jtL {b) + ^ , где Я,: [Г,I "J -> ~ поднятие кривой X в L , т.е. {XL(-lr)L ^ •£"], и

7fX± - X . Из инвариантности интеграла (3) нетрудно тогда вывести, что где L * IR - вложение, и следовательно, подмногообразия с Г*!!?*1 лагранжевы и, если (в, s)6 L , то при i близких к s сfj 2 е t^ [3] , Обратно, предположим, что существует Ol-^-мерное С ^-подмногообразие /, cT^IRN fR? такое, что 1) сужение

- диффеоморфизм на некоторое открытое множество Л^хИ?, A) для всех и В) -0. Тогда кривая ft включается в поле экстремалей, задаваемое полем направлений 1) = (^ji^) * зс^)е^, где Hi - ^l^ips^-t} " СУ®61216 W на слой t =

Теперь рассмотрим, как интерпретируется условие Якоби /отсутствие сопряженных к ic точек в интервале / и как из. него можно вывести существование требуемого семейства лагранжевых многообразий. Предположим, что мы уже построили подмногообразие удовлетворяющее условиям и 3) . Подмногообразия L±c а 1}лагранжевы. Обозначим через ^ касательное пространство к в точке } Тогда -^лагранжева плоскость линейного симплектического пространства Т^щ = Обозначим через p=dy, координаты в этом пространстве, проекцию (р?^)^ обозначим тем же символом f: fR If?'1'. Для произвольной лагранжевой плоскости Л iP^**" положим глл^ Л dim (ГХ). Поскольку f(H - <f£ I® * (Ц > №>) ' (fs^ > g то = Заметим теперь, что, если для всех ie

ГСиьк - то для некоторой окрестности ]/<^T*IR xlR множества Г(?) | ^Рч>А]| многообразие Lf)V будет удовлетворять условиям i), 2), з). Следовательно, достаточно доказать существование семейства лагранжевых плоскостей J[^ с , такого, что h - % h и faJnk Xi =п для всех е У, гДе f^ = (^Д,. | Tfa) ' В ЭТ0М случае можно по~ л ожить i где £ >0? L° — гиперплоскость в T ^Р'г= /J?"21^ проходящая через точку tf (i0) и параллельная . j ^^

Семейство линейных симплектических диффеоморфизмов i llv —* —:>fi?2'Vv , как легко убедиться, порождено гамильтоновой системой с квадратичным гамильтонианом К($7i) - |)7 f - (P>l)< Уравнения (5) - это дифференциальные уравнения Якоби для I" [4о]| , и из определения сопряженной точки следует, что сопряженные к i0 точки - это те точки ie R , для которых fЪлк ^ n-i, где / = Таким обРазом> условие Якоби означает, что гсоък ^ /г для всех

Поскольку отображения vi/^ - линейные симплектические, то

1ч > J поток ^ ; (р jp порождает поток vps : У\ М А (|г) на лагранжевом грассманиале Л fr-) М 7 fs -'Л -А е

6 Л Си), лагранжеву плоскость Л ^ И? п мы рассматриваем одновременно как подпространство в ft? К и как точку многообразия Л (*-)/. Траектория : i ^ ^ Г € Л Gt) ie [i0? ,

- ю потока ^ пересекает замкнутое множество rtutк Д < в единственной точке X при 4= i0 . Из положительной определенности при всех i матрицы Ъ^К/дрдр можно тоща вывести, используя технику работы , что существует близкая к J\° траектория А : , потока ^ , не пересекающая JlOrb), т.е. fOfck \ = Kt для всех i £

2. В качестве следующего примера рассмотрим задачу оптимального быстродействия с фиксированными концами для управляемой системы i = P(x,tb) , хеЪ\ M.6U, (е) где 17 с [R^ отображение непрерывно вместе с частными производными ^/Зх » допустимые управления суть измеримые отображения CC']i07iJU. Траекторию Ih^ системы (б) без самопересечений вместе с соответствующим ей управлением будем называть локально оптимальной, если для некоторой окрестности W множества ^([0,Т]) и для всякой траектории ^ : [07 7]] IV системы из равенств ^ (0) = jf(0), jfl {Tj следует ^ Т.

Положи = | U eU} £ IR>U {^J.

Достаточным условием оптимальности пары U-) согласно методу динамического программирования [15-iS] является существование ^ -функции

S ■■ IR определенной на некоторой окрестности W множества ^ ([07 Tj) и такой, что для почти всех £е[о,Г]. Предположим, что функция /V конечна и принадлежит классу С , и пусть кривая ^; [ОД] Г*/??11, удовлетворяет уравнениям Гамильтона (Ь) и //= i. Тогда, как и выше, можно определить потоки ср"1: IP*1, (j^2* = и Л ности //fy,*) по у, здесь 1Шк ffl 4 п.-i для всех £e[0,TJ. Оказывается, однако, если функция = nwdc^- неубывающая на [07 Г] , то существует семейство лагранжевых плоскостей ? е[07Г]? такое, что ГаИ^Л^^/г и TdU{f(b))

Отсюда же нетрудно вывести, что существует лагранжево многообразие

L <= Гтакое, что //(2~)=i] , #) • Из Условия ^ следует, что L П V хорошо проектируется на fi^ ^ для некоторой окрестности ]/ множества ^([0,Т])и, следовательно, задается производящей функцией

Функция и будет требуемой в методе динамического программирования. Условие, что - неубьвающая функция, равносильно тому, что для всякого решения J ^ zfefO, 7~3 , уравнений из условий = = О следует ^^

Интерпретация поля экстремалей в примере I как семейства лагранжевых многообразий и решения £ уравнения Беллмаяа (?■) в примере 2 как лагранжева многообразия не является новой /см., например, [i], §4.4/. Однако, накладывая дополнительные требования гладкости на эти многообразия, мы получаем возможность ограничиться рассмотрением касательных пространств к этим многообразиям /лагранжевых плоскостей/ в точках поднятия рассматриваемой экстремали в 11 Производящие квадратичные формы этих лагранжевых плоскостей удовлетворяют некоторому обыкновенному дифференциальному уравнению, коэффициенты которого определены рассматриваемой экстремалью, и для проверки оптимальности рассматриваемой экстремали нужно проверить выполнение некоторых условий для одного фиксированного решения этого уравнения*

В работе получены следующие основные результаты. I. Построен аналог теории сопряженных точек по Якоби в терминах свойств некоторого потока на лагранжевом грассманиане для задач оптимального управления, в которых не выполняются классические предположения этой теории, и на этой основе получены достаточные условия оптимальности в задаче Лагранжа и в задаче оптимального быстродействия.

2. Получены необходимые условия Якоби в задаче Лагранжа с фиксированными концами незакрепленным!временем для неавтономных управляемых процессов.

3. Найдены достаточные условия локальной единственности решения двухточечной задачи управления.

4. Выделен один класс скользящих режимов и получены достаточные условия оптимальности экстремалей, содержащих участки скользящих режимов этого класса.

При дополнительных предположениях на управляемый процесс полученные достаточные и необходимые условия оптимальности превращаются в классические условия Якоби вариационного исчисления. В случае отсутствия переключений построенные в главе II достаточные условия согласуются с условиями, полученными в работе [ю] в рамках принципа Лагранжа.

Проверка полученных в работе достаточных условий представляется более простой, чем условий регулярного синтеза [*I4,I5] . Кроме того условия регулярного синтеза не выполняются для рассматриваемых в главе III особых экстремалей. В случае же локальной единственности /и следовательно, оптимальности/ решения двухточечной задачи управления названные вше методы не работают.

Основные результаты диссертации опубликованы в работах

Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Ананьев, Виктор Владимирович, Ленинград

1. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. - М.: Наука, 1979. - 432 с.

2. Анрион Р. Теория второй вариации и ее приложения в оптимальном управлении. М.: Наука, 1979. - 207 с.

3. Арнольд В.И. Математические методы классической механики. -М.: Наука, 1974. 432 с.

4. Арнольд В.И. О характеристическом классе, входящем в условия квантования. Функц. анализ, 1967, т. I, вып. I, с. I-I4.

5. Арнольд В.И. Контактные многообразия, лежандровы отображения и особенности волновых фронтов. УМН, 1974, т. 29, вып. 4, с. 153-154.

6. Арнольд В. И. Лагранжевы и лежандровы кобордизмы. Функц. анализ, 1980, т. 14, вып. 3, с. I-I3, вып. 4, с. 8-17.

7. Арнольд В.И. Особенности систем лучей. УМН, 1983, т. 38, выи. 2, с. 77-147.

8. Арнольд В.И. Обыкновенные дифференциальные уравнения. М.: Наука, 1976. - 240 с.

9. Арнольд В.И., Варченко А.Н., Гусейн-Заде С.М. Особенности дифференцируемых отображений. М.: Наука, 1982. - 304 с.

10. Арутюнов А.В., Тынянский Н.Т. Условия первого и второго порядка в задачах оптимального быстродействия. УМН, 1981,т. 36, вып. 6, с. 199-200.

11. Ахиезер Н.И. Лекции по вариационному исчислению. М.: Гос-техиздат, 1955. - 248 с.

12. Блисс Г.А. Лекции по вариационному исчислению. М.: ИЛ, 1950. - 348 с.

13. Болтянский В.Г. Достаточные условия оптимальности. ДАН СССР, т. 140, Я 5, 1961, с. 994-997.

14. Болтянский В.Г. Достаточные условия оптимальности и обоснование метода динамического программирования. Изв. АН СССР, сер. матем., 1964, т. 28, № 3, с. 481-514.

15. Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969. - 408 с.

16. Величенко В.В. К обобщению метода Вейерштрасса на неклассические задачи. ДАН СССР, 1972, т. 207, tf 4, с. 769-772.

17. Величенко В.В. О методе поля экстремалей в достаточных условиях оптимальности. ЖВМ и МФ, 1974, т. 14, № I, с. 45-67.

18. Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов. М.: Наука, 1971. - 507 с.

19. Габасов Р., Кириллова Ф.М. Особые оптимальные управления. -М.: Наука, 1973. 25S с.

20. Габасов Р., Кириллова Ф.М. Методы оптимального управления. -Итоги науки и техники. Современные проблемы математики.Т. 6. М., 1976, с. 133-20©.

21. Гамкрелидзе Р.В. О скользящих оптимальных режимах. ДАН СССР, 1962, т. 143, $ 6, с. 1243-1245.

22. Гельфанд И.М., Фомин С.В. Вариационное исчисление. М.: Физматгиз, 1961. - 228 с.

23. Гийемин В., Стернберг С. Геометрические асимптотики. М.: Мир, 1981. - 504 с.

24. Годбийон К. Дифференциальная геометрия и аналитическая механика. М.: Мир, 1977. - 188 с.

25. Голубицкий М., Гийемин В. Устойчивые отображения и их особенности. М.: Мир, 1977. - 296 с.

26. Закашокин В.М. О лагранжевых и лежандровых особенностях. -Функц. анализ, 1976, т. 10, вып. I, с. 26-36.

27. Зубов В.И. Лекции по теории управления, Л.: Изд-во ЛГУ, 1972, - 204 с.

28. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1972. - 49В с.

29. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973. - 44S с.

30. Левитин Е.С., Милютин А.А., Осмоловский Н.П. Условия высших порядков локального минимума в задачах с ограничениями. -УМН, 1978, т. 33, вып. 6, с. 85-148.

31. Ли Э.Б., Маркус Л. Основы теории оптимального управления. -М.: Наука, 1972. 576 с.

32. Лобри К. Динамические полисистемы и теория управления. -В кн.: Математические методы в теории систем. М.: Мир, 1979, с. 134-173.

33. Мищенко А.С., СтернинБ.Ю., Шаталов В.Е. Лагранжевы многообразия и метод канонического оператора. М.: Наука, 1978. -352 с.

34. Моисеев Н.Н. Элементы теории оптимальных систем. М.: Наука, 1975. - 528 с.

35. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976. - 392 с.

36. Сарычев А.А. Индекс второй вариации управляемой системы. -Матем. сб., 1980, т. ИЗ, $ 3, с. 464-486.

37. Хартман Ф. Обыкновенные дифференциальные уравнения. М.: Мир, 1970. - 720 с.

38. Хирш М. Дифференциальная топология.-М.: Мир, 1979. 280 с.

39. Хрустал ев М.М. Необходимые и достаточные условия оптимальности в форме уравнений Беллмана. ДАН СССР, 1978, т. 242,5, с. 2023-2026.

40. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. М.: Мир, 1974. - 488 с.- 149

41. C&rctiWodo г/ С. VWiodionsrccfin^Kg. uW p&rlitile dcffere-^itA-tyPbLtkusng&b e,rsie-r Orc/yiuny. cfiUp г effort yl ! Teudner f 1335\ - bOl s,

42. Web stun, Symp&ciic тапС^оЫз cuid -theirЬц rctyi^ULY) StA&nWll^oUs . Ло(/, 6>t IUdik.7 iSli, v. G, p.

43. Л. <£&cjrcbhQeouyi iLuinwuifolds Сим/ fbbvniliom&h. ysiemj. Лпп. of JUatk., №15, V.р.т-но.Работы, опубликованные по теме диссертации

44. Ананьев В.В. О распространении теоремы Якоби на неклассические задачи. Л., 1981, деп. ВИНИТИ, № 4524-81, с. 1-30.

45. Ананьев В.В. Лагранжевы многообразия и достаточные условия оптимальности. -Вестн. ЛГУ, сер. матем., механ., астроном., 1982, JP 13, с. 57-62.

46. Ананьев В.В. Оптимальность траекторий в задаче быстродействия с подвижными концами. Л., 1982, деп. ВИНИТИ,6176-82, с. 1-33.