Асимптотическое поведение экстремалей в окрестности особых траекторий высокого порядка тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Манита, Лариса Анатольевна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1996
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М. В. Ломоносова
Механико-математический факультет
На правах рукописи УДК 517.977
Манита Лариса Анатольевна
АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ ЭКСТРЕМАЛЕЙ В ОКРЕСТНОСТИ ОСОБЫХ ТРАЕКТОРИЙ ВЫСОКОГО ПОРЯДКА
01.01.02 — дифференциальные уравнения
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
МОСКВА 1996
Работа выполнена на кафедреобщих проблем управления механико-математического факультета Московского государственного университета имени М. В. Ломоносова
Научный руководитель — Официальные оппоненты:
Ведущая организация —
доктор физико-математических наук, профессор М. И. Зеликин
доктор физико-математических наук, профессор М. С. Никольский, доктор физико-математических наук, профессор А. В. Арутюнов
Институт проблем механики РАН
Защита диссертации состоится "<СУ_" и.ссут,тт~1с1- 1990 г. в 16 час. 05 мин. на заседании диссертационного совета Д.053.05.04 при Московском государственном университете имени М. В. Ломоносова по адресу: 119899, ГСП, Москва, Воробьёвы Горы, МГУ, механико-математический факультет, аудитория 16-24.
С диссертацией можно ознакомится в библиотеке механико-математического факультета МГУ (14 этаж, Главное здание).
Автореферат разослан
Учёный секретарь диссертационного совета Д.053.05.04 при МГУ доктор физико-математических наук,
профессор Т. П. Лукашенко
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Работа представляет собой исследование в одной из активно развивающихся в последние годы областей оптимального управления — теории режимов с учащающимися переключениями (четтеринг-режимов). Суть четтеринг-режимов состоит в том, что управление на оптимальной траектории имеет бесконечное число неустранимых разрывов на конечном интервале времени. Впервые пример такой задачи привел А. Т. Фуллер [1]. Затем было найдено большое число задач, в том числе и прикладных, в которых также имеет место феномен Фуллера. В связи с этим возник вопрос о типичности четтеринг-режимов. Ответ был дан в недавних работах И. Купки [2], М. И. Зеликина и В. Ф. Борисова [3], в которых доказано, что для открытого множества гамильтоновых систем принципа максимума Понтрягина с одномерным управлением существует подмногообразие конечной коразмерности, через каждую точку которого проходит однопара-метрическое семейство четтеринг-траекторий.
Одной из основных причин возникновения феномена Фуллера является наличие у управляемой системы особого режима. Под особым режимом [4] понимается траектория, в точках которой условие максимума Понтрягина не определяет однозначно значение управляющей функции, то есть максимум гамильтониана достигается более чем в одной точке. Для задач, афинно порожденных ска-
[1] Фуллер А. Т. Оптимизация релейных систем регулирования по различным критериям качества. Труды I конгр. ИФАК (Москва, 1960). М. 1961. Т. 2, с. 584-605.
[2] Kupka I. The ubiquity of Fuller's phenomenon. Nonlinear Controllability and Optimal Control. Monograph Textbook Pure Appl. Math., 133 (ed. by H. Sussman). — N. Y.: Dekker, 1990. P. 313-350.
[3] Zelikin M. I., Borisov V. F. Theory of Chattering Control with applications to Astronautics, Robotics, Economics, and Engineering. Birkhauser, Boston-Basel-Berlin, 1994.
[4] Габасов P., Кириллова Ф. M. Особые оптимальные управления. — M.: Наука, 1973.
лярным управлением, гамильтониан линейно зависит от и, и коэффициент при и — функция Н\ от фазовой и сопряженной переменной — вдоль особой траектории есть тождественный нуль. Управление на такой траектории не определяется из принципа максимума Понтрягина, однако может быть получено последовательным дифференцированием тождества Н\ = 0, где Н\ — коэффициент при и в гамильтониане. При этом впервые управление и появляется обязательно на четном шаге дифференцирования Число д называется порядком особой траектории. Для задач, афинных по управлению, оптимальная траектория, как правило, выходит на особый режим. Однако доказано, что сопряжение кусочно-гладкой неособой траектории с особой траекторией любого четного порядка неоптимально (теорема Кэлли-Коппа-Мойера [5]). Поэтому для оптимальных траекторий особый участок (четного порядка) сопрягается не с кусочно-гладкой дугой, а с четтеринг-траекторией.
Полная теория четтеринг-режимов второго порядка построена в работах М. И. Зеликина, В. Ф. Борисова [3, 6], в которых дано полное описание фазового портрета разрывных гамильтоновых систем в окрестности особого многообразия второго порядка, показано, что асимптотика решений таких задач определяется решением двумерной классической задачи Фуллера.
Несмотря на то, что задачи с особыми режимами высокого порядка привлекают к себе большое внимание, они до сих пор остаются малоизученными. Полученные в этом направлении результаты носят, в основном, частный характер. Аналитические результаты получены только для отдельных семейств решений, обладающих специальной группой симметрии. В работе Маршала [7]
[5] Kelley Н. J., Корр R. Е., Моуег Н. G. Singular extremals. Topics in optimization. Ed. G. Leitmann. N. Y., Acad. Press, 63-103 (1967).
[6] Зеликин M. И., Борисов В. Ф. Режимы учащающихся переключений в задачах оптимального управления. Труды МИАН им. В. А. Стеклова, Т. 197, 85-167 (1991).
[7] Marchal С. Second order tests in optimization theories. J. Optimiz. Theory and Appl. V. 15, N. 6, 633-666 (1975).
была сформулирована задача, являющаяся п-мерным аналогом задачи Фуллера. В [6] высказана гипотеза, что асимптотика решений, лежащих в окрестности особого многообразия порядка п, задается решением п-мерного аналога задачи Фуллера.
Цель работы. Разработать эффективный метод построения негладких функций Ляпунова для задач стабилизации многомерных управляемых систем. На основе этого метода исследовать асимптотическое поведение решений в задачах оптимального управления в окрестности особых режимов, доказать существование чет-теринг-режимов в окрестности особых траекторий высокого порядка. Применить полученные результаты к изучению задач с особыми режимами высокого порядка, имеющих отношение к робототехнике.
Методы исследования. В работе используются методы теории оптимального управления и функционального анализа, методы теории дифференциальных уравнений с разрывной правой частью, выпуклый и негладкий анализ, второй метод Ляпунова.
Научная новизна. Основные результаты диссертации являются новыми и состоят в следующем.
Разработан новый конструктивный метод построения негладких функций Ляпунова в задачах стабилизации нелинейных управляемых систем, являющихся возмущениями п-мерной линейной вполне управляемой системы. На основе этого метода строится негладкая функция Ляпунова для возмущенных управляемых систем, которая имеет тот же порядок малости, что и функция минимального времени в невозмущенной задаче.
Доказано существование решений для класса задач минимизации квадратичного функционала на траекториях управляемых систем (с ограниченным скалярным управлением), являющихся нелинейными возмущениями п-мерной линейной вполне управляемой системы. Для этого класса задач с использованием негладких функций Ляпунова показано, что асимптотическое поведение решений вблизи особой траектории определяется поведением решений невозмущенной задачи. То есть, доказано, что решения возмущенной
задачи выходят на особый режим за конечное время, причем это время, рассматриваемое как функция от начальной точки, имеет тот же порядок малости, что и соответствующая функция времени невозмущенной задачи.
Для широкого класса возмущений доказано, что на особый режим высокого порядка оптимальные решения выходят с бесконечным числом переключений на конечном интервале времени.
С использованием полученных в диссертации результатов доказано, что в задачах управления манипуляторами реализуются особые режимы любого четного порядка, на которые оптимальные траектории выходят с четтерингом.
Приложения. Работа имеет теоретический характер. Результаты диссертации могут быть полезны при изучении задач оптимального управления, обладающих особыми режимами, задач стабилизации многомерных нелинейных управляемых систем, при исследовании устойчивости систем нелинейных дифференциальных уравнений с разрывной правой частью, а также при изучении задач робототехники, космической навигации.
Апробация диссертации. Основные результаты диссертации докладывались автором на семинаре по оптимальному синтезу на механико-математическом факультете МГУ, на семинаре кафедры оптимального управления факультета ВМК МГУ, на конференции "Понтрягинские чтения - IV" (Воронеж, 1993).
Публикации. По теме диссертации опубликовано 4 научные работы. Список публикаций приведен в конце автореферата.
Структура диссертации. Диссертация состоит из введения и 4 глав, разделенных на параграфы. Список литературы содержит 61 наименование. Общий объем диссертации составляет 131 страницу.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении дан обзор работ по теме диссертации и приведены основные результаты. В диссертации рассматривается следующая управляемая система:
¿1 ¿2
^ хп
где а; = (хь... ,хп) £ Rn, х(0) = х°, f(x) = (/i(z),..., /„(х)), управление и одномерно и удовлетворяет ограничению < u(t) < для произвольных заданных и- <0, и+ > 0, а функции fi достаточно гладкие. Допустимые управления — измеримые функции, допустимые траектории абсолютно непрерывны. Мы будем пользоваться векторными обозначениями х = Ах + Ьи + /(х), подразумевая систему (1).
Рассматривается функционал
оо
= J xl(t)dt. (2)
о
В диссертации используется следующая терминология.
Задача I: n-мерная невозмущенная задача Фуллера — минимизировать функционал (2) на траекториях системы (1) в предположении, что f(x) =0, и+ = —U- = 1.
Задача II: Задача быстродействия — минимизировать время попадания в начало координат по траекториям управляемой системы (1) при f(x) = 0.
Задача III: n-мерная возмущенная задача Фуллера — минимизировать функционал (2) на траекториях системы (1), где возмущение f(x) удовлетворяет условию малости в смысле группы Фуллера.
= и+ fi{Xi,...,Xn)
= f2(xi,...,xn)
— — 1 fn O^l) • • • > ^n) >
Группой Фуллера мы будем называть однопараметрическую группу G = {ffAi А > 0} диффеоморфизмов пространства R":
дх(х) = (Axi,..., Хпхп).
Множество решений невозмущенной задачи Фуллера инвариантно относительно действия группы G.
Будем говорить, что возмущение f(x) = (/j (х),..., /„(х)) мало в смысле действия группы Фуллера, если равномерно по всем х из множества {а;: < 1 , г = 1,... ,п} имеют место оценки
шЩ^<С0, г = 1,..., п, (3)
а-Ц-О А1
для некоторой постоянной Со > 0.
В главе 1 рассматривается n-мерная невозмущенная задача Фуллера. Для нее начало координат х = 0 есть особый режим порядка п. Основное содержание главы составляет предлагаемый в диссертации новый метод доказательства следующего утверждения.
Теорема 1.2. Оптимальные траектории в задаче 1с начальными условиями :r(0) £ Qr, где
Qr = {xe R" : \xi\ < r\ i = l,...,n} ,
достигают начала координат за конечное время, не превосходящее const • г.
Хотя это утверждение вытекает из результатов [3], однако метод доказательства работы [3] существенным образом использует инвариантность невозмущенной задачи Фуллера относительно действия группы Фуллера. Этот метод не работает в ситуации, когда инвариантность отсутствует. Преимущество предлагаемого в главе 1 нового метода состоит в том, что на его основе удаётся получить аналогичные результаты для возмущенной тг-мерной задачи Фуллера, не обладающей группой симметрии, что составляет со-
держание главы 3. Метод основан на использовании оценки сверху оптимального значения функционала в рассматриваемой задаче.
Предложение 1.1. Пусть — оптимальная траектория в задаче I, выходящая из точки х(0) 6 <3Г. Тогда
J(x(■)) < Е ■ г2п+\ Е> 0. (4)
Пусть х(£) — оптимальная траектория в задаче I с начальным условием х° е (¿г и т(х°) т£ {£: х(1) 6 <5Г/г}- Основной пункт доказательства Теоремы 1.2 состоит в том, что т(х°) < д ■ г, где положительная константа д не зависит от г и начальной точки х° (Лемма 1.9). При доказательстве используется оценка функционала снизу: существует такое 7 > 0, что для всех натуральных к < т(х°)/г
кт
I 4(0<Й>7 Т2п+1.
(к- 1)г
В главе 2 рассматривается задача стабилизации управляемой системы (1), соответствующей возмущенной задаче Фуллера. Доказывается, что для любого х° из достаточно малой окрестности нуля существует такое управление и = гг(й), что соответствующее ему решение системы (1) приходит в начало координат за конечное время и остается там неподвижно. При этом, это управление, рассматриваемое как функция от текущего положения траектории в фазовом пространстве, одно и то же для-всех возмущений /(х), удовлетворяющих условию малости относительно действия группы Фуллера. А именно, пусть и = й(х) — оптимальный синтез в задаче быстродействия (задача II). Тогда для любого я(0) = х° траектории невозмущенной управляемой системы
х = Ах + Ьй(х) (5)
приходят в начало координат за конечное время Т(х°). Результат этой главы состоит в том, что тот же синтез и — й(х) приводит
в ноль траектории возмущенной управляемой системы:
х = Ах + Ъй{х) + /(¡г), (6)
при условии, что функция f(x) мала в смысле действия группы Фуллера, а начальная точка достаточно близка к началу координат.
Теорема 2.1. Найдётся такое Го > 0, что для всех г < го верны следующие утверждения.
1) Траектория системы (6) выходящая из точки х° £ QT, достигает начала координат за время 0(х°) < const -г, причем const зависит лишь от го и постоянной Со из условия (3).
2) Траектория x(t) системы (6) выходящая из точки х° G Qr, целиком содержится в множестве Qlit-'
{z(i), t > 0} С QLxt,
причем положительная постоянная L\ зависит лишь от го и постоянной Со из условия (3).
Таким образом, время прихода в начало координат траектории возмущенной управляемой системы с разрывной правой частью (6) имеет тот же порядок малости, что и для невозмущенной системы.
Из утверждения Теоремы 2.1 следует аналог оценки функционала (4) для возмущённой задачи Фуллера.
Для доказательства Теоремы 2.1 мы используем второй метод Ляпунова. Для этого строим функцию Ляпунова ш(х), которая строго убывает вдоль каждого решения системы (6). Особенность нашей ситуации в том, что функция ш(х) не гладкая, а лишь кусочно-гладкая. Поэтому, вместо обычно рассматриваемой производной в силу системы, следует использовать верхнюю производную Дини. Использование негладашГфункций Ляпунова для исследования устойчивости систем дифференциальных уравнений с разрывной правой частью представляется совершенно естественным.
Некоторые общие теоремы об устойчивости в терминах негладких функций Ляпунова приведены в работе [8].
Близкой по содержанию к задаче устойчивости является проблема стабилизации управляемых систем. Общепризнанно, что основная трудность в применении второго метода Ляпунова для решения конкретной задачи состоит в явном построении функции Ляпунова. Автору неизвестны примеры конструктивного построения и применения негладких функций Ляпунова в задачах стабилизации высокой размерности.
В §2.1 сформулирована следующая теорема.
Теорема 2.2. Существует непрерывная функция и>(х), заданная в некоторой замкнутой окрестности нуля Р* С К" и обладающая следующими свойствами:
1) у(0) = 0, ш(х) > 0 при х ф 0;
2) и(х) — однородная функция степени 1 относительно действия группы Фуллера, то есть ш(дг(х)) = гш(х) \/г > 0;
3) существует такое в > 0, что Т(х) < ш(х) < вТ(х), х £ Р*, где Т(х) — функция оптимального времени для задачи быстродействия II;
4) верхняя производная Дини функции и>(х) в силу системы (6) отрицательна, а именно, найдётся к о > 0, такое, что
где — решение системыг{%Устачалъным условием у{0) = 2° £ <3г С Р*, г достаточно мало.
Доказательство Теоремы 2.2 основано на явном построении функции ш(х), удовлетворяющей условиям теоремы. В главе 2 предложен конструктивный метод построения негладкой функции Ляпу-
[8] Руш Н., Абетс П., Лалуа М. Прямой метод Ляпунова в теории устойчивости. — М.: Мир, 1980.
нова — метод "срезки". Суть этого метода заключается в следующем. Функция, минимального времени Т(х) в задаче быстродействия (в задаче II) является негладкой функцией Ляпунова для невозмущенной системы (5). Однако, функция Т(х) может уже не быть убывающей на решениях системы (6) при произвольных возмущениях f(x). Проблемы могут возникнуть в точках негладкости Т(х). Метод "срезки" состоит в том, что у поверхности уровня функции Т{х) срезаются участки недифференцируемости конечным числом надлежащим образом выбранных гиперплоскостей. Строится функция ш(х), которая является негладкой функцией Ляпунова как для невозмущенной системы, так и для возмущенной системы. Причем функция w{x) одна и та же для любых возмущений f(x), малых относительно действия группы Фуллера.
В работах В. И. Коробова и Г. М. Скляра предложен метод решения задачи стабилизации управляемых систем, основанный на построении гладкой функции управляемости. Однако из результатов их работ не следует существование синтеза и(х), при помощи которого траектории системы (1) достигают начала координат за время такого же порядка, что и Т(х). Последнее необходимо для получения результатов глав 2, 3 и 4 данной диссертации.
В главе 3 рассматривается n-мерная возмущенная задача Фуллера (задача III), для которой доказывается существование решения в малой окрестности нуля и конечность времени его прихода в начало координат — особый режим задачи.
В §3.2 сформулирован основной результат этой главы.
Теорема 3.1. Существует число г° > 0, такое, что всех г < г° справедливы утверждения:
1) для любого х° 6 Qr существует оптимальная траектория x(t)
б задаче III с начальным условием х(0) = х°;
2) оптимальная траектория x(t) достигает начала координат за
конечное время, не превосходящее const-г.
Таким образом, мы видим, что решения невозмущенной и возмущенной задач Фуллера достигают начала координат за время
одного и того же порядка, то есть мы говорим, что асимптотическое поведение решений возмущенной задачи определяется поведением решений невозмущенной задачи Фуллера.
Введем следующее обозначение: 1С(х°) — множество всех допустимых траекторий, выходящих из точки х(0) = х°. В §3.3 изучаются свойства траекторий из !С(х°). В §3.4 мы рассматриваем специальный подкласс К.(М,х°) С /С(х°), М > 0, для представителей которого выполнена оценка:
оо
I х2п№ < М(д(х°))2п+\
о -——- -------
где д(ж) = шах ¡я^1/1, х = (х1,...,хп) 6 11п. Из результатов
1 <г<п
главы 2 следует, что найдутся такие го > 0 и Мо > 0, что класс }С(Мо,х°) непуст для х° е г < го- Основным содержанием §3.4 является доказательство следующего утверждения.
Теорема 3.2. Для любого М > О существует такая положительная константа АГо = Ыо{М), что для любой допустимой функции
верно следующее:
с <Эм0ф°)-
Используя эту теорему, удается показать, что для х°, удовлетворяющих неравенству ./Уод^гг0) < го, семейство функций 1С(М,х°) равностепенно непрерывно (Предложение 3.2).
В §3.5 доказано существование оптимального решения в возмущенной задаче Фуллера. Доказательство основано на равностепенной непрерывности и равномерной ограниченности семейства функций К,{М,х°). В §3.6 доказывается вторая часть Теоремы 3.1 — оценка времени прихода оптимальной траектории, выходящей из С}г, в начало координат. Для доказательства используется ме-
тод, предложенный в главе 1, и результаты главы 2.
В главе 4 с использованием результатов главы 3 мы доказываем наличие четтеринг-режимов для некоторого класса задач.
Теорема 4.1. Рассмотрим п-мерную возмущенную задачу Фул-лера. Пусть функции /¿(а;), г = 1,... ,п, имеют следующий вид
где уцс — произвольные постоянные коэффициенты, к{(хп) — нелинейные достаточно гладкие функции, зависящие только от переменной хп, причем /гДО) = 0 и /г'ДО) = 0.
Тогда верно следующее.
1) Начало координат есть особая траектория порядка п.
2) Если размерность фазового пространства чётная, то существует такое 5 > 0, что оптимальные траектории с начальными условиями х° 6 С}Т, г < 6, существуют и достигают начала координат за конечное время с бесконечным числом переключений управления.
Отметим,-ито класс возмуще-ний-(-7)-достаточно широк. В частности, ему принадлежат все линейные возмущения, удовлетворяющие условию малости относительно действия группы Фуллера. Известно, что любая линейная вполне управляемая система с одномерным управлением приводится невырожденной заменой переменных к виду (7) с Ы(хп) = 0. Кроме этого, сюда относятся интересные механические управляемые системы, которые мы изучаем в §4.2. Рассматриваются модели управляемых роботов. Доказывается, что в этих моделях реализуются особые режимы любого четного порядка, при этом оптимальные решения выходят на особый режим с четтерингом.
Автор благодарит профессора М. И. Зеликина за постановку задачи и постоянное внимание к работе. Автор благодарит также В. Ф. Борисова за многочисленные обсуждения.
п
(7)
РАБОТЫ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ
1. Манита Л. А. Оптимальное управление осциллятором с переменной жесткостью. Тезисы докладов Воронежской математической школы "Понтрягинские чтения - IV". Воронеж, 1993. С. 128.
2. Манита Л. А. Оптимальное управление осциллятором с переменной жесткостью. Вестник Московского Университета. Сер. 1, математика, механика. 1993, № 6, С. 89-91.
3. Манита Л. А. Поведение экстремалей в задачах оптимального управления в окрестности особых траекторий. Депонировано в ВИНИТИ РАН 5.12.95, № 3217-В95, 98 с.
4. Манита Л. А. Поведение экстремалей в окрестности особых режимов и негладкие функции Ляпунова в задачах оптимального управления. Фундаментальная и прикладная математика, Т. 2, Вып. 2, С. 449-485 (1996).