Методы гамильтонова формализма в задачах нелинейного синтеза управлений тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Рублев, Илья Вадимович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2004 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Методы гамильтонова формализма в задачах нелинейного синтеза управлений»
 
Автореферат диссертации на тему "Методы гамильтонова формализма в задачах нелинейного синтеза управлений"

Московский государственный университет им. М.В. Ломоносова

На правах рукописи

Рублев Илья Вадимович

Методы гамильтонова формализма в задачах нелинейного синтеза управлений

01.01.02 — дифференциальные уравнения

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Москва 2004 г.

Работа выполнена в Московском государственном университете им. М.В. Ломоносова на кафедре системного анализа факультета Вычислительной математики и кибернетики.

Научный руководитель — доктор физико-математических наук, академик РАН А.Б. Куржанский.

Официальные оппоненты — доктор физико-математических наук, профессор М.И. Зеликин; доктор физико-математических наук, профессор Т.Ф. Филиппова.

Ведущая организация — Институт проблем механики РАН.

Защита состоится 27 февраля 2004 года в 14"- на заседании диссертационного совета К 501.001.07 при Московском государственном университете им. М.В. Ломоносова по адресу: 119992, ГСП-2, Москва, Ленинские горы, МГУ, 2-й учебный корпус, факультет ВМиК, аудитория 685.

С диссертацией можно ознакомиться в научной библиотеке им. А.М. Горького Московского государственного университета им. М.В. Ломоносова по адресу: 119992, ГСП-2, Москва, Ленинские горы, МГУ, 2-й учебный корпус.

Автореферат разослан " " января 2004 г.

Ученый секретарь / СС7

диссертационного совета, к. ф.-м. н.

В.М. Говоров

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Задача синтеза является центральной в математической теории процессов управления. Возникновение этой теории была мотивировано потребностями прикладных наук, в том числе задачами управления движением, автоматики, робототехники и т.д. В дальнейшем она нашла применения в таких областях как экономика, финансовая инженерия и моделирование медикобиологических процессов. Последнее время задачи управления стали возникать при изучении квантовых процессов в физике, при конструировании коммуникационных систем и т.п. Большой вклад в решение задач синтеза управлений внесли Л.С. Понтрягин, Н.Н. Красовский, В.Г. Болтянский, Р.В. Гам-крелидзе, М.И. Зеликин, В.Ф. Кротов, А.Б. Куржанский, Е.Ф. Мищенко, Ю.С. Осипов, Б.Н. Пшеничный, А.И. Субботин, Ф.Л. Черноусько, R. Bellman, R. Brockett, A.I, Bryson, Ch.I. Byrnes, Ft. Isaacs, A. Isidori, A. Krener, P. Kokotovic, G. Leitmann, S. Mitter, S. Sastry, E. Sonntag, H. Sussman, P. Varaiya и другие.

Одним из подходов к решению задачи синтеза управлений является использование трубок достижимости и разрешимости, описывающих эволюцию областей достижимости управляемых систем в прямом и попятном времени. Данная эволюция может быть охарактеризована при помощи функции цены специальных задач динамической оптимизации. А именно, трубка достижимости (разрешимости) совпадает с многозначным отображением, получающемся при параметризации по времени множества уровня этой функции. Функция цены удовлетворяет принципу оптимальности Беллмана [1] и вытекающему из него уравнению Гамильтона-Якоби-Беллмана. Подобные уравнения находят применение в теории оптимального управления и ее приложениях. Однако, как правило, для уравнения Гамильтона-Якоби не существует глобальных классических решений. Последнее приводит к необходимости введения понятия обобщенного негладкого решения. Различные определения обобщенного решения уравнения Гамильтона-Якоби дали, в частности, С.Н. Кружков [6], В.П. Маслов, В.Н. Колокольцов и С.Н. Самборский [3, 8], А.И. Субботин [12, 13, 26], M.G. Crandall и P.-L.Lions [14, 15, 22] (см. также обзор в [9]). Изучение негладких решений — интенсивно развивающимся разделом теории уравнений в частных производных. Одним из важных методов этой теории является обобщенный метод характеристик Коши. Следует заметить, что прямое применение данного метода приводит, вообще говоря, к серьезным трудностям, так как гамильтониан часто является негладким, а значит, уравнения Гамильтона, определяющие характеристики, имеют разрывную правую часть. Кроме того, характеристики могут пересекаться. Несмотря на указанные трудности, остается возможность использования для решения задачи синтеза управлений модификаций классического метода характеристик Коши. Изучению данного вопроса и посвящена диссертация.

Цель работы состоит в исследовании связи между обобщенными решениями уравнения Гамильтона-Якоби, основанными на негладком анализе, и идемпотентными решениями, введенными по аналогии с классической теорией распределений, а также в изучении применимости обобщенных решений уравнения Гамильтона-Якоби и обобщенных уравнений Гамильтона, описывающих характеристики этого уравнения, к задачам достижимости и синтеза управления в конкретных билинейных управляемых системах каскадного типа.

Основные результаты работы.

1. Проведено прямое доказательство эквивалентности минимаксных решений и обобщенных слабых решений уравнения Гамильтона-Якоби, основанных на идемпотент-ном анализе.

2. Уравнение Гамильтона-Якоби-Беллмана, рассмотренное в рамках теории обобщенных решений, и уравнения Гамильтона, описывающие его характеристики, применены для получения свойств множеств достижимости каскадных управляемых систем, представляющих основу для численной схемы.

3. Для трехмерной каскадной системы области достижимости представлены в аналитическом виде, решены задача быстродействия перехода из одного состояния в другое и задача синтеза управления. Для двумерной билинейной системы решения аналогичных задач, а также построение областей достижимости доведены до простейшего численного алгоритма

Научная новизна работы. Полученные результаты являются новыми.

В работе проведено прямое доказательство эквивалентности минимаксных решений [12, 13, 26) и решений, основанных на идемпотентном анализе [3]. При этом проанализирована связь между определениями соответствующих понятий обобщенного решения уравнения Гамильтона-Якоби.

Используя обобщенные уравнения Гамильтона, описывающие характеристики уравнения Гамильтона-Якоби-Беллмана, удалось получить свойства областей достижимости каскадных билинейных управляемых систем, которые представляют основу для схемы вычисления этих областей и решения задачи синтеза управления. При этом область достижимости для трехмерной каскадной управляемой системы построена в аналитическом виде.

Теоретическая и практическая ценность работы. Работа носит в основном теоретический характер. Первая глава представляет собой законченное исследование в области изучения негладких решений уравнений в частных производных. Полученные во второй и третьей главе результаты могут служить основой для дальнейших исследований и применяться при анализе конкретных задач не только в робототехнике, но и в других прикладных областях. Полученные в этих главах численные алгоритмы позволяют решить соответствующие задачи до конца.

Методы исследования. Уравнение Гамильтона-Якоби-Беллмана, которое возникает для задачи синтеза управления при решении специально подобранных задач динамической оптимизации в рамках метода динамического программирования, исследовалось в работе с точки зрения теории обобщенных решений. При этом использовались методы классической и современной теории уравнений в частных производных, в том числе метод характеристик. Кроме того, в диссертации использован аппарат теории обыкновенных дифференциальных уравнений, экстремальных задач, принцип максимума Понтрягина, элементы выпуклого, негладкого анализов.

Апробация работы. Результаты работы были представлены в виде докладов на научно-исследовательских семинарах кафедры системного анализа факультета ВМиК

МГУ (рук. Куржанский А.Б.), кафедры общих проблем управления механико-математического факультата МГУ (рук. Зеликин М.И.), а также на следующих конференциях:

• международная конференция студентов и аспирантов по фундаментальным наукам "Ломоносов-2000" (Москва, МГУ, апрель 2000 г.)

• школа-семинар молодых ученых факультета ВМиК МГУ им. М.В. Ломоносова (Дубна, октябрь 2001 г.)

• международная конференция "Обобщенные решения в задачах управления" (Пере-славль-Залесский, август 2002 г.)

• совместный французско-русский семинар "Control Under Uncertainty and Differential Games" (Москва, МГУ, январь 2003 г.)

• международный симпозиум "Idempotent Mathematics and Mathematical Physics" (Вена, Австрия, февраль 2003 г.)

Публикации. По теме диссертации опубликовано 4 работы.

Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения и библиографии. Общий объем диссертации 98 страниц. Библиография включает 64 наименования.

Краткое содержание работы. Во введении дается краткий обзор литературы, примыкающей по своей тематике к вопросам, рассмотренным в диссертации, раскрываются цели работы, а также дается краткое описание основных результатов, полученных в работе.

Первая глава посвящена прямому доказательству эквивалентности понятия минимаксного решения и обобщенного слабого решения из [3], введенного при помощи идем-потентного анализа, для задачи Копта

в случае гамильтониана вогнутого и глобально лшшшцевого по я (последнее

условие влечет за собой линейный рост гамильтониана по импульсной переменной).

Отметим основную трудность доказательства эквивалентности решений, введенных при помощи идемпотентного анализа [3], и других обобщенных решений. Многие обобщенные решения, как, например, вязкостные [14,15,16, 22] и минимаксные [12, 13, 26], могут быть определены инфинитезимально, подобно классическим решениям. Это означает, что в определении фиксируется, в каком смысле данное решение удовлетворяет уравнению Гамильтона-Якоби в данной точке. Таким образом, некоторая функция является решением уравнения тогда и только тогда, когда она удовлетворяет этому уравнению во всех точках. В отличие от этого, идемпотентные обобщенные слабые решения определены при помощи эволюционного оператора, разрешающего уравнение. Следовательно, этот оператор должен быть сконструирован, хотя и для достаточно хороших краевых условий,

(1)

У(Т,х) = ф), i е R'

m

перед тем, как становится возможно ввести идемпотентные решения. Значит, эволюционный оператор должен быть построен, основываясь на другом понятии обобщенного решения. В диссертации для этого использовано понятие минимаксного решения.

Первая глава состоит из шести разделов. В первом из них формулируется исследуемая задача Коши.

Во втором разделе все необходимые определения и результаты, касающиеся веще-ственнозначных минимаксных решений, естественным образом распространены на случай минимаксных решений, принимающих значение в полукольце которые

являются либо непрерывными в метрике либо полунепре-

рывными снизу по отношению к естественному порядку А. Это необходимо для рассматриваемого в главе доказательства эквивалеыаости, так как идемпотентные обобщенные слабые решения могут принимать в некоторых точках значение +00. Для того, чтобы проиллюстрировать это расширение, рассмотрим следующий пример. Пусть п = 1 и H(t,x,s) = — |s|. Последовательность функций = <рь(х+Т~t), к = 1,2,..., сходит-

ся при к—*оо равномерно относительно метрики р(а, Ь) к функции V(t,x) = <р(х + T — t), где

Так как для любого натурального числа к функция Vk(t,x) является классическим решением уравнения Гамильтона-Якоби, то функцию V(t,x) можно интерпретировать как решение задачи (1).

В третьем разделе первой главы гамильтониан, который удовлетворяет основным предположениям из [12] и, кроме того, вогнутый по импульсной переменной, представлен двумя способами в виде, характерном для задач оптимального управления. На основе этих формул представления в рамках Л-значных минимаксных решений показана линейность уравнения Гамильтона-Якоби по отношению к операциям Это является

основным результатом данной главы.

В четвертом разделе на основе идемпотентного анализа, используя полученную обобщенную линейность уравнения Гамильтона-Якоби, для А-значных минимаксных решений задачи Копта получена следующая формула представления:

Здесь b(t,х,i) — некоторая Л-значная функция, которая ограничена снизу и полунепрерывна снизу по переменной Необходимо отметить, что для случая, когда гамильтониан H(t,X,s) вогнут по s и стремится к —00 при ||s|| —» 00, а также когда функция ip равномерно ограничена и равномерно непрерывна, соответствующее вязкостное решение задачи Коши (1) удовлетворяет формуле представления того же вида [15].

В пятом разделе на основе (2) показано, что минимаксные решения эквивалентны идемпотентным слабым решениям в том случае, когда гамильтониан а функция <р такова, что оба вида обобщенных решений определены. А именно, ip является Л-значноЙ ограниченной снизу и полунепрерывной снизу по отношению к порядку А функцией. Отмечено, что для любой R-Зяачвой ограниченной снизу непрерывной функции соответствующее вязкостное решение, а также обобщенное решение в смысле

С.Н. Кружкова задачи Коши (1) совпадают с ее идемпотентным слабым решением. Кроме того, при помощи формулы Хопфа для неавтономного уравнения Гамильтона-Якоби [11,25] представление (2) приведено к явному виду, обобщающему классическую формулу Лакса-Олейнш [9, 17, 21, 22].

В шестом разделе первой главы приведены доказательства некоторых вспомогательных результатов.

Во второй главе исследуется каскадная управляемая система, уравнения которой возникают в робототехнике [24]. А именно, рассматривается система следующего вида:

п > 3. Здесь измеримое управление и(-) = (к1(*)|*'2(')>'"11|п-1(*))' удовлетворяет мгновенным "жестким" ограничениями вида и(<) £ Р, ( 6 [0,71]. Множествйвляется непустым выпуклым компактом из К""1. Центральная задача данной главы — изучение свойств области достижимости системы (3).

Глава состоит из четырех разделов. В первом разделе формулируется задача достижимости для системы (3).

Во втором разделе на основе [20] для класса систем, аффинных по управляющим параметрам, к которому относится и система (3), получена формула, представляющая область достижимости через характеристики Коши уравнения Гамильтона-Якоби со сглаженным гамильтонианом. Опишем подробнее это представление.

Исходный гамильтониан управляемой системы, вообще говоря, негладкий. Значит, характеристики исходного уравнения Гамильтона-Якоби-Беллмана вида (1) описываются уравнениями с разрывной правой частью. Следовательно, эти уравнения Гамильтона (являющиеся уравнениями принципа максимума Понтрягина [16]) в общем случае не выделяют единственную характеристику по заданным начальным значениям фазовой и сопряженной переменной. При сглаживании исходного гамильтониана характеристики соответствующего возмущенного уравнения Гамильтона-Якоби определяются однозначно начальными условиями, так как задающие их уравнения Гамильтона имеют непрерывную правую часть (удовлетворяющую также условиям Липшица для указанного в разделе сглаживания). Обозначим эти характеристики через ХхМ = 1°, 5°). Здесь Л > 0 есть параметр сглаживания, ^ — начальный момент времени, а и 5° — начальные значения фазовой и сопряженной переменной, соответственно. В разделе показано, что при определенном сглаживании исходного гамильтониана системы область достижимости из позиции имеет следующее представление:

*(Мо,1°) = с1( иЫМо,*0,*0)}].

Ч^ек» /

(4)

Формула (4) имеет лишь теоретический характер, т.к. а0 должно пробегать все пространство При этом наиболее существенными для структуры области достижимости яв-

ляются точки Г({,которые потенциально могут быть получены в (4) при помощи операции замыкания с1, то есть предельные точки хх(^,1о,х°,за) при ||80|| —» оо. Все это делает (4) неприменимой непосредственно для реальных вычислений. Тем не менее, представление (4) использовано в главе при получении свойств областей достижимости каскадных управляемых систем.

Кроме того, в данном разделе проанализирована связь (4) с принципом максимума Понтрягина. Показано, что в простейшем случае, когда у управляемой системы отсутствуют особые режимы (то есть вдоль траектории оптимальное управление однозначно определяется значениями фазовой и сопряженной переменной), а также в случае линейной управляемой системы множество Г({,<о, 1°) в точности определяется уравнениями принципа максимума Понтрягина [10, с. 26]. При этом Г(£,<о,£0) является внешней оценкой границы области достижимости.

В третьем разделе при помощи дифференциально-геометрических методов, приведенных в [18], исследуется топологическая структура области достижимости системы (3) при управлениях, близких к фиксированному гладкому управлению. Показано, что область достижимости имеет непустую внутренность, то есть система (3) локально вполне управляема.

В четвертом разделе на основании результатов первого и второго раздела данной главы доказано, что для каскадной управляемой системы (3) при эллипсоидальных ограничениях ка управление область достижимости имеет полную размерность. Таким образом, граница области достижимости представляет из себя (п — 1)-мерную поверхность. Далее, в результате проведенного в разделе анализа системы (3) показано, что множество точек 2(1, ®0)> получаемых при помощи особых режимов принципа максимума Понт-рягина, лежит в линейном многообразии. Коротко поясним значимость

этих результатов.

Для многих задач оптимального управления характерны системы, оптимальный синтез для которых содержит особые режимы управления (см., например, [2, 5]). Однако вычисление особых режимов доставляет дополнительные трудности, так как принцип максимума Понтрягина дает о них недостаточно информации. Следовательно, требуются некоторые добавочные исследования каждого особого управления в отдельности. При этом семейство особых режимов не описывается при помощи конечного числа параметров. Некоторым аспектам, связанным с вычислением особых режимов, посвящена работа [23].

Однако ситуация с особыми режимами может значительно упроститься. В случае системы (3) с эллипсоидальными ограничениями на управление вследствие разницы размерностей границы области достижимости ¿о,Х°) и многообразия, которое содержит (о,!0), точки входящие в 4о,х0), могут быть сколь угодно точно аппроксимированы точками, отвечающими неособым режимам управления, то есть точками, которые определяются однозначно начальным значением сопряженной переменной. Таким образом, внешняя оценка границы области достижимости с точностью до замыкания имеет описание при помощи конечного числа параметров. Следовательно, полученные во второй главе результаты дают основу для численной схемы, так как особые режимы можно не учитывать при вычислениях. Эта схема приведена в конце данной главы.

Третья глава диссертации посвящена дальнейшему исследованию трехмерной каскадной управляемой системы (3) в случае эллипсоидальных ограничений на управление, а также двумерной билинейной системы

и состоит состоит из пяти разделов. В первом из них формулируются решаемые далее задачи.

Во втором разделе множество T{t,tQ,x°) вычислено аналитически. При этом показано, что у трехмерной каскадной управляемой системы имеется целое семейство особых режимов, порождающее одномерное множество ее конечных состояний. Среди последних присутствуют точки, входящие в границу области достижимости. Однако, в работе показано, что все граничные точки достигаются при неособых режимах управления, то есть особые режимы могут быть исключены из процесса вычисления.

В третьем разделе при помощи T{t,ta,X0) граница области достижимости представлена в аналитическом виде. Она является двумерной поверхностью, гомеоморфной сфере, и имеет две особенности. Особенности связаны с аналогом понятия точки обрыва (cut locus), известного из вариационного исчисления. Здесь также решены задача о быстродействии перехода из одного состояния системы в другое и задача синтеза позиционного управления.

В четвертом разделе для билинейной системы (5), решения аналогичных задач, а также построение областей достижимости доведены до простейшего численного алгоритма.

В пятом разделе содержатся иллюстрации к третьей главе.

В заключении сформулированы основные результаты, которые получены в диссертации.

Автор приносит глубокую благодарность своему научному руководителю Александру Борисовичу Куржанскому за постановку задач и полезные замечания.

Список цитируемой литературы

[1] Беллман Р. Динамическое программирование. М., Изд-во иностр. литературы, 1960.

[2] Габасов Р.Ф., Кириллова Ф.М. Особые оптимальные управления. М., Наука, 1973.

[3] Колоколъцов В.Н., Маслов В.П. Идемпотентный анализ и его применение в оптимальном управлении. М., Наука, 1994.

[4] Красовский Н.Н. Теория управления движением. М., Наука, 1968.

[5] Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М., Наука, 1973.

[6] Кружков С.Н. Обобщенные решения нелинейных уравнений со многими независимыми переменными, 1 // Мат. сборник. 1966. т. 70, N3. С.394-416.

[7] Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М., Наука, 1977.

[8] Маслов В.П., Самборский С.Н. Существование и единственность решений стационарных уравнений Гамильтона-Якоби и Беллмана. Новый подход // Докл. РАН. 1992. т. 324, N6. С.1143-1148.

[9] Олейник О.А. Разрывные решения нелинейных дифференциальных уравнений // Успехи мат. наук. 1957. т. 12, N3. С.3-73.

[10] Понтпрягин JI.C, Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М., 1961.

[11] Рублев И.В. Обобщенные формулы Хопфа для неавтономного уравнения Гамиль-тона-Якоби // Прикладная математика и информатика: Тр. фак-та ВМиК МГУ им. М.В. Ломоносова. 1999. N3. С.81-89.

[12] Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М., Наука, 1991.

[13] Субботин А.И. Минимаксные решения уравнений с частными производными первого порядка // Успехи мат. наук. 1996. т. 51, вып. 2. С.105-138.

[14] Crandall M.G., Lions P.-L. Viscosity Solutions of Hamilton-Jacobi Equations // Trans. Amer. Math. Soc. 1983. Vol.277. P.l-42.

[15] Crandall M.G., Evans L.C., Lions P.-L. Some Properties of Viscosity Solutions of Hamilton-Jacobi Equations // TVans. Amer. Math. Soc. 1984. Vol.282. P.487-502.

[16] Fleming W.H., Soner H.M. Controlled Markov Processes and Viscosity Solutions. Springer-Verlag, New York, 1993.

[17] HopfE. Generalized solutions of nonlinear equations of first order // J. Math. Mech. 1965. Vol.14. P.951-973.

{18] Istdori A. Nonlinear Control Systems, 3 ed. Springer-Verlag, New York, 1995.

[19] Kurzhanski А.В., Vdlyi I. Ellipsoidal Calculus for Estimation and Control. Birkhauser, Boston-Basel-Berlin, 1997.

[20] Kurzhanski A.B., Varaiya P. Dynamic Optimization for Reachability Problems // JOTA. 2001. Vol.108, N2, P.227-251.

[21] Lax P.D. Hyperbolic systems of conservation laws II // Comm. on Pure & Appl. Math. 1957. Vol.10. P.537-566.

[22] Lions P. L. Generalized solutions of Hamilton-Jacobi equations. London, 1982.

[23] Melikyan A.A. Generalized characteristics of first order PDEs: Applications in optimal control and differential games. Birkhauser, Boston, 1998.

[24] Murray R.M., Li Z., Sastry S.S. A Mathematical Introduction to Robotic Manipulation. CRC Press, 1994.

[25] Silin D.B. Viscosity solutions via unbounded set-valued integration // Nonlinear Anal. T. M. A. 1998. Vol.31. P.55-90.

[26] Subbotm A.I. Generalized solutions of first-order PDEs: the dynamical optimization perspective. Birkhauser, Boston, 1995; русский перевод: Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка: Перспективы динамической оптимизации. Москва-Ижевск, 2003.

Публикации по теме диссертации

[27] Рублев И.В. Об обобщенной формуле Лакса для неавтономного уравнения Гамиль-тона-Якоби // Материалы Междунар. конференции студентов и аспирантов по фундаментальным наукам "Ломоносов-2000", секция "Вычислительная математика и кибернетика", Москва, 2000. С.27-28.

[28] Рублев И.В. О связи между двумя понятиями обобщенного решения уравнения Гамильтона-Якоби // Дифференциальные уравнения. 2002. т. 38, N6. С.818-825.

[29] Рублев И.В. О двух понятиях обобщенного решения уравнения Гамильтона-Якоби // Тезисы Междунар. симпозиума "Обобщенные решения в задачах управления", Переславль-Залесский, 2002. С.210-212.

[30] Roublev I. V. On two notions of generalized solution to the Hamilton-Jacobi equation // Proc. Intern. Workshop on Idempotent Mathematics and Math. Physics, Vienna, 2003.

»- П з

Издательство ООО "МАКС Пресс". Лицензия ИД № 00510 от 01.12.99 г. Подписано к печати 22.01.2004 г. Формат 60x90 1/16. Усл.печл. 0,75. Тираж 100 экз. Заказ 096. Тел. 939-3890,939-3891,928-1042. Тел./факс 939-3891. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В Ломоносова.

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Рублев, Илья Вадимович

Содержание и

Введение

Список обозначений

1 Связь между понятиями минимаксного решения и обобщенного слабого решения, основанного на идемпотентном анализе

1.1 Введение.

1.2 Основы минимаксных решений

1.3 Обобщенная линейность уравнения Гамильтона-Якоби.

1.4 Формула представления минимаксных решений.

1.5 Эквивалентность минимаксных и обобщенных слабых решений

1.6 Некоторые вспомогательные результаты.

2 Свойства областей достижимости для каскадных управляемых систем

2.1 Введение.

2.2 Представление области достижимости.

2.3 Топологические свойства области достижимости каскадной управляемой системы

2.4 Область достижимости каскадных управляемых систем при эллипсоидальных ограничениях

3 Области достижимости трехмерной каскадной управляемой системы и двумерной билинейной управляемой системы в

3.1 Введение.

3.2 Внешняя оценка границы области достижимости трехмерной каскадной управляемой системы.

3.3 Точная область достижимости для трехмерной каскадной управляемой системы и задача о быстродействии.

3.4 Область достижимости для двумерной билинейной управляемой системы.

3.5 Иллюстрации.

 
Введение диссертация по математике, на тему "Методы гамильтонова формализма в задачах нелинейного синтеза управлений"

Математическая теория процессов управления была мотивирована потребностями прикладных наук, в том числе задачами управления движением, автоматики, робототехники и т.д. В дальнейшем она нашла применения в таких областях как экономика, финансовая инженерия и моделирование медикобиологических процессов. Последнее время задачи управления стали возникать при изучении квантовых процессов в физике, при конструировании коммуникационных систем и т.п.

Центральной в теории оптимального управления является задача синтеза управления. Цель данной задачи состоит в том, чтобы построить управляющие воздействия, переводящие систему, описываемую уравнениями динамики, в предписанное конечное состояние. При этом управление в задаче синтеза является позиционным, то есть является функцией как времени, так и фазовой переменной. Последнее обусловлено решением практических задач в условиях неполной или неточной информации при наличии возмущений.

Большой вклад в решение задач синтеза управлений внесли J1.C. Понтрягин, H.H. Красовский, В.Г. Болтянский, Р.В. Гамкрелидзе, М.И. Зеликин, В.Ф. Кротов, А.Б. Куржанский, Е.Ф. Мищенко, Ю.С. Осипов, Б.Н. Пшеничный, А.И. Субботин, Ф.Л. Черноусько, R. Bellman, R. Brockett, A.I. Bryson, Ch.I. Byrnes, R. Isaacs, A. Isidori, A. Krener, P. Kokotovic, G. Leitmann, S. Mitter, S. Sastry, E. Sonntag, H. Sussman, P. Varaiya и другие.

Одним из методов решения задач программного управления (то есть когда управление является функцией лишь времени, но не фазовой переменной) опирается на принцип максимума Понтрягина [22], в рамках которого изучаются необходимые условия оптимальности управления. Этот метод используется при решении задачи синтеза, причем последняя решается с точки зрения некоторого критерия оптимальности, например, в быстродействии перехода управляемой системы из одного состояния в другое.

Подчеркнем, что в условиях отсутствия возмущений (которые приняты в данной диссертации и выполнение которых подразумевается везде ниже) значение критерия оптимальности при синтезированных позиционных стратегиях такое же, как и при программных управлениях. Однако особенно важно решать задачи синтеза при наличии возмущений, являющиеся предметом игровых задач динамики, то есть теории дифференциальных игр. В последнем случае для этих задач программных управлений недостаточно.

Наряду с принципом максимума Понтрягина, обобщая подходы классического вариационного исчисления [5, 18, 37], рассматривается метод динамического программирования Р. Беллмана [1], посвященный достаточным условиям оптимальности и восходящий к формализму уравнений Гамильтона-Якоби. Таким способом оказывается также возможным изучать эволюцию по времени областей достижимости управляемых систем. Под областью достижимости в данный момент времени подразумевается множество всевозможных состояний системы, в которые можно перейти при помощи соответствующего допустимого управляющего воздействия из фиксированного в заданный начальный момент времени состояния (или множества состояний) [10, 17, 53, 63]. Эволюцию областей достижимости в прямом времени описывает трубка достижимости, а в об]мтном времени — трубка разрешимости. Теории трубок траекторий посвящена работа [49].

Задача синтеза состоит в поиске позиционного управления, переводящего систему в предписанное конечное состояние (или мгюжество), которое для этого должно удерживать траекторию внутри соответствующей трубки разрешимости (или моста) иа заданном отрезке времени. Это составляет существо "правила экстремального прицеливания", введенного H.H. Красовским [10, 11].

При данном подходе основные этапы решения задачи синтеза управления сосредоточены в нахождении областей достижимости. При этом в нелинейном случае, когда решение найти трудно, полезным является изучение различных качественных свойств областей достижимости, таких как ограниченность, замкнутость, выпуклость, непрерывная зависимость от параметров (см., например, [2, 17, 33, 34, 35]).

Эволюция по времени области достижимости в фазовом пространстве исследуемой системы может быть охарактеризована при помощи следующих способов: поточечное представление, описание при помощи параметрического задания границы, использование аппарата опорных функций (в том случае, если области выпуклые) и представление в виде множеств уровня локально липшицевых функций.

В рамках последнего представления было показано, что для описания динамики областей достижимости можно использовать задачи динамической оптимизации [51]. А именно, вводилась функция цены

V(t, х) = min d2(x(t0), Ло), где минимум берется по всем допустимым траекториям системы х(>), выпущенным в обратном времени из позиции {t,x}. Здесь ci2(x(fo),^о) — квадрат эвклидова расстояния от левого конца траектории x(to) до выпуклого компактного множества начальных состояний Как показано в [51], область достижимости в момент времени t совпадает с множеством {х: V(t,x) < 0}. Отметим, что для функции V(t, х) справедливо полугрупповое свойство

V(t, x) = V(t, x\t0, V(t0, •)) = V(t, x\r, V(t, .|í0) V{tQ, •))), h<r<t, определяющее для введенного семейства задач оптимального управления принцип оптимальности в рамках метода динамического программирования [1]. Как следствие, функция х) удовлетворяет задаче Коши для уравнения Га-мильтона-Якоби-Беллмана следующего вида:

Для линейно-выпуклых управляемых систем (то есть систем с линейными уравнениями динамики и жесткими "мгновенными" геометрическими ограничениями на управление в виде выпуклых компактов) функция цены У(£, х) вычислялась средствами выпуклого анализа [9, 16, 50, 51, 58]. Также были вычислены и опорные функции областей достижимости, являющихся в данном случае выпуклыми компактами, при этом было показано, что функция У{Ь,х) представляет собой классическое решение задачи (1) [50, 51].

Однако для нелинейных управляемых систем функция х) является, вообще говоря, дифференцируемой лишь для почти всех значений аргументов. Поэтому У{Ь,х) является решением (1) лишь в обобщенном смысле. Отметим, что мы не можем определить решение просто как функцию, удовлетворяющую уравнению Гамильтона-Якоби почти всюду, ибо данному условию может удовлетворять бесконечно много функций (см., например, [44]). Для того, чтобы отвечающее заданному краевому условию решение было единственно, необходимо наложить на него дополнительные условия, приводящие к различным понятиям обобщенного решения.

Обобщенные решения уравнений в частных производных первого порядка играют исключительно важную роль не только в теории оптимального управления,

1)

V(to,x) = d2(x, Xq). но и во многих теоретических и прикладных областях. Рассмотрим некоторые понятия обобщенного решения уравнения Гамильтона-Якоби, не претендуя на полный обзор. Для гамильтониана H(t,x,s), выпуклого по импульсной переменной s, что характерно для задач оптимального управления, понятие обобщенного решения было введено С.Н. Кружковым [13]. При помощи метода исчезающей вязкости были построены вязкие решения [14, 20, 43]. В отсутствии предположения о выпуклости гамильтониана было предложено несколько понятий обобщенного решения уравнения Гамильтона-Якоби. М.Дж. Крэндалл и П.-Л. Лионе ввели понятие вязкостного решения [38, 39, 44, 54], использующее суб- и супердифференциалы в качестве обобщения понятия производной. Эквивалентное ему понятие минимаксного решения было предложено А.И. Субботиным [29, 30, 62]. Понятие минимаксного решения по сути основывается на обобщении метода характеристик Коши [30, 62] и также, как и понятие вязкостного решения, может быть определено в инфинитезимальной форме при помощи различных средств негладкого анализа, таких как производные по направлениям, конусы касательных направлений и т.д.

В.П. Маслов и его сотрудники исследовали уравнение Гамильтона-Якоби с точки зрения идемпотентного анализа. При условии выпуклости гамильтониана ими была предложена концепция обобщенного решения, введенного по аналогии с классической теорией распределений [8]. В идемпотентном анализе традиционная структура поля над R с операциями а + Ьна-Ь заменяется структурой полукольца А = RU{+oo} с операциями афЬ = min{a, b} и а©6 = а + Ь. В [8] понятие обобщенного слабого решения определялось через оператор, сопряженный к эволюционному оператору, разрешающего задачу Коши (1) для подходящего класса краевых условий. Сопряжение понимается по отношению к "скалярному произведению" функций (/,д)д = infх(/(я) + Все обобщенные слабые решения имеют представление, сводящееся в случае, когда H(t,x,s) = H(s), к формуле

Лакса-Олейник [20, 46, 52, 54]. Кроме того, в [19] для гамильтониана 5), уже не обязательно выпуклого по й, опять же на основе идемпотентного анализа слабое решение определено подобно другому классическому подходу, принятому в математической физике, который использует понятие слабой сходимости.

В силу разнообразия способов формализации понятия обобщенного решения важным является исследование вопроса об структурных взаимоотношениях между различными его определениями. Эквивалентность большинства определений, данных в инфинитезимальной форме и использующих конструкции негладкого анализа, доказана в [29, 62]. Эквивалентность идемпотентных решений из [19], введенных при помощи слабой сходимости, и вязкостных решений исследовалась в [45]. Кроме того, в [41] было показано, что для специального случая задач оптимального управления, формализованных при помощи введенных в [40] процессов Беллмана-Маркова, понятия обобщенного слабого решения из [8] и вязкостного решения совпадают.

Цель данной работы состоит в исследовании связи между обобщенными решениями уравнения Гамильтона-Якоби, основанными на негладком анализе, и идемпотентными решениями, введенными по аналогии с классической теорией распределений, а также в изучении применимости обобщенных решений уравнения Гамильтона-Якоби и обобщенных уравнений Гамильтона, описывающих характеристики этого уравнения, к задачам достижимости и синтеза управления в конкретных билинейных управляемых системах каскадного типа.

Перейдем к описанию основных результатов диссертации.

Первая глава посвящена прямому доказательству эквивалентности понятия минимаксного решения и обобщенного слабого решения из [8], введенного при помощи идемпотентного анализа, для задачи Коши о, (1,()6<г = МхЕ., {2)

У(Т,х) = (р(х), хеЕп в случае гамильтониана в), вогнутого и глобально липшицевого по 5 (последнее условие влечет за собой линейный рост гамильтониана по импульсной переменной). Отметим, что краевое условие здесь задано, в отличие от (1), на правом конце, что сделано лишь для совместимости с определениями минимаксного решения, данными в [29, 30, 62]. Чтобы рассмотреть задачу Коши на левом конце, надо сделать замену времени £ = £о + Т — т, т > 10.

Отметим основную трудность доказательства эквивалентности решений, введенных при помощи идемпотентного анализа, и других обобщенных решений. Как уже было отмечено выше, многие обобщенные решения, как, например, вязкостные и минимаксные, могут быть определены инфинитезимально, подобно классическим решениям. Это означает, что в определении фиксируется, в каком смысле данное решение удовлетворяет уравнению Гамильтона-Якоби в данной точке. Таким образом, некоторая функция является решением уравнения тогда и только тогда, когда она удовлетворяет этому уравнению во всех точках. В отличие от этого, идемпотентные обобщенные слабые решения определены при помощи эволюционного оператора, разрешающего уравнение. Следовательно, этот оператор должен быть сконструирован, хотя и для достаточно хороших краевых условий, перед тем, как становится возможно ввести идемпотентные решения. Значит, эволюционный оператор должен быть построен, основываясь на другом понятии обобщенного решения. В диссертации для этого использовано понятие минимаксного решения.

Первая глава состоит из шести разделов. В первом из них формулируется исследуемая задача Коши.

Во втором разделе все необходимые определения и результаты, касающиеся вещественнозначных минимаксных решений, естественным образом распространены на случай минимаксных решений, принимающих значение в полукольце А = Е и {+оо}, которые являются либо непрерывными в метрике р(а,Ь) = | ехр(—а) — ехр(—6)|, либо полунепрерывными снизу по отношению к естественному порядку А. Это необходимо для рассматриваемого в главе доказательства эквивалентности, так как идемпотентные обобщенные слабые решения могут принимать в некоторых точках значение +оо. Для того, чтобы проиллюстрировать это расширение, рассмотрим следующий пример. Пусть п = 1 и в) = — |в|.

Последовательность функций = <рк(х + Т — £), к = 1,2,., сходится при к —> оо равномерно относительно метрики р(а, Ь) к функции х) = (р(х+Т—£), где

Так как для любого натурального числа к функция 14(f,x) является классическим решением уравнения Гамильтона-Якоби, то функцию V(i, х) можно интре-претировать как решение задачи (2).

В третьем разделе первой главы гамильтониан, удовлетворяющий основным предположениям из [29] и, кроме того, вогнутый по импульсной переменной, представлен двумя способами в виде, характерном для задач оптимального управления. На основе этих формул представления в рамках А-значных минимаксных решений показана линейность уравнения Гамильтона-Якоби по отношению к операциям ф = min и О = +. Это является основным результатом данной главы.

В четвертом разделе на основе идемпотентного анализа, используя полученную обобщенную линейность уравнения Гамильтона-Якоби, для А-значных минимаксных решений задачи Коши получена следующая формула представления: 0 + ^(0). (3)

Здесь 6(г,а:,£) — некоторая Л-значная функция, которая ограничена снизу и полунепрерыва снизу по переменной Необходимо отметить, что для случая, когда гамильтониан #(£, х, в) вогнут по 5 и стремится к — оо при ||5|| —> оо, а также когда функция <р равномерно ограничена и равномерно непрерывна, соответствующее вязкостное решение задачи Коши (2) удовлетворяет формуле представления того же вида [39].

В пятом разделе на основе (3) показано, что минимаксные решения эквивалентны идемпотентным слабым решениям в том случае, когда гамильтониан Н(Ь,х, з) = #(¿,5), а функция <р такова, что оба вида обобщенных решений определены. А именно, <р является Л-значной ограниченной снизу и полунепрерывной снизу по отношению к порядку Л функцией. Отмечено, что для любой Е-значной ограниченной снизу непрерывной функции <р соответствующее вязкостное решение, а также обобщенное решение в смысле С.Н. Кружкова задачи Коши (2) совпадают с ее идемпотентным слабым решением. Кроме того, при помощи формулы Хопфа для неавтономного уравнения Гамильтона-Якоби [24, 61] представление (3) приведено к явному виду, обобщающему классическую формулу Лакса-Олейник [20, 46, 52, 54].

В шестом разделе первой главы приведены доказательства некоторых вспомогательных результатов.

Во второй главе исследуется каскадная управляемая система, уравнения которой возникают в робототехнике [57]. А именно, рассматривается система следующего вида:

XI ¿2 ¿3 п-1 п > 3. Здесь измеримое управление и(-) = («!(•), М2(*)>., и„1(-))' удовлетворяет мгновенным "жестким" ограничениями вида и{1) €■ V, I € [0,Т]. Множество V является непустым выпуклым компактом из Кп1. Центральная задача данной главы — изучение свойств области достижимости системы (4).

Глава состоит из четырех разделов. В первом разделе формулируется задача достижимости для системы (4).

Во втором разделе на основе [51] для класса систем, аффинных по управляющим параметрам, к которому относится и система (4), получена формула, представляющая область достижимости через характеристики Коши уравнения Гамильтона-Якоби со сглаженным гамильтонианом. Опишем подробнее это представление.

Исходный гамильтониан управляемой системы, вообще говоря, негладкий. Значит, характеристики исходного уравнения Гамильтона-Якоби-Беллмана вида (1) описываются уравнениями с разрывной правой частью. Следовательно, эти уравнения Гамильтона (являющиеся уравнениями принципа максимума Понтря-гина [44]) в общем случае не выделяют единственную характеристику по заданным начальным значениям фазовой и сопряженной переменной. При сглаживании исходного гамильтониана характеристики соответствующего возмущенного уравнения Гамильтона-Якоби определяются однозначно начальными условиями,

XI х2 щ, и3,

2 ' ип-1»

4) так как задающие их уравнения Гамильтона имеют непрерывную правую часть (удовлетворяющую также условиям Липшица для указанного в разделе сглаживания). Обозначим эти характеристики через = хл(Мо.я°,50). Здесь Л > 0 есть параметр сглаживания, £0 — начальный момент времени, а х° и в0 — начальные значения фазовой и сопряженной переменной, соответственно. В разделе показано, что при определенном сглаживании исходного гамильтониана системы область достижимости Ьа,х°) из позиции {¿о» я0} имеет следующее представление:

Формула (5) имеет лишь теоретический характер, т.к. й0 должно пробегать все пространство Еп. При этом наиболее существенными для структуры области достижимости являются точки Г(£,£о,х°), которые потенциально могут быть получены в (5) при помощи операции замыкания с1, то есть предельные точки ха(£,<0|£°>з0) при ||5°|| —» со. Все это делает (5) неприменимой непосредственно для реальных вычислений. Тем не менее, представление (5) использовано в главе при получении свойств областей достижимости каскадных управляемых систем.

Кроме того, в данном разделе проанализирована связь (5) с принципом максимума Понтрягина. Показано, что в простейшем случае, когда у управляемой системы отсутствуют особые режимы (то есть вдоль траектории оптимальное управление однозначно определяется значениями фазовой и сопряженной переменной), а также в случае линейной управляемой системы множество Г(£, ¿о. в точности определяется уравнениями принципа максимума Понтрягина (22, с. 26]. При этом Г(£,£о>я°) является внешней оценкой границы области достижимости.

В третьем разделе при помощи дифференциально-геометрических методов, приведенных в [48], исследуется топологическая структура области достижимости системы (4) при управлениях, близких к фиксированному гладкому управлению. Показано, что область достижимости имеет непустую внутренность, то есть система (4) локально вполне управляема.

В четвертом разделе на основании результатов второго и третьего раздела данной главы доказано, что для каскадной управляемой системы (4) при эллипсоидальных ограничениях на управление область достижимости имеет полную размерность. Таким образом, граница области достижимости представляет из себя (п — 1)-мерную поверхность. Далее, в результате проведенного в разделе анализа системы (4) показано, что множество точек получаемых при помощи особых режимов принципа максимума Понтрягина, лежит в (п — 2)-мерном линейном многообразии. Коротко поясним значимость этих результатов.

Для многих задач оптимального управления характерны системы, оптимальный синтез для которых содержит особые режимы управления (см., например, [4, 12]). Однако вычисление особых режимов доставляет дополнительные трудности, так как принцип максимума Понтрягина дает о них недостаточно информации. Следовательно, требуются некоторые добавочные исследования каждого особого управления в отдельности. При этом семейство особых режимов не описывается при помощи конечного числа параметров. Некоторым аспектам, связанным с вычислением особых режимов, посвящена работа [55].

Однако ситуация с особыми режимами может значительно упроститься. В случае системы (4) с эллипсоидальными ограничениями на управление вследствие разницы размерностей границы области достижимости и многообразия, содержащего 2(£,£о>я°)> точки 2(1,1 о,х°), входящие в могут быть сколь угодно точно аппроксимированы точками, отвечающими неособым режимам управления, то есть точками, которые определяются однозначно начальным значением сопряженной переменной. Таким образом, внешняя оценка границы области достижимости Г(£,<0>я°) с точностью до замыкания имеет описание при помощи конечного числа параметров. Следовательно, полученные во второй главе результаты дают основу для численной схемы, так как особые режимы можно не учитывать при вычислениях. Эта схема приведена в конце данной главы.

Третья глава диссертации посвящена дальнейшему исследованию трехмерной каскадной управляемой системы (4) в случае эллипсоидальных ограничений на управление, а также двумерной билинейной системы iil = "ь № ¿2 = ' U2 и состоит состоит из пяти разделов. В первом из них формулируются решаемые далее задачи.

Во втором разделе множество T(t, to, х°) вычислено аналитически. При этом показано, что у трехмерной каскадной управляемой системы имеется целое семейство особых режимов, порождающее одномерное множество ее конечных состояний. Среди последних присутствуют точки, входящие в границу области достижимости. Однако, в работе показано, что все граничные точки достигаются при пеособых режимах управления, то есть особые режимы могут быть исключены из процесса вычисления.

В третьем разделе при помощи T(t,to,x°) граница области достижимости представлена в аналитическом виде. Она является двумерной поверхностью, го-меоморфной сфере, и имеет две особенности. Особенности связаны с аналогом понятия точки обрыва (cut locus), известного из вариационного исчисления. Здесь также решены задача о быстродействии перехода из одного состояния системы в другое и задача синтеза позиционного управления.

В четвертом разделе для билинейной системы (6) решения аналогичных задач, а также построение областей достижимости доведены до простейшего численного алгоритма.

В пятом разделе содержатся иллюстрации к третьей главе.

В заключении сформулированы основные результаты, которые получены в диссертации.

Результаты диссертации отражены в публикациях [25, 26, 27, 60], а также представлены в виде докладов на следующих конференциях:

• международная конференция студентов и аспирантов по фундаментальным наукам "Ломоносов-2000" (Москва, МГУ, апрель 2000 г.)

• школа-семинар молодых ученых факультета ВМиК МГУ им. М.В. Ломоносова (Дубна, октябрь 2001 г.)

• международная конференция "Обобщенные решения в задачах управления" (Переславль-Залесский, август 2002 г.)

• совместный французско-русский семинар "Control Under Uncertainty and Differential Games" (Москва, МГУ, январь 2003 г.)

• международный симпозиум "Idempotent Mathematics and Mathematical Physics" (Вена, Австрия, февраль 2003 г.)

Кроме того, работа [28] принята к печати.

Автор приносит глубокую благодарность своему научному руководителю Александру Борисовичу Куржанскому за постановку задач и полезные замечания.

Список обозначений

• В = {5бГ: ||*|| < 1}, S={se Rn: ||s|| = 1}

• В = {(5,г) € R" х R: Ц5Ц2 + г2 < 1}

• B+ = {(s,r)emn xR: ||s||2 + r2 < l,r > 0}

• S+ = {(s,r) 6 R" x R: ||s|[2 + r2 = l,r > 0}

• Br(s0) = {s G R": ||s - so|| < R} — шар с центром в точке s0 € R" и радиусом R> 0

• £(р,Р) = {z 6 Rm: (z — p, P~\z - p)) < 1} — эллипсоид с центром в точке р € Rm и матрицей Р € Rmxm, Р = Р' > 0

• comp(Rm) — пространство непустых компактных подмножеств Rm

• conv(Rm) — пространство непустых выпуклых компактов из Rm

• d(z,Z) = inf{||z — | £ € .2} — эвклидово расстояние от точки z G Rm до множества Z С Rm

• h(ZuZ2) = max(sup{ci(Ci,^) | Сг € Zi},sup{cf(C2, Zx) | C2 € Z2}) — расстояние по Хаусдорфу между двумя множествами Zi,Z2 G comp(Rm)

• lin Z — линейная оболочка множества Z С Rm со Z — выпуклая оболочка множества Z С Rm el Z — замыкание множества Z С Rm int Z — внутренность множества Z С Rm dZ — граница множества Z С Rm

А = R U {+оо}, © = min, 0 = +, р(а, b) = | ехр(—а) — ехр(—Ь)|) — метрическое идемпотентное полукольцо epi^ = {(z,а) е Rm х R: а > ip(z)} — надграфик функции ф : Rm А hypoф = a) G Rm х R: а < ф(г)} — подграфик функции ф : Rm -»• А

C(R",R) — класс непрерывных конечнозначных (т.е. R-значных) функций, определенных на Rn

C(Rn, А) — класс Л-значных функций, определенных на Rn и непрерывных по отношению к метрике р(а,Ь).

LSC(Rn, А) — класс Л-значных функций с областью определения R", полунепрерывных снизу по отношению к естественному порядку в А

 
Заключение диссертации по теме "Дифференциальные уравнения"

Итак, основные результаты данной диссертации следующие:

• Проведено прямое доказательство эквивалентности минимаксных решений и обобщенных слабых решений уравнения Гамильтона-Якоби, основанных на идемпотентном анализе.

• Уравнение Гамильтона-Якоби-Беллмана, рассмотренное в рамках теории обобщенных решений, и уравнения Гамильтона, описывающие его характеристики, применены для получения свойств множеств достижимости каскадных управляемых систем, представляющих основу для численной схемы.

• Для трехмерной каскадной системы области достижимости представлены в аналитическом виде, решены задача быстродействия перехода из одного состояния в другое и задача синтеза управления. Для двумерной билинейной системы решения аналогичных задач, а также построение областей достижимости доведены до простейшего численного алгоритма.

Заключение

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Рублев, Илья Вадимович, Москва

1. Беллмап Р. Динамическое программирование. М., Изд-во иностр. литературы, 19G0.

2. Благодатских В.И., Филиппов А.Ф. Дифференциальные включения и оптимальное управление // Труды МИАН СССР. 1985. т. 169. С.194-252.

3. Васильев Ф.П. Методы оптимизации. М., Факториал, 2002.

4. Габасов Р.Ф., Кириллова Ф.М. Особые оптимальные управления. М., Наука, 1973.

5. Гельфанд И.М., Фомин C.B. Вариационное исчисление. М., Физматгиз, 1958.

6. Голыитейп Е.Г. Теория двойственности в математическом программировании и ее приложения. М., Наука, 1971.

7. Колоколъцов В.Н., Маслов В.П. Общий вид эндоморфизмов в пространстве непрерывных функций со значениями в числовом коммутативном полукольце (с операцией © = шах) // Докл. АН СССР. 1987. т. 295, N2. С.283-287.

8. Колоколъцов В.Н., Маслов В.П. Идемпотентный анализ и его применение в оптимальном управлении. М., Наука, 1994.

9. Красовский H.H. Теория управления движением. М., Наука, 1968.

10. Красовский H.H. Игровые задачи о встрече движений. М., Наука, 1970.

11. Красовский H.H. Управление динамической системой. Задача о минимизации гарантированного результата. М., Наука, 1985.

12. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М., Наука, 1973.

13. Кружков С.Н. Обобщенные решения нелинейных уравнений со многими независимыми переменными, 1 // Мат. сборник. 19G6. т. 70, N3. C.394-41G.

14. Крылов Н.В. Управляемые процессы диффузионного типа. М., Наука, 1977.

15. Курант Р., Гильберт Д. Методы математической физики, т.2. M.-JI., 1945.1С. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М., Наука, 1977.

16. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М., Наука, 1972.

17. Лаврентьев М.А., Люстерник Л.А. Курс вариационного исчисления. M.-JI., ГИТТЛ, 1950.

18. Маслов В.П., Самборский С.Н. Существование и единственность решений стационарных уравнений Гамильтона-Якоби и Беллмана. Новый подход // Докл. РАН. 1992. т. 324, N6. С.1143-1148.

19. Олейпик O.A. Разрывные решения нелинейных дифференциальных уравнений // Успехи мат. наук. 1957. т. 12, N3. С.3-73.

20. Половинкин Е.С. Сильно выпуклый анализ // Матем. сборник. 199С. т. 187, N2. С.103-130.

21. Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М., 1961.

22. Рокафеллар Р.Т. Выпуклый анализ. М., Мир, 1973.

23. Рублев И.В. Обобщенные формулы Хопфа для неавтономного уравнения Гамильтона-Якоби // Прикладная математика и информатика: Тр. фак-та ВМиК МГУ им. М.В. Ломоносова. 1999. N3. С.81-89.

24. Рублев И.В. Об обобщенной формуле Лакса для неавтономного уравнения Гамильтона-Якоби // Материалы Междунар. конференции студентов и аспирантов по фундаментальным наукам "Ломоносов-2000" секция "Вычислительная математика и кибернетика", Москва, 2000.

25. Рублев И.В. О связи между двумя понятиями обобщенного решения уравнения Гамильтона-Якоби // Дифференциальные уравнения. 2002. т. 38, N6. С.818-825.

26. Рублев И.В. О двух понятиях обобщенного решения уравнения Гамильтона-Якоби // Тезисы Междунар. симпозиума "Обобщенные решения в задачах управления", Переславль-Залесский, 2002.

27. Рублев И.В. Множества достижимости в каскадных управляемых системах // (принято к печати в журнале "Дифференциальные уравнения").

28. Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М., Наука, 1991.

29. Субботин А.И. Минимаксные решения уравнений с частными производными первого порядка // Успехи мат. наук. 1996. т. 51, вып. 2. С.105-138.

30. Субботина H.H. Построение обобщенного решения уравнения Гамильтона-Якоби-Беллмана с помощью метода характеристик Коши // Свердловск, ИММ УрО АН СССР, 1991. Деп. в ВИНИТИ No. 2571-В91. С.1-53.

31. Субботина H.H. Метод характеристик Коши и обобщенные решения уравнений Гамильтона-Якоби-Беллмана // Докл. АН СССР. 1991. т. 320, N 3, С.556-561.

32. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М., 1985.

33. Черпоусъко Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М., Наука, 1988.

34. АиЫп J.-P., Cellina A. Differential Inclusions. Springer-Verlag, Berlin-Heidelberg, 1984.

35. Benton, Jr. S.H. The Hamilton-Jacobi Equation: A Global Approach. Academic Press, 1977.

36. Caratheodory C. Calculus of variations and partial differential equations of the first order. Chelsea Publ. Company, New York, 1989.

37. Crandall M.G., Lions P.-L. Viscosity Solutions of Hamilton-Jacobi Equations // Trans. Amer. Math. Soc. 1983. Vol.277. P. 1-42.

38. Crandall M.G., Evans L.C., Lions P.-L. Some Properties of Viscosity Solutions of Hamilton-Jacobi Equations // Trans. Amer. Math. Soc. 1984. Vol.282. P.487-502.

39. Del Moral P., Doisy M. Maslov idempotent probability calculus I // Theor. Prob. Appl. 1999. Vol.43, N4. P.562-576.

40. Del Moral P., Doisy M. Maslov idempotent probability calculus II // Theor. Prob. Appl. 2000. Vol.44, N2. P.319-332.

41. Evans L.C., Souganidis P.E. Differential games and representation formulas for solutions of Hamilton-Jacobi-Isaacs equations // Indiana Univ. Math. J. 1984. Vol.33. P.773-797.

42. Fleming W.H. The Cauchy problem for a nonlinear first-order partial differential equation // J. Differential Equations. 1969. Vol.5, N3. P.515-536.

43. Fleming W.H., Soner Ü.M. Controlled Markov Processes and Viscosity Solutions. Springer-Verlag, New York, 1993.

44. Gondran M. Analyse MINPLUS // C. R. Acad. Sei. Paris. 1990. t. 323, Série I. P.371-375.

45. Hopf E. Generalized solutions of nonlinear equations of first order //J. Math. Mech. 1965. Vol.14. P.951-973.

46. Ishii H. Representation of solutions of Hamilton-Jacobi equations // Nonlinear Anal. T. M. A. 1988. Vol.12. P.121-146.

47. Isidori A. Nonlinear Control Systems, 3 ed. Springer-Verlag, New York, 1995.

48. Kurzhanski A.B., Filippova T.F. The theory of trajectory tubes — a mathematical formalism for uncertain dynamics, viability and control // In: Advances in

49. Nonlinear Dynamics, Viability and Control: a Report from Russia, Birkhauser, Boston, ser. PSCT, 1993. P.122-188.

50. Kurzhanski A.B., Valyi I. Ellipsoidal Calculus for Estimation and Control. Birkhauser, Boston-Basel-Berlin, 1997.

51. Kurzhanski A.D., Varaiya P. Dynamic Optimization for Reachability Problems 11 JOTA. 2001. Vol.108, N2, P.227-251.

52. Lax P.D. Hyperbolic systems of conservation laws II // Comm. on Pure k Appl. Math. 1957. Vol.10. P.537-5G6.

53. Leitmann G. Optimality and Reachability via Feedback Controls // In: Dynamic Systems and Microphysics, A. Blaquiere and G. Leitmann (eds.), Academic Press, New York, 1982.

54. Lions P.-L. Generalized solutions of Hamilton-Jacobi equations. London, 1982.

55. Melikyan A.A. Generalized characteristics of first order PDEs: Applications in optimal control and differential games. Birkhauser, Boston, 1998.

56. Michael E. Continuous selections III // Ann. of Math. 1957. Vol.65. P.375-390.

57. Murray R.M., Li Z., Sastry S.S. A Mathematical Introduction to Robotic Manipulation. CRC Press, 1994.

58. Rockafellar R.T. State Constraints in Convex Problems of Bolza // SIAM Journ. on Control and Optimization. 1972. Vol.10. P.691-715.

59. Rockafellar R. Т., Wets R.J.-B. Variational Analysis. Springer-Verlag, New York, 1998.

60. Roublev I. V. On two notions of generalized solution to the Hamilton-Ja-cobi equation // Proc. Intern. Workshop on Idempotent Mathematics and Math. Physics, Vienna, 2003.

61. Varaiya P. Reach Set Computation Using Optimal Control // Proc. of the KIT Workshop on Verification of Hybrid Systems, Verimag, Grenoble, France, 1998.

62. Zelikin M.I., Borisov V.F. Theory of chattering control. With applications to astronautics, robotics, economics and engineering. Birkhauser, Boston, 1994.