Уравнение эволюции невыпуклых множеств в задаче достижимости и управление потоками тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Мазуренко, Станислав Сергеевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2012
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
Московский государственный университет имени М.В. Ломоносова Факультет вычислительной математики и кибернетики
На правах рукописи
.,........;:/ <
Мазуренко Станислав Сергеевич
Уравнение эволюции невыпуклых множеств в задаче достижимости и управление потоками
01.01.02 — Дифференциальные уравнения, динамические системы и оптимальное управление
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
' с ЛЕК 2012
Москва 2012 г.
005056350
Работа выполнена в МГУ имени М. В. Ломоносова на кафедре системного анализа факультета ВМК.
Научный руководитель — доктор физико-математических наук,
академик Александр Борисович Куржанский.
Официальные оппоненты — доктор физико-математических наук,
член-корреспондент РАН, профессор Сергей Миронович Асеев;
доктор физико-математических наук, профессор Николай Леонтьевич Григоренко.
Ведущая организация — Институт математики и механики УрО РАН.
Защита состоится 26 декабря 2012 г. в 15:30 на заседании Диссертационного совета Д 501.001.43 при Московском государственном университете имени М.В. Ломоносова, расположенном по адресу: 119991, Российская Федерация, Москва, ГСП-1, Ленинские горы, Факультет ВМК МГУ имени М.В.Ломоносова, аудитория 685.
С диссертацией можно ознакомиться в научной библиотеке Факультета ВМК МГУ имени М.В. Ломоносова
2012 г.
Ученый секретарь совета
доктор физико-математических наук,
профессор
Евгений Владимирович Захаров
Общая характеристика работы
Актуальность темы. Задачи управления и оптимизации ставились исследователями с давних пор, однако активное изучение этих задач началось в ЗОх - 40х годах прошлого столетия. Современная проблематика теории управления затрагивает многие научные области: разработка систем автоматизации и роботостроения, управления процессами в физике, биологии, моделирование экономических процессов и т.д.
Толчок к развитию математической теории процессов управления был получен благодаря результатам академика Л.С. Понтрягина и его сотрудников. В частности, были выведены необходимые условия оптимальности для функционалов различного вида, получившие название Принципа максимума Понтрягина [1]. Примерно в те же годы Р. Беллманом был создан метод динамического программирования для решения задач синтеза управления в терминах гамильтонова формализма, а также получены достаточные условия оптимальности [2].
С тех пор круг задач, к которым применимы результаты теории управления, ровно как и методы решения таких задач, стремительно расширялся. Н. Н. Красовский активно занимался решением задач синтеза управления для различных классов возмущений в динамических уравнениях. Им и его сотрудниками были исследованы основные свойства ситем с неопределенностями и их разнообразные приложения [3],[4]. Р. Калман исследовал вопросы фильтрации и предсказания поведения динамических процессов в рамках вероятностных моделей, а также ввел понятия наблюдаемости и управляемости [5]. Широкий класс подобных задач решался при использовании понятий множества достижимости и разрешимости: соответственно куда и откуда мо-
жет передвигаться объект, описываемый системой дифференциальных уравнений. Теория оптимального управления получила свое продолжение для уравнений в частных производных в работах Ж.-Л. Лиониса [6].
В дальнейшие годы, математическая теория процессов управления достигла широкого распространения с различными приложениями. A.B. Кур-жанским и его сотрудниками были продолжены исследования задач управления в условиях неопределенности [7], синтеза управления, оценки и наг хождения множеств достижимости и разрешимости при различных типах ограничений на состояния и параметры системы [8].
Настоящая диссертация продолжает исследования A.B. Куржанского и его сотрудников в области задач синтеза управлений по реально доступной информации в широком смысле этого слова [9]. Ими была развита теория множеств и трубок достижимости [10]. Эти результаты были также представ-ленны в совместных работах с О.И. Никоновым [11] и Т.Ф. Филипповой [12]. В частности, был получен результат для нахождения множества достижимости дифференциального включения в терминах эволюционного уравнения в общем случае, а также, в терминах опорных функций в случае выпуклого решения задачи дифференциального включения.
Современное развитие технологий ставит перед исследователями все более нестандартные задачи, требующие выработки новых методов решения. Так, например, в билинейных по управлению и позиции системах наряду с выпуклыми задачами динамического программирования возникает необходимость перейти к невыпуклому случаю. Это может произойти, если имеется неопределенность в коэффициентах матрицы движения линейной системы. В результате этого, множества достижимости системы представляют собой
4
звездную структуру даже при выпуклом начальном множестве. Разработанный к настоящему времени аппарат исследования таких задач при помощи выпуклого анализа и теории двойственности не может описать точное решение.
Альтернативный подход к задачам управления был предложен Р. Бро-кеттом [13], который обратил свое внимание на необходимость изучения задач управления потоками с заданными начальными распределениями состояний системы, которые могут быть сосредоточены и на невыпуклых множествах. Р. Брокетт рассматривает динамическую задачу управления потоком не в терминах отдельных объектов - фазовых переменных пространства Я." и соответствующих траекторий движения, а в терминах эволюции всей плотности распределения состояний системы. Исследование динамики всего распределения проведено с использованием уравнения Лиувилля - уравнения в частных производных для функции плотности. Помимо абсолютно непрерывного случая, уравнение верно и для более широкого класса распределений из пространства обобщенных функций. В результате, с помощью методов динамического программирования стало возможным нахождение в явном виде оптимального управления системой, сосредоточенной, например, в конечном числе точек, или на границе эллипсоида.
Представленная работа дополняет исследования задач теории управления при помощи эволюционного уравнения [12] и задания динамики системы в терминах уравнения Лиувилля [13].
Целью работы была разработка механизма нахождения невыпуклых множеств достижимости эволюционных систем, описываемых системами обыкновенных дифференциальных уравнений с начальными условиями в ви-
5
де распределений, и оптимального управления такими системами, который бы позволил численно находить соответствующие множества и оптимальное управление.
Научная новизна работы. Полученные результаты являются новыми. В работе рассмотрены ранее мало изученные динамические задачи с невыпуклой динамикой.
В частности, в дополнение к результатам [13] была формализована постановка задачи управления системой в случае, когда состоянием системы являются не координаты в п—мерном пространстве, а распределение координат. Данная постановка уравнения Гамильтона-Якоби-Беллмана была проделана для случая функции цены, зависящей от обобщенной функции распределения.
Настоящая работа продолжила исследования [12] в области систем со звездной динамикой. В данной работе эволюционные уравнения для множества достижимости дифференциальных включений были преобразованы и записаны для функций Минковского, что позволило численно находить калибровочную функцию и восстанавливать по ней всю звездную трубку достижимости.
Наконец, в диссертации представлены новые результаты по нахождению связующей нити между функцией цены в задаче поиска множества достижимости и калибровочной функцией Минковского.
Теоретическая и практическая ценность работы. Полученные результаты могут служить основой для дальнейших исследований и позволят далее перейти к практически реализуемым численным алгоритмам, то есть к решению задачи до конца. В частных случаях (квадратичный интегральный
6
функционал для систем с распределениями и двумерные линейные системы для задачи нахождения звездных множеств достижимости) были построены численные решения.
Методы исследования. Решение рассматриваемых в диссертации задач было получено в рамках упомянутых выше подходов, основанных на методах динамического программирования, а также на методах вариационного анализа и теоремах о дифференцировании условного максимума. Работа носит преимущественно теоретический характер.
Апробация работы. Результаты работы были представлены в виде докладов на семинаре кафедры системного анализа факультета ВМиК МГУ (рук. академик РАН А. Б. Куржанский), а также на конференции Ломоносов 2009.
Публикации. По теме диссертации опубликовано 4 работы, из них 2 статьи в рецензируемых журналах, рекомендованных ВАК.
Структура и объём диссертации. Диссертация состоит из введения, трёх глав, заключения и библиографии. Общий объём диссертации 85 страниц. Библиография включает 57 наименований.
Содержание работы
Во введении раскрываются цели работы, ее актуальность, а также кратко описаны основные результаты, полученные в диссертации.
В первой главе рассматривается задача управления в случае, когда множество начальных состояний системы характеризуется функцией распределения. В первом разделе приведена общая постановка подобной задачи: рас-
7
сматривастся система
x = f(t,x,u), teT=[t0,ti],
где х 6 R", u(t) € W - управление из некоторого класса кусочно-непрерывных функций U, функция f(t,x,u) удовлетворяет стандартным свойствам для существования, единственности и продолжаемости решения на отрезок Т. Начальное состояние системы задается функцией распределения p(to,x) - в общем случае - обобщенным линейным функционалом над пространством непрерывных функций с компактным носителем. Такие распределения часто используются в физике, где, например, вещество или заряд могут быть сосредоточены на границе некоторого множества, или в конечном числе точек, для чего вводится понятие ¿—функции.
Помимо задания рассматриваемого класса обобщенных функций, в разделе приводится теорема РиссагРадона, позволяющая отождествить функции распределения с мерами Радона. Поэтому такая постановка задачи может говорить о вероятностном распределении начальных состояний системы и/или о плотности потока в различных точках пространства в начальный момент времени. Под позицией системы в первой главе будем подразумевать пару (t,p(t, •))•
В разделе 1.1 выводится уравнение Лиувилля, являющееся линейным по позиции и задающее закон её изменения:
д д
g-tP(t,x) = -(g^,p(t,X)f(t,X,U)).
В разделе 1.2 показывается, как зная вид решения исходной системы мож-
8
но получить решение уравнения Лиувилля: в случае, когда отображение <-р каждому значению хо ставит в соответствие решение системы Ьо, хо) с начальным условием х(Ь0) = х0, плотность распределения х в момент времени £:
где — Якобиан преобразования (р.
Далее ставится задача оптимизации: и
J ! ЬЦ,х,и)р{Ь,х)с1х<И + J ф(х)р(Ьих)йх—> Ы, (о К" К"
в которой обе функции х, и) и ф(х) непрерывно дифференцируемы по совокупности переменных. Оптимальное решение ищется при помощи метода динамического программирования: определение функции цены распространяется на случай, когда фазовая переменная - не вектор в Л", а обобщенная функция (мера):
У(Ь>,ро)= Ш < / ( Щ,х,и)р{г,х)(ЬМ + Jф{х)р{Ьих)<1х
¡.(о К" К"
где множество Т задает меры, для которых сходятся несобственные интегралы в целевом функционале.
При таком задании функции цены выполняется полугрупповое свойство, из которого в представленной работе выводится принцип оптимальности и
9
соответствующий ему аналог системы Гамильтона-Якоби-Беллмана:
&V(t,p(t, •)) + inf {-v;(£,p(t,x)f(t,x,u)) + / L{t,x,u)p(t,x)dx\ = О
us и l К" . J
У{к,р{к,-)) = f i!>{x)p{tb-),
r"
которая рассматривается в области Т х JF.
Также, доказывается теорема, согласно которой достаточно найти частное решение полученной системы Гамильтона-Якоби-Беллмана, которое будет оценкой снизу функции цены, а при дополнительных условиях совпадет с её точным значением.
В разделе 1.4 для начального условия с распределением ставится задача нахождения оптимального управления линейной системой с линейно-квадратичным интегралом, зависящим от определенной выше позиции системы. Для такой задачи находится решение в замкнутом виде с использованием уравнений Риккати. Также в этом разделе рассматриваются частные примеры начальных условий с многомерным нормальным распределением, равномерным распределением на параллелепипеде и эллипсоиде, а также с равномерным распределением на границе эллипсоида.
Последний раздел Главы 1 описывает модификацию исходной задачи оптимизации, в которой целевой функционал зависит от распределения уже нелинейно:
U
[ F(t,u,p(t, + Р(М) —► inf.
J u&J
to
Для такого функционала выводится соответствующий аналог принципа оптимальности и уравнений Гамильтона-Якоби-Беллмана. Также решение
задачи управления линейной системой с функционалом, квадратичным по распределению, приводится к замкнутому виду.
Тем не менее, несмотря на универсальность подхода динамического программирования, применимого для задача с распределениями на невыпуклых множествах, нахождение функции цены представляется весьма трудоемкой, а иногда и трудно разрешимой задачей. В частности, если управление заложено в саму матрицу динамики линейной системы, то аналогичное уравнению с аддитивным управлением решение в замкнутом виде построить не удается.
Поэтому в дальнейшем в работе акцентируется внимание на задаче нахождения множества достижимости, которое в общем случае также можно искать как линии уровня функции цены специального вида [7]. Здесь уже известны методы, затрачивающие намного меньшее количество вычислительных мощностей, чем прямое интегрирование уравнений ГЯБ [12]. Например, в выпуклом случае возможно выразить динамику множеств достижимости при помощи опорных функций. Однако как показывает практика, даже в системах с изначальной линейной структурой по фазовой переменной множества достижимости могут оказаться невыпуклыми. В начале второй главы диссертации рассматривается система, билинейная по (х,и), в которой управление (или неопределенность) заложено в саму матрицу движения. В разделе 2.1.3 в явном виде ищется частное решение простейшей двумерной линейной системы и на примере показано, что множество достижимости для системы не выпуклое, а звездное, т.е. Ух 6 ХОД, А € [0,1] =*> Ах € Х[£].
11
В разделе 2.2 рассматривается общая постановка задачи управления
х € F(t, х) = (J f(t,x-,a), t 6 Г= [i0,ii], XqGXq, (1)
aeA(t)
для которой выполнены стандартные условия существования, единственности и продолжаемости решения ([14]), а также предположение
Предположение 1. Существует малое е > 0, такое, что система (1) удовлетворяет свойствам:
1. Начальное множество Хо €
2. График системы (1) дгар!цР € St(R2n) для любого момента времени
3. Окрестность нуля sB0<\ Q X[t] для любого момента времени t € Т.
Здесь graphtF = {(х, у) е R2n\y € F(t, х)} - график многозначного отображения F(t,x), и #о,1 - шар единичного радиуса в Л" с центром в начале координат. При таком предположении, множество достижимости будет оставаться звездным, причем ноль будет всегда лежать строго внутри. Из [12] известно, что многозначная функция X[f] - множество достижимости системы - является тогда единственным решением следующего эволюционного уравнения:
t €Т,
X[fo] = 12
где к(А, В) - метрика Хаусдорфа.
В выпуклом случае для дифференциального включения при выполнении некоторых дополнительных ограничений ([12]) это уравнение можно записать в терминах опорных функций. Целью настоящей главы было выйти за рамки выпуклых множеств и вывести дифференциальное уравнение для калибровочной функции Минковского:
которая, как и опорная функция, позволяет однозначно восстановить само множество:
в случае, когда множество £ является звездным.
Раздел 2.3 приводит необходимые для данной работы свойства калибровочной функции, а также в этом разделе доказывается результат касательно непрерывной дифференцируемости функции г(*|2(<т)) по параметру а, который сформулирован в виде Теоремы 2.1. В результате, в разделе 2.4 доказывается основная теорема второй главы:
Теорема 2.5.
Пусть для системы (1) выполнено Предположение 1. Тогда для любого ненулевого направления I 6 Я", такого, что функция г(/,£) дифференцируема по I в некоторой его окрестности, существует правая производная д+г(1,Ь)/дЬ, причем
г(1\г) = тах{А € д|лг е г}, г(0\г) = -Изо,
2 = 0 € яг : г(1 \г) > 1},
где г = г(1,
Полученное дифференциальное уравнение обладает рядом примечательных свойств. В частности, из-за однородности калибровочной функции, оно может быть решено лишь на п-мерной сфере единичного радиуса для I, т.е. фактически размерность задачи совпадает с размерностью вектора I, что отмечено в работе в конце данного раздела.
В разделе 2.4 на систему дополнительно накладываются фазовые ограничения в виде выпуклого компактнозначного непрерывного по Хаусдорфу отображения V(4). Дифференциальное уравнение изменяется соответствующим образом, однако необходимо потребовать следующее ограничение:
Предположение 2. Выполнены следующие требования на многозначное отображение :
1. Существует малое положительное £ : V* е Т =Ф- еВод € У(Ь),
2. Функция Минковского г(7|У(^) дифференцируема по I.
В этом случае верна следующая теорема:
Теорема 2.6
Пусть для системы (1) действуют фазовые ограничения и выполнены Предположения 1-2. Тогда для любого ненулевого направления I £ Я", такого, что функция г(1, £) дифференцируема по I в некоторой его окрестности, существует правая производная д+г(1, Ь)/дЬ, причем
приг(М)<г(!|У(0),
* | т1п{тах(-^М,/(«,г;а)),|г(г|У(<))}, при г(М) = г(«|У(0).
14
где z = r(l, t)l.
Напомним, что определение звезды подразумевает наличие некоторого множества, называемого центральным, для каждой точки которого отрезок, соединяющий эту точку и произвольную точку множества, лежит внутри этого множества. Раздел 2.6 исследует вопрос, как изменится дифференциальное уравнение для калибровочной функции, если центральное множество звезды будет сосредоточено не вокруг начала координат, а вокруг некоторой заранее известной движущейся точки q(t) : q(t) = Q{q,t). Для этого необходимо потребовать, чтобы множество достижимости было строгой звездой: звездным множеством с центром из точки q{t) и некоторой ее окрестности. Тогда дифференциальное уравнение для функции r[l, £] = r(i|X[t] - q{t)) :
где z = r[l,t]l + q(t).
Третья глава диссертации посвящена сравнению двух подходов к задаче поиска множества достижимости: подходу с использованием линий уровня функции цены и подходу с использованием калибровочных функций. В первом подходе множество достижимости системы может быть найдено как линии уровня функции цены для попятной системы:
х = f(t, х; а), а € A(t), t S Г, ®(tx) = х, (2)
d(x(to),Xо)-> inf а eA(t
где ¿(в, 5) - некоторая метрика в пространстве К1:
У5 е сотр(Н.п), 5,=
Если здать функцию цены как
то из теории динамического программирования известно, что такая функция цены подчиняется уравнению Беллмана:
Множество достижимости исходной системы может быть найдено как линии уровня функции цены для попятной системы:
Аппарат Гамильтонова формализма позволяет, таким образом, находить множества достижимости и для невыпуклых задач, однако имеет ряд вычислительных трудностей.
Однако можно рассмотреть метрику ¿(з, 5), которая зависит от калибровочной функции, например,
(3)
У(«о,х) = (1{х,Х0).
хщ = {хеКп:У(г,х)<0}.
где функция д(х) = 0 для значений х < О, и д{х) возрастает при х > 0. Т.е. "расстояние"от точки s до множества S — длина отрезка, заключенного между точкой s и множеством S, на прямой, соединяющей начало координат и точку s. В этом случае, если
seS& r(a|S) > 1 d(s, S) = 5(1 - г(а|5)) = 0,
поэтому линии уровня функции цены V(t, х) < 0 будут задавать искомое множество достижимости.
Основной результат раздела заключен в следующей теореме:
Теорема 3.2
Пусть система (2) удовлетворяет Предположению 1. Пусть также выполнено следующее равенство:
/ 0r(x,t) 1 ... , .V Л / dr(x,t) ... Д
Tl? \—фТут г(х' t)x>а)/ = ^ \ ~аГ-'/(i'а)/
для любых ненулевых векторов igÄ", и момента времени t € [¿о, г] С Т. Тогда функция V(t, х) — д( 1 —r(x, t)) является решением системы Гамильтона-Якоби-Беллмана
_ V(to,x) = g(l-r(x\Xo))
на отрезке t € [io,r], для непрерывно дифференцируемой функции д(х), такой, что д(х) = 0 для значений х < 0, и возрастает при х > 0.
Т.е, например, для однородной правой части вида f(t, х, а) = Ах, А € А
17
функция
является решением системы Гамильтона-Якоби-Беллмана:
В разделе 3.3 рассмотрены частные примеры двумерных линейных систем, даны иллюстрации множеств достижимости, а также трубок достижимости, проиллюстрирована функция цены в фиксированные моменты време-
ни.
Основные результаты
1. Разработан метод поиска решения задачи оптимального управления потоками с позиции распределения при помощи модифицированных уравнений Гамильтона-Якоби-Беллмана. Решена задача оптимального управления потоками, задаваемыми линейной системой с линейно-квадратичным интегралом, зависящим от позиции (£,р(£, х)). Построены графические иллюстрации динамики распределения в частных случаях;
2. Выведено дифференциальное уравнение для калибровочной функции Минковского множества достижимости дифференциального включения, позволяющее строить трубки достижимости систем со звездной динамикой. Получена модификация этого уравнения при наличии фазовых ограничений;
3. Теоретически обоснована взаимосвязь предложенных методов с подходами к решению задач управления в рамках гамильтонова формализма. Указаны уравнение и решение для функции цены задачи поиска множеств достижимости. Построены графические иллюстрации трубок достижимости и функций цены для задач с неопределенностью в матрице динамики линейной системы.
Автор приносит искреннюю благодарность своему научному руководителю Александру Борисовичу Куржанскому за постановку задач, постоянное внимание к работе и ценные советы.
Работа выполнена в рамках ФЦП "Научные и научно-педагогические кадры инновационной России на 2009-2013 годы" (контракт № 16.740.11.0426 от
19
26 ноября 2010 г.) и при частичной финансовой поддержке РФФИ (грант 09-01-00589-а).
Публикации по теме диссертации
1. Мазуренко С. С. Метод динамического программирования в системах с состояниями в виде распределений // Вестник Московского Университета. Секция 15. Вычислительная математика и кибернетика, 2011. № 3. с. 30-38.
2. Мазуренко С. С. Дифференциальное уравнение на калибровочную функцию Минковского звездного множества достижимости дифференциального включения // Доклады Академии Наук. Математика. 2012. Т. 445, № 2. с. 139-142.
Цитированная литература
[1] Л. С. Поптрягии "Избранные научные труды", 2 т., М.: Наука, 1988.
[2] Р. Беллман "Динамическое программирование", М.: Изд-во Иностранная литература, 1960.
[3] Н. Н. Красовский "Теория управления движением", М.: Наука, 1961.
[4] Н. Н. Красовский "Игровые задачи о встрече движений", М.: ФИЗ-МАТЛИТ, 1970.
[5] R. Е. Kaiman"A new approach to linear filtering and prediction problems", Trans. ASME. 1960. V. 82. N. Series D. P. 35-15.
[6] Ж.-Л. Лионе "Управление сингулярными распределенными системами", М.: Наука, 1987.
[7] А. Б. Куржанский "Управление и наблюдение в условиях неопределённости", М.: Наука, 1977.
[8] А. Н. Даръин, И.А. Дигайлова, И.В. Рублев "Избранные труды А.Б. Куржанского", МГУ: 2009.
[9] А.Б. Куржанский "О задачах синтеза управлений по реально доступной информации", Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика. 2005. Специальный выпуск. С. 113-122.
[10] А.Б. Куржанский "Об аналитическом описании пучка выживающих траекторий дифференциальной системы", Доклады АН СССР. 1986. Т. 287. № 5. С. 1047-1050.
[11] А.В. Куржанский, О.И. Никонов "Эволюционные уравнения для пучков траекторий синтезированных систем управления", Доклады РАН. 1993. Т. 333. № 4. С. 578-581.
[12] А. В. Kurzhanski, Т. F. Filippova "On the theory of trajectory tubes -a mathematical formalism for uncertain dynamics, viability and control", Advances in Nonlinear Dynamics and Control. Boston: Birkhauser, 1993. P. 122-188.
[13] R. W. Brockett "Optimal control of the Liouville equation", Engineering and applied science, Harvard University.
[14] А. Ф. Филиппов "Дифференциальные уравнения с разрывной правой частью", М.: Издательство физ.-мат. литературы, 1985.
Напечатано с готового оригинал-макета
Подписано в печать 21.11.2012 г. Формат 60x90 1/16. Усл.печл. 1,0. Тираж 100 экз. Заказ 452.
Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от 01.12.99 г. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В. Ломоносова, 2-й учебный корпус, 527 к. Тел. 8-495-939-3890. Тел./факс 8-495-939-3891.
Введение
1 Динамическое программирование в линейных системах с состояниями в виде распределений
1.1 Постановка задачи в общем случае.
1.2 Преобразование плотности.
1.3 Принцип оптимальности. Уравнение типа Гамильтона-Якоби-Беллмана
1.4 Линейный случай.
1.4.1 Квадратичный функционал для линейных систем
1.4.2 Примеры.
1.5 Общий случай интегрального функционала.
1.6 Применимость метода.
2 Звездные множества достижимости. Дифференциальное уравнение для калибровочной функции
2.1 Линейные системы. Выпуклый и звездный случаи
2.1.1 Выпуклый случай.
2.1.2 Звездный случай.
2.2 Звездные множества. Эволюционное уравнение.
2.3 Калибровочные функции.
2.4 Уравнение в частных производных для калибровочной функции множества достижимости
2.5 Фазовые ограничения.
2.6 Случай движущегося центра звезды
3 Звездные множества в рамках гамильтонова формализма
3.1 Уравнение Гамильтона-Якоби-Беллмана для нахождения множества достижимости
3.2 Калибровочная функция в рамках гамильтонова формализма
3.3 Пример с двумерной линейной системой.
Задачи управления и оптимизации ставились исследователями с давних пор, однако активное изучение этих задач началось в ЗОх - 40х годах прошлого столетия. Современная проблематика теории управления затрагивает многие научные области: разработка систем автоматизации и роботостроения, управления процессами в физике, биологии, моделирование экономических процессов и т.д.
Толчок к развитию математической теории процессов управления был получен благодаря результатам академика Л.С. Понтрягина и его сотрудников: В.Г. Болтянского, Р.В. Гамкрелидзе, Е.Ф. Мищенко, а следом за ними и других исследователей. В частности, были выведены необходимые условия оптимальности для функционалов различного вида, получившие название Принципа максимума Понтрягина [1]. Примерно в те же годы Р. Беллманом был создан метод динамического программирования для решения задач синтеза управления в терминах гамильтонова формализма, а также получены достаточные условия оптимальности [2].
С тех пор круг задач, к которым применимы результаты теории управления, ровно как и методы решения таких задач, стремительно расширялся. Н. Н. Красовский активно занимался решением задач синтеза управления для различных классов возмущений в динамических уравнениях. Им и его сотрудниками были исследованы основные свойства систем с неопределенностями и их разнообразные приложения [3],[4]. Р. Калман исследовал вопросы фильтрации и предсказания поведения динамических процессов в рамках вероятностных моделей, а также ввел понятия наблюдаемости и управляемости [5]. Широкий класс подобных задач решался при использовании понятий множества достижимости и разрешимости: соответственно куда и откуда может передвигаться объект, описываемый системой дифференциальных уравнений. Теория оптимального управления получила свое продолжение для уравнений в частных производных в работах Ж,-Л. Лиониса [6].
Среди других исследователей теории управления и её приложений отметим работы Ф.Л. Черноусько [7], Б.Н. Пшеничного [8], В.А. Троицкого [9], В.А. Якубовича [10],
В.Ф. Кротона [11], Р. Габасова и Ф.М. Кирилловой [12], В.М. Кунцевича [13]. Наряду с ними серьезный вклад в эту теорию внесли G. Leitsmann, T.Basar и Р. Bernhard [14], R. Brockett [45], Р. Kokotovic [15], A. Isidori [16], A. Krener [17], Ch. Byrnes [18], Р. Varaiya [19], Л. Lygeros, С. Tomlin и S. Sastry [20], E.B. Lee и L. Markus [21].
В дальнейшие годы, математическая теория процессов управления достигла широкого распространения с различными приложениями. Активную роль в развитии этой теории сыграли сотрудники H.H. Красовского: A.B. Куржанский, Ю.С. Осипов [22], А.И. Субботин [23] и другие. В том числе были продолжены исследования задач управления в условиях неопределенности [24], синтеза управления, оценки и нахождения множеств достижимости и разрешимости при различных типах ограничений на состояния и параметры системы [25]. Область научных интересов A.B. Куржан-ского включает такие направления исследования, как задачи гарантированного оценивания, в которых не известны стохастические свойства ненаблюдаемых величин и неопределенностей, а есть лишь информация о возможных диапазонах их изменений; задачи, в которых ограничения, накладываемые на систему двойные: геометрические и интегральные ограничения, имеющие общий резерв [26]; задачи эллипсоидального исчисления и оценивания [43] и многие другие.
Помимо названных работ, отдельно отметим существенный вклад в современную теорию управления М.И. Гусева [28]-[20], В.Н. Ушакова [30], С.¡VI. Асеева [31], H.JI. Григорснко [32], ¡VI.С. Никольского [33], В.А.Комарова [34], Н.Н.Субботиной [35], А.Н. Дарьина [36], И.В. Рублева [37] и других.
Настоящая диссертация продолжает исследования А.Б. Куржанского и его сотрудников в области задач синтеза управлений по реально доступной информации в широком смысле этого слова [38]. Ими была развита теория множеств и трубок достижимости [39]. Эти результаты были также представлены в совместных работах с О.И. Никоновым [40] и Т.Ф. Филипповой [41]. В частности, был получен результат для нахождения множества достижимости дифференциального включения в терминах эволюционного уравнения в общем случае, а также, в терминах опорных функций в случае выпуклого решения задачи дифференциального включения.
Современное развитие технологий ставит перед исследователями все более нестандартные задачи, требующие выработки новых методов решения. Так, например, в билинейных но управлению и позиции системах наряду с выпуклыми задачами динамического программирования возникает необходимость перейти к невыпуклому случаю. Это может произойти, если имеется неопределенность в коэффициентах матрицы движения линейной сисчемы. В результате этого, множества достижимости системы представляют собой звездную структуру даже при выпуклом начальном множестве. Разработанный к настоящему времени аппарат исследования таких задач при помощи выпуклого анализа и теории двойственности не может описать точное решение.
Альтернативный подход к задачам управления был предложен Р. Брокеттом [45], который вслед за К. Рейнольдсом [44] обратил свое внимание на необходимость изучения задач управления потоками с заданными начальными распределениями состояний системы, которые могут быть сосредоточены и на невыпуклых множествах. Р. Бро-кетт рассматривает динамическую задачу управления потоком не в терминах отдельных объектов - фазовых переменных пространства В!1 и соответствующих траекторий движения, а в терминах эволюции всей плотности распределения состояний системы. Исследование динамики всего распределения проведено с использованием уравнения Лиувилля - уравнения в частных производных для функции плотности. Помимо абсолютно непрерывного случая, уравнение верно и для более широкого класса распределений из пространства обобщенных функций. В результате, с помощью методов динамического программирования стало возможным нахождение в явном виде оптимального управления системой, сосредоточенной, например, в конечном числе точек, или на границе эллипсоида.
Представленная работа дополняет исследования задач теории управления при помощи эволюционного уравнения [41] и задания динамики системы в терминах уравнения Лиувилля [45].
Целью данной работы была разработка механизма нахождения невыпуклых множеств достижимости эволюционных систем, описываемых системами обыкновенных дифференциальных уравнений с начальными условиями в виде распределений, и оптнмалыгого управления такими системами, который бы позволил численно находить соответствующие множества и оптимальное управление.
В частности, в дополнение к результатам [45] была формализована постановка задачи управления системой в случае, когда состоянием системы являются не координаты в п—мерном пространстве, а распределение координат. Данная постановка уравнения Гамильтона-Якоби-Беллмаиа была проделана для случая функции цены, зависящей от обобщенной функции распределения [42].
Настоящая работа продолжила исследования [41] в области систем со звездной динамикой. В данной работе эволюционные уравнения для множества достижимости дифференциальных включений были преобразованы и записаны для функций Минковского, что позволило численно находить калибровочную функцию и восстанавливать по ней всю звездную трубку достижимости.
Наконец, в диссертации представлены новые результаты по нахождению связующей нити между функцией цены в задаче поиска множества достижимости и калибровочной функции Минковского.
Решение рассматриваемых в диссертации задач было получено в рамках упомянутых выше подходов, основанных на методах динамического программирования, а также на методах вариационного анализа и теоремах о дифференцировании условного максимума. Работа носит преимущественно теоретический характер. Полученные результаты могут служить основой для дальнейших исследований и позволят далее перейти к практически реализуемым численным алгоритмам, то есть к решению задачи до конца. В частных случаях (квадратичный интегральный функционал для систем с распределениями и двумерные линейные системы для задачи нахождения звездных множеств достижимости) были построены численные решения.
Диссертация состоит из трёх глав.
В первой главе рассматривается задача управления в случае, когда множество начальных состояний системы характеризуется функцией распределения. В первом
разделе приведена общая постановка подобной задачи: рассматривается система х = /(Ь,х,и), Ь £Т — [¿о,¿1], где х £ К", ?/,(/,) £ Ш.1' - управление из некоторого класса кусочно-непрерывных функций и, функция /(£, х,и) удовлетворяет стандартным свойствам для существования, единственности и продолжаемости решения на отрезок Т. Начальное сос тояние системы задается функцией распределения р(£0, х) - в общем случае - обобщенным линейным функционалом над пространством непрерывных функций с компактным носителем. Такие распределения часто используются в физике, где, например, вещество или заряд могут быть сосредоточены на границе некоторого множества, или в конечном числе точек, для чего вводится понятие 5—функции.
Помимо задания рассматриваемого класса обобщенных функций, в разделе приводится теорема Рисса-Радона, позволяющая отождествить функции распределения с мерами Радона. Поэтому такая постановка задачи может говорить о вероятностном распределении начальных состояний системы и/или о плотности потока в различных точках пространства в начальный момент времени. Под позицией системы в первой главе будем подразумевать пару •)).
В разделе 1.1 выводится уравнение Лиувилля, являющееся линейным по позиции и задающее закон её изменения: д д
В разделе 1.2 показывается, как зная вид решения исходной системы можно получить решение уравнения Лиувилля: в случае, когда о тображение ц) каждому значению Хо ставит в соответствие решение системы х{Ь, ¿о, Хо) с начальным условием х(Ьо) = хо, плотность распределения х в момент времени Ь : р^о.УГЧЗО) где 3{р - Якобиан преобразования (р.
Далее ставится задача оптимизации: І1
J ! Ь(і,х,и)р{Ь,х)йх(Іі + J'ф(x)p(tl,x)dx ті, иеи о К" К" в которой обе функции Ь(Ь, х, и) и ф{х) непрерывно дифференцируемы по совокупности переменных. Далее оптимальное решение ищется при помощи метода динамического программирования: определение функции цены распространяется на случай, когда фазовая переменная - не вектор в Я71, а обобщенная функция (мера):
У(іо,Ро) — іпГ ^ [ I х, и)р(Ь, х)йхсІІ + / ф{х)р{Ьі,х)йх . ¿о К" К" р(і0, •) =Ро(-) є т > , где множество Т задает меры, для которых сходятся несобственные интегралы в целевом функционале.
При таком задании функции цены выполняется иолугрупповое свойство, из которого в представленной работе выводится принцип оптимальности и соответствующий ему аналог системы Гамильтона-Якоби-Беллмана:
§1У(1>р(1,г))+т1\-У;(§х,р(Ь,х)/(1,х,и))+ I Ь(Ь,х,и)р(1,х)ах\ = 0 иеи К" J
У{к,р{Ь,-)) = !'Ф(х)р{1!,.), которая рассматривается в области Т х Т.
Также, доказывается теорема, согласно которой достаточно найти частное решение полученной системы Гамильтона-Якоби-Беллмана, которое будет оценкой снизу функции цены, а при дополнительных условиях совпадет с её точным значением.
В разделе 1.4 для начального условия с распределением ставится задача нахождения оптимального управления линейной системой с линейно-квадратичным интегралом, зависящим от определенной выше позиции системы. Для такой задачи находится решение в замкнутом виде с использованием уравнений Риккати. Также в этом разделе рассматриваются частные примеры начальных условий с многомерным нормальным распределением, равномерным распределением на параллелепипеде и эллипсоиде, а также с равномерным распределением на границе эллипсоида.
Последний раздел Главы 1 описывает модификацию исходной задачи оптимизации, в которой целевой функционал зависит от распределения уже нелинейно:
Для такого функционала выводится соответствующий аналог принципа оптимальности и уравнений Гамильтона-Якоби-Беллмана. Также решение задачи управления линейной системой с функционалом, квадратичным по распределению, приводится к замкнутому виду.
Тем не менее, несмотря на универсальность подхода динамического программирования, применимого для задача с распределениями на невыпуклых множествах, нахождение функции цены представляется весьма трудоемкой, а иногда и трудно разрешимой задачей. В частности, если управление заложено в саму матрицу динамики линейной системы, то аналогичное уравнению с аддитивным управлением решение в замкнутом виде построить не удается.
Поэтому в дальнейшем в работе акцентируется внимание на задаче нахождения множества достижимости, которое в общем случае также можно искать как линии уровня функции цены специального вида [24]. Здесь уже известны методы, затрачивающие намного меньшее количество вычислительных мощностей, чем прямое интегрирование уравнений ГЯБ [411- Например, в выпуклом случае возможно выразить динамику множеств достижимости при помощи опорных функций. Однако как показывает практика, даже в системах с изначальной линейной структурой по фазовой переменной множества достижимости могут оказаться невыпуклыми. В начале второй главы диссертации рассматривается система, билинейная по (х,и), в которой управление (или неопределенность) заложено в саму матрицу движения. В разделе 2.1.3 в явном виде ищется частное решение простейшей двумерной линейной системы и на примере показано, что множество достижимости для системы не выпуклое, а 1 о звездное.
Далее рассматривается общая постановка за,дачи управления: х G F(t, х), t G [¿о, ¿i], х0 € Х0, для которой выполнены стандартные условия существования, единственности и продолжаемости решения ([48]), а также предположение о звездной структуре динамики и начального множества.
Тогда, из [41] известно, что многозначная функция X[t] - множество дос тижимости системы - является единственным решением следующего эволюционного уравнения: lim [ X[t + а], |J {a;=0, i G Т,
X[t0] = Х0, где 1г(Л, В) - метрика Хаусдорфа.
В выпуклом случае для дифференциального включения при выполнении некоторых дополнительных ограничений ([41]) это уравнение можно записать в терминах опорных функций. Целью настоящей главы было выйти за рамки выпуклых множеств и вывести дифференциальное уравнение для калибровочной функции Минковского: r(l\Z) = max{A G R\M G Z}, r(0|Z) = +oo, которая, как и опорная функция, позволяет однозначно восстановить само множество.
Раздел 2.3 приводит необходимые для данной работы свойства калибровочной функции, а также в этом разделе доказывается результат касательно непрерывной дифференцируемости функции r(l\Z(a)) по параметру и, который сформулирован в виде Теоремы 2.1. В результате, в разделе 2.4 выводится дифференциальное уравнение для калибровочной функции Минковского: d+r(l,t) / dlog r(l,t) \ --й—>К>г'аЧ' где 2 = r(l, t)l. Решение этого уравнения можно искать в классическом виде. Однако как правило, для уравнений типа Гамильтона-Якоби-Беллмана рассматриваются вязкостные решения, условия существования которых для разных типов подобных уравнений можно найти, например в [6].
В следующем разделе на систему дополнительно накладываются фазовые ограничения в виде выпуклого компактно-значного непрерывного по Хаусдорфу отображения Показывается, что дифференциальное уравнение изменяется соответствующим образом.
Напомним, что определение звезды подразумевает наличие некоторого множества, называемого центральным, для каждой точки которого отрезок, соединяющий эту точку и произвольную точку множества, лежит внутри этого множества. Раздел 2.6 исследует вопрос, как изменится дифференциальное уравнение для калибровочной функции, если центральное множество звезды будет сосредоточено не вокруг начала координат, а вокруг некоторой заранее известной движущейся точки <¡(1,) : г/(£) =
Третья глава диссертации посвящена сравнению двух подходов к задаче поиска множества достижимости: подходу с использованием линий уровня функции цены и подходу с использованием калибровочных функций. В первом подходе множество достижимости системы может быть найдено как линии уровня функции цены для попятной системы:
ХЩ = {хе Ип: У(Ь,х) < 0}.
Аппарат Гамильтонова формализма позволяет, таким образом, находить множества достижимости и для невыпуклых задач, однако он имеет ряд вычислительных трудностей.
В данной работе рассматривается метрика ¿(в, 5), которая сама зависит от калибровочной функции: ф,5) = 5(1-г(5|5)), где функция д{х) = 0 для значений х < 0, и д{х) возрастает при х > 0, то показывается, что функция ж) = д( 1 — г(х, £)) является решением некоторой системы Гамильтона-Якоби-Беллмана для любой непрерывно дифференцируемой функции
Т.е, например, для однородной правой части вида /(£, х, а) — Ах, А £ Л функция
V(l,x)=g(l-r(x,t)) является решением системы Гамильтона-Якоби-Беллмана:
V{ta,x) = д{1 - r{x,t0)).
В разделе 3.3 рассмотрены частные примеры двумерных линейных систем, даны иллюстрации множеств достижимости, а также трубок достижимости, проиллюстрирована функция цены в фиксированные моменты времени.
Основные результаты работы следующие:
1. Разработан метод поиска решения задачи оптимального управления потоками с позиции распределения при помощи модифицированных уравнений Гамильтона-Якоби-Беллмана. Решена задача оптимального управления потоками, задаваемыми линейной системой с линейно-квадратичным интегралом, зависящим от позиции (t,p(t, х)). Построены графические иллюстрации динамики распределения в частных случаях;
2. Выведено дифференциальное уравнение для калибровочной функции Минков-ского множества достижимости дифференциального включения, позволяющее строить трубки достижимости систем со звездной динамикой. Получена модификация этого уравнения при наличии фазовых ограничений;
3. Теоретически обоснована взаимосвязь предложенных методов с подходами к решению задач управления в рамках гамильтонова формализма. Указаны уравнение и решение для функции цены задачи поиска множеств достижимости. Построены графические иллюстрации трубок достижимости и функций цены для задач с неопределенностью в матрице динамики линейной системы.
Заключение
Таким образом, в данной работе был разработан метод поиска решения задачи оптимального управления потоками при задании начального распределения. Основной метод - модифицированные уравнения Гамильтона-Якоби-Беллмана. Решена задача оптимального управления линейной системой с начальным распределением и линейно-квадратичным интегралом, построены графические иллюстрации динамики распределения в частных случаях.
Для случая звездных систем было получено дифференциальное уравнение для калибровочной функции Минковского множества достижимости, позволяющее строить трубки достижимости систем со звездной динамикой. Получена модификация этого уравнения при наличии фазовых ограничений, а также при движущимся центре звезды.
Теоретически обоснована взаимосвязь преобразованных в работе методов со стандартными подходами решения задач управления в рамках гамильтонова формализма. Найдена соответствующая функция цены задачи поиска множества достижимости, построены графические иллюстрации трубок достижимости и функций цены в случае с неопределенностью в матрице динамики линейной системы.
Автор приносит искреннюю благодарность своему научному руководителю Александру Борисовичу Куржанскому за постановку задач, постоянное внимание к работе и ценные советы.
1. Л. С. Понтрягин"Избранные научные труды", 2 т., М.: Наука, 1988.
2. Р. Беллмаи "Динамическое программирование", М.: Изд-во Иностранная литература, I960.
3. Н. Н. Красовский "Теория управления движением", М.: Паука, 1961.
4. Н. Н. Красовский "Игровые задачи о встрече движений", М.: ФИЗМАТЛИТ, 1970.
5. R. Е. Kaiman "A new approach to linear filtering and prediction problems", Trans. ASME. 1960. V. 82. N. Series D. P. 35-45.
6. Ж.-Л. Лионе "Управление сингулярными распределенными системами", М.: Наука, 1987.
7. Ф.Л. Черноусько, A.A. Меликяи "Игровые задачи управления и поиска",М.: Паука, 1978.
8. Б.Н. Пшеничный, В.В. Остапенко "Дифференциальные игры",Киев: Наукова думка, 1992.
9. В.А. Троицкий "Вариационные задачи оптимизации процессов в системах с ограниченными координатами", Прикладная математика и механика, 26, выпуск 3, 1962.
10. В.А. Якубович "Решение некоторых матричных неравенств, встречающихся в теории автоматического регулирования", ДАН СССР, т.143, N 6, 1962, с.1304-1307.
11. В.Ф. Кротов, В.И. Гурман "Методы и задачи оптимального управления", М,: Наука, 1973.
12. Р. Габасов, Ф.М. Кириллова "Конструктивные методы оптимизации", Mil: Изд-во "Университетское 1984.
13. В. М. Кугщевич "Синтез оптимального робастного управления линейными объектами при ограниченных возмущениях", Автомат, и телемех., 1992, jYs 7, 178-182.
14. Т. Basar, Р. Bernhard, "Н00 Optimal Control and Related Minimax Design Problems", SCFA. Basel: Birkheauser, 2nd ed., 1995.
15. P. V. Kokotovic, R.A. Freeman "Robust Nonlinear Control Design: State-Space and Lyapunov Techniques", Boston: Birkhauser, 2008.
16. A. Isidori "Nonlinear Control Systems", Springer, 1995.
17. A. Krener "A Generalization of the Accessibility Problem for Control Systems", University of California, Davis, California, 1971.
18. A.B. Kurzhanski, Ch. Byrnes "Modelling and adaptive control", Proceedings of the IIASA conference, Sopron, Hungary, July, 1986.
19. A.B. Kurzhanski, I.M. Mitchell, P. Varaiya"Control Synthesis for State Constrained Systems and Obstacle Problems", Proc. NOLCOS-Ü4. TFAC, Elsevier Science, Stuttgart, 2004.
20. J. Lygeros, C. Tomlin, S. Sastry "Controllers for reachability specifications for hybrid systems", Automatica. 1999. V. 35. N. 3. P. 349 370.
21. E.B. Lee, L. Markus "Foundations of Optimal Control Theory", N.Y.: Wiley, 1967.
22. Y.S. Osipov, A.V. Kryazhimskiy "Inverse problems for ordinary differential equations: dynamical solutions", London: Gordon and Breach, 1995.
23. N.N. Krasovskii, A.I. Subbotin "Game-Theoretical Control Problems",SSSM. N.Y.: Springer, 1988.
24. A.B. Куржанский "Управление и наблюдение в условиях неопределённости", М.: Наука, 1977.
25. А.Н. Даръин, И.А. Дигайлова, И.В. Рублев "Избранные труды А.Б. Куржан-екого", МГУ: 2009.
26. А.Н. Даръин, А.Б. Куржаиский "Нелинейный синтез управления при двойных ограничениях", Дифференп, уракн. 2001. Т. 37. № 11. С. 1476 -1484.
27. A.D. Kurzhanski, I. Valyi "Ellipsoidal Calculus for Estimation and Control", SCFA. Boston: Birkheauser, 1997.
28. М.И. Русев "О структуре оптимальных минимаксных оценок в задаче гарантированного оценивания", Доклады РАН. 1992. Т. 332. j\° 5. С. 832-835.
29. М.И. Русев "Об устойчивости информационных множеств в задаче гарантированного оценивания", Труды ИММ УрО РАН. 2000. Т. 6. JV* 1. С. 55-72.
30. В.Н. Ушаков, А.Р. Матвийчук, А.Р. Малев "Задачи динамики систем с фазовыми ограничениями", Изв. ИМИ УдГУ, 2012, № 1(39), 138-139.
31. G.M. Асеев, A.B. Кряжимский "Принцип максимума Понтрягина и задачи оптимального экономического роста", Тр. МИАН, 257, Наука, М., 2007.
32. H.JI. Рригоренко "Задача преследования несколькими объектами", Тр. МИАН СССР, 166, 1984, 61-75.
33. M.G. Никольский "О задаче оптимального быстродействия для одного класса двумерных билинейных управляемых систем", МТИП, 2:3 2010, 7-20.
34. В.А. Комаров "Уравнение множеств достижимости дифференциальных включений в задаче с фазовыми ограничениями", Труды МИАН СССР. 1988. Т. 185. С. 116-125.
35. II. Н. Субботина "Метод характеристик Коши и обобщенные решения уравнений Гамильтона-Якоби-Беллмана", Доклады АН СССР, 1991, 320(3), 556-561.
36. А. П. Даръин, А.Б. Куржанский"Управление в условиях неопределённости при двойных ограничениях", Дифференц. уравн. 2003. Т. 39. № 11. С. 1474-1486.
37. И.В. Рублев "О связи между двумя понятиями обобщённого решения уравнения Гамильтона-Якоби", Дифференц. уравн. 2002. Т. 38. № 6. С. 818-825.
38. А.В. КуржанскийиО задачах синтеза управлений по реально доступной информации", Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика. 2005. Специальный выпуск. С. 113-122.
39. А.Б. Куржанский "Об аналитическом описании пучка выживающих траекторий дифференциальной системы", Доклады АН СССР. 1986. Т. 287. .VJ 5. С. 1047-1050.
40. А.Б. Куржанский, О.И. Никонов "Эволюционные уравнения для пучков траектории синтезированных систем управления", Доклады РАН. 1993. Т. 333. № 4. С. 578-581.
41. А.В. Kurzhanski, T.F. Filippova"On the theory of trajectory tubes a mathematical formalism for uncertain dynamics, viability and control", Advances in Nonlinear Dynamics and Control. Boston: Birkhauser, 1993. P. 122-188.
42. A.B. Kurzhanski, A.N. Daryin "Dynamic Programming for Impulse Controls", Annual Reviews in Control. 2008. V. 32. N. 2. P. 213-227.
43. A.B. Kurzhanski, P. Varaiya "Dynamic Optimization for Reachability Problems", A Journal of Optimization Theory and Applications. Boston: Birkhauser, 2001. V. 108, N.2, P. 227-251.
44. B.C. Владимиров "Уравнения математической физики", Наука, Главная редакция физико-математической литературы, Москва 1981.
45. И.М. Гельфнжд, Г.Е. Шилов "Обобщенные функции и действия над ними", Государственное издательство физико-математической литературы, Москва 1959.
46. А.Ф. Филиппов "Дифференциальные уравнения с разрывной правой частью", М.: Издательство физ.-мат. литературы, 1985.
47. R.T. Rockafellar "Convex Analysis", Princeton University Press, 1970.
48. R.T. Rockafellar, ft. Wets "Variational Analysis", Springer-'Verlag, 2009.
49. Fan Ky "Minimax theorems", Proc. Nat. Acad, of Sci. USA 1953, V. 39. N. 1. P. 42-47.
50. K. Ro, K. Kunisch "Lagrange Multiplier Approach to Variational Problems and Applications", Society for Industrial and Applied Mathematics, Philadelphia, 2008.
51. А.Б. Куржапский, Т.Ф. Филлипова "Об описании пучка выживающих траекторий дифференциального включения", Докл. АН СССР. 1986. Т. 279, М 1.
52. А.Б. Куржапский, Т.Ф. Филлипова "Об описании пучка выживающих траекторий дифференциального включения", Дифференц. уравнения. 1987. Т. 23, Ш 8. С. 1303-1315
53. А.В. Kurzhanski, T.F. Filippova "Dynamics of the set of viable trajectories to a differential inclusions: the evolution equation", Проблемы управления и теории информации (Венгрия), 1988. Т. 17, Ч 3. С. 137-144.
54. А.И. Панасюк "Множества достижимости дифференциальных включений в замкнутой области определения", Матем. заметки, 50:3 (1991), 113-121.
55. В.А. Комаров "Об одном способе описания эволюции множества достижимости дифференциального включения", Труды Математического института РАН 1995, Т. 211.
56. С. С. Мазуренко "Метод динамического программирования в системах с состояниями в виде распределений", Вестник московского университета. Секция 15. Вычислительная математика и кибернетика, 2011. Л'2 3. с. 30—38.
57. С.С. Мазуренко "Дифференциальное уравнение для калибровочной функции звездного множества достижимости дифференциального включения", Доклады Академии наук. Математика. 2012. Т. 445, № 2. с. 139-142.