Игровые задачи сближения-уклонения: обратная связь и стабильность множеств тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Латушкин, Ярослав Александрович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
2008
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
На правах.рукшнсп
ЛАТУШКИН Ярослав Алекттитдрогтч
ИГРОВЫЕ ЗАДАЧИ СБЛИЖЕНИЯ-УКЛОНЕНИЯ:
ОБРАТНАЯ СВЯЗЬ И СТАБИЛЬНОСТЬ МНОЖЕСТВ
01 01.02 — Дифференциальные уравнения
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
□03454070
Екатеринбург — 2008
003454070
Работа выполнена в отделе динамических систем Института математик» механики УрО РАН
Научный руководитель доктор физико-математических паук
Брыкалос С'ер|.еп Аркадьевич
Официальные оппоненты, доктор физико-математических наук,
профессор Ъшков Евгений Леонидович
доктор физико-математических паук, профессор Ухоботов Виктор Иванович
Ведущая организация. Московский Государственный Университет
имени МII Ломоносова
Защита диссертации состоится 10 декабря 2008 года в 13 часов на заседании дисс рационного совета Д 004 006.01 по защите диссертаций па соискание ученой степс доктора наук при Институте математики п механики УрО РАН по адресу 620219 Екатеринбург ГСП-384, ул Софьи Ковалевской д 16
С диссертацией можно ознакомиться в Научной библиотеке Института математик механики УрО РАН
Автореферат разослан "О—'' ноября 2008 г
Ученый секретарь
диссертационного совета )
<
доктор фпз -мат паук
■ - '-3 НЮ Лукоянов
л;
Общая характеристика работы
ктуалыюсть темы. Данная работа посвящена некоторым задачам теории дпффе-енцпальных игр на конечном промежутке времени Рассматриваются копфлжтпо-правляемые системы дос таточно общего вида, стесненные геометрическими oipauu-енпями па управления
В работе изучаются в основном две игровые задачи управления задача об ук.юие-ш1 и задача о сближении конфликтно-управляемой системы с компактным целевым шожеством в евклидовом пространстве.
Для задач об уклонении исследуются вопросы, связанные с построением ырлптп-угощего управления второго ш'рока п выяснением структуры этого управления
Для задач о сближении исследуется свойство u-стабнлыюстп множеств содержа-щхся в пространстве позиции игры, введенное в работах Н.Н Красовского н Л И .убботипа [11,12,18,19] Известно несколько основных подходов к формализации дифференциальных игр Одной из первых методик исследования дифференциальных игр явплас в методика, редложенная Р Апзексом в середине XX столетня, базирующаяся па нсиольювшшн ак называемого «основного уравнения» теории дифференциальных игр |2|
В 60-е годы XX столетня Л С. Поптрягнпым для решения линейных дпфферен-нальных игр была введена конструкция альтернированного интеграла |30], выделя-щая и пространстве позиций игры множество разрешимости — множество всех тех озпцнп, из которых разрешима задача о сближении Конструкция альтернированного нтеграла J1.C Поитряпша получила развитие в работах М С. Никольского Е С По-овипкппа, А И Пономарева, II X Розова [22,27,281- В настоящее время продолжается азработка теории п методов вычисления альтернированного интеграла Л С Понтря-ша. Здесь отметим работы А Б Куржапского и его учеников [9,21], посвященные дачам синтеза управлений в системах с линейной структурой. В этих работах ре-гение задач конфликтного управления достигается соединением модифицированные нструкций экстремального прицеливания H.H. Красовского и альтернированного нтеграла Л.С. Поитряпша
В 60-е годы Н Н Красовскпм была предложена концепция позиционной диффе-епцналыюн игры [11,12], которая затем последовательно развивалась пм и его со-эудппками. В рамках этой концепции была разработана позиционная формализации пфференцпальпых игр, базирующаяся па понятии позиционных стратегии Оспов-ым элементом разрешающих конструкций, ориентированных па решение нелинейных ифференцпальпых игр, являются стабильные мосты — множества в пространстве озицип дифференциальной игры, оканчивающиеся на целевом множестве п слабо шарпаитпые относительно некоторого набора дифференциальных включений, свя-шпых с динамикой конфликтно-управляемой системы. Разрешающая позиционная гратегпя в игровой задаче о сближении может быть построена как экстремальная к „ [•обильному мосту стратегия В 70-е, 80-е годы XX столетия теория дифференциальных игр интенсивно развпва-
лась в этот период были опубликованы монографии Н Н Красовского [12,1G) МП Красовского и А.11 Субботина [29|.А II Субботина и А.Г Чеццова [33| Концепция экстремального прицеливания была перепечена па различные классы дифференциальных. игр, в том числе Ю С Осшкшым и А В Кряжимским па дифференциальные игры с запаздыванием [20,2-1]. Параллельно велись исследования в Киеве Б Н Пшеничным [31], Ленинграде И Н Петровым, Л А Петросяпом [25,26], а также их учениками. В 80-е годы появилась возмолпость(развнвающаяея вычислительная техника) разрабатывать методы п алгоритмы приближенного вычисления стабильных мое тон и функции цены и реалпзовывать пх па ЭВМ для некоторых классов игровых задач.
В середине 70-х годов были опубликованы работы H.H. Красовского [14 15] но унификации в дифференциальных играх В настоящей работе используется уннфпкацн-оииое определение стабильности [14,15]. В 80-е годы А И. Субботин предложил [32] понятие обобщенных решений уравнений Гампльтопа-Якоби-Беллмаиа-Айзекса в теории дифференциальных игр, которое позволило ему рассмотреть функцию цены дифференциальной игры как такое решение и доказать существование и единственность ее при общих предположениях на конфликтно-управляемую систему. При этом использовались инфшштезныальные конструкции негладкого анализа. Эти конструкции также используются в настоящей работе.
Цели работы. Теоретическое исследование некоторых задач об уклонении и о сближении с целыо на конечном промежутке времени; изучение структуры разрешающих стратегий в задачах об уклонении и свойства стабильности в задачах о сближении
Методы исследования. Применяется аппарат теории обыкновенных дифференциальных уравнений, математического анализа п теории позиционных дифференциальных игр, включающий краевые задачи, уравнения с отклоняющимся аргументом, теорему Шаудера о неподвижной точке, конструкции многозначного анализа, метод экстремального прицеливания Н Н Красовского Используются позиционный подход н конструкции, разработанные в рамках этого подхода. Основными элементами этих конструкций являются стабильные мосты, уннфнкациоиные схемы стабильности н процедуры управления с поводырем, наряду с которыми можно рассматривать и схемы, базирующиеся на экстремальном прицеливании
Научная новизна. Все основные научные результаты диссертации являются новыми.
Практическая и теоретическая ценность. Работа имеет теоретический характер Ее результаты могут использоваться в дальнейших исследованиях по теории дифференциальных игр п в соответствующих спецкурсах. Некоторые из результатов работы дают понимание структуры конкретных задач конфликтного управления, возникающих в приложениях, и могут служить основой для создания вычислительных алгоритмов для решения таких задач
Апробация работы. По материалам диссертации были сделаны доклады на меж-
(унпродных научных семинарах 'Теория управления и обобщенные решения уравне-шй Гампльтона-Якобн - 2005'' (г. Екатеринбург), ''Устойчивость, управление н мо-¡.елировапне динамических систем - 2006" (г Екатеринбург), па всероссийской пауч-10И конференции 'Теория управления и математическое моделирование - 2UÜG'' (г. 'Ькевск), международных конференциях "llth WSEAS Intei national Conference on pplied mathematics — 2007" (г Даллас, США), "Дифференциальные уравнения н ■межныс вопросы — 2007'' (г Москва), "Дифференциальные уравнения и топология — 008'' (г Москва), Пятом международном конгрессе по псишсПпощ' апялпзу — 2008 г Орландо, США), на. всероссийской научной конференции-)емпнаре'Теория уирав-1сния и математическое моделирование — 2008" (г Ижевск), на семинарах в Институте 1атематнкп н механики УрО РАН
убликации. Основные результаты диссертации опубликованы в работах [1^—14*]
труктура и объем диссертации. Диссертация состоит из введения, трех глав и писка литературы Общий объем работы составляет 142 страницы Бнблпографиче-кпи список состоит из 67 наименований Работа, содержит 20 иллюстраций
Содержание работы
Во введении приводится краткий обзор литературы но теме диссертации, обсуж-аются постановки задач и основные результаты работы
В теории дифференциальных игр представляют существенный интерес вопросы, тпосящнеся к структуре и свойствам различных классов стратегий При этом прин-ипиаиьным является вопрос [4-8,10,16,19,33,44] о свойствах непрерывных страте-пй и их связи с программными управлениями. Некоторым аспектам этой тематики освящена первая глава диссертации. Этот вопрос подробно изучен (4-8,10] для ппеппых управляемых систем в предположении выпуклости терминального мпоже-тва Можно ослабить это предположение до ацикличности (вырожденности группы омологпп) некоторых связанных с задачей объектов, см. [8]
Непрерывные по фазовому вектору стратегии образуют естественный класс законов правления, который удобен как в теоретических построениях, так и при работе с кон-ретными управляемыми объектами. Одно из хороших свойств этого класса состоит в ом, что вопрос о наличии решений начальной задачи для системы с обратной связью ешается с иомощыо хорошо известных из теории обыкновенных дифферешщальиых равнений стандартных теорем существования.
Вместе с тем, имеются примеры несложных по своей постановке задач, разрешить оторые в классе непрерывных стратегии невозможно в принципе В таких задачах кладывается в определенном смысле парадоксальная ситуация, обеспечить уклоие-ие от терминального множества можно только с помощью разрывных стратегий. Га-аитпровать уклонение посредством непрерывных стратегий не удается, несмотря на
доступность всей текущей информации о движении объекта. Необходимость обраб тьшать данные с номощыо непрерывной функции обесценивает всю эту ииформацш
Использование разрывных стратегий в теории дифференциальных игр есть при цинналыюе обстоятельство. Имеются дифференциальные игры, в которых невозмо> но построение непрерывной стратегии уклонения являющейся компонентом седлов точки Достаточно типична ситуация, в которой седловую точку необходимо строи' в более широком классе стратегий, допускающем разрывы по фазовому вектору.
В работе [5| для линейно-выпуклого случая (линейная динамика и выпуклое целев множество) рассматриваются однозначные позиционные стратегии, удовлетворяюну условиям Каратеодори или свойству непрерывности, получены глубокие теоремы невозможности уклонения в классе таких стратегий
В примере речь идет о преследовании безннерционной точки материальной точко В ¡заботе [4] в линейно-выпуклом случае исследуются возможности многозначных п знциоппых стратегий, обладающих свойством полунепрерывное™ но включению, д казаны соответствующие теоремы, рассмотрены многозначные стратегии для прнме[ из [5] Доказательства из [4,5] опираются па принцип неподвижной точки типа теор мы Какутанп (а именно, па теорему Карлииа и Бопенбласта). При этом рассуждеш существенно используют выпуклость терминального множества, из которой следу выпуклость значений рассматриваемого многозначного отображения. Теоремы это типа для нелинейных дифференциальных игр без требования выпуклости целево1 множества были получены в [8]. Работа [8] опирается па соответствующие свойст фуикцпопалыю-диффереициальных включений [7] Эти свойства основаны на теор ме Энленберга п Монтгомери о неподвижной точке, в которой, в отличие от теорем Какутанп, не требуется выпуклости значений рассматриваемого многозначного ото ражеиня
Результаты работы [8] позволили построить пример [6) обсуждаемого типа с пев пуклым терминальным множеством. Здесь приходится опираться на гомологичесю методы, что не всегда удобно в теории дифференциальных игр.
В первой главе диссертации рассматриваются три примера дифференцнальнь игр с певыпуклым терминальным множеством, иллюстрирующие свойства непреры ных стратегий.
Во всех случаях игра происходит на плоскости, причем терминальным мнол<ество является окрул-спость с центром в начальной точке, которая совпадает с началом к ординат х\ + х| = 1. Во всех примерах динамика задается одной и той же систем двух дифференциальных уравнений х = 2(1 — + V. Примеры различаются геоме' рпчеекпмп ограничениями па управления игроков.
В первой из рассматриваемых игр (§1) геометрические ограничения задаются двуд перпендикулярными отрезками равной длины
Р={и = (0,и2) . -1 < «г < 1} , д = {я- = (иь0) : -1 < «1 < 1} . Во второй игре (§2) ограничения имеют вид отрезка и квадрата р = {и = (щ, щ) : -1 < «1 < 1, -1 < «2 < 1} , Я = {V = («1.0) : ~2 < ы < 2}.
В третьи! задаче (§3) используются два совпадающих отргчка
р = {м = (иь0) : -1 < 7(1 < 1} , д = {V = (17!, 0) -1 < ^ < 1}
1о-шшу третий пример фактически является одномерным, п терминальное множество южно считать двухточечным
Можно непосредственно проверить, что в рассматриваемых в трех примерах дифференциальных играх программные управления не позволяют гарантировать укло-енне от терминального множества Также указаны способы уклонения по обратно!! вязи В примерах, содержащихся в первых двух параграфах, уклонение от терминал ь-01'0 множества гарантируется с помощью одного замера фазового вектора, причем со-тветствующне способы управления задаются разрывными отображениями Указаны екоторые семейства таких способов управления, зависящие от параметра Проведе-а оптимизация но этому параметру В задаче из §3 можно обеспечить уклонение с омощыо простой непрерывной стратегии
В связи с этим возникает вопрос, можно ли в первых двух примерах гарантировать клопение посредством непрерывных стратегии Ответ на этот вопрос оказывается трнцательпым. Показано, что удовлетворяющие условиям Каратеодори стратегии с тклопеппеы аргумента не могут обеспечить уклонение от терминального множества в ервоп и второй играх. При этом в доказательстве удалое ь обойтись без использования онятин и результатов алгебраической топологии Рассуждения основаны на теореме аудера о неподвижной точке, которая применяется в пространстве траектории ен-гемы, снабженном равномерной нормой.
Во второй главе рассматривается конфликтно-управляемая система общего вида а конечном промежутке времени Управления игроков, как н в предыдущей гла-е, стеснены геометрическими ограничениями Исследуются вопросы, относящиеся одному из центральных понятий теории позиционных дифференциальных игр — войству стабильности, введенному в работах Н Н Красовского и А.й. Субботина 1,12,18]
В течение последующих десятилетии, начиная с 1970 года, имела место эволюция описании этого свойства.
В [17-19] стабильность была представлена как свойство слабой инвариантности множества в пространстве позиций игры относительно некоторого семейства диффереи-нальных включений, связанных с динамикой конфликтно-управляемой системы. Эти ифференцнальные включения содержат в качестве параметра векторы управлений торого игрока
В середине 1970-х годов появляется новая формулировка стабильности и постепенно ыкристаллпзовывается новое направление, базирующееся на этой формулировке — иификацня дифференциальных игр
В 1971 г в журнале "Прикладная математика и механика" была опубликована ста-ья Н Н. Красовского [13], посвященная минимаксному поглощению в играх сближения В пей рассматривалась конфликтно-управляемая система без традиционного редположения о существовании седловой точки в так называемой маленькой игре В
предложенной формализации игры не исключалось, что выбор значения второго игрока может опираться па информацию о значении управления к[(] первого игрока Тем самым при рассмотрении игры сближения к управлению второго игрока допускались функции У(1, и) — так называемые контр-управлеппя [13] В статье было дано обоснование правила минимаксного прицеливания первого игрока в регулярном случае Для обоснования этого правила были введены функции ")• экстремальные на направлениях а (я — векторы сопряженного пространства к фазовому пространству) Введение этих функций явилось топ точкой отсчета, с которой началось развитие методов унификации в дифференциальных играх. В появившихся позже работах Н.Н Красовского |14 15] было дано определение упификациоппых моделей, изучены ш свойства ц указаны перспективы применения в различных классах игровых задач динамики Унификация играет важную роль и при сравнении копфлпктпо-управляемы систем Отметим, что тематика второй главы близка к вопросам сравнения возмож ностей конфликтно-управляемых систем Разным аспектам унификации, в том числе, вычислительным аспектам посвящены работы [3,37].
В цервой половине 1980-х годов появилась довольно общая формулировка свой ства стабильности [31, 35], вобравшая в себя некоторые известные формулировки В этой формулировке так же, как и в унификациониоп схеме [14,15] присутствует явно гамильтониан конфликтно-управляемой системы
Вслед за этим, в середине 1980-х годов было получено ппфшштезимальиое представление свойства стабильности ¡42], выраженное в терминах конусов Булпгапа или правых пропзводпых соответствующего множества. Как было показано А И Субботиным [45], это представление оказалось полезным ие только при рассмотрении теоретических вопросов в дифференциальных играх, по и при исследовании обобщенны (минимаксных и вязкостных) решений уравнения Гамильтопа-Якоби.
Во второй главе данной диссертации показано, что конструкции, участвующие в ннфшштезнмалыюм определении свойства стабильности, удобно использовать и для некоторого расширения понятия стабильности. Это влечет расширение сферы применимости метода- экстремального прицеливания [16-19]
Как правило, при работе с конкретной дифференциальной игрой приходится заменять стабильный мост некоторым другим, близким к нему множеством, которое не является стабильным мостом. Ниже приведена математическая конструкция, использующая понятие дефекта стабильности и позволяющая работать с необязательно стабильным мостом в пространстве позиций, решая при этом менее жесткую задачу о сближении — задачу о сближении с некоторой окрестностью цели Дефект стабильности множества есть величина, оценивающая, в какой степени для используемого приближенного множества нарушается свойство стабильности
В §2 второй главы формулируется задача конфликтного управления, которой посвящены последующие параграфы второй главы.
Задана конфликтно-управляемая система, поведение которой па промежутке вре-
цепи [/o, д], tn < т) < oo описывается дифференциальным уравнением
J=/(Í,3,U г), i(f„) = i(l «eF, i) 6 Q. (1)
Здесь г — т-мерпый фазовый вектор и? евклпдового пространства R"\ v — управпе-uue первого игрока, v — управление второго игрока, Р и Q — компакты в евклидовых пространствах RP п RQ соответственно Предполагается, что выполнены условия-
(Л) Вектор-функция. J(t,x,u,u) онрсде ieita и 'непрерывна по совокупности переменны v (t, х, и, i>) на множестве [/о, 0] х ñ'" х Р х Q и удовлетворяет условию для июбо?о компакта D С [¿о,#] х R"1 найдется такое L = L(D) 6 (0, оо), что
f{t,x{1),u,v) - f(t,x{2\v,v) <L г(1)-г(2) (l,r{'\u,v) 6 Dx PxQ,i = 1,2.
(Б) Существует такое число // £ (0, оо), что ||/(?,.т,гм))[| < /х(1 + ([а:(|) длялюбых 1,х,и,ь) в [¿о,0] х Д'" х Р х д. Зс>есг> ||/|| — норма вектора / б соответствующем евклидовом пространстве
Рассматриваемая во второй главе дифференциальная игра является аитагописти-тской и складывается из двух задач — задачи о сближении и задачи об уклонении (19] задаче о сближении, стоящей перед первым игроком, требуется обеспечить иоиада-ше движения х(1), I £ [¿о, 0], системы (1) в момент в на заданный компакт М в В™, едковы бы пи были при этом допустимые управления второго игрока. Решение зада-И1 требуется обеспечить в классе позиционных процедур управления первого игрока десь для системы (1) не предполагается выполнение условия седловон точки в ма-юнькой игре.
Задача об уклонении, стоящая перед вторым игроком, заключается в том, чтобы зыбрать коитр-позпцпоипую процедуру управления второго игрока, обеспечивающую ччлоненпе движений х(1),1 6 [¿сь системы (1) в момент 0 от некоторой замкнутой -окрестности Мс компакта М, каковы бы ни были при этом допустимые управления гервого игрока.
Для этой дпфференцпалыюй игры справедливо (19): существует такое замкнутое тожество IV'0 С х /?"' — максимальный гг-стабпльный мост, что для всех пс-
одпых позиций (tt,xí) е И/0 разрешима задача о сближении, и для всех исходных юзпцпп (£*.,£,,) € ([¿о> 9\ х Д'") \Н'° разрешима задача об уклонении.
Согласно нршщпну экстремального прицеливания (12,18,19], разрешающая про-;едура управления первого игрока для исходных позиций (£, , х,.) € И*0 может быть эеалпзована как процедура управления с поводырем, нацеливающая движение т(7) тстемы (1) па поводыря, идущего по мосту
Часто, решая задачу о сближении, мы имеем пе мост IV0, а некоторое, может быть, ¡в сильно отличающееся от него множество И/-* С [1о,в\ х Я'", удовлетворяющее краевому условию 1Г*(0) = П'°(0) = Л/, где И'(£) = {х <Е Дт • (¿,х) € 1К} Для точек 1,,!*) множества И''* разрешима, вообще говоря, пе исходная задача о сближении с /, а менее жесткая задача о сближении с некоторой е-окрестностыо множества М.
Одна in основных задач, рассматриваемых во второй главе — аккуратная оценг r-окрестностп в этой менее жесткой задаче о сближении Эта оценка проводится предположении о выполнении некоторых условий на множество W*
В §3 даются определения, связанные с центральным понятием теории познцпоннь дифференциальных игр — стабильностью множеств
Исходя из условия (Б), наложенного на (1). и, считая, что задан пек торый компакт W* в * Rm, можем выбрать компактную облас
D = {(i,x):te [io,0],||x|| < (l + ß(t ~ tü))c'l{f~'a)}, 7 € (0,oo) настолько большо что в пей содержатся множества {0,М) = {(0,х) : j £ М}, W* п все стабильные м сты IV
Также, в §3 вводится в рассмотрение семейство С отображений {t,x) >—* F[(t,x Fi(t, т) С Rm, (t,x) £ D, отвечающих векторам I £ S = {I € Rm : ||i|| = 1} С Rm.
Заметим, что по определению, все Fi(t,x), (t,x,L) € D х S, есть выпуклые ко пакты в Rm из некоторого достаточно большого шара G — {д £ Rm ■ ||</|| < г} в RJ Вводятся в рассмотрение i», xt) — множество достижимости в момент t* £ (£», (/.о < t, < t* < в) дифференциального включения .г £ Ft(t,x),x(t„) = xt, t £ [£,,£ \y\t*,t*,X*) = {я, £ Rm : Ii(i';i„i,)nr ф 0}, А'* С Rrn
Приводятся определения оператора стабильного поглощения тг и м-стабильно1 моста в задаче о сближении, выраженные в терминях множеств (¿*j L*jJC* (t.,r, X') е Д х 2Л", / е 5, где Д = {[t,.r) ■ t0 <t*<tm<0} С to,в] х [£0, Мы здесь не приводим эти определения, поскольку ниже приводятся соответствуг щпе определения в более общей форме.
Следующее утверждение перебрасывает мостпк от свойства стабильности к вв дпмому ниже в этой главе понятию дефекта стабильности множеств в пространен позиции Как известно [42], замкнутое множество W С D является ы-стабильны мостом тогда и только тогда, когда
IV{0) С М; DW(t, х) П F,{t, т) ф ф, t € [t„, 0), (i, х, I) £ dW x S. ( Здесь dW — граница множества W, D\V(t, z) =
= {de Rm :d= lim {(tk,iuk)} С W, tk I t при к —» oo, lim wk = .т}.
С к —>00 к ' oo J
Для максимального ы-стабильиого моста И'*0 первое условие в (2) превращается равенство W°(ß) = М.
Из свойств моста W° вытекает W°{t*) П (а.,) Ф 0, (tt,x,) 6 И/0. Здес
0,(xt) = {х £ R"' : \\х - г,|| < т}, 7 > 0.
Последнее условие означает, что многозначное отображение I н-> И/0(£), I € [£о,' меняется в некотором смысле не очень быстро в точках £ И/0, £ [io,'?) пр
увеличении t.
В §4 второй главы рассматривается множество !Г* С Д упомянутое в §3, уд влстворяющее условию W*{ü) = М.
Предполагается, что W*, подобно И/0, удовлетворяет условию
(В) W*(l*) П 0(t._i.)r(a:.) ф ф, (i„ х,) £ W*, l0 < I, < Г < 0.
Условие (В) представляется вполне естественным Из него педуег
и еМ)
Пусть (ltlzt) € DW, /, € Цо,0) Число c(ít,.it) = s\\pp(ÜW'(U, xt), /')(/„ j J)
les
шзовем дефектом стабильности множества XV* в точке (í„,x»)
Можно сказать, выражаясь не очень строго, что дефект стабильности множества V* в точке € DW*, h t [ío д) выражает степень ненпварнаптпостп множества,
V* в точке (tt¡xt) относительно системы (1).
В §4 показывается, что множество DW(tt, х„) в формуле для £(tt,x,) можно иод-(снить более удобным — компактным множеством DvW(ft,Tt) = DlV(t,, г,) П 3(7 де 3G = {Зд : g € G}, так что
les
устъ Г(, = {(i»,x) : х е R'"} ,АЩ = ЭИ^ПГ,,. Величину s(Q = sup £•(/,, г4),
(/.,).)ел(г.)
« 6 [to,0), назовем дефектом стабильности множества W* в момент 1„ €
Так определенная неотрицательная функция e(t), t 6 [to,0)} рассматривается иа-
UI как некоторая характеристика нестабильности (иеппварпаптиостн) множества П/4
табнльность множества W* эквивалентна, согласно (2), равенству s(l) : 0 на [¿о-б1)
тсюда следует, что в случае s(t) s 0 на [ío, в), правило экстремального ирнцелнвання
а поводыря, идущего по 1У*, гарантирует приведение движения r(t) системы (1) па
>/, если (tt,x(Q) = (í„x») £ W*
Естественно ожидать, что малость функции e(í) па [£и, в) позволяет правилу эке-
ремалыюго нрнцелнваипя на поводыря, идущего по W*, обеспечивать приведение
внження x(í) системы (1) в малую ^-окрестность множества M Также, по-видимому,
и
может быть выражено через интеграл f e(L)dt
to
Для обоснования этих положении вводятся условия на W и e(t), t Е [fo, i?)
(С) Существует такая функция ip* . (О, оо) i—> [0,оо), <р*(5) | О при 5 | 0, что (х, + S ■ х,), + à)) < 6 ■ (¿„ x.) G dW*, 8 e (0,0 - t,);
(E) Функция e(t) интегрируема по Рьману на [¿о,0].
Здесь обозначено х„ -)- 5 ■ X, = {х* + 6 • J : f £ X,}; /г(х, -(- S ■ X,, X*) — sup + ô ■ /, .Y"), и X* - множества из Rr", p(xt + ó ■ f, X*) = nif ||(x, +S-f)-i' ||
x*eX*
В §5 вводится позиционная процедура управления с поводырем (И'*- процедура правления с поводырем), отвечающая конечному разбиению Г„ промежутка [f»,0] из о, 0] и исходной позиции (¿*, X,.) Эта процедура отличается от известных позиционных роцедур управления тем, что она сконструирована для множества W" в пространстве ознцин, не являющегося «.-стабильным мостом Это обстоятельство вносит некоторую гецнфнку в определение Н^-нроцедуры управления. При этом учитываются условия, сложенные на систему (1), в частности, условие (С) Сама процедура управления еталыю описана в §5
В §6 второй главы выводится оценка рассогласования ||s(0)|| = ||-(0) - х(0 между движением x(í) конфликтно-управляемой системы (1) и вспомогательным дв жеиаем z(í) порожденными П^-процедуроп управления первого игрока отвечающ разбиению Ги В силу упомянутых выше особенностей IГ*-процедуры унравлеш оценка выводится не традиционным путем суммирования традиционных локальнь оценок квадрата рассогласования, а с использованием нестандартных рдссужденп Она имеет вид
i -v-1
||5(0)|| < S0'^ (у"(Д<">)} | (ДН^дИ^ +{()_ ¿,)х(д('0)) + с/-(«-'-) ]Гф;)Д
(=0
Здесь ip°(ó), x'(ô') — неотрицательные функции переменной 6 > 0, монотонно стрем щиеся к пулю при ô | 0, Д'"' — диаметр разбиения Гп
Переходя к пределу при п —» оо, —> оо от пошаговых движений x(t) и z( отвечающих разбиениям Г„, к конструктивным движениям х(1), в итоге получаем
г?
р{;х{0), М) J ф)йТш (
t.
Иными словами (конструктивное) движение, порожденное 1У-нроцедурой упра леипя с поводырем первого игрока, удовлетворяет включению
i •>
x{û) g М£, s = ew. = - Jе(т)с1т. (
t.
Число e = £\v (4) мы трактуем как меру нестабильности множества IV*
Замечание 1 Требование интегрируемости по Риману функции e(t.) является стпаточпо жестким. Поскольку речь идет о верхней оценке, в определении дефеш стабильности можно заменить интеграл Римана верхним пределом ингпегральн сумм для функции s(t) при диаметре разбиения, стремящемся к нулю
В третьей главе рассматривается та же самая конфликтно-управляемая сист ма (1), что и во второй главе, па конечном промежутке времени [¿о, <?]
Изучаются и сравниваются две игровые задачи о сближении с терминальным ми жеством M в фазовом пространстве [12,19] В первой из них первому игроку требуете обеспечить с номощыо позиционного управления попадание фазового вектора сист мы (1) па M в конечный момент времени "д. Во второй задаче требуется обеспечить помощью позиционного управления попадание фазового вектора па M не позже м мента ■д. Эти задачи относятся к наиболее важным в теории дифференциальных пг Постановка первой задачи — задачи о сближении с M в момент выглядит нескол ко проще, чем постановка второй задачи, и поэтому естественно ожидать, что алг ритмы построения ее решения проще, чем алгоритмы построения решения второй з' дачи - задачи о сближении с 71/ не позже момента, (или, что одно и то же, — зада1
о сближении с Л/ к моменту iD) Имеющийся опыт разработки алгоритмов подтверждает это Один из первых вопросов, возникающих при сравнении згнх двух задач -вопрос о выделении тех условии па систему (1) н терминальное множество Л/, при которых решения обеих ¡адач совпадают Решения в этих задачах мы идентифицируем с максимальными н-отабнльными мостами и Wa в них При выполнении условии, обеспечивающих совпадение и можно использовать для решения второй задачи алгоритмы построения решения более простой первой задачи
Отметим, что вопрос о том, как трансформировать стационарную конфликтно-управляемую систему в систему, в которой бы выполнялось равенство И'" = 1Г", исследовался, в частности в работе [1].
При том позиционном подходе, который предложен в [11,12,18,19], максимальные н-стабильные мосты U/LJ и W0 являются центральными элементами разрешающей конструкции В §3 даются определение оператора стабильного поглощения п м-стабнлыюго моста (определение 3 1-3,4) в задаче о сближении с М в момент -в в достаточно общей форме (аксиоматической форме, базирующейся па условиях А 1, А 2, А 3). Следует отметить что эта форма записана па языке соответствующих дифференциальных включений, отвечающих "обратному" времени.
Приведем эти определения (см ¡35]). Пусть [i0, i9] х /?"' э (l,x) G{1, i) С R'" — непрерывное в хаусдорфовой метрике многозначное отображение, G(t,x) — выпуклые компакты в R"'. удовлетворяющие включению F[t,x) С G(t,x), (l,r) е D, F(t, х) = со {f(t, x,u,v) и £ Р, v £ Qj, со А — выпуклая оболочка множества А
Пусть также задано некоторое множество Ф элементов ip и семейство {Fv ф £ Ф} отображений F^ : (¿.х) t-> F„(£, j,) с Rm, (£,х) € D, удовлетворяющее условиям
А.1 Для любых (t,x/ij>) £ D х Ф множество F^,(t,x) выпукло, замкнуто в R"1 и F^t,x)cG{t,x);
А.2 Для любых (t,xj) € D х S выполняется min /¿Fv,(t,a.)(0 = II(l,'-iJ);
А.З Существует такая скалярная функция и*(6), (ui'(S) J. О при 6 J, 0), что {F^,(tt,x,),F0(t*,x*)) < u/(|it - t*\ + ||:г„ -а;*||) для (t„xt) и (Г,х') из D, ф € Ф.
десь hp{}) = sup </,/>— опорная функция множества F с R'", d —
J4F
аусдорфово расстояние между компактными множествами F^ и F^ из /?"' Приведем определение оператора стабильного поглощения в задаче о сближении с в момент Л
Пусть td < t„ < t* < 0 Полагаем t,, xt) — множество достижимости в момент
* дифференциального включения
х £ F,p(t,x), = xt, ip 6 Ф, (5)
'ф\и; t*, Н*) = {xt £ R"1 ■ н* П АДГ; t„ i,) Ф 0}, Я* С Rm
Определение 1 (см. [35]) Оператором стабильного погло'щети тт в задаче о сближении в момент д назовем отображение тг • Д х 2я"' >—> 2Л', заданное иютноте нием тг(£*;£*,#<) = П X-\tt,t\H*), Д = {(i„i4) € [fo.tf] х [to.f] U < Г}
t'SÜ'
Определение 2 Замкнутое мноо/сество IF С D назовем и-стабиаьным мостом ( задаче о сближении с М в момент ■О, если
]V{i)) С M;W(tt) с 7r(i*;i*,VT(i*)), (U,t*) € Д
Наряду с дифференциальными включениями (5), участвующими в определении и стабильного моста 1Г и отвечающими "прямому" времени, в третьей главе рассмат риваются дифференциальные включения
¿[г] e<TV,(r,r[r]), z{t*} = z*, V-бФ, (б
отвечающие "обратному" времени г 6 [¿о,??], где Фф(т,г) = 2), т = U) + -0 — t
t € [io, 1З] Полагаем нрн этом г* = ¿у + д — т» = ¿о + — £*•
Соответственно "обратному" времени, введем в рассмотрение ^.(тГ1т*, z") — мио жество достижимости дифференциального включения (6) в момент т„ Полагаем также Z„,(n, т\ Н*) = (J т*. н* с
Справедливо равенство 7r(f», f, If*) = f) X^l{tt\tr,n*) = П Z${t,\t*,11*)
Учитывая введенное выше "обратное" время г, множество 1-F С х Л"", рас
сматрнваемое ранее в пространстве позиций (¿,г), будем обозначать в терминах "об ратного" времени т символом W С [io,$] х Rm и трактовать как множество в про страистве позиций (г, z) При этом временные ссчегшя в пространствах позиции (t, т и (т,г) множеств W и W связаны равенством W(t.) = >V(r), t + т = t0 +15, так чт W{t0) = W(0) н W{ß) = щи,)
Запишем определение u-стабилыюго моста в задаче о сближении с М в момент "д терминах множеств достижимости Еф(т^;т*,Н"), Н* С Rm, отвечающих "обратному1 времени
Определение 3 (см. [40]) Оператором стабильного поглощения тг в задаче о сбли
жении с М в момент $ назовем отображение тг : Д х 2я"' i—> 2ß"', заданное соотп
ношением тт(т,; т\ #*) = П 2Ф(т.; т\ Н"); здесь (т*, т„) £ Д, Н* С К".
^еФ
Определение 4 Замкнутое множество W С D назовем и-стабильньш мостом задаче о сближении с А/ в момент д, если
Wfa) С М; W(rt) С тгЫт\Щт*)), (т*,т.) € Д.
Из определения 4 следует, что максимальный «-стабильный мост Wu С D в за даче о сближении с М в момент d есть максимальное замкнутое множество из D удовлетворяющее условиям
Wa(Lо) = М\ Wa(n) с 7г(г,; т*,УУа(т*)), (т*,т,) G Д (7
В соотношениях (7), характеризующих максима шпын »-стабильный мост >Va, V'iac j'uvroT наряду с начальным моментом /о пары моментом (г* г4) 6 Д
Оказывается возможным перейти от этих соотношений к характеризацнп моста Wu при помощи пифипптезпмалышх соотношений, в которых пары (г*, г,) € Д подменены моментами т* G [/о, i)) (то есть как бы спиты в одни момент г*), а пары сечений (\Уи{т*),У\}а{т*)) — точками (т*,г*), содержащимися в >Vd(t*). При этом представляется целесообразным выявить и ипфинптсзпмальные свойства произвольного м-стабильпого моста W, а не только моста WL1
Ппфппптезпмальные конструкции и-стабнльных мостов, которые рассматриваются в §§3 - 5 третьей главы, тесно связаны с понятием контингентного конуса, введенным Булпгапсш [23|. Имеется несколько определений контингентного конуса Тц(х) непустого множества fi из RN в точке х 6 il
Определение 5 (см. [23]) Множество Тц(х) = Г) П U ~ х) + £ВЛ) на'
£■>0 о>0 /|£(0 а]
ывается контингентным конусом к П в точке х. Здесь В'х = {b£RN : ||6|| < 1}, ||Ь|| — евклидова норма вектора b G
В §3 третьей главы приводится еще одно определение контингентного конуса п(х) удобное в рассуждениях, касающихся u-стабильных мостов
емма 1 Tn(x') = (~) cl con (SI(х; а) — х).
а>0
десь con (fl(:г,-а) — х) = {Ад • А > 0,g € а) — .т)} — конус в RN, натянутый па шожество [il{jL, а) — х), cl А — замыкание множества А
С помощью этого определения контингентного конуса становится более прозрачной вязь между данными ранее неппфшштезпмальпымп определениями и-стабильных юстов и следующим необходимым условием и-стабплыюсти, выраженным в инфини-■езимальноп форме (Теорема 1). Предварительно, следуя работе [42), введем производное множество W(w*) = {de Rm . (1,d) G 7^(w*)} отображения t i—> W(r), r G [r*,i?] в точке .* = [t%z*) e W, здесь W = Wfl {(r, z) : r € [r\t?], с € Л'"}-
еорема 1 Если замкнутое множество W С D является и-стабилънъш мостом в адаче о сближении с M в момент д, то
VW(t\ л*) С р) (ТщГ')(г*) H Фф(т\ z*)), r' G [/„, д), (г*, z*) G W. (8) ОеФ
Для «-стабильного моста W, записанного в переменных /, г, можно также ввести ропзводпые множества, отвечающие возрастанию и убыванию "прямого" времени t. акпе производные множества рассматривались в работах [36, 38, 42]. Обозначим их оответствепио символами DW(i*,x") п 0\\г(1*,х*).
Для одного н того же гмтлбплышго моста справедливы равенстватоме (Г,х*) £ И' ((т\г*) = (/<, + И - 1\х*) £ XV) Ъ\У{1\х1) = VW(т\z' 1Ж(1*,х,) = Т>УУ{т%^).
Учитывая первое равенство, запишем теорему 1 в виде
Теорема 2 Если замкнутое множество IV С Б является и-стабильным мостом, задаче о сближении с М в момент г?, то необходим,о, чтобы
П]¥(1*,х*) с Г) (т1Г(г)(.о - Рф(1*,х')) , (Г,х*) £ Щ Г £ (1а, '(?]. (Г
^еФ
Именно в такой форме теорема I была сформулирована п доказана в [34, 35| диссертации приведено новое доказательство теоремы 1, существенно отлнчающеес от соответствующих доказательств в [34,35[.
В §4 третьей главы определяются оператор стабильного поглощения п ? стабильный мост в задаче о сближении с М к моменту д. Приведем эти определени Полагаем, что М — то же самое что и в задаче о сближении с М в момент {> Пус (/*, £*) £ Д, II С Ят Введем обозначение
м<{н>-\ мин, ¿ = г.
Определение 6 (см. [38]) Оператором стабильного поглощения х в задаче о сбл жении с М'к моменту х) назовем отображение х '• А х 2я'" I—» 2я", задачи соотношением
х(их,н)= и Х^{и-ХМ({Н)).
('■СФ ?£[/.,(*]
Определение 7 Замкнутое множество IV С Б назовем и-стабилънъш мостом задаче о сближении с М к моменту А, если
\У{д) С м- С х{Ц1*№)), (и,1*) £ Д.
Можно показать, что семейства {Р,;,: В I—> 2Л""}, отвечающие различным мпож ствам Ф и удовлетворяющие условиям А 1 — А.З, эквивалентны в том смысле, ч' соответствующие операторы выделяют одни и те же и-стабнльные мосты И" в О
Точно так же, как в задаче о сближении с Л/ в момент д, здесь можно заннса-определения оператора стабильного поглощения п и-стабилыюго моста в термин; "обратного" времени т.
Определение 8 Оператором стабильного поглощения х в задаче о сближении с 1 к моменту д назовем отображение х 2Л'" >—> 2я"', заданное соотношением
Х(т.; т\ Я) = П У г? (т.; г, МТ(Н)); (т*, т,) £ Д, Н С Я,'п.
1/;бФ гб[г*,т,]
пределение 9 Замкнутое множество С О назовем и-стабчлины м мостом в Iдаче о сближении с М к моменту г), если
Ж«о) С м, Щт,) С т-,>У(т*)), (г*, г.) 6 Д
В §5 третьей главы изучается вопрос о выделении тех условии ил систему (1) и пожестио А/, при которых решения обеих задач о сближении совпадают Основной ро-льтат третьей главы составляют критерии совпадения максимальных (/-стабильных стов н И'" в задачах о сближении с А/ для стационарных коифниктпо-фавляемых систем (1) Приведем эти критерии. Пусть система (1) имеет вид
^ = Дх, и, и), х € Ят, и£Р, и е (?. (10)
Введем в рассмотрение множество }¥л/ = [¿о, х М С £>
орема 3 Для того, чтобы в двух задачах о сближении с М, сфюрму трованны ь я системы (10), выполнялось равенство \¥а = IV0, необходимо и достаточно, обы замкнутое множество IVм с В было и-стабильньш мостом в задаче о шжении с М ь момент 0
ределение 10 Будем говорить, что максимальный и-стабильныи мост 1УП в даче о сближении с М в момент тЗ является монотонным, если для пюбых двух ментов и, V, (г., Г) £ Д верно 1Ка(£») Э И^Г).
орема 4 Для того, чтобы в двух задачах о сближении с М, сформулированных • системы (10), выполнялось равенство И70 = IV0, необходимо и достаточно, юбы мост был монотонным.
мечание 2 При доказательстве теорем 3 и 4 используются соотношения (2) и орема 2, сформулированная и доказанная в §3 третьей главы
Основные результаты диссертации
Подробно исследованы способы управления по обратной связи в трех конкретных дифференциальных играх уклонения. Изучены законы управления с непрерывной обратной связью и отклонением аргумента. Исследованы способы уклонения с одним зал^ром фазового вектора В частности, построены естественные примеры невырожденных дифференциальных игр с невыпуклым терминальным множеством, в которых каратеодориевские стратегии с отклонением аргумента не позволяют гарантировать уклонение, причем доказательство этого факта удается провести достаточно элементарными средствами;
2 Исследовано свойство стабильности в игровой задаче о сближении управляемо!1 системы с делыо в фиксированный момент времени Введено понятие дефект* стабильности множества IV* в пространстве позиций Предложена нозицношпц процедура управления с поводырем (1К'-процедура), обеспечивающая отклонение движений от цели, це превосходящее величины равной дефекту стабильности;
3 Исследовано свойство стабильности в двух игровых задачах о сближении стацио парной управляемой системы с целью в фазовом пространстве — задача о сбли жешш в момент н задача о сближении к моменту С использованием коиструкцп негладкого анализа получены два критерия совпадения максимальных стабнл пых мостов в этих задачах,
4. Получено повое доказательство теоремы (теорема 1), описывающей ипфнпптез1 мальиые свойства стабильного моста в задаче о сближении в момент и лежаще в основе доказательства двух упомянутых критериев
Публикации по теме диссертации
[1*] Латушкин Я. А О задачах уклонения от исвыпуклого множества // Проблемы тсорстическо и прикладной математики (Труды 30-он молодежной ьшферепцин), Институт математики механики, стр 278-283, Екатеринбург, 2005 [2*| Брыкалов С А , Латушкип Я А Непрерывная и разрывная обратная связь в некоторых днфф репциальных играх е певыпуклым целевым множеством // Тезисы международного ccMimai по теории управления и теории обобщенных решений уравнений Гампльтона-Якоби, стр 41-4' Екатеринбург, 2005.
[3*] Латушкин Я.А., Брыкалов CA. Некоторые свойства непрерывных стратегии конфликтно уклонения от исвыпуклого множества ,// Тезисы международного научного семинара "Усто] чпвость, управление и моделирование динамических систем стр. 53, Екатеринбург, 200G [4*] Ушаков ВН., Латушкин Я А. Дефект стабильности множеств в игровых задачах управл шгя // Труды Института математики и механики УрО РАН, Екатеринбург, 200G, том 12 № с 178-194.
[5*) Брыкалов С.А., Латушкин Я.А Об одпоп игровой задаче уклонения от окружности // Тс рпя управления п обобщенные решения уравнении Гамнльтопа-Якобп (Труды международно семинара) Том 1, стр 197-204 Изд-во УрГУ, Екатеринбург, 200G. [6*] Брыкалов С. А , Латушкип Я. А О непрерывных стратегиях уклонения от исвыпуклого мн
жсства в условиях неопределенности // Автоматика ir телемеханика № 11, 2007, С. 122-134 [7*| Ушаков В.Н, Латушкин Я. А Критерии совпадения стабильных мостов в двух задачах о сбл\ жсиип // Сб тезисов международной конференции "Дифференциальные уравнения и смсжпь вопросы"им И Г Петровского, Москва, 2007, С 325 [8*] Брыкалов С.А , Латушкин Я А Некоторые дифференциальные игры с окружностью в к честве целевого множества /Институт математики и механики Уральского отделения РАН Екатеринбург, 2007. - 26 с , ил , бпбл 8 - Рус - Деп в ВИНИТИ 18 09 2007, № 8S0-B2007 [9*| Ушаков В Н, Брыкалов С.А., Латухшмп Я А Дефект стабильности множеств в дпфферепц альпых играх /Институт математики и механики Уральского отделения РАН - Екатерпнбу! 2007 - 30 с , нл , библ. 2G - Рус - Деп в ВИНИТИ 18 09 2007, № 881-В2007.
[10*] Vladimir N Ushakov, Seigey A. Brykalov, Yaioslav A Latushkin The Notion of Stability Defect Game Control Problems // Proceedings of the lltli WSEAS International Confeience on Apphc Mathematics, Dallas, USA, 2007, PP 8G-91
[И*] Ушш,оо В И Брыьалов С А Матушкин Я А. Использование дефекта стабипыгостп для формирования управления в дифференциальной игре / Псспшк Удмуртского Университета. -Ижевск. Пьш 2, 2008, С.155-102
[12*| Ушагаю В Н . Литцшкин Я А , Лебедев П Д Критерии совпадения двух стабильных мостов в двух мдачах о (ближеппн /'/ Тезисы докладов Международной конференции "Дифференциальные v равнения и топология" МГУ им. Ломоносова, С 111-112 Моеква, 2008
[W] I'bhtikoii V.N, Bnjkalov S А , Latuihhn Y A Stable ami unstable hets m pioblems of conflict contiol Functional Ditteienti.-il Equations 2008 V 15 No.3-4. PP 309-338
[14*| Ушиьоь В II, Лшт/шкип Я А. Критерии совпадения максимальных стабильных мостов в двух mponux задачах о сблнжсиин // Труды математического института им. В А Стсклопа, 2008, Т 202, С 253-271
!писок цитируемой литературы
[1] Аьсрбух Ю В Некоторые вопросы структуры решения игровых задач управления // автореферат диссертации на соискание ученой степени кандидата фпз -мат паук 01 01 02 - дифференциальные уравнения Институт математики и механики УрО РАН Екатеринбург. 2007 г. 20с.
[2] Айзеке Р Дифференциальные игры М Мир, 19G7 480с
[3] AiicKcrilHUh М II Дальнейшая формализация основных элементов антагонистической диффе-ренцналып'го игры // Мат. анализ п его прил. Ростов Н'Д Ростов гос ун-т им AM Горького, 1975 Т 7 С. 191-199
[4| Барпбаиова Н Н, Субботин А И О классах стратегий в дифференциальных играх уклонения от встречи // Пршсл математика п механика 1971 Т 35 вып 3 С 385-392
[5] Бирабаиоои Н.Н.. Субботин А.И. О непрерывных стратегиях уклонения в игровых задачах о встрече движений // Прикл математика и механика 1970 Т 34 вып 5 С 79G-803
[G] Бршншов С А Две дифференциальные игры с исвыпуклымп целевыми множествами // Изв РАН Теория ц системы управления. 2002 №. 3 С 94-101
[7] Брыыиюв С А Конфликтно управляемые системы и дифференциальные включения // Днффс-рсип уравнения 2002 Т 38 №3 С. 298-304
[8] Брымиюа С А. Непрерывные стратегии в дифференциальных играх // Дифферепц. уравнения. 2002 Т 38 № 4. С 453-459.
[9] Дарьии А.Н Синтез управлений при двойных и неоднородных ограничениях // автореферат диссертации на соискание ученой степени кандидата фпз -мат паук. 01 01 02 - дифференциальные }равпс1шя МГУ им. MB Ломоносова Москва. 2004 г 15с
0] Красовсччй II.II. Дифференциальные игры. Апироксимацнонныс п формальные модели // Мат сб 1978. Т 107. № 4 С 541-571.
1] К]мсовсгсий Н Н Игровые задачи динамики I // Нзв АН СССР Тсхп кибернетика. 1969. №5. С 3-12
2] ¡{¡мсовский Н Н Игровые задачи о встрсчс движений. М Наука. 1970 420с.
3] KpuamLhuii НН Минимаксное поглощение в игре сближения /.'Прикл математика и механика 1971 Т. 35, вып G. С. 945-951.
4] Кр\сонскгш Н Н. К задаче унификации дифференциальных игр // Доклады АН СССР. 197G Т 226 №0 С. 1200-12G3
5] Красовский II.Н Унификация дифференциальных игр / / Игровые задачи упр Свердловск ИММ УНЦ АН СССР, 1977 Вып 24. С 32-45
G] Красовский Н Н Управление динамической системой Задача о минимуме гарантированного результата М. Наука, 1985 518с
7| Красовский Н И, Субботин А И Аппроксимация в дифференциальных играх // Прикл математика и механика 1973 Т 37, вып 2 С. 197-204.
8] К/ли ове кий II.II, Субботин А II О структуре дифференциальных игр // Доклады АН СССР. 19G9 Т 190 № С 523-52G.
110( R'/xiumt мш H H , Субботин А И Позиционные днффсренцпатьные игры M Наука, 1974 45G( |20¡ Кряж iuich.aU Л В , Осипов ЮС Диффорепцпатыга-разиостная игра сближения с фупкцпс нл'1Ы1им цотспым множеством//Прпкл математика п механика 1973 Т 37, вьгп 1 С 3-13 |21| Кцрлсаиский А Б Альтернированный интеграл Поитрягипа и теории спите ia управлений //
Mai Пп-та им Стеклова 1999 Т 224 С 234-248 |22| Никольский AI С Об альтернированном интеграле JI С Поитряпша // Математический c6o¡
ник 1981 Т 12С (153). №1(9). С 136-144. [23] Обей Ж -П , Эклаид II. Прикладной нелинейный анализ M Мир, 1988 512с [2 1| Осипов Ю С. Дифференциальные игры для систем ( иоспсдеГгстнием // Доклады АН ССС
1971 Т 19G Л'"4 С 779-782 [2Г>| Петров H ff. О сущестпопашш значения игры прсстсдопаиня 7 Доклады АН СССР. 197 Т 190 №G. С. 1289-1291
|20) Пстртлн Л А Дифференциальные игры с неполной информацией // Доклады АН СССР. 197 Т 195 №3 С 558-5G1
[27] По'ювинкин Е С Неавтономные дифференциальные игры // Дифференциальные уравиепп 1979 Т 15 № G С. 1007-1017
[28] Пономарев А.И , Розов Н.Х. Устойчивость и сходимость альтернированных сумм Поитрягипа Вестник МГУ Сер вьгшел матсм и кнбери 1978 TIC 82-90
[29] Поптрягин Л С Лшгсйиыс дифференциальные игры преследования // Математический сбо пик 1980 Т 112 (154) №3(7) С. 307-330.
[30] Поптрягии Л С О линейных дифференциальных играх II / / Доклады АН СССР. 1967 Т 1 №4 С 910-912
[31] Пшеничный Б.H Структура дифференциальных игр // Доклады АН СССР 19G9 Т. 184 X
С 285-287
¡32| Субботин A.II Обобщение основного уравнения теории дифференциальных игр // Докла
АН СССР 1980 Т. 254, №2. С 293-297 [33] Субботин А II, Чепцов А Г. Оптимизация гарантии в задачах управления М.: Наука, 19
288с
]31] Тарасьсв A.M , Ушаков В H О построении стабильных мостов в минимаксной игре сблпжспи
уклонения Свердловск, 1983 61с Дсп в ВИНИТИ, № 2451-S3 [351 Тарас ьсо A M, Ушаков Б.H, Хрипуиов А П. Об одном вычислительном алгоритме решен игровых задач управления // Прикл математика и механика 1987 Т. 51, вып. 2. С 216-222 [3G] Ушаков В H К вопросу стабильности в дифференциальных играх // Позиционное упр с гар
тированным результатом / УрО АН СССР Свердловск 1988 С. 101-109 [37| Ушаков В H К задаче построения стабильных мостов в дифференциальной игре сближепп уклонения // Изв АН СССР. Техи кибернетика. 1980. №4 С 29-3G
[38] Ушаков В H Процедуры построения стабильных мостов в дифференциальных играх Дне. д-фпз -мат паук 01 01 02 Свердловск, 1991. 308с / Ни-т математики и механики УрО АН ССС
[39] Ушаков В И, Успенский A.A., Токманцев ТВ. Стабильные мосты в дифференциальных игр на конечном промежутке времени // Труды Института математики и механики УрО РА Екатеринбург, 2004, том 10 №2, с.155-177.
|40] Хрипуиов А.П. Построение областей достижимости и стабильных мостов в нелинейных задач управления Дне к-та физ -мат наук. 01 01 02 Екатеринбург, 1992 140с. / Пп-т математики механики УрО РАН
[41] Черипусъко Ф Л, Меликяи А А Игровые задачи управления н поиска M . Наука, 1978 [42| Gvseinov H G., Subbotm A I, Ushakov V N. Derivatives for Mutlivalucd Mappings with Applicatio to Game-Thcorctical Problems of Control // Problems Control Inform Theory. 1985 Vol 14, no P 155-167
[43] KnibOüiiku NN, Kmiovskii A N Control Under Lack of Information. Berlin etc Bnhauscr. 32 (System & Contiol. Foundations k Appl.)
[44] Kmsoushi% NN., Subbotin A.I. Game-theoretical control problems New York Springer-Vet lag, 19t
[45] Sabbotui A.I. // Generalized Solutions of First-Order PDEs The Dynamical Optimizati Perspective Boston Biikhauser. 1995 392P. (System k Control Foundations & Appl )
ЛАТУШКИН Ярослав Александрович
ИГРОВЫЕ ЗАДАЧИ СБЛИЖЕНИЯ—УКЛОНЕНИЯ:
ОБРАТНАЯ СВЯЗЬ И СТАБИЛЬНОСТЬ МНОЖЕСТВ
АВТОРЕФЕРАТ
Подписало в печать 01 11 2008 г Формат 6\магп 60X00 1 10 Бумага офсстпа^ Печать рнзографнчсская Объем 1 \сп п п Тираж 100 экз Заказ N ^О < у Отпечатано в типографии ООО "11Р\-УТК" с ориптат-макста заказчика 020219. г Екатсрит^рг, \ и Карпа 7ибкие\та, д 42
Условные обозначения
Введение
• > *
1 Свойства' некоторых классов стратегий на примере дифференциальных игр с окружностью в качестве целевого множества
§1 Введение.
§2 Задача с перпендикулярными отрезками
§3 Ограничения в виде квадрата и отрезка.
§4 Случай совпадающих отрезков.
2 Дефект стабильности множеств в дифференциальных играх
§1 Введение.
§2 Постановка задачи конфликтного управления
§3 Стабильность множеств в пространстве позиций игры
§4 Дефект стабильности множеств в пространстве позиций игры
§5 Позиционная процедуры управления с поводырем первого игрока
§6 Оценка рассогласования между движениями и х{Ь) в момент $.
3 Критерии совпадения максимальных стабильных мостов в двух игровых задачах о сближении
§1 Введение.
§2 Постановка задач о сближении.
§3 Оператор стабильного поглощения и стабильные мосты в задаче о сближении в момент $.
§4 Оператор стабильного поглощения и стабильные мосты в задаче о сближении к моменту $.
§5 Критерии совпадения стабильных мостов для стационарных управляемых систем.
Данная работа посвящена некоторым задачам теории дифференциальных игр на конечном промежутке времени. Рассматриваются конфликтно-управляемые системы достаточно общего вида, стесненные геометрическими ограничениями на управления.
В работе изучаются в основном две игровые задачи управления: задача об уклонении и задача о сближении конфликтно-управляемой системы с компактным целевым множеством в евклидовом пространстве.
Для задач об уклонении исследуются вопросы, связанные с построением гарантирующего управления второго игрока и выяснением структуры этого управления.
Для задач о сближении исследуется свойство и-стабильности множеств, содержащихся в пространстве позиций игры, введенное в работах H.H. Красовского и А.И. Субботина [18,19,28,29].
Известно несколько основных подходов к формализации дифференциальных игр.
Одной из первых методик исследования дифференциальных игр явилась методика, предложенная Р. Айзексом в середине ХХ-ого столетия, базирующаяся на использовании так называемого «основного уравнения» теории дифференциальных игр. Монография Р. Айзекса «Дифференциальные игры», переведенная в 1968 году на русский язык, сыграла определенную роль в становлении теории дифференциальных игр в нашей стране.
В 60-е годы JI.C. Понтрягиным для решения линейных дифференциальных игр была введена конструкция альтернированного интеграла [41], выделяющая в пространстве позиций игры множество разрешимости — множество всех тех позиций, из которых разрешима задача о сближении. Концепция альтернированного интеграла получила развитие в работах M.C. Никольского, Е.С. Половинкина, Н.Х. Розова, А.И. Пономарева. В настоящее время усиленно продолжается разработка теории и методов вычисления альтернированного интеграла Л.С. Понтрягина, оставаясь в центре внимания специалистов по теории дифференциальных игр. Здесь отметим, работы A.B. Куржанского и его учеников [14,29], посвященные задачам синтеза управлений в системах с линейной структурой. В этих работах решение задач конфликтного управления достигается соединением модифицированных конструкций экстремального прицеливания H.H. Кра-совского и альтернированного интеграла Л.С. Понтрягина.
В 60-е годы ХХ-ого столетия H.H. Красовским была предложена концепция позиционной дифференциальной игры [18,19], которая затем последовательно развивалась им и его сотрудниками. В рамках этой концепции была разработана позиционная формализация дифференциальных игр, базирующаяся на понятии позиционных стратегий. Основным элементом разрешающих конструкций, ориентированных на решение нелинейных дифференциальных игр, являются стабильные мосты — множества в пространстве позиций дифференциальной игры, оканчивающиеся на целевом множестве и слабо инвариантные относительно некоторого набора дифференциальных включений, связанных с динамикой конфликтно-управляемой системы. Разрешающая позиционная стратегия в игровой задаче о сближении может быть построена как экстремальная к стабильному мосту стратегия.
В 70-е, 80-е годы ХХ-ого столетия теория дифференциальных игр развивалась особенно интенсивно; здесь отметим монографии H.H. Кра-совского [19,24], H.H. Красовского и А.И. Субботина [29], А.И. Субботина и А.Г. Ченцова [45]. Концепция экстремального прицеливания была перенесена на различные классы дифференциальных игр, в том числе Ю.С. Осиповым и A.B. Кряжимским на дифференциальные игры с запаздыванием [31,38]. В 80-е годы появилась возможность (развивающаяся вычислительная техника) разрабатывать методы и алгоритмы приближенного вычисления стабильных мостов и функции цены и реализовывать их на
ЭВМ для некоторых классов игровых задач.
В середине 70-х годов были опубликованы работы H.H. Красовско-го [20,23] по унификации в дифференциальных играх. В настоящей работе используется унификационное определение стабильности [20,23]. В середине 80-х годов А.И. Субботин предложил [44] понятие обобщенных решений уравнений Гамильтона-Якоби-Беллмана-Айзекса в теории дифференциальных игр, которое позволило ему рассмотреть функцию цены дифференциальной игры как такое решение и доказать существование и единственность ее при общих предположениях на конфликтно-управляемую систему. При этом использовались инфинитезимальные конструкции негладкого анализа. Эти конструкции также используются в настоящей работе.
Целью данной работы было теоретическое исследование некоторых задач об уклонении и о сближении с целью на конечном промежутке времени; изучение структуры разрешающих стратегий в задачах об уклонении и свойства стабильности в задачах о сближении.
Для достижения поставленной цели используются позиционный подход и конструкции, разработанные в рамках этого подхода. Основными элементами этих конструкций являются стабильные мосты, унификацион-ные схемы стабильности и процедуры управления с поводырем, наряду с которыми можно рассматривать и схемы, базирующиеся на экстремальном прицеливании.
Перейдем к краткому описанию содержания диссертации:
В теории дифференциальных игр представляют существенный интерес вопросы, относящиеся к структуре и свойствам различных классов стратегий. При этом принципиальным является вопрос [4,5,7-9,17,24,29,45, 64] о свойствах непрерывных стратегий и их связи с программными управлениями. Некоторым аспектам этой тематики посвящена первая глава диссертации. Этот вопрос подробно изучен [4, 5,17, 24, 29, 45, 64] для линейных управляемых систем в предположении выпуклости терминального множества. Можно ослабить это предположение до ацикличности (вырожденности группы гомологий) некоторых связанных с задачей объектов, см. [9] .
Непрерывные по фазовому вектору стратегии образуют естественный класс законов управления, который удобен как в теоретических построениях, так и при работе с конкретными управляемыми объектами. Одно из хороших свойств этого класса состоит в том, что вопрос о наличии решений начальной задачи для системы с обратной связью решается с помощью хорошо известных из теории обыкновенных дифференциальных уравнений стандартных теорем существования.
Вместе с тем, имеются примеры несложных по своей постановке задач, разрешить которые в классе непрерывных стратегий невозможно в принципе. В таких задачах складывается в определенном смысле парадоксальная ситуация: обеспечить уклонение от терминального множества можно только с помощью разрывных стратегий. Гарантировать уклонение посредством непрерывных стратегий пе удается, несмотря на доступность всей текущей информации о движении объекта. Необходимость обрабатывать данные с помощью непрерывной функции обесценивает всю эту информацию.
Использование разрывных стратегий в теории дифференциальных игр есть принципиальное обстоятельство. Имеются дифференциальные игры, в которых невозможно построение непрерывной стратегии уклонения, являющейся компонентом седловой точки. Достаточно типична ситуация, в которой седловую точку необходимо строить в более широком классе стратегий, допускающем разрывы по фазовому вектору.
В работе [5] для линейно-выпуклого случая (линейная динамика и выпуклое целевое множество) рассматриваются однозначные позиционные стратегии, удовлетворяющие условиям Каратеодори или свойству непрерывности, получены глубокие теоремы о невозможности уклонения в классе таких стратегий.
В примере речь идет о преследовании безинерционной точки материальной точкой. В работе [4] в линейно-выпуклом случае исследуются возможности многозначных позиционных стратегий, обладающих свойством полунепрерывности по включению, доказаны соответствующие теоремы, рассмотрены многозначные стратегии для примера из [5]. Доказательства из [4,5] опираются на принцип неподвижной точки типа теоремы Какутани (а именно, на теорему Карлина и Боненбласта). При этом рассуждения существенно используют выпуклость терминального множества, из которой следует выпуклость рассматриваемого многозначного отображения. Теоремы этого типа для нелинейных дифференциальных игр без требования выпуклости целевого множества были получены в [9]. Работа [9] опирается на соответствующие свойства функционально-дифференциальных включений [8]. Эти свойства основаны на теореме Эйленберга и Монтгомери о неподвижной точке, в которой, в отличие от теоремы Какутани, не требуется выпуклости значений рассматриваемого многозначного отображения.
Результаты работы [9] позволили построить пример [7] обсуждаемого типа с невыпуклым терминальным множеством. Здесь приходится опираться на гомологические методы, что не всегда удобно в теории дифференциальных игр.
В первой главе диссертации рассматриваются три примера дифференциальных игр с невыпуклым терминальным множеством, иллюстрирующие свойства непрерывных стратегий.
Во всех случаях игра происходит на плоскости, причем терминальным множеством является окружность с центром в начальной точке, которая совпадает с началом координат
Х-^ -|— == 1*
Во всех примерах динамика задается одной и той же системой двух дифференциальных уравнений х = 2(1 - £)и + V.
Примеры различаются геометрическими ограничениями на управления игроков.
В первой из рассматриваемых игр (§2) геометрические ограничения задаются двумя перпендикулярными отрезками равной длины р = {и= (0,п2) : -1 < и2 < 1},
Я — — (^1,0) : -1 < 171 < 1} .
Во второй игре (§3) ограничения имеют вид отрезка и квадрата р = {и = (щ, и2) : -1 < Щ < 1, -1 < и2 < 1} , <Э = {г; = (гл,0): -2 < гл < 2} .
В третьей задаче (§4) используются два совпадающих отрезка р = {и={иъ 0): —1 < ггх < 1> , (5 = {г; = (г;1,0): -1<1Л<1}.
Поэтому третий пример фактически является одномерным, и терминальное множество можно считать двухточечным.
Можно непосредственно проверить, что в рассматриваемых в трех примерах дифференциальных играх программные управления не позволяют гарантировать уклонение от терминального множества. Также указаны способы уклонения с помощью управления по принципу обратной связи. В примерах, содержащихся в §2, §3, уклонение от терминального множества гарантируется с помощью одного замера фазового вектора, причем соответствующие способы управления задаются разрывными отображениями. Указаны некоторые семейства таких способов управления, зависящие от параметра. Проведена оптимизация по этому параметру. В задаче из §4 можно обеспечить уклонение с помощью простой непрерывной стратегии.
В связи с этим возникает вопрос, можно ли в первых двух примерах гарантировать уклонение посредством непрерывных стратегий. Ответ на этот вопрос оказывается отрицательным. Показано, что удовлетворяющие условиям Каратеодори стратегии с отклонением аргумента не могут обеспечить уклонение от терминального множества в первой и второй играх. При этом в доказательстве удалось обойтись без использования понятий и результатов алгебраической топологии. Рассуждения используют лишь очень хорошо известную теорему Шаудера о неподвижной точке, которая применяется в пространстве траекторий системы, снабженном равномерной нормой.
Во второй главе рассматривается конфликтно-управляемая система достаточно общего вида на конечном промежутке времени. Управления игроков, как и в предыдущей главе, стеснены геометрическими ограничениями. Исследуются вопросы, относящиеся к одному из центральных понятий теории позиционных дифференциальных игр — свойству стабильности. Свойство стабильности было введено в работах H.H. Красовского и А.И. Субботина [18,19,28].
В течение последующих десятилетий, начиная с 1970 года, имела место эволюция в описании этого свойства.
В [4,5,8,17] стабильность была представлена как свойство слабой инвариантности множества в пространстве позиций игры относительно некоторого семейства дифференциальных включений, связанных с динамикой конфликтно-управляемой системы. Эти дифференциальные включения содержат в качестве параметра векторы управлений второго игрока.
В середине 1970-х годов появляется новая формулировка стабильности и постепенно выкристаллизовывается новое направление, базирующееся на этой формулировке — унификация дифференциальных игр.
В 1971 г. в журнале "Прикладная математика и механика" была опубликована статья H.H. Красовского [22], посвященная минимаксному поглощению в играх сближения. В ней рассматривалась конфликтно-управляемая система без традиционного предположения о существовании седловой точки в так называемой маленькой игре. В предложенной формализации игры не исключалось, что выбор значения v[t] второго игрока может опираться на информацию о значении управления u[t] первого игрока. Тем самым при рассмотрении игры сближения к управлению второго игрока допускались функции V(t,u) — так называемые коитр-управления [22]. В статье было дано обоснование правила минимаксного прицеливания первого игрока в регулярном случае. Для обоснования этого правила были введены функции Vs(t,u), экстремальные на направлениях s (s — векторы сопряженного пространства к фазовому пространству). Введение этих функций явилось той точкой отсчета, с которой началось развитие методов унификации в дифференциальных играх. В появившихся чуть позже работах H.H. Красовского [20, 23] было дано определение унификацион-ных моделей, изучены их свойства и указаны перспективы применения в различных классах игровых задач динамики. Суть унификации заключается в том, что свойство стабильности выражается в терминах векторов s сопряженных переменных и гамильтониана конфликтно-управляемой системы. Исследования, проведенные в последующие годы, прояснили, что одна из важных направленностей унификации состоит в выражении свойства стабильности на языке анализа, в том числе выпуклого анализа. Унификация играет важную роль и при сравнении конфликтно-управляемых систем. Так, например, совершенно прозрачным становится тот факт, что две конфликтно- управляемые системы, имеющие одинаковые гамильтонианы, эквивалентны с точки зрения решения дифференциальной игры. Отметим, что тематика второй главы достаточно сильно близка к вопросам сравнения возможностей конфликтно-управляемых систем. Разным аспектам унификации, в том числе, вычислительным аспектам посвящены работы [2,51].
Следующий этап, связанный с представлением свойства стабильности, относится к началу 1980-х годов. К этому времени было рассмотрено несколько конкретных дифференциальных игр, в которых свойство стабильности можно было выразить, используя лишь конечное число дифференциальных включений и, кроме того, для некоторых из этих игр дифференциальные включения уже не ассоциировались к конкретным вектором управления второго игрока.
Таким образом, можно констатировать, что к началу 1980-х годов налицо имелось несколько представлений, используемых при описании свойства стабильности, столь важного в дифференциальных играх. Хотя эти представления различны по форме, они выделяют одни и те же стабильные мосты и, значит, эквивалентны по существу.
В первой половине 1980-х годов появилась довольно общая формулировка свойства стабильности [48,49], вобравшая в себя некоторые известные формулировки. В этой формулировке так же, как и в унификационной схеме [20,23], присутствует явно гамильтониан конфликтно-управляемой системы.
Вслед за этим, в середине 1980-х годов было получено инфинитези-мальное представление свойства стабильности [63], выраженное в терминах конусов Булигана или правых производных соответствующего множества. Как было показано А.И. Субботиным [65], это представление оказалось полезным не только при рассмотрении теоретических вопросов в дифференциальных играх, но и при исследовании обобщенных (минимаксных и вязкостных) решений уравнения Гамильтона-Якоби. Несколько позже инфи-нитезимальные конструкции, связанные с конусами Булигана, были применены при исследовании более общих уравнений в частных производных первого порядка.
Во второй главе данной диссертации показано, что конструкции, участвующие в инфинитезимальном определении свойства стабильности, удобно использовать и для некоторого расширения понятия стабильности. Это влечет расширение сферы применимости метода экстремального прицеливания H.H. Красовского [24,29].
Как правило, при работе с конкретной дифференциальной игрой приходится заменять стабильный мост некоторым приближением. Стабильный мост может иметь весьма изощренную форму, не допускающую удобного аналитического описания. Кроме того, погрешности неизбежны при реализации алгоритма управления на ЭВМ. Ниже приведена математическая конструкция, использующая понятие дефекта стабильности и позволяющая работать с необязательно стабильным множеством в пространстве позиций, решая при этом менее жесткую задачу о сближении — задачу о сближении с некоторой окрестностью цели. Дефект стабильности множества есть величина, оценивающая, в какой степени для используемого приближенного множества нарушается свойство стабильности.
В §2 второй главы приводится задача конфликтного управления, которой посвящены последующие параграфы второй главы.
Задана конфликтно-управляемая система, поведение которой на промежутке времени ¿о < $ < оо, описывается векторным дифференциальным уравнением х = f(t, х,и, у), х^о) = х°, и е Р, v Е (0.1)
Здесь х — га-мерный фазовый вектор из евклидового пространства К171, и — управление первого игрока, у — управление второго игрока, Р и <3 -компакты в евклидовых пространствах ВР и Ш4 соответственно.
Предполагается, что выполнены условия:
А) Вектор-функция /(¿, х, и, у) определена и непрерывна по совокупности переменных х, и, у) на множестве [¿0, х Ит х Р х ф и удовлетворяет условию: для любого компакта И С [¿сь^] х К171 найдется такое Ь = £(£)) Е (0,оо), что
1,х{1\щу)<Ьх{1)-х^ (0.2) для любых (¿, х^г\ и, у) Е Б х Р х ф, г = 1, 2.
Б) Существует такое число \1 Е (0, оо); что г,х,щу)\\<11{1 + \\х\ для любых (¿, х, и, у) Е [¿о, х Рт х Р х
Здесь ||/|| — норма вектора / в соответствующем евклидовом пространстве.
Рассматриваемая во второй главе дифференциальная игра является антагонистической и складывается из двух задач — задачи о сближении и задачи об уклонении [29]. В задаче о сближении, стоящей перед первым игроком, требуется обеспечить попадание движения Е системы (0.1) в момент д на заданный компакт М в Ят, каковы бы ни были при этом допустимые управления второго игрока. Решение задачи требуется обеспечить в классе позиционных процедур управления первого игрока.
Здесь для системы (0.1) не предполагается выполнение условия сед-ловой точки в маленькой игре.
Задача об уклонении, стоящая перед вторым игроком, заключается в том, чтобы выбрать допустимую стратегию Vе, обеспчивающую уклонение движений £Е [¿о,^] системы (0.1) в момент д от некоторой замкнутой е-окрестпости МЕ компакта М, каковы бы ни были при этом допустимые управления первого игрока.
Для сформулированной дифференциальной игры справедлива альтернатива [29]: существует такое замкнутое множество С [¿о, х Кгп — максимальный п-стабильный мост, что для всех исходных позиций (£*, £*) 6 разрешима задача о сближении, и для всех исходных позиций (£х, я*) £ ([¿о, х Я171) \И/Г° разрешима задача об уклонении.
Согласно принципу экстремального прицеливания [18, 28, 29], разрешающая процедура управления первого игрока для исходных позиций (£*,£*) £ может быть реализована как процедура управления с поводырем, нацеливающая движение х{Ь) системы (0.1) на поводыря, идущего по мосту ]¥°.
Весьма часто при построении разрешающих управлений мы имеем не мост а некоторое, может быть, не сильно отличающееся от него множество IV* С х Я771, удовлетворяющее краевому условию $) = = М, где обозначено И^) = : (г,х) <Е УУ}. Для точек (£*,£*) множества \¥* разрешима, вообще говоря, не исходная задача о сближении с М, а менее жесткая задача о сближении с некоторой е-окрестностью множества М.
Одна из основных задач, рассматриваемых во второй главе — задача аккуратной оценки £-окрестности в этой менее жесткой задаче о сближении. Эта оценка проводится в предположении о выполнении некоторых условий на множество Ш*.
§3 второй главы является вспомогательным.
В нем даются определения, связанные с центральным понятием теории позиционных дифференциальных игр — стабильностью множеств.
Исходя из условия (Б), наложенного на систему (0.1), и, считая, что задан некоторый компакт ТУ* в [¿о,^] х можем выбрать компактную область в = {(г,х): г Е [*о,0], |М < + 0))е^о)},
7 Е (0, оо) настолько большой, что в ней содержатся множества М) — {($, х) : х Е М}, ТУ* и все стабильные мосты ТУ, включая максимальный стабильный мост ТУ0.
В §3 вводится в рассмотрение семейство С, отображений я) С (^ж) Е £>, отвечающих векторам I из единичной сферы
5 = {I е Д™ : ||2|| =1}сГ (см. стр. ).
Заметим, что по определению, все множества ж), (£, ж, € -О х есть выпуклые компакты в Я171, содержащиеся в некотором достаточно большом шаре (7 = {д Е ВТ1 : ||р|| < г} в пространстве К171.
Далее вводятся в рассмотрение ц>ж*) — множество достижимости в момент £* Е (£*,#] (¿о <£*<£*<$) дифференциального включения ж € = ж*, [£*,£*];
- {ж* € Дт : ^ 0} , X* С Ят.
Приводятся определения 3.1 и 3.2 оператора стабильного поглощения 7Г в задаче о сближении и ^-стабильного моста в задаче о сближении, выраженные в терминах множеств X*), (£*;£*, X*) Е А X 2^™, Е б1, где А = {(£*, ¿*) : ¿о < < < — треугольное множество в [¿о, х [¿о, Здесь во введении мы не приводим эти определения, поскольку ниже приводятся соответствующие определения в более общей форме.
Следующее утверждение, важное в теории дифференциальных игр, перебрасывает мостик от свойства стабильности к вводимому ниже в этой главе понятию дефекта стабильности множеств в пространстве позиций. При этом в рассуждениях, сопутствующих этому переходу, принимается во внимание следующее важное утверждение из работы Х.Г. Гусейнова, А.И. Субботина и В.Н. Ушакова [63].
Теорема 0.1 Замкнутое множество W С D является и-стабилъным мостом в задаче о сближении тогда и только тогда, когда
1. W($) С М;
2. DW(t, х) П Fi(t, х)фф, te [£0, (£, ж, I) GdW х S. Здесь
DW(t,x) = \d£Rm:d= lim Wk~x; k—>oo tk — t tk,wk)} С W,tk[t при k —► oo, lim wk = x У , k—>oo J dW — граница множества W.
Для максимального -zi-стабильного моста W° условие 1 в теореме 0.1 превращается в равенство W°($) = М. Из свойств моста W0 вытекает
W°(t*) П 0{r-U)T{x*) ф 0, (t-.z*) g W0.
Здесь 07(:с*) ={ж£ Rm : ||ж — х*\\ < 7}, 7 > 0.
Последнее условие означает, что многозначное отображение L W°(t), t б [toi$] меняется в некотором смысле не очень быстро в точках (t*, а;*) £ W0, € [to,$) при увеличении t.
В §4 второй главы рассматривается множество W* С D: упомянутое в §3, удовлетворяющее условию W*($) = М.
Предполагается, что множество W*, подобно мосту Wудовлетворяет условию
В) W*(t*) П 0(i.t.)r(a;*) ф ф} (t„xt) в W*,t0 <U<t*<$.
Условие (В) представляется нам вполне естественным. Из него следует
DW*(U,x*) П G ф </>,(**, О G dW\ U G [¿о,^)
Пусть (t*,x*) G dW\ U G Величину e(t*,x*) = supp(DW*(t*,x*),Fi(t*,x*)) > 0 les назовем дефектом стабильности множества W* в точке (£*,£*)•
Можно сказать, выражаясь ие очень строго, что дефект стабильности множества W* в точке (¿*,£*) G dW*, i* G [¿сь^) выражает степень неинвариантности множества W* в точке (t*,a;*) относительно динамики конфликтно-управляемой системы в этой же точке (£*,&*).
В §4 показывается, что множество DW(t*,x*) в формуле для £(£+,£*) можно подменить более удобным — компактным множеством £>vW(i*, х*) - я*) П 3G, где 3G = {Зр : я G G}, так что ж*) = supp(DvW(U, ж*), ж*)). les
Пусть Г\ = {(i, х) : х G Rm} , A(i*) = П Г\. Величину e(i*) = sup G назовем дефектом стабильности множества W* в момент i* G [¿о,^)
Так определяемая неотрицательная функция е(£), t G [¿о, рассматривается нами как некоторая характеристика нестабильности (неинвариантности) множества VF*.
Стабильность множества ТУ* эквивалентна согласно теореме 0.1 равенству e(t) е 0 на [to, Отсюда следует, что в случае e(t) = 0 на правило экстремального прицеливания на поводыря, идущего по W*, гарантирует приведение движения x(t) системы (0.1) на М, если (U,x(Q) = (t*,x*) G W*.
Естественно ожидать, что малость функции е(1) на позволяет правилу экстремального прицеливания на поводыря, идущего по IV*, обеспечивать приведение движения х{Ь) системы (0.1)в малую ^-окрестность множества М. Также, по-видимому, £ может быть выражено через интед грал / к
Для обоснования этих положений вводятся условия на множество У/*
И фуНКЦИЮ &(£), £ € [¿0;
С) Существует неубывающая скалярная функция : (0, оо) —» [0, оо), ср*(5) I 0 при 5 | 0; такая, что
Н{х, + <5 • х*), + 6)) <5- (р*{6), е д\¥\ 5 6 (0,
Е) Функция е({) интегрируема по Римаиу на [¿Оэ^]
Здесь обозначено х* -1- 5 ■ X* = {ж* + 5 ■ / : / 6 X*} ; ъ(х* 4- <5 • X*, X*) = вир + 8 ■ /, X*), X* и X* — множества из Лт; р(х* + 5-/,Х*)= Ц^ + ^Я-^Ц. х*£Л*
В §5 вводится позиционная процедура управления с поводырем (И7'*-процедура управления с поводырем), отвечающая конечному разбиению Гп промежутка [£*,$] из [£о)$] и исходной позиции (£*,#*). Эта процедура отличается от известных позиционных процедур управления тем, что она сконструирована для множества ]¥* в пространстве позиций, не являющегося -и-стабильным мостом. Это обстоятельство вносит некоторую специфику в определение ТУ*-процедуры управления. При этом учитываются условия, наложенные на систему (0.1), в частности, условие (С). Сама процедура управления детально описана в §5.
В §6 второй главы выводится оценка рассогласования 115№Н ~ — между движением х(Ь) конфликтно-управляемой системы (0.1)и вспомогательным движением z(t), порожденными W*-процедурой управления первого игрока, отвечающей разбиению Гп. В силу упомянутых выше особенностей И^*-процедуры управления оценка выводится не традиционным путем суммирования традиционных локальных оценок квадрата рассогласования, а с использованием нестандартных рассуждений.
Она имеет вид s(tf)|| < + (Д(")^°(Д(П)))5 + {ti - ^)x(A(n})) + i=0
0.3)
Здесь (p°(5), X(S) — неотрицательные функции переменной S > 0, монотонно стремящиеся к нулю при
5 | 0; ДМ — диаметр разбиения Гп.
Переходя к пределу при п —оо, —» оо от пошаговых движении x{t) и z(t), отвечающих разбиениям Гп, к конструктивным движениям x(t), в итоге получаем д p{x{ti),M) < ■ Je(r)dr. (0.4)
Иными словами (конструктивное) движение, порожденное W*-процедурой управления с поводырем первого игрока, удовлетворяет включению x(ti) е Ме, е = ew. = еь{Р~и) • J e{r)dr. (0.5) и
Число е — £w* (0.5) мы трактуем как меру нестабильности множества
W*.
Замечание 0.1 Требование интегрируемости по Риману функции e(t) является достаточно жестким. Поскольку речь идет о верхней оценке, в определении дефекта стабильности можно заменить интеграл Римана верхним пределом интегральных сумм для функции e(í) при диаметре разбиения, стремящемся к нулю.
В третьей главе рассматривается та же самая, что и во второй главе, конфликтно-управляемая система (0.1) на конечном промежутке времени [¿о, .
Изучаются и сравниваются две игровые задачи о сближении с терминальным множеством М в фазовом пространстве [19,29]. В первой из них первому игроку требуется обеспечить с помощью позиционного управления попадание фазового вектора системы (0.1) на М в конечный момент времени -д. Во второй задаче требуется обеспечить с помощью позиционного управления попадание фазового вектора на М не позже момента Эти задачи являются наиболее важными в теории дифференциальных игр.
Постановка первой задачи — задачи о сближении с М в момент выглядит, на наш взгляд, несколько проще, чем постановка второй задачи, и поэтому естественно ожидать, что алгоритмы построения ее решения проще, чем алгоритмы построения решения второй задачи - задачи сближения с М не позже момента (или, что одно и то же, — задачи сближения с М к моменту Имеющийся опыт разработки алгоритмов подтверждает это. Один из первых вопросов, возникающих при сравнении этих двух задач — вопрос о выделении тех условий на систему (0.1) и терминальное множество М, при которых решения обеих задач совпадают. Решения в этих задачах мы идентифицируем с максимальными и-стабильными мостами \УП и в них. При выполнении условий, обеспечивающих совпадение и можно использовать для решения второй задачи алгоритмы построения решения более простой первой задачи.
При том позиционном подходе, который предложен в [19,29], максимальные и-стабильныс мосты и являются центральными элементами разрешающей конструкции. В §3 даются определение оператора стабильного поглощения и г/,-стабильного моста (определение 3.1-3.4) в задаче о сближении с М в момент д в достаточно общей форме (аксиоматической форме, базирующейся на системе условий А.1, А.2, А.З). Следует отметить, что эта форма записана на языке соответствующих дифференциальных включений, отвечающих "обратному" времени.
Приведем эти определения (см. [49]).
Пусть х Rm Э (t, re) i-> G(t,x) С Rm — непрерывное в хаусдорфовой метрике многозначное отображение; G(t, ж) — выпуклые компакты в Rm, удовлетворяющие включению
F(t,x) с G(t,x), (t,x) С В,
F(t,x) = со {f(t,x,u,v) : и £ Р, v € Q}; соА — выпуклая оболочка множества Л.
Пусть также задано некоторое множество Ф элементов ф и семейство {F^p : ф € Ф} отображений ify : (£,ж) ^ ^(£,ж) С (t,x) G Д удовлетворяющее условиям
А.1 Для любых (£, х,ф) Е -D х Ф множество х) выпукло, замкнуто в Rm и F^itj х) С <3(*,ж);
А.2 Для любых (t,x,l) Е В х 5 выполняется min hm,x)(l) = H(t,x,l);
А.З Существует такая скалярная функция uj*(5), (ш*(8) | 0 прг/ (5 j. что d(F^U,x*)iF^(t\x*)) < и* (|£* - t*| + ||ж* - ж*||) для (£*,ж*) гг (Г, ж*) из В, ф £ Ф.
Здесь = sup < I, f > — опорная функция множества F С feF d(FW,FW) =
- max J sup inf /W - /(2) II, sup inf /W - /(2) II I [/(i)eF(D/(2)eF(2) 11 /(2)eF(2)/W6F(i) "J хаусдорфово расстояние между F^ и из Rm.
Приведем определение оператора стабильного поглощения в задаче о сближении с М в момент д.
Пусть ¿о < < < Полагаем х*) — множество достижимости в момент дифференциального включения х € = ж*, ф е Ф;
0.6)
Х^*; Я*) = {х, Е В™ : Я* П Х^*; ж*) ^ 0} , здесь Я* Сй™
Определение 0.1 (см. [49]) Оператором стабильного поглощения тг в задаче о сближении с М в момент $ назовем отображение тг : Л х , заданное соотношением тг(£*;£*, Я*) = р|Х^*;Л#*); Здесь А = {(£>,£*) 6 х [¿0,#] : £* < £*}
Определение 0.2 (см. [49]) Замкнутое множество \¥ С И назовем и-стабилъным мостом в задаче о сближении с М в момент д, если
•&) С М; и) С тг (£*; Г, Ж(£*)) , (£*, Г) € Д.
Наряду с дифференциальными включениями (0.6), участвующими в определении п-стабильного моста V/ и отвечающими "прямому" времени, в третьей главе рассматриваются дифференциальные включения г] е ФФ(т, *[т]), г[т*] = Ф, (0.7) отвечающие "обратному" времени т € гДе
Полагается при этом г* = Ц + $ — £*, г* = ¿о + ^ —
Соответственно "обратному" времени, введем в рассмотрение Z■ф(т^т*,z*) — множество достижимости дифференциального включения (0.7) в момент т*.
Полагаем также
ЗДт*;т*,Я*) = (J гф(п-т\г*), Я* С Rm. z*eH*
Справедливо равенство тг(Ь; t*, Я*) = f| Г, Я*) = f| г*, Я*) (0.8) ч/'еФ ^еФ
Учитывая введенное выше "обратное" время т, множество W С [¿о, х Rm, рассматриваемое ранее в пространстве позиций (£, я), будем обозначать в терминах "обратного" времени т символом W С х и трактовать как множество в пространстве позиций r,z). При этом временные сечения в пространствах позиций (t, х) и {r,z) множеств W и W связаны равенством W(r), ¿ + r = to + ^, так что W(t0) - W(i?) и = W(t0).
Запишем определение w-стабильного моста в задаче о сближении с М в момент $ в терминах множеств достижимости т*, Я*), Я* С отвечающих "обратному" времени.
Определение 0.3 (см. [60]) Оператором стабильного поглощения 7г в задаче о сближении с М в момент $ назовем отображение 7г : А х 2Rm I—> 2Rm, заданное соотношением тг (т*;т*,Я*) = р|^(т*;т*,Я*); здесь (т*,т*) £ А, Н* С Rm.
Определение 0.4 Замкнутое множество W С. D назовем и-стабильным мостом в задаче о сближении с М в момент если
W(t0) С М; W(r*) Стг(т*;т*, W(r*)), (т*,т*)еД.
Из определения 0.4 следует, что максимальный -¿¿-стабильный мост УУП С £> в задаче о сближении с М в момент $ есть максимальное замкнутое множество из I), удовлетворяющее условиям
Уп(£о) = М;
0.9)
С 7г(т*;т*,МЯ(т-*)), (т*, Тф) € Д.
В соотношениях (0.9), характеризующих максимальный и-стабильный мост УУ0, участвуют наряду с начальным моментом ¿о пары моментов (г*, г*) Е А.
Оказывается возможным перейти от этих соотношений к характери-зации моста УУП при помощи инфинитезимальных соотношений, в которых пары (г*,г*) Е Д подменены моментами т* Е [¿(ь^) (то есть как бы слиты в один момент г*), а пары сечений (УУп(т*), УУп(т*)) — точками (т*,г*), содержащимися в УУп(т*). При этом представляется целесообразным выявить и инфинитезимальные свойства произвольного «-стабильного моста УУ, а не только моста УУ0.
Инфинитезимальные конструкции «-стабильных мостов, которые рассматриваются в §§3, 4, 5 третьей главы, тесно связаны с понятием контингентного конуса, введенным Булиганом в начале тридцатых годов предыдущего века [37]. Имеется несколько определений контингентного конуса Тп(х) непустого множества О из в точке
Определение 0.5 Множество называется контингентным конусом к & в точке х.
Здесь Вн = {Ь Е Я!* : ||Ь(| < 1}; ||Ь|( — евклидова норма вектора Ъ Е
В §3 третьей главы приводится еще одно определение тангенциального конуса Тп(х), удобное в рассуждениях, касающихся «-стабильных мостов.
Лемма 0.1 Tq(x) = П el con(ü(x]a) —x). a>0
Здесь con c¿) — x) — {Xg : A > 0, g G a) — re)} — конус в
RN: натянутый на множество (Q(x]a) — x)] el A — замыкание множества А.
С помощью этого определения тангенциального конуса становится более прозрачной связь между данными ранее неинфинитезимальными определениями u-стабильных мостов и следующим необходимым условием и-стабильности, выраженным в инфинитезимальной форме (Теорема 0.2). Предварительно введем производное множество
VW{w*) = {deRm: (М) G Ttf(w*)} отображения г i—> W(r); т G [т*, #] в точке w* — (т*, z*) G W. Здесь VV = W П {(г, z) : г G [г*, #],*<= Rm}.
Теорема 0.2 Если замкнутое мполсество W С D является и-стабилъным мостом в задаче о сближении с М в момент то необходимо выполняется z*) С f| {ТЩтф*) + Фф(т*, z*)) (0.10) ф€ Ф для всех т* G (т*, z*) G >V.
Для i¿-стабильного моста W, записанного в переменных í, ж, можно также ввести производные множества, отвечающие возрастанию и убыванию "прямого" времени t. Такие производные множества рассматривались в работах [50,52,63]. Обозначим их соответственно символами DW(t*,x*) и DW(t*,x*).
Для одного и того же ^-стабильного моста справедливы равенства для точек (£*, х*) G W ((t*,z*) = (tQ + $-t*,x*) G W)'
DW(t*,x*) = VW{t\z*), DW{t*,x*) = VW(t*,z*).
Учитывая первое равенство, запишем теорему 0.2 в виде
Теорема 0.3 Если замкнутое множество \У С. И является и-стабильным мостом в задаче о сближении с М в момент {), то необходимо, чтобы
П (Тщг^х*) — Рф(Ь*,х*)) ,
0.11)
Г,X*)
Именно в такой форме теорема 0.2 была сформулирована и доказана в работах [48,49]. Доказательство теоремы 0.2, приведенное здесь в диссертации в терминах "обратного" времени, повторяет с некоторыми изменениями доказательство из [48,49].
В §4 третьей главы определяются оператор стабильного поглощения и и-стабильный мост в задаче о сближении с М к моменту д.
Приведем эти определения.
Полагаем, что М — то же самое, что и в задаче о сближении с М в момент Пусть (£*,£*) Е А, Н С Дто
Введем обозначение мт = { м, te[t,,n [мин, г = г*.
Определение 0.6 Оператором стабильного поглощения х 6 задаче о сближении с М к моменту $ назовем отображение х : Д х 2дт I—> 2кт, заданное соотношением х(г*;Г,#)=рI и Х^^М^Н)).
Определение 0.7 Замкнутое множество IV С V назовем и-стабильным мостом в задаче о сближении с М к моменту если
С М;
W(Qcx(U;t*,W(t*)): (£*,£*) £ А.
Можно показать , что как в этой задаче о сближении, так и в задаче о сближении с М оператор стабильного поглощения определен корректно.
А именно, можно показать, что семейства {i^ : D \—> 2ят}, отвечающие различным множествам Ф и удовлетворяющие условиям А.1 — А.З, эквивалентны в том смысле, что соответствующие операторы выделяют одни и те же n-стабильные мосты W в D.
Точно так же, как в задаче о сближении с М в момент здесь можно записать определения оператора стабильного поглощения и ^-стабильного моста в терминах "обратного" времени т.
Определение 0.8 Оператором стабильного поглощения х 6 задаче о сближении с М к моменту $ назовем отображение X ■ 2дт I—> 2Rm, заданное соотношением
Х(т*;т*,#)= р| (J Z-ф (т*; г, МГ(Я));
•0еФте[т*,т,] здесь (т*,т*) € А, Я С Rm.
Определение 0.9 Замкнутое мнолсество W С D назовем и-стабильным мостом в задаче о сближении с М к моменту д, если
W(to) С М;
W(n) с X (г*; Г*, W(t*)) , (г*, г,) е А.
В §5 третьей главы изучается вопрос о выделении тех условий на систему (0.1) и множество М, при которых решения обеих задач о сближении совпадают. Основной результат третьей главы составляют критерии совпадения максимальных ^-стабильных мостов WD и W0 в задачах о сближении с М для стационарных конфликтно-управляемых систем (0.1). Приведем эти критерии. Пусть система (0.1) имеет вид dx = /(£, ж, и, v), xeRm, иеР, v £Е Q. (0.12)
Введем в рассмотрение множество WM = [to, х М С D.
Теорема 0.4 Для того, чтобы в двух задачах о сблиэюении с М, сформулированных для системы (0.12), выполнялось равенство Wn = W°, необходимо и достаточно, чтобы замкнутое мноэюество \¥м С О было и-стабилъным мостом в задаче о сближении с М в момент
Определение 0.10 Будем говорить, что максимальный и-стабильный мост в задаче о сближении с М в момент $ является монотонным, если для любых двух моментов £*, (£*,£*) € Д верно
0.13)
Теорема 0.5 Для того, чтобы в двух задачах сближении с М, сформированных для системы (0.12), выполнялось равенство — \¥°, необходимо и достаточно, чтобы мост \УП был монотонным.
Замечание 0.2 При доказательстве теорем 0.4 и 0.5 используются теорема 0.1 и теорема 0.3, сформулированная и доказанная в §3 третьей главы.
Основные результаты диссертации опубликованы в работах [10-13,34, 35,53-58,66,67].
1. Свойства некоторых классов стратегий на примере дифференциальных игр с окружностью в качестве целевого множества
В данной главе приведены примеры невырожденных дифференциальных игр на плоскости с невыпуклым терминальным множеством, показывающие, что задача уклонения в классе непрерывных по фазовому вектору стратегий может оказаться как разрешимой, так и неразрешимой в зависимости от свойств управляемой системы. При этом невырожденность игры понимается как возможность гарантировать уклонение с помощью (разрывных) законов управления по обратной связи и невозможность сделать это посредством программных управлений. Неразрешимость задачи установлена в классе стратегий с отклонением аргумента, удовлетворяющих условиям Каратеодори. Несмотря на невыпуклость терминального множества, которым служит окружность, доказательство неразрешимости удается провести с помощью достаточно простой математической техники на основе теоремы Шаудера о неподвижной точке.
§1. Введение
В теории позиционных дифференциальных игр [24, 29, 45, 64] представляет интерес вопрос о свойствах непрерывных стратегий [4,5,9,17]. Этот вопрос хорошо изучен в предположении выпуклости терминального множества. Можно ослабить это предположение до ацикличности (вырожденности групп гомологий) некоторых связанных с задачей объектов, см. [9].
В данной работе рассматриваются три примера дифференциальных игр с невыпуклым терминальным множеством, иллюстрирующие свойства непрерывных стратегий.
Во всех трех случаях игра происходит на плоскости, причем терминальным множеством является окружность с центром в начальной точке, которая совпадает с началом координат. Во всех примерах динамика задается одной и той же системой двух дифференциальных уравнений. Примеры различаются геометрическими ограничениями на управления игроков.
В первой из рассматриваемых игр геометрические ограничения задаются двумя перпендикулярными отрезками равной длины. Во второй игре геометрические ограничения имеют вид отрезка и квадрата. В третьей задаче используются два совпадающих отрезка. Поэтому третий пример фактически является одномерным, и терминальное множество можно считать двухточечным.
Можно непосредственно проверить, что в трех рассматриваемых дифференциальных играх программные управления не позволяют гарантировать уклонение от терминального множества. В работе также указаны способы уклоненияс помощью управления по принципу обратной связи. В первых двух примерах уклонение от терминального множества гарантируется с помощью одного замера фазового вектора, причем соответствующие способы управления задаются разрывными отображениями. Указаны некоторые семейства таких способов управления, зависящие от параметра. Проведена оптимизация по этому параметру. В третьей задаче можно обеспечить уклонение с помощью простой непрерывной стратегии.
В связи с этим возникает вопрос, можно ли в первых двух примерах гарантировать уклонение посредством непрерывных стратегий. Ответ на этот вопрос оказывается отрицательным. Показано, что удовлетворяющие условиям Каратеодори стратегии с отклонением аргумента не могут обеспечить уклонение от терминального множества в первой и второй играх. При этом в доказательстве удалось обойтись без использования понятий и результатов алгебраической топологии. Рассуждения используют лишь очень хорошо известную теорему Шаудера о неподвижной точке, которая применяется в пространстве траекторий системы, снабженном равномерной нормой.
Пусть движение точки описывается уравнением: х = 2(1 - +
1.1) где ж(0) = О,
1.2) £ [0,1], х £ В?. Вектора и иг? - управления двух игроков, причем должны выполняться геометрические ограничения и £ Р и г? € ф.
Терминальное множество М задано на плоскости х = (а^,^) соотношением: х\-\-х\ = 1. Таким образом, М есть окружность единичного радиуса с центром в начале координат. Положим, что функция и(Ь) измерима по Лебегу. Решение должно лежать в классе абсолютно непрерывных функций и удовлетворять дифференциальному уравнению почти всюду, то есть на множестве полной меры. Требуется так выбрать управление г?, чтобы в конечный момент времени гарантировать уклонение от терминального множества, т. е. чтобы выполнялось соотношение х{1) М при любой допустимой помехе и(Ь).
Ниже при использовании стратегий V со свойством непрерывности по фазовому вектору будем просто подставлять эти стратегии в правую часть (1.1) и рассматривать абсолютно непрерывные решения получившегося при такой подстановке дифференциального уравнения.
§2. Задача с перпендикулярными отрезками
Сначала рассмотрим управляемую систему (см. рис. 1) , в которой
Р = {и = (0,и2) : -1 <и2 <!}, {у = (г>1,0) : —1 < г>1 < 1}.
Рис. 1. Управляемая система в задаче с перпендикулярными отрезками
Убедимся в невырожденности задачи. Для этого, с одной стороны, нужно проверить, что программные управления v — vit) не позволяют гарантировать уклонение от терминального множества. С другой стороны, нужно указать обеспечивающий уклонение разрывный способ формирования v. Покажем, что программные управления v = v(t) не гарантируют уклонение от терминального множества М, даже если помеха и выбирается постоянной.
Фактически мы установим несколько большее: с помощью программных управлений нельзя обеспечить уклонение от верхней полуокружности.
Свойство 1.1 Для всякой измеримой функции V\ : [0,1] —> [—1,1] найдется константа щ G [0,1] такая, что соответствующее решение х начальной задачи (1.1), (1.2) при щ = = 0 удовлетворяет условиям х(1) G M, х2{1) > 0
Действительно, положим и2 — и2 Е [0,1] С [—1,1], и имеем т)йт)2. Тогда х2 I
Ж1(1) = j vi (т)с2т, о 1
1) = У 2(1 - т)и2(1т = и2>
0.
Поэтому
1 1 хК 1) + хЦ1) = (IУ\{т)(1т)2 + 1 - (/гл(т)<*т)!
1.
Таким образом, свойство 1.1 проверено.
Укажем способ уклонения, использующий обратную связь. При этом будет достаточно сделать лишь замер величины х2{\)
Свойство 1.2 Выберем некоторое число а Е Пусть управление г>х. строится следующим образом. При 0 < £ < | положим у\ = 1. Для | < £ < 1 возьмем — 1, если |ж2(|)| > а, и положим = —1, если
Тогда для любой измеримой функции и2 : [0,1] —» [—1,1] решение начальной задачи (1.1),(1.2) при и2 — щ = 0 и указанных У\,и2 удовлетворяет условию:
1-л/ж?(1) + ^(1)
1}. (1.3)
Отметим, что левая часть неравенства (1.3) есть расстояние от точки ж(1) до окружности М.
Доказательство. Поскольку |гг2| < 1, имеем х2{1)-х2(-)
1 I
J 2(1 — т)\и2(т)\йт < J 2(1-т)<1т =
В случае, если
1*2^)1 ><*, справедливо неравенство
Кроме того жх(1) = 1, так как в этом случае «1 = 1 при всех t из отрезка [0,1].
Поэтому у^(1) + х\{1) = у! 1 + хЦ1) > + (а - = 1 + (1.4) где - положительная величина, зависящая от а. В случае, ссли
М^)! < справедливо неравенство
N(1)1 < ы±)\ + \х2(1) - Ж2ф| < а +
При этом Ж1(1) = 0, поскольку VI = 1 для Ь Е [0, |) и г>1 = —1 для Ь Е 1]. Таким образом, *!(!) + ^ = (1.5)
Так как а < величина ^ положительна.
Итак, можно обеспечить расстояние до терминального множества не менее тт^, 2:2}, и требуемая оценка (1.3) выполняется.
Замечание 1.1 Если параметр а лежит вне интервала |) и а ф то существует такая кусочно-постоянная функция и2 : [0,1] —» [—1,1] с не более чем одной точкой разрыва, что решение начальной задачи (1.1),(1.2) прии2 = «1 = 0, соответствующее этой функции и2 = «2 СО и описанному в формулировке свойства 1.2 способу формирования удовлетворяет условию х{1) € М. Если же а = то рассматриваемый способ формирования У\ гарантирует выполнение соотношения х(1) ф. М, однако расстояние от я(1) до М может быть сколь угодно малым.
Доказательство. Рассмотрим 3 случая. а) сх < Положим и2 = и2(1) = { 3 " 2
Непосредственным интегрированием из (1.1),(1.2) находим х2{\) = х2(1) = 0. Поскольку Ж2(|) — \ > описанный в формулировке свойства 1.2 способ управления дает = 1 при всех I £ [0,1]. Поэтому £1.(1) = 1. Таким образом, 0^(1) 4-^2(1) = 1, и точка х(1) принадлежит терминальному множеству. б) а > |. Пусть и2 = 1 при всех £ е [0,1]. Тогда х2(^) — |, х2(1) = 1. Поскольку — | < а> исследуемый способ управления дает = 1 при £ £ [0, |) и VI = — 1 при £ € 1]. Получаем £1(1) = 0. Поэтому х\(1) + х\{1) = 1, и снова ж(1) е М. в) а = |. Для достаточно малого е > 0 положим и2 = 1-е при всех ¿ 6 [0,1]. Получаем х2{\) = |(1 — е), х2{1) = 1 — е. Таким образом 1Х2Ш1 = 1(1 — £) < I = а- Поэтому г>1 = 1 при £ е [0, и VI = —1 при £ £= 1]. (Подчеркнем, что здесь существенно используется то, что е отлично от нуля.) Следовательно £1(1) = 0. Поскольку 1 — у/х\(1) + £2(1) = расстояние от точки ж(1) до терминального множества М можно сделать сколь угодно малым положительным числом, взяв подходящее е. Однако это расстояние не может обратиться в нуль. Рассуждая по аналогии с доказательством свойства 1.2, можно показать, что в рассматриваемом случае траектория не может закончиться на терминальном множестве. Это завершает проверку замечания.
Замечание 1.2 Для рассматриваемой дифференциальной игры оценка (1.3) является неулучшаемой. Поэтому правая часть неравенства (1.3) есть гарантированный результат для способа назначения V, приведенного в формулировке свойства 1.2.
Доказательство. Пусть функция и2 задается следующим образом:
М*) =
0 < г < -1, I < ^ < 1
Эта функция удовлетворяет соответствующему геометрическому ограничению.) Тогда ж2(|) = ск, ж2(1) = а — Поэтому = 1 при всех £ е [0,1], а значит Ж].(1) = 1. Таким образом,
1)+^(ц = У
Поэтому достигается второе из выражений под знаком минимума в (1.3). Пусть теперь функция и2 задается следующим образом: ч2(*) =
0 < г < 1, \ < г < 1, где число е > 0 достаточно мало. В этом случае функция х{р) зависит также от величины е. Тогда — а — |е, х2(1) = а 4-1 — §£. Поскольку |ж2(^)| < а, получаем = 1 при £ е [0, и г?1 = — 1 при £ € 1], следовательно ^(1) = 0. Поэтому
1-^(1) + ®1(1) +0. Тогда 1
3 3
- - а + -е.
4 4
Устремим е 3
--а.
Таким образом, можно сколь угодно близко подойти к первому из выражений под знаком минимума в (1.3). Замечание 1.2 доказано.
Свойство 1.3 В способе управления из свойства 1.2 величину гарантированного уклонения от терминального множества молено оптимизировать путем выбора а £ (|)|)- Числу а — | соответствует максимальное значение гарантированного уклонения, равное
Доказательство. Согласно свойству 1.2, рассматриваемый способ управления обеспечивает расстояние до терминального множества М, не меньшее чем minimi, г2}, где zi = z1{a) = yi + (a - - 1, (1.6) 3
22 = 22(а) = - - а. (1.7)
См. также формулы (1.4) и (1.5).) Функции z\ — 21(a) и 22 = 2:2(0;) непрерывны для всех вещественных а. Нетрудно убедиться в существовании и единственности оптимального значения а. Действительно, на интервале | < а < | функция 21(a) строго возрастает, а функция 22(a) строго убывает, причем *(§) = о.
Значит на этом интервале лежит ровно один корень уравнения zi (а) — 22(a) (см. рис. 2). При выполнении последнего равенства функция min{2i,22} аргумента а достигает своего максимума на рассматриваемом интервале. Согласно замечанию 1.2, оценка (1.3) дает гарантированный результат.
Рис. 2. Графики функций ¿1(0:) и 22(0;)
В точке а — \ график л = г^а) касается оси а. Итак, обозначив — Z2, с помощью (1.6),(1.7) составим систему: у1+(«-^)2 =1 + *, (1.8) а + \ (1.9)
Возведем оба равенства в квадрат:
1 + а2 - \а + ^ = 1 + 2г + г2, а2 + \а + ^ =1-2г + г2. Вычитая из первого второе, получим:
1 - а = 4г . (1.10)
Решая систему линейных уравнений (1.9),(1.10), найдем оптимальные значения а = г = Свойство 1.3 доказано.
Покажем, что в рассматриваемой задаче стратегии, обладающие свойством непрерывности по фазовому вектору, не позволяют гарантировать уклонение от терминального множества. При этом будем рассматривать стратегии, содержащие отклонение аргумента и имеющие вид V — а;1(-), а^-))? где (•), а^гС") - непрерывные функции, заданные на всем отрезке [0,1]. (В частности сюда относятся стратегии с памятью.) Кроме того, полагаем, что выполняются условия Каратеодори. Таким образом, выражение v = г>(£, а^-), ЖгО)) непрерывно зависит от функций 2а(")>х2(') £ С0 при почти всяком фиксированном числе t и измеримо в смысле Лебега по t при всяких фиксированных з^-), ^(О
В частности, в этот класс попадают удовлетворяющие условиям Каратеодори позиционные стратегии V — г>(£, ^2), Где х±,Х2~ вещественные числа. Известно, что для таких стратегий абсолютно непрерывное решение начальной задачи может быть неединственным. Считаем, что стратегия гарантирует уклонение, если ни одно из движений, соответствующих этой стратегии и различным допустимым помехам, не оканчивается на терминальном множестве.
Свойство 1.4 Пусть отображение : [0,1] х С0 [—1,1] удовлетворяет условиям Каратеодори. Тогда найдется такая константа и2 £ [0,1], что начальная задача (1.1)-(1.2), где щ — 0, = г>1(£, а^-), а^-)); щ — 0, имеет хотя бы одно решение х, для которого х(1) £ М.
Замечание 1.3 Из неотрицательности щ и вида уравнения (1.1) следуетчто Х2(£) > 0 для всехЬ £ [0,1]. Поэтому удовлетворяющая условиям Каратеодори стратегия не мооюет гарантировать уклонение не только от всего терминального множества М, но и от верхней полуокружности. Аналогично устанавливается невозможность обеспечить этим способом уклонение от ниоюней полуокруэюности.
Докажем свойство 1.4. Требуется показать наличие абсолютно непрерывной функции х : [0,1] —> Я2 и числа и2 Е [0,1], удовлетворяющих соотношениям
1 = (£,£!(•), (1-11)
2 = 2(1-4)^2, (1.12) ж(0) = 0, (1.13) а*(1) + 4(1) = 1. (1.14)
Правая часть дифференциального уравнения по первой координате (1.11) совпадает с рассматриваемой стратегией. Поскольку стратегия содержит отклонение аргумента, уравнение (1.11) является функционально-дифференциальным. Краевое условие (1.14) соответствует требованию ж(1) е М.
Из (1.12),(1.13) видно, что х2(Ь) = и;(ф2, где о;(£) = ¿(2 - £). Подставляя это выражение в (1.14), находим щ = у/1 — ^(1). Исключая переменные Х2,и2 из (1.11)-(1.14), приходим к следующей начальной задаче по первой координате
1.15)
Жх(0) = 0. (1.16)
Заметим, что из-за присутствия в правой части (1.15) величины £1(1) это функционально-дифференциальное уравнение содержит опережение, даже если г>1 является стратегией с памятью или позиционной. Опережение возникло из-за краевого условия (1.14).
Остается установить разрешимость начальной задачи (1.15),(1.16), откуда будет следовать требуемое существование х, и2.
Обозначим через <5 семейство всех функций 2 : [0,1] —> [—1,1], удовлетворяющих условию Липшица с константой 1. По теореме Арцела-Асколи множество 5 есть компакт в банаховом пространстве непрерывных функций. При этом множество S выпукло. Для z(-) £ <S, t G [0,1] рассмотрим следующий нелинейный интегральный оператор t
F(z(-))(t) = J Vi{t,z{-)M-W 0
Всякая неподвижная точка этого оператора является абсолютно непрерывным решением начальной задачи (1.15),(1.16). При любой фиксированной z(-) функция F(z(-))(t) аргумента t удовлетворяет условию Липшица с константой 1, поскольку — 1 < Vi < 1. Кроме того, ,F(2:(-))(0) = 0. Неравенство — ^ — 1 справедливо для всех z{-) £ S, t £ [0,1]. Отображение F переводит выпуклый компакт S в себя. Оно является непрерывным относительно равномерной нормы пространства непрерывных функций. По теореме Шаудера отображение F имеет в множестве S хотя бы одну неподвижную точку. Таким образом, начальная задача (1.15),(1.16) разрешима. Свойство доказано.
1. Айзеке Р. Дифференциальные игры. "Мир", 1967.
2. Алексейчик М.И. Дальнейшая формализация основных элементов антагонистической дифференциальной игры // Мат. анализ и его прил. Ростов Н/Д: Ростов, гос. ун-т., 1975. Т. 7. С. 191-199.
3. Алгоритмы и программы решения линейных дифференциальных игр // Субботин А.И., Пацко B.C. ред. Свердловск: ИММ УНЦ АН СССР, 1984. 295 с.
4. Барабанова H.H., Субботин А.И. О классах стратегий в дифференциальных играх уклонения от встречи // Прикл. математика и механика. 1971. Т. 35. вып. 3. С. 385-392.
5. Барабанова H.H., Субботин А.И. О непрерывных стратегиях уклонения в игровых задачах о встрече движений // Прикл. математика и механика. 1970. Т. 34. вып. 5. С. 796-803.
6. Благодатских В.И., Филиппов А.Ф. Дифференциальные вклдючения и оптимальное управление // Тр. Мат. ин-та им. Стеклова. 1985. Т. 169. С. 194-252.
7. Брыкалов С.А. Две дифференциальные игры с невыпуклыми целевыми множествами // Изв. РАН. Теория и системы управления. 2002. №. 3. С. 94-101.
8. Брыкалов С.А. Конфликтно управляемые системы и дифференциальные включения // Дифференц. уравнения. 2002. Т. 38. № 3. С. 298-304.
9. Брыкалов С.А. Непрерывные стратегии в дифференциальных играх // Дифференц. уравнения. 2002. Т. 38. № 4. С. 453-459.
10. Брыкалов С. А., Латушкин Я. А. О непрерывных стратегиях уклонения от невыпуклого множества в условиях неопределенности // Автоматика и телемеханика № 116 2007, С. 122-134.
11. Брыкалов С.А., Латушкин Я.А. Об одной игровой задаче уклонения от окружности // Теория управления и обобщенные решения уравнений Гамильтона-Якоби (труды международного семинара) Том 1, стр. 197204 Изд-во УрГУ, Екатеринбург, 2006.
12. Дарьин А.Н. Синтез управлений при двойных и неоднородных ограничениях // автореферат диссертации на соискание ученой степени кандидата физ.-мат. наук. 01.01.02 дифференциальные уравнения. МГУ им. М.В. Ломоносова. Москва. 2004 г. 15с.
13. Демьянов В.Ф., Рубинов A.M. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. 432 с.
14. Красовский H.H. Дифференциальные игры. Аппроксимационные и формальные модели // Мат. сб. 1978. Т. 107. № 4. С. 541-571.
15. Красовский H.H. Игровые задачи динамики. I// Изв. АН СССР. Техн. кибернетика. 1969. № 5. С. 3-12.
16. Красовский H.H. Игровые задачи о встрече движений. М.: Наука, 1970. 420 с.
17. Красовский H.H. К задаче унификации дифференциальных игр // Докл. АН СССР. 1976. Т. 226, № 6. С. 1260-1263.
18. Красовский H.H. К теории дифференциальных игр.// Прикл. математика и механика. 1970. Т. 34, вып. 2. С. 197-207.
19. Красовский H.H. Минимаксное поглощение в игре сближения // Прикл. математика и механика. 1971. Т. 35, вып. 6. С. 945-951.
20. Красовский H.H. Унификация дифференциальных игр // Труды Института математики и механики УНЦ АН СССР. Свердловск, 1977. Вып. 24: Игровые задачи управления. С 32-45.
21. Красовский H.H. Управление динамической системой. М.: Наука, 1985.
22. Красовский H.H., Осипов Ю.С. К теории дифференциальных игр с неполной информацией.// Докл. АН СССР. 1974. Т. 215, № 4. С. 780783.
23. Красовский Н. Я. Субботин А.И. Аппроксимация в дифференциальных играх // Прикл. математика и механика. 1973. Т. 37, вып. 2. С. 197204.
24. Красовский Н. Н., Субботин А.И. Дифференциальная игра наведения // Дифференц. уравнения. 1970. Т. 6, № 4. С. 579-591.
25. Красовский Н. Н., Субботин А.И. О структуре дифференциальных игр // Докл. АН СССР. 1969. Т. 190, № 3. С. 523-526.
26. Красовский H. H., Субботин AM. Позиционные дифференциальные игры. M.: Наука, 1974. 456 с.
27. Красовский H. Н., Субботин А.И. Смешанное управление в дифференциальной игре. // Докл. АН СССР. 1969. Т. 188, № 4. С. 745-747.
28. Кряжимский A.B., Осипов Ю.С. Дифференциально-разностная игра сближения с функциональным целевым множеством. // Прикл. математика и механика. 1973. Т. 37, вып. 1. С. 3-13.
29. Куржанский А.Б. Альтернированный интеграл Понтрягина в теории синтеза управлений //Т. Мат. Ин-та им. Стеклова. 1999. Т. 224. С. 234-248.
30. Куржанский A.B. О синтезе управлений по результатам измерений // Прикл. математика и механика.-2004.-Т.68, Вып.4. С.547-563.
31. Латушкин Я. А. О задачах уклонения от невыпуклого множества // Проблемы теоретической и прикладной математики (Труды 36-ой молодежной конференции), Институт математики и механики, стр. 278283, Екатеринбург, 2005.
32. Латушкин Я.А., Брыкалов С.А. Некоторые свойства непрерывных стратегий конфликтного уклонения от иевыпуклого множества // Тезисы международного научного семинара "Устойчивость, управление и моделирование динамических систем стр.53, Екатеринбург, 2006.
33. Никольский М.С. Об альтернированном интеграле JI.C. Понтрягина // Мат. сб. 1981. Т. 116, № 1. С. 136-144.
34. Обен Ж.-П., Экланд И. Прикладной нелинейный анализ. М.: Мир, 1988. 512 с.
35. Осипов Ю.С. Дифференциальные игры для систем с последействием // Доклады АН СССР. 1971. Т. 196. №4. С. 779-782.
36. Панасюк А.П. Уравнения динамики множеств достижимости в задачах оптимизации и управления в условиях неопределенности // Прикл. математика и механика. 1986. Т. 50, Вып. 4. С. 531-543.
37. Понтрягин Л.С. О линейных дифференциальных играх. I // Докл. АН СССР, 1967. Т. 174, № 6. С. 1278-1280.
38. Понтрягин Л.С. О линейных дифференциальных играх. II // Докл. АН СССР, 1967. Т. 175, № 4. С. 764-766.
39. Пшеничный Б.Н. Структура дифференциальных игр // Докл. АН СССР. 1969. Т. 84, № 2. С 285-287.
40. Субботин АЖ. Минимаксные неравенства и уравнения Гамильтона — Якоби. М.:Наука, 1991. 216 с.
41. Субботин АЖ. Обобщение основного уравнения теории дифференциальных игр // Доклады АН СССР. 1980. Т. 254, №2. С. 293-297.
42. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления // М.: Наука, 1981. 288 с.
43. Субботина H.H., Субботин А.И. Игровая задача управления при неполной информации // Изв. АН СССР. Техн. кибернетика. 1977, № 5. С. 1423.
44. Тарасьев A.M., Ушаков В.Н. Алгоритмы построения стабильного моста в линейной задаче сближения с выпуклой целью / / Исслед. задач минимаксного упр. Свердловск: ИММ УНЦ АН СССР, 1985. С. 82-90.
45. Тарасьев A.M., Ушаков В.Н. О построении стабильных мостов в минимаксной игре сближения-уклонения. Свердловск, 1983. 61 с. Деп. в ВИНИТИ. № 2454-83.
46. Тарасьев A.M., Ушаков В.Н., Хрипунов А.П. Об одном вычислительном алгоритме решения игровых задач управления// Прикл. математика и механика. 1987. Т. 51, вып. 2. С. 216-222.
47. Ушаков В.Н. К вопросу стабильности в дифференциальных играх // Позиционное упр. с гарантированным результатом / УрО АН СССР. Свердловск, 1988. С. 101-109.
48. Ушаков В.Н. К задаче построения стабильных мостов в дифференциальной игре сближения—уклонения // Изв. АН СССР. Техн. кибернетика. 1980, № 4. С. 29-36.
49. Ушаков В.Н. Процедуры построения стабильных мое тов в дифференциальных играх.: Дис. д-ра физ.-мат. наук: 01.01.02. Свердловск, 1991. 308 с. / Ин-т математики и механики УрО АН СССР.
50. Ушаков В.Н.,Брыкалов С.А., Латушкин Я.А. Дефект стабильности множеств в дифференциальных играх /Институт математики и механики Уральского отделения РАН. Екатеринбург, 2007. - 30 е., pul, библ. 26. - Рус. - Деп. в ВИНИТИ 18.09.2007, № 881-В2007.
51. Ушаков В.Н., Врыкалов С.А., Латушкин Я.А. Использование дефекта стабильности для формирования управления в дифференциальной игре // Вестник Удмуртского Университета. Ижевск, Вып.2, 2008, С.155-162.
52. Ушаков В.Н., Латушкин Я.А. Дефект стабильности множеств в игровых задачах управления // Труды Института математики и механики УрО РАН, Екатеринбург, 2006, том 12 №2, с. 178-194.
53. Ушаков В.Н., Латушкин Я.А. Критерии совпадения максимальных стабильных мостов в двух игровых задачах о сближении // Труды математического института им. В.А. Стеклова, 2008, Т. 262, С. 253-271.
54. Ушаков В.Н., Латушкин Я.А. Критерии совпадения стабильных мостов в двух задачах о сближении //Сб. тезисов международной конференции "Дифференциальные уравнения и смежные вопросы"им. И.Г. Петровского, Москва, 2007, С. 325.
55. Ушаков В.Н., Латушкин Я.А., Лебедев П. Д. "Критерии совпадения двух стабильных мостов в двух задачах о сближении" // Тезисы докладов Международной конференции "Дифференциальные уравнения и топология". МГУ им. Ломоносова, С. 411-412. Москва, 2008.
56. Ушаков В.Н., Хрипунов А.П. О приближенном построении решений в игровых задачах управления // Прикл. математика и механика.-1997.-Т.61, №.3. С.413-421.
57. Хрипунов А.П. Построение областей достижимости и стабильных мостов в нелинейных задачах управления.: Дис. к-та физ.-мат. наук: 01.01.02. Екатеринбург, 1992. 140с. / Ин-т математики и механики УрО РАН.
58. Ченцов А.Г. Об игровой задаче сближения в заданный момент времени // Мат. сб. 1976. Т. 99, № 3. С. 394-420.
59. Ченцов А. Г. Итерационная программная конструкция для дифференциальной игры с фиксированным моментом окончания // Докл. АН СССР. 1978. Т. 240, № 1. С. 796-800.
60. Guseinov E.G., Subbotin A.I., and Ushakov V.N Derivatives for Multivalued Mappings with Applications to Game-Theoretical Problems of Control // Problems Control Inform. Theory. 1985. Vol 14, no 6. P. 405-419.
61. Krasovskii N.N., Subbotin A.I. Game-theoretical control problems. New York: Springer-Verlag, 1987.
62. Subbotin A.I. Generalized Solutions of First-Order PDEs. The Dynamical Optimization Perspective. Boston: Birkhauser. 1995. 312 P. (System & Control: Foundation & Appl.)
63. Ushakov V.N., Brykalov S.A., Latushkin Y.A. Stable and unstable sets in problems of conflict control. Functional Differential Equations. 2008. V.15. No.3-4. PP.309-338.
64. Vladimir N. Ushakov, Sergey A. Brykalov, Yaroslav A. Latushkin The Notion of Stability Defect in Game Control Problems // Proceedings of the 11th WSEAS International Conference on Applied Mathematics, Dallas, USA, 2007, PP. 86-91.