Оптимизация параметров и достаточные условия в конфликтно управляемых процессах уклонения тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Югай, Лев Павлович АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1996 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Автореферат по математике на тему «Оптимизация параметров и достаточные условия в конфликтно управляемых процессах уклонения»
 
Автореферат диссертации на тему "Оптимизация параметров и достаточные условия в конфликтно управляемых процессах уклонения"

I \\ ФЕВ 1ПР7

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М.В. ЛОМОНОСОВА

Факультет вычислительной математики и кибернетики

На правах рукописи ЮГАЙ Лев Павлович

УДК 517.9

ОПТИМИЗАЦИЯ ПАРАМЕТРОВ И ДОСТАТОЧНЫЕ УСЛОВИЯ В КОНФЛИКТНО УПРАВЛЯЕМЫХ ПРОЦЕССАХ УКЛОНЕНИЯ

01.01.02 - дифференциальные уравнения

Автореферат диссертации на соискание ученой степени доктора фиоико-математических наук

Москва - 1996

Работа выполнена на кафедре высшей математики и информатики Ташкентского государственного института востоковедения Республики Узбекистан.

Официальные оппоненты: академик РАН Ф.Л. Черноусько,

доктор фиоико-математичесхих наук, профессор В.В. Дикусар, доктор фжшко-математигтесхих наук, профессор М.С. Никольский.

Ведущая организация: Московский Фиэико-Технический Институт.

Защита состоится.1997 года в час мин. на заседании Диссертационного совета Д.053.05.37 в Московском государственном университете имени М.В. Ломоносова по адресу:

119899, Москва, Воробьевы горы, МГУ, факультет вычислительной математики и кибернетики, аудитория 685.

С диссертацией можно ознакомится в библиотеке факультета вычислительной математики и кибернетики МГУ.

Автореферат разослан "........ ".......................... 1997г.

Ученый секретарь

Диссертационного совета, профессор

Е.И. Моисеев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Объектом исследования реферируемой диссертационной работы является задача уклонения траектории в теории конфликтно управляемых процессов.

Актуальность темы. Теория конфликтно управляемых процессов представляет собой интенсивно раовивающпйся раздел современной математики. В отой теории исследуются задачи управления динамическими процессами в условиях конфликта, который предполагает наличие двух или более сторон, способных воодействовать на процесс с противоположными или несовпадающими целями и оптимизировать ааданные функционалы качества процесса. Динамические процессы могут описываться дифференциальными, интегральными, разностными, гибридными и др. уравнениями. Конфликтно управляемые процессы, описываемые обыкновенными дифференциальными уравнениями, называют также дифференциальными играми1, термин был введен Р. Айзексом - одним из основоположников теории дифференциальных игр .

Теория конфликтно управляемых процессов имеет в своем основании общую теорию игр, математическую теорию управления и теорию дифференциальных уравнений.

Перейдем к краткому изложению проблематики теории конфликтно управляемых процессов.

Фундаментальными результатами математической теории управления являются принцип максимума Л.С. Понтрягина 2 и метод динамического программирования Р. Бедлмана1 , которые оказали огромное влияние на развитие теории конфликтно управляемых процессов.

В начале 50-х годов Р. Айзеке применил метод динамического программирования к исследованию игровых оадач преследования и убегания. Полученное им уравнение с частными производными первого

1 Айзеке Р. Дифференциальные игры. - М.: Мир, 1967. - 480 с.

1 Понтрягин Л.О., Болтянский В.Г., Гамкрелидое Р.В., Мищенхо Е.Ф. Матема-

тическая теория оптимальных процессов. - М.: Наука, 1983. - 392 с.

порядка (основное уравнение Айоекса-Бешшана) содержит в качестве решения функцию цены игры (оптимальное значение функционала качества). Метод Айоекса лоовопил выделить характерные особенности, присущие задачам теории конфликтно управляемых процессов ((экстремальные стратегии, информированность игроков, поверхности переключения, барьеры и т.д.). Им рассмотрен ряд важных прикладных оадач и получены интересные реоультаты. Однако метод Айоекса не был до конца строго обоснованным, что потребовало его дальнейшего исследования. Новым импульсом развития метода Айоекса послужили результаты3 по исследованию уравнения Г&мильтона-Якоби. На их основе уравнение Айоекса-Беллмана (заменялось парой дифференциальных неравенств и было доказано, что каждое решение обоих неравенств (минимаксное или "вязкое" решение) совпадает с функцией цены некоторой дифференциальной игры. Поскольку класс минимаксных решений шире класса возможных решений уравнения Агозекса-Беллмана, то метод Айоекса был значительно усилен и, вместе с тем, стал более строго обоснованным. Отметим еще работу Л.С. Понтрягина4, в которой метод Айоекса был обобщен на более широкие классы игр. Реоультаты втой работы основаны на принципе максимума Л.С. Понтрягина.

На основе принципа максимума H.H. Красовским в конце 60-х годов был разработан эффективный метод «экстремального прицеливания для решения линейных игровых оадач сближения-уклонения. Другие приложения принципа максимума Л.С. Понтрягина к исследованию конфликтно управляемых процессов даны в монографиях Гаврилова В.М., Пацюкова В.П., Пропоя А.И и др.

Применение основных результатов теории оптимального управления к игровым оадачам не решило всех проблем теории конфликтно

3 Субботин А.И. Минимаксные неравенств» и уравнение Гамильтона-Яхоби. -М.: Науха, 1991. - 216 с.

1 Понтрягнн Л.С. К теории дифференциальных игр. УМН, - 1966, т. 21, вып. 4. - С. 219 - 274.

управляемых процессов. Оставался открытым вопрос строгой формализации понятия игры (конфликтно управляемого процесса), т.е. вопрос о том, что понимать под движением (траекторией) динамической системы, какие способы формирования стратегий (управлении) и какая информированность допустимы для игроков.

В решении проблемы строгого обоснования гзадач теории конфликтно управляемых процессов фундаментальные результаты принадлежат советским и постсоветским ученым.

Позиционный подход при принятиии решении в условиях конфликта был предложен H.H. Красовским5'8'7.

Этот подход, основанный на формировании оаконов управления с обратной свяоью, пооволил ему, А.й. Субботину7»8 , A.B. Куржан-скому9, Ю.С. Осипову10 /А.Г. Ченцову8 и их сотрудникам дать строгую постановку оадач теории конфликтно управляемых процессов, изучить их структуру и выдвинуть основополагающий принцип построения разрешающих стратегий - принцип экстремального прицеливания.

В классах совместимых пар стратегий в единой (позиционной) схеме рассматривается дифференциальная игра сближения - уклонения, для которой доказаны фундаментальные теоремы об альтернативе: для каждой начальной позиции разрешима либо задача о сближении, либо задача об уклонении. Решение игровой задачи сводится к последовательному выбору екстремальных управлений, сохраняющих траекто-

s Красовсгии H.H. Игровые вадочи о встречи движений. - М.: Наука, 1970. - 420

с.

* Красовсгии H.H. Управление динамичесхои системой. Задача о минимуме гарантированного результата. - М.: Наука, 1985. - 520 с.

7 Красовсгии H.H., Субботин А.И. Позиционные дифференциальные игры. -М.: Наука, 1974. - 456 с.

* Суббатни А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. -

М.: Наука, 1981. - 288 с.

8 Куржансхии A.B. Управление и наблюдение в условиях неопределенности. -М.:

Наука, 1977. - 392 с.

ш Осипов Ю.С. К теории дифференциальных игр с распределенными параме-

трами. ДАН СССР. - 1975. - Т. 223, N 6. - С. 1314 - 1317.

рию конфликтно управляемого процесса на стабильном мосту (специальном множестве позиций) и приводящих траекторию по нему на терминальное (целевое) множество.

Теоремы об альтернативе позволяют рассматривать каждую ш задач сближения или уклонения как критерии разрешимости противоположной задачи.

Теорию позиционных дифференциальных игр значительно развили и развивают представители свердловской шкоды : Э.Г. Альбрехт, В.А. Байдосов, В.Д. Батухтин, Ю.И. Бердышев, Н.Д. Боткин, В.А. Вяо-гин, М.С. ГЬбриэлян, М.И. Гусев, В.Г. ГУсейнов, В.й. Жуковский, С.Т. Завалищин, М.А. Зарх, В.М. Кеин, А.Ф. Клейменов, А.Н. Кра--совсхий, A.B. Кряжимский, C.B. Лутманов, В.И. Максимов, О.Н. Никонов, С.П. Охеоин, В.Е. Пак, B.C. Падко, А.Б. Пашаев, Ю.М. Репин, В.М. Решетов, В.П. Серов, А.Н. Сесекин, A.M. Тарасьев, С.И. Тарлинский, В.Е. Третьяков, В.Л. ТУрова, В.И. Ухоботов, С.Д. Филиппов, Т.Ф. Филиппова, А.Ю. Хапалов, А.Ф. Шориков и др.

В работах втой школы большое внимание уделено вопросам практической реализации процедур управления и численного решения прикладных оадач теории дифференциальных игр (см. напр.11).

Начиная с работ Л.С. Понтрягина и Е.Ф. Мшценко12'13 началась систематическая разработка другого подхода к задачам теории конфликтно управляемых процессов, когда на первый план выдвигается один но игроков, имеющий возможность строить свое управление (стратегию) на основе определенной информационной дискриминации игрока - противника. В этом случае возникают две отдельные задачи: задача преследования и задача убегания (уклонения траекторий). При таком

11 Алгоритмы и программы решения линейных дифференциальных игр (Материалы по матобеспечению ЭВМ). / Под. ред. А.И. Субботина и B.C. Пацко. -Свердловск, УНЦ АН СССР, 1984. - 295с.

" Понтрягин Л.С., Мшценхо Е.Ф. Задала убегания одного управляемого объекта от друтого. ДАН СССР. - 1969, т. 189, N 4. - С. 721 - 723.

19 Понтрягин Л.С. Лннеиная дифференциальная игра убегания. Т^з. Матеы. ин-та АН СССР им. В.А. Стеклова. - 1971, т. 112. - С. 30 - 60.

подходе не возникает трудностей с формализацией основных объектов конфликтного процесса (решение (траектория), стратегии, степень информированности игроков и др.), поэтому получаются эффективные решения многих оадач. К достижениям понтрягинской школы по теории конфликтно управляемых процессов следует отнести:

- разработанные методы решения оадач преследования14'15'16'17'18 ;

- глубокое изучение структуры дифференциальных игр (операторная теория)19'20'21 ;

- эффективные достаточные условия уклонения траекторий19'22'23. Значительные реоупьтаты в этом направлении были достигнуты

также в работах Р.В. ГЬмкрелидое, А.Я. Авимова, A.B. Арутюнова, Д. Зонневенда, В.Л. Зака, М.И. Зеликина, H.A. Зенкевича, Р.ГГ. Иванова, А.К. Керимова, Д.Л. Келенджеридое, В.й. Коробова, В.Б. Крамаровского, В.Н. Лагунова, Ю.С. Ледяева, A.B. Мезенцева, А.Г. Пашкова, Г.К. Пожарицкого, П.В. Прокоповича, И.С. Раппопорта, М.М. Сагайдак, Н.Т. Тынянского, А. Фазыяова, Г.Л. Харатишвили, Г.Ц. Чикрий и др.

Во всех постановках (формализациях) одним го основных вопро-

14 Понтрягш! Л.С. Иобранные научные труды. - Т. 2. (с. 342-349). - М.: Наука, 1988. - 576 с.

" Чикрии A.A. Конфликтно управляемые процессы. - Кнев:НД, 1992. - 384 с. 14 Черноусмо Ф.Л., Меликян A.A. Игровые оадачи пояска и управления. - М.: Наука, 1978. - 272с.

17 Григореню Н.Л. Математические методы управления несколькими динамическими процессами. - М., МГУ, 1990. - 198 с. 11 Петросян Л.А, Дифференциальные игры преследования. - ЛГУ, 1977. - 224с. 19 Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. - Киев: НД, 1992.

- 261 с.

30 Гуслтннгов П.Б. ТЪория дифференциальных игр. - М.: МФТИ, 1982. - 99 с.

31 Аоамов А. О втором методе Понтрягина в линейных дифференциальных играх

преследования. Мат. сборник. - 1982. - Т. 118, N 3. - С. 422 - 430.

33 Мищенко Е.Ф., Никольский М.С., С&тимов Н. Задача уклонения от встречи в дифференциальных играх многих лиц. МИАН им. В.А. Стеклова. - 1977, т. 143.

- С. 105 - 128.

м Сатимов Н., Рихсиев Б.Б. О кваоилинеиных дифференциальных играх убегания. Диф. уравнения. - 1978. - Т. 14, N 6. - С. 1046-1052.

сов при решении задач преследования (сближения) является вопрос об оптимальности времени завершения игры (преследования). Практически для каждого метода преследования важным параметром (критерием) его оценки является оптимальность времени завершения преследования. Значительные результаты по исследованию оптимальности времени преследования получены в работах5'17-20'24'25.

В задачах уклонения на бесконечном интервале времени этот параметр отсутствует. Поэтому возникает задача выявления и оптимизации существенных параметров, являющихся количественными характеристиками процесса уклонения траекторий.

Далее, еще не завершен процесс получения новых эффективных достаточных условий уклонения траекторий с цепью охвата наиболее широких классов конфликтно управляемых процессов и приближения этих условий к необходимым.

Данная диссертация посвящена исследованию проблемы оптимизации параметров в задачах уклонения и получению новых достаточных условий уклонения траектории нелинейных конфликтно управляемых процессов.

Актуальность выбранной тематики диссертационной работы объясняется требованиями внутреннего развития теории конфликтно управляемых процессов и возрастающими потребностями практического приложения этой теории к задачам, возникающим в экономиках переходного периода, гражданской и военной авиации, промышленности, экологии и других конкретных областях человеческой деятельности.

Целью работы является изучение проблемы оптимизации параметров уклонения, получение эффективных достаточных условий оптимальности параметров уклонения в нелинейных конфликтно управляе-

и ГУсятников П.Б., Нвхольсквк М.С. Об оптимальности времени преследования. ДАН СССР. - 1969. - Т. 184, N3.-0. 518 - Б21.

ш Половингин Б.С. Стабильность терминального множества и оптимальность времени преследования в дифференциальных играх. Диф. уравнения. - 1984. - Т.

20, N3.- 0. 433-446.

мых процессах, ухапание алгоритмов их определения, расширение кдас-сов нелинейных конфликтно управляемых динамических систем, для которых разрешима глобальная задача уклонения траекторий.

Научная новизна реоультатов. Иа защиту выносятся следующие основные результаты диссертационной работы.

1. Поставлена проблема оптимизации параметров в задачах уклонения траекторий от (заданного множества и получено ее решение для квазилинейных конфликтно управляемых процессов.

2. Решена задача нахождения локально-оптимальных параметров уклонения в нелинейных конфликтно управляемых процессах. Получены достаточные условия существования и указаны алгоритмы определения локально-оптимальных параметров уклонения.

3. Выяснен вопрос о связи двух основных методов уклонения траекторий в конфликтно управляемых процессах: маневра обхода JI.C. Понтрягина и уклонения по направлениям. Обобщена на многомерный случай лемма JI.C. Понтрягина о маневре обхода и улучшены оценки снизу для расстояний до терминального множества.

4. Получены новые достаточные условия уклонения траекторий нелинейных конфликтно управляемых процессов, расширяющие известные результаты Б.Н. Пшеничного, A.A. ЧикрияиВ.В. Остапенко.

5. Разработаны эффективные способы уклонения траекторий в случае отсутствия геометрического преимущества уклоняющегося игрока над преследующим.

6. Решена задача уклонения траектории нелинейных конфликтно управляемых систем от дискретного терминального множества при геометрических и интегральных ограничениях на управления.

Теоретическая и практическая значимость. Полученные в диссертации результаты имеют теоретическую направленность. Ин-

тересными дня практики являются конструктивность методов оптимизации параметров уклонения, возможность их численного расчета и использования при построении разрешающих стратегий в прикладных задачах теории конфликтно управляемых систем. Примеры, иллюстрирующие преимущества полученных достаточных условий уклонения траекторий, могут быть включены в программы учебных курсов и пособий по теории конфликтно управляемых процессов.

Апробация. Приведем перечень мероприятий (конференций, симпозиумов и др.), на которых докладывались результаты диссертации: VIII Всесоюзная конференция "Проблемы теоретической кибернетики", ГЪрький, 1988; IV Международная конференция по дифференциальным уравнениям КДУ-IV, Русе (Болгария), 1989; III Вс. школа "Понтря-гинские чтения. Оптимальное управление. Геометрия и анализ." Кемерово, 1990; XI Вс. конференция "Проблемы теоретической кибернетики", Волгоград, 1990; Вс. конференция "Дифференциальные уравнения и оптимальное управление". Ашхабад, 1990; Вс. школа-семинар "Моделирование и исследование устойчивости физических процессов", Киев, 1991; КДУ-VIII, СНГ - конференция "Качественная теория дифференциальных уравнений", Самарканд, 1992; 3-rd Crimean Math. School-Symposium (CFMS - III), Simferopol, Ukraine, 1993; Международная школа-семинар "Моделирование и исследование устойчивости систем", Киев, 1993; Intern. Symposium MTNS'93 , Regensburg, Germany, 1993; The 3-rd Int. Workshop "Multiple Criteria Problems under Uncertainty", Orekhovo-Zuevo, Russia, 1994; The 3-rd Int. Congress on Industrial and Applied Math. ICIAM-95, Hamburg, Germany, 1995; Международный симпозиум по наукам и технологиям, Сеул, Корея, 1996; I съезд математиков Казахстана, Шымкент, 1996; Intern, conf. on some topics in math., Samarkand, 1996; Int. conf. in honour of 50-th anniversary of Korean Math. Society, Seoul, Korea, 1996.

Результаты диссертации докладывались и обсуждались на следующих научных семинарах:

- семинар по теории оптимального управления и дифференциаль-

ным играм. Ташкент, ТашГУ, 1988 - 1996. Н. рук., чл.-корр. АН РУо, проф. Н.Ю. Сатимов;

- семинары кафедр системного аналиоа (н. рук. акад. А.Б. Куржан-ский) и оптимального управления (н. рук. акад. Ю.С. Осипов, проф. М.С. Никольский, проф. Н.Л. Г^игоренко) факультета ВМК МГУ, 1994, 1996 ;

- семинар отдела оптимизации управлемых процессов ИК им. В.М. Гпушкова HAH Украины, 1994, 1996. Н. рук. проф. A.A. Чикрий;

- семинар по дифференциальным играм, Фуданьский университет, Шанхай, Китай, 1992. Н. рук. проф. Li Xunjing, проф. Yong J. ;

- семинар по дифференциальным играм. Технический университет г. Мюнхена, Германия, 1996. Н. рук. проф. R. Bulirsch;

- семинар по исследованию операций и эконометрике Технического университета г. Вепа, Австрия, 1996. Н. рук. проф. G. Feichtinger ;

Публикация. По теме диссертации опубликованы 33 работы. Основные результаты диссертации содержатся в работах автора }1 - XVI].

Структура работы: диссертация состоит из введения, четырех глав, приложения и списка литературы из 260 наименований. Объем диссертации составляет 227 страниц компьютерного текста.

Благодарности. Выражаю глубокую благодарность чл.-корр. АН РУо, проф. Н.Ю. Сатимову и проф. П.В. Гусятникову за постоянное внимание и полетные советы, которые были использованы при выполнении диссертационной работы.

Глубоко признателен академику РАН А.Б. Куржанскому за всемерную помощь и поддержку в период оформления диссертации.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении излагаются фундаментальные достижения теории конфликтно управляемых процессов, дан обзор работ по проблематике теории, обсуждается актуальность темы диссертации, определяется ее цель и значимость, приводится краткое содержание по главам и дана информация о публикациях, апробации и структуре диссертации.

Первая глава состоит из пяти параграфов и посвящена постановке и изучению проблемы оптимизации параметров в глобальной задаче уклонения траекторий квазилинейных конфликтно управляемых процессов.

В § 1.1 дается постановка глобальной задачи уклонения траекторий и указаны классы стратегий, разрешающих эту задачу.

Рассматривается конфликтно управляемый вектор г, движение которого описывается системой дифференциальных уравнений

¿ = д(*,г,и,и), (1)

где г е Дя;и,и - управляющие параметры, и е Р с е <3 с БЯ\Р и <3 - непустые компакты и < > г0 - время. В Д" задано непустое целевое (терминальное) множество М. Функция <;(•) удовлетворяет стандартным условиям существования, единственности и продолжаемости на [О, +оо) решений задачи Коти для (1).

Параметры и и V выбираются двумя сторонами (соответственно преследующим и уклоняющимся игроками) в виде измеримых функций и = и(<) е — £<?,<> *о> Для воздействия на вектор г и достижения противоположных или несовпадающих цепей, определяемых заданными функционалами качества.

Будем говорить, что перечисленными выше данными описан нелинейный конфликтно управляемый процесс (1), который будем называть квазилинейным, если в Сг + /(и,и), где /(•) -

непрерывная функция, С - постоянная (п х п) - матрица.

Глобальная оадача уклонения траекторий в постановке Л.С. Понтрягина и Е.Ф. Мшценко формулируется следующим образом12 :

В заданных классах стратегий игроков найти условия на параметры конфликтно управляемого процесса (1), при которых для всех I > Ц возможно уклонение от М каждой траектории г(1) процесса (1), начинающейся в момент £0 из начальной позиции г0 М. При этом требуется укапать способ формирования управления (его мы будем называть стратегией), обеспечивающего уклонение и, по возможности,

оценить снгоу расстояние от z(t) до терминального множества М.

Конфликтно управляемые процессы, для которых будет исследовала глобальная задача уклонения траектории, будем называть конфликтно управляемыми процессами уклонения.

Процесс уклонения начинается при t = t0 ив начальной позиции z0 е Rn \ М. Уклоняющийся игрок в каждый момент t, используя доступную ему информацию, стремится выбрать v = v(t) е Q таким образом, чтобы для траектории z(t),z(tü) = z0 , уравнения (1) выполнялось соотношение z{t) g М для всех t > t0 при любых мыслимых и совместимых8 противодействиях преследователя. Характерной особенностью конфликтно управляемого процесса уклонения является незнание уклонящимся игроком будущего поведения противника12, т.е. в каждый момент t > t0 уклоняющемуся неизвестны и = u(s) е Р при s>t.

Опишем классы стратегий, применяемые в теории конфликтно управляемых процессов уклонения.

Программной стратегией или программным управлением уклонения будем называть любую измеримую функцию v(t) е Q.

Бели в ходе процесса уклоняющийся игрок формирует мгновенные значения v(f) только на основе реализовавшейся позиции z(t) и известных до игры параметров процесса, то говорят, что уклоняющийся игрок использует7 пооиционные стратегии.

Назовем предысторией управления преследователя в момент t,t > to, функцию

ut(-) = (u(s): u(a) 6 P, л € [<о,- измерима}.

Будем говорить, что задана кваопстратегия уклоняющегося игрока, если определено измеримое отображение v(t) = V(t,za,ut(-)),t > tQ, со значениями из области управления Q. При втом должно быть выполнено условие "физической осуществимости "8 : если и*() € U, u2(-) е U и u!(i) = u2(i) почти всюду для t > t0, то соответствующие им при отображении V(t, z0, ut(-)) функции vl(t), v\t) также равны друг другу. Условие "физической осуществимости" (в общей теории систем его на-

оывают еще "условием причинности") укалывает, обраоно говоря, что "одинаковые причины" порождают одно и то же следствие.

Частным случаем кваоистратегии являются стробоскопические стратегии , которые определяют7»15 контруправления. Для их формального определения достаточно воять в определении кваоистратегии вместо отображения V(t,Zo,iii(•)) отображение V(t,Zo,u(t)) , т.е. контруправление уклоняющегося игрока строится на основании информации о начальной позиции z0 и мгновенного значения управления преследователя.

Если уклоняющийся игрок применяет функции вида и = v(t,z,u) , то говорят7 об использовании им контрстратегии . В этом случае уклоняющийся игрок формирует в каждый момент t > íQ свое измеримое управление на основе информации о реализовавшейся позиции z(t) и значения u(f) управления преследователя в тот же момент.

Определим классы стратегий по разбиению, используемые в диссертации при решении глобальной задачи уклонения траекторий.

Пусть Д = {г,- : а = го < Ti < ... < tv = b} - разбиение отрезка [a,6],i/ > 0 - целое число, А; = {t¡ е A, j =0,1,...,»'},г[Д;] = (z(to),z(ti), ...,z(r,)), где z(t) - некоторая функция, определенная на отрезке (а, 6].

Будем говорить, что в конфликтно управляемом процессе (1) задана £ - контр стратегия уклонения по pao биению из класса , если для каждого z € Rn найдутся:

а) функция e(z) : й" fí\e(z) > 0,

б) разбиение A(z) = {r¿, » = 0,1,..., v(z)} отрезка [í0, t0 +

в) система функций

= {V¿(z[A;],r,u) : Rn*P+1) x ñ1 x P Q,i = 0,1/(2)-l} такая, что для каждого i = 0,l,...,j/(z) - 1, функция V¿(z[A,],r,u) является измеримой по г € [г,-,г,+1] и борелевской по и е Р функцией.

Если = V¡(«[A¡],r), то будем говорить об е - пооици-

оиной стратегии уклонения по раобиению из класса V£p, . В ряде работ такую стратегию называют кусочно-программной.

Если функции V¡(z[A¡],r,u) = то соответствующие страте-

гии уклонения называются33 е -стратегиями по разбиению уклоняющегося игрока. Класс таких стратегий обозначим V£fp..

Напомним, что два класса стратегий соответственно преследующего и уклоняющегося игроков совместны8 (совместимы), если любая пара стратегий (по одной го каждого класса) порождает для всех начальных состояний, по крайней мере, одну траекторию уравнения (1), определенную на бесконечном интервале.

Опишем действия уклоняющегося игрока согласно е - контрстратегии уклонения по разбиению ив класса Vfcrp , совместимой со стратегиями преследующего игрока.

Пусть в момент tQ конфликтно управляемый процесс (1) начинается из позиции zq € Rn\ M. Согласно выбранной стратегии уклоняющийся игрок применяет на интервале [t0,Tj) управление v(t) = VÓ(z[A0M,u(0)-

В паре с некоторым допустимым управлением (стратегией) преследователя оно дает решение z(t) системы (1) с начальным условием г(£0) = za, определенное при t е [í0, rj). В момент гь когда решение системы (1) оказывается в положении = zfa), уклоняющийся игрок производит смену управления, полагая согласно выбранной стратегии но V£p.

v(í) = ВДД!],*,^)) s Vi(z(zot*i),iMQ)> t б 1гьгз)-

Описанную последовательность действий уклоняющийся игрок повторяет [*о»<о+е(го)] v{zo) pao- Далее процесс ухлонения организуется индуктивно согласно тройке (e(zo),A(5o)> гДе ^о = z(i0 + e(¿r0)).

Отметим, что в диссертации разбиение отрезков при построении стратегий уклонения траекторий может быть задано заранее либо строится индуктивно в процессе уклонения.

Стратегии , обеспечивающие решение глобальной задачи уклонения траектории, будем называть разрешающими стратегиями.

и Чижрин A.A., Губарев Е.В. Достаточные условия раореюжмости глобальной аадачи убегания для нелинейных дифференциальных игр. / Препринт 92-22. - Киев: ИК им. В.М. Глушюва, 1992. - 38 с.

В S 1.2 для квазилинейного конфликтно управляемого процесса

¿ = GZ + /(u,D) (2)

исследуется структура ортогонального дополнения L к терминальному множеству М, которое предполагается подпространством Rn.

Обозначим через JV+ множество целых положительных чисел, п(и>) : йп -» ш - ортопроектор ив R* на подпространство о>,о> с Ь, Lin А -несущее подпространство множества А с ЙЛ, {а} - множество, состоящее из вектора а е йа, А + 5 - алгебраическая сумма множеств А и В из Ä", G{A) множество всех подпространств ш с А(А с Ь), наделенное метрикой раствора 0( ) :

max{ sup d(x,ui), sup d(x,LJ2)}, xes(ui) xes(wj)

где £ A,d(a,ai,) = inf | x - y |,t = 1,2. Для удобства полагаем

yCw

Oe/(P,Q).

Определение 1.2.1.

T-S5r(w)C если TUii,{OhieN+.

Основные результаты 51.2 сформулированы в следующих леммах. Лемма 1.2.4 (о расщеплении ортогонального дополнения). Пусть в квазилинейном конфликтно управляемом процессе (2) терминальное множество M является подпространством и M + L = Rn. Тогда найдутся взаимно ортогональные подпространства L; с L,i — 1,2,...,« +1, такие, что

а) L-£1 + Lj+...+ Lf + I,w, (3)

б) k(L) = k(Zi) < k(l2) < ... < k(Lt), k(Lt+1) = 0,

в) для каждого ненулевого подпространства tj с = 1,2,...,а, выполняется равенство к(и>) = к(Ц).

Лемма 1.2.5 (о единственности расщепления L). Для квазилинейного конфликтно управляемого процесса (2) расщепление (3) ортогонального дополнения удовлетворяющего свойствам б) и в) леммы 1.2.4 является единственным.

Лемма 1.2.6 (о структуре ортогонального дополнения L ). Пусть для конфликтно управляемого процесса (2) подпространства Li с L, i е J = {1,2,...,5}, удовлетворяют условиям:

1) Lx = LinTT._uk(p._^, Г,_1 = £.; -f-Г,-, ieJ, Г0 = Ь,

2) 1 < ¿(Li) < k(L2) < ... < k(Lt), к(Т,) = 0.

Тогда для каждого ненулевого подпространства w с L такого, что ш с Г,_!, со (Z Г,-, > б J , выполняется равенство fc(a>) = A;(L,). Следствие 1.2.1. Функция к{ы),ш е G(L), имеет вид:

Л,-, если w с i Г;,» е J,

fc(w) = -fci+1, есиишсГ;,ге/\{8}, . 0, если ыеГж.

и является разрывной функцией.

В § 1.3 вводятся функции преимущества, исполызуемые в конфликтно управляемых процессах, методах оптимизации и отличающиеся от известных. Исследуются их экстремальные свойства. Наряду с обозначениями §1.2 введем следующие: S(u>) и B{d,Lj) соответственно единичная сфера и шар радиуса d > Q подпространства и> с Rn(u> f' {0}) с центром в начале Дп, < а, 6 > -скалярное произведение векторов a, Ь € R" .

Пусть/ = {1,2,...,п},Х = G(L)xÄ»xfinxPxQ, а = (w,i,^,u,t>) е X. Введем следующие функции:

ад =< ^(«лс^/К«) - J] >,«е х,

NHw) = max min maxmin NA a). ieDi $es(u) VSQ «ер

N?(cj) — max min min max iV;(а). 14 ' JeDi VeS(w) »€Q 4

Aj(«)»=max{JV/(w),^(w)}, »6/, MwJ^^^weGtl), fc(w)>l.

Функции iV/(w), A;(w), A(w),t e j = 1,2, называются функциями пр еимущества.

Теорема 1.3.1. Функции преимущества г е /, У = 1,2,

квазилинейного конфликтно управляемого процесса (2) непрерывны и достигают своих точных граней на (3(Х).

Заметим, что испольоуемые ранее функции преимущества отличались от введенных в § 1.3 тем, что в них отсутствовали операции внешнего максимума по I и все они рассматривались при некотором фиксированном о; с Ь.

Основной результат первой главы содержится в § 1.4, где на основе результатов § 1.2 и § 1.3 дается определение оптимальных параметров уклонения, ставится задача их оптимизации и доказана теорема существования для квазилинейных конфликтно управляемых процессов. Доказывается также, что на оптимальных параметрах разрешима глобальная задача уклонения траекторий.

Пусть Я = {и> е йЩ : к(и) = ¿}, Щ - {и е <?(#)" : сНтш > г +

1, > 0}, г е Н — и 2Г,-.

Ш

Определение 1.4.1. Натуральное число ко, подпространство и>0 с Ь и число ТУо > 0 называются оптимальными параметрами уклонения в квазилинейном конфликтно управляемом процессе (2), если выполнены соотношения:

ко = тЫ*: Я,- ^ = шахА(и>), Я0 = Я^,

•61 ыело

сУт^о = пип{с11шш : и е Агдтях А(а;)}, Х(и>) = А^(а>).

. Задача оптимиоацни параметров уклонения. Исследовать условия существования и алгоритмы определения оптимальных в установленном смысле параметров уклонения, в терминах которых описываются или формулируются достаточные условия разрешимости глобальной задачи уклонения траекторий.

Теорема 1.4.1. Пусть в конфликтно управляемом процессе (2) с геометрическими ограничениями на управления игроков ( Р и ф - компакты) выполняется условие ЕфЬ.

Тогда существуют оптимальные параметры уклонения, обеспечивающие разрешимость глобальной задачи уклонения траекторий.

В теореме 1.4.1 возможность уклонения докапывается в классах или VIр. е - стратегии по разбиению и получены оценки снизу для расстояний от до М. В процессе доказательства указан алгоритм нахождения оптимальных параметров уклонения.

В § 1.5. рассмотрены два примера, для которых вычисляются оптимальные параметры уклонения.

Пример 1. Контрольный пример Л.С. Понтрягина "с мягкой посадкой".

Движения управляемых объектов х и у описываются уравнениями х + ах — 2 рПу у + Ру = 2(7 V,

где ж,у,и,ие Д",1/> 1,а> 0,/?> 0,р>0,сг > 0,| и |< 1,| « |< 1.

Уклоняющийся игрок выбором V стремится к невыполнению при всех * 6 [0,+оо), по меньшей мере, одного из равенств г(<) = =

у{1.). Заменой переменных уравнения движения приводится к виду (2) ¿1 = ¿2,

, ¿з = - <*г3 + сги + ри, После необходимых вычислений показано, что все условия теоремы 1.4.1 выполнены если 1/>2и<г>ри оптимальные параметры уклонения равны: ¿о = 1, //о = <т - р,и>0 - произвольное двумерное подпространство из — {г е Я3" : ¿1 = 23 = 0}.

Пример 2. Рассматривается задача уклонения объекта у = (У1, Уа)т от объекта х = (ж1,х2)у, их уравнения движения имеют вид

¿1 = Р1«1, У1 = <Т1»1,

Х2 + «¿2 = />2«2, У2+/?У2 = 0^2, (4)

У».««. »¿бД>>1,а>0)(9> 0, А- > 0, > 0,1 «£ |< 1, | vi |<, г = 1,2.

Стандартной заменой переменных (4) можно привести к виду (2). Все условия теоремы 1.4.1 выполнены, если либо V > 1 и <71 > ръ либо V > 3 и ог > Рг-

Показано, что оптимальные параметры в задаче уклонения (4) существуют при V > 1,0-1 > рх и равны = 1, = <Гх - р\, о?0 -некоторое двумерное подпространство из Я4".

В втом случае {и > 1,СТ) > р{) уклонение можно осуществить выбором "скоростной компоненты" «1 управляющего параметра и = (г>1, щ)т.

Если в задаче уклонения (4) < Ри то Нк1 = 0 , тогда оптимальные параметры уклонения существуют при и > 2 и а2 > р2 и равны ко = 2, N0 = <72-/)2, и0 - некоторое трехмерное подпространство го Я4", что означает возможность уклонения оа счет выбора "инерционной компоненты" v2 управляющего параметра » = (иь«2)т.

Вторая глава состоит го трех параграфов и посвящена исследованию задачи оптимизации параметров уклонения в нелинейных конфликтно управляемых процессах, описываемых уравнением

где г е Дп, и е Р с V е ф с Д«, Р и <2 - непустые компакты, /(•) -непрерывная по (г,и,«) функция.

Результаты первой главы ( §5 1.2 - 1.5) не переносятся непосредственно на системы (5), причиной является нелинейность рассматриваемых конфликтно управляемых процессов. Поэтому при переходе к (5) все основные понятия первой тпавы носят локальный характер.

Обозначим через матрицу первых частных производных

дf(z,u,v)/дzij)i,j = 1,2,...,п, и положим

где a(z,o>) - некоторый вектор го R*.

Через äff А будем обозначать аффинную оболочку множества А с R* , черео LinA - подпространство Rn парапельное äff А .

В § 2.1 на основе лемм 1.2.4 - 1.2.6 исследуется для каждого гей" структура L и выявлены свойства функции k(z,to), и> е G(L).

¿r= /(z,u,v),

(5)

ip(z}0,11,«) = ?, ф, j,u,v) = ~ 1,»)]/(*>W,«),

T{x,v,j) = *(vM*J,P>Q)J 6 N+ = {1,2,3,...}.

д

mm{j : T(z,uJ) # {a(z,u)},j e N+}> 0, если T(z,w,j)={a(z,u>)},j eJV+,

Введем локальные функции преимущества (z,l е Rn,u) е L)

min maxminMz.o:), N2(z,u,l)=^ min minmaxN(z,a),

AJ(z,o>) = max N>(z,U},l), A(z,a;) = maxiA^.w), A2(z,o>)},

IgB(Z)U)

B{z,u>) = {у e Д" :| у |< d(z,w)}, ф,ы) = max | |

и положим E3(z,lj) = Arg max NHz,(jj,l),j = 1,2.

l€B(*,w)

Теорема 2.1.1. Пусть область U с R" такова, что для всех z е U и wcL = const. Тогда функции непрерывны по (z,u>) е

UxG(L), а при каждом фиксированном z» е U функции Ai(z„u),j = 1,2, достигают своих точных граней на G{L).

Положим для каждого z б R* и i е iV+ F&z) = {uc L: =»},

H({z) = {we G{Fi{z)): dim со >2, Аw) > 0},

¿CJV+

Определение 2.1.1. В конфликтно управляемом процессе уклонения (5) числа ¿о € jV0 > 0 и подпространство цс£ называются лохально-оптнмальными параметрами уклонения для точки ze Rn\ М, если выполнены соотношения:

fco = = min{i е N+ : Ei{z) jt 0}, N0 = 2V0(z) = max А(гг,о;),

шеЯо(г)

dimw0 = min{dima>: cj e Arg max A(z,w)}, Я0(г) г

шбН0(х)

Задача оптимизации локальных параметров уклонения заключается в нахождении условий существования и алгоритмов определения локально-оптимальных параметров, разрешающих в совокупности глобальную задачу уклонения траекторий. § 2.2 содержит основной результат второй главы. Теорема 2.2.1. Пусть в конфликтно управляемом процессе (5) найдутся область П э М , непрерывные по (z,w) efix G(L) функции V(z,a>) g = 1,2, число q, е такие, что

a) H{z)^i,z € О; б) == fc(w) < g», *€ii,weG(L);

в) функции ir(aj)<p(z,fc(w),u,t;) удовлетворяют условию Липшица по z € ii при всех и 6 <?(£),u е P,v е Q.

Тогда для каждой позиции zo е П \ М существуют локально-оптимальные параметры уклонения, обеспечивающие в совокупности разрешимость глобальной задачи уклонения траекторий.

Результаты теоремы 2.2.1 иллюстрируются на двух нелинейных примерах. Приведем один из них.

Пример. Пусть движения двух взаимосвязанных объектов х — и у = {уиу2)т описываются соответственно уравнениями

¿1 = Pi«i(l «1 - Vi I3 +l)_1in2 (I xx - yx р +e),

x2 + aii = РтУг cos21 Xi - y2|2,

Vi = croifl *i - У1 !3 +1)"1 ln (I ~ У1 P +e)>

fa + ßy2 = <72t;2 cos I x3 - y2 (6)

где xityit6 Rv,v > l,a > 0,ß > > 0,<r; > 0,i = l,2,e = 2,718...., K l< 1,1 »t |S 1»* = 1,2.

Целью уклоняющегося игрока является выполнение при всех t > О, по меньшей мере, одного из неравенств xx(t) yt(t), x2(t) yt y2(i).

Стандартной заменой (6) приводится к виду (5), в котором z — (zuz^z^eR^Ji.) = (A(.),...,/4(-)F.»t = ("г,«2)т,« = (v^iT,

fx(z,u,v)= Z4-Z3,

f2(z,u,o) = (Г2г)2[Ь(| z212 +e) - p2«2/n2(| z2 |2 +e)](| z2 I3 +1)"1, , f3(z, ti,v) = -az3 + рхЩ cos2 | Z\ |2, fi(z, U,V)= -ßZi + <TiVx cos I Zx |2.

Терминальное множество M с Я4", era ортогональное дополнение L примут вид

М = {z е Riv : Zx = z2 = 0},£ = {z e Й4" : z3 = z4 = 0}, Простые вычисления показывают, что для примера (6)

Lx = {z: z2 = z3 = z4 = 0}, L2 = {z : Zi = Z3 = z4 = 0},

k(z, Lx) ski - 1. Z/2) ~ki~2 для всех z € ftj = {z e Riv :| z2 |< 1},

k(z,cj) = 2,г e ili,w с £ поэтому в теореме 2.2.1 можно положить q, — 2,

= (ст2 -p2cos | z2 р)cos | z2 |2,w € 12,.г e

при этом

^(z.w) = E\z,oj) = {-/?z4 + az3}, и для каждого ucLltze R*u,

А(г,ы) = (| |3 +1)-»[<n - Pliu(| Z! |2 +e)]in(l ^ I2 +e).

Все условия теоремы 2.2.1 выполнены, если

v > 2, <Ti > pi либо a2 > Р2,Я* = 2,i2 =

fl2 = {z e R4" :| z2 |< ci}, cj = expiffx/px - 1) > 0.

Итак, при выполнении условий и > 2 н <т\ > р\{р2 и р% могут быть произвольными), для каждой точки существуют локально-

оптимальные параметры уклонения равные

h = 1 ,N0 = N0(z0) = [ах - рМ*ю I2 +е)](| *10 I3 +1)"1 Ml *« I2 +е), w0 - любое подпространство, такое, что ш0 с Ь,ша<£ Ь2. В этом случае процесс локального уклонения из точки z0 е П\М можно осуществлять выбором "скоростной" компоненты Uj управляющего параметра v = (vj, v2)T е Q.

Если в примере (6) < то локально-оптимальные параметры уклонения для zq е Sl\M существуют при выполнении условий и > 2,<т2 > p2,q+ = 2 и будут равны:

fc0 = 2, No(zt)) = (ст2 — /j2 cos | z|0)cos | z20 |\w0 с L2 (dimu0 = 2).

При этом, по теореме 2.2.1 разрешимость глобальной задачи уклонения осуществима за счет управления "инерционной" компонентой v2 управляющего параметра t> = (i>i , v2)T.

В третей главе исследуется глобальная оадача уклонения траекторий квазилинейных и нелинейных конфликтно управляемых процессов, которые предполагаются минимаксными7, т.е. когда уклоняющийся игрок при построении разрешающих стратегий использует информацию о предыстории управления противника.

В $ 3.1 на примере квазилинейных конфликтно управляемых процессов исследуется взаимосвязь между двумя основными типами преимуществ уклоняющегося игрока: преимущества по маневру12-13'22*23 и преимущества по направлениям22,24'27'28.

Показано, что в минимаксных конфликтно управляемых процессах уклонения оба типа преимуществ эквиваленты в так называемых "грубом" и "промежуточном" случаях , а в "тонком" случае способ уклонения траекторий, основанный на идеях маневра обхода, применим к более широким классам конфликтно управляемых процессов .

Пусть W с L- некоторое двумерное подпространство с выбранным в нем ортонормированием базисом 7Г - ортопроектор из Rn

на W,S ж В соответственно единичные сфера и шар в W с центрами в начале Rn,IntwA и со А соответственно внутренность относительно W и выпуклая оболочка множества А с Rn,< b,c > - скалярное произведение векторов Ь,с е Д",| b |= \]< b,b>,jj il || - норма матрицы Ü, согласованная с векторной нормой | • D = ([7rCil_1]i, [xCk:'~l]i)T - линейное отображение из Rn на W, в котором к\ и fc2 - некоторые натуральные числа, Т - транспонирование, [£2],- -1 -я сторока матрицы = 1,2.

Предположение 3.1.1. Для конфликтно управляемого процесса уклонения (2) существуют двумерное подпространство W с L, натуральные числа fej и ¿2 (¿1 < &2), компактные множества Qi с Rqi и Qi с Ди, непрерывное отображение V : Р Qi такие, что выполня-

27 Чихрий A.A. Оадача уклонения в нелинейных дифференциальных играх. Кибернетика. - 1975. - N 3, - С. 65-68.

м Сатимов Н. Об одном способе уклонения от встречи в дифференциальных играх. Матем. сборник. - 1976. - Т. 99 (141), N S. - О. 380-393.

ются условия :

а) V = (vuv2)T,t?i € <3i,t>2 € Qi,Qi х Q2 с Q,

б) множества [xC>-1j;-/(P, V(P),Q2) являются одноточечными при всех t' = 1,2, ...,fcj-2;j = 1,2,

в) Л = roaxmmmm тах < ib.Dfiu, VTu),t>2) -J > > О, ' im i>zs ueP »j6<?3 n A 1 v y' " '

где Fa = Df(P, V(P),Q2).

Теорема 3.1.1 об уклонении. При выполнении предположения 3.1.1 в кваоилинейном конфликтно управляемом процессе (2) разрешима глобальная задача уклонения траектории. При этом для расстояний £(i) и v{t) от точки z{t) до М и L имеет место оценка

lc!e^(í), если ¿0 >

где сцб! - константы, = £(0), S(t) = {[1 + i/(t)]** + [1 +

Предположение 3.1.2. Существуют двумерное подпространство W с L и ортонормированный баоис (wbtD2) в W , натуральные числа fci и к2, компактные множества Qj с Й?1 ж Q2 с непрерывное отображение V :Р-*Qi такие, что выполняются условия :

а) V = (w1,ü2)3>i еQi,u2 е Q2,Qi хQ2 с <3,

б) каждое множество [я-С'-^ДР, V(P),Q2) состоит ио единственной точки при i = 1,2,...,¿y - 2;j = 1,2,

в) множество Äo = f| coD/(u, V(u),<32) содержит внутреннюю от-

иеР

нослтельно W точку.

Предположение 3.1.3. Выполнены условия а) и б) предположения 3.1.2, причем fei jt к2, кроме того, выполняется условие в) :

Rx= П coDf(u,V(u),Q2)

содержит отреоок ненулевой длины, не параллельный ни одному ио векторов и ш2.

Будем говорить, что в кваоилинейном управляемом процессе (2) имеет место грубый случай12»13 , если выполнено предположение 3.1.2 и ki = к2 = feo; промежуточный (смешанный) случай23, если вы-

полнено предположение 3.1.2 и fei £ к2; тонкий случай13,23, если выполнено предположение 3.1.3.

Способ уклонения, основанный на предположении 3.1.1, называют, обычно, способом уклонения по направлению. В известных работах , развивавших метод уклонения по направлению, присутствует дополнительное ограничение на размерность W, именно, требовалось, чтобы dimW > ¿2 (¿1 < к2), в предположении же 3.1.1 это ограничение снято.

Способы уклонения, основанные на предположениях 3.1.2 и 3.1.3, называются способами (методами) уклонения по маневру.

Основной результат § 3.1 заключается в доказательстве того, что предположения 3.1.1 н 3.1.2 (грубый и промежуточный случаи) эквивалентны в смысле разрешимости глобальной задачи уклонения траекторий. Доказательство основано на теореме П2.4 об эквивалентности.

Теорема П2.4 (об эквивалентности).

Пусть F(u, v):PxQ-*Rn- непрерывное отображение, где Р и Q -непустые компакты, W - линейная оболочка (подпространство) выпуклого компакта coF(P, Q) (со - операция овыпукления), S - единичная сфера в W с центром в начале йл . Далее, пусть

G0= П <»П«><3), Fo = F(PtQ)y

иеР

Х{1) = mktminmax < 0,F(u,u)-i >,

4 ' fes »eP veQ r' v ' ' '

7 = maxA(i), E = ArgmaxA(i).

ieio lifo

Для того, чтобы было 7 > 0 необходимо и достаточно, чтобы выполнялись включения ¡о е IniwG0, 10 € Е, при этом выполняется равенство 7 = 7,= тах{(5 > 0: /0 + 6S с G0}.

В § 3.2 получены достаточные условия уклонения для нелинейных минимаксных конфликтно управляемых процессов, расширяющие известные результаты Б.Н. Пшеничного, A.A. Чикрия и В.В. Остапенко по нелинейным задачам уклонения. Преимущества полученных результатов показаны на контрольном примере J1.C. Понтрягина "с форсированием".

Положим основной результат § 3.2.

Рассматривается нелинейный конфликтно управляемый процесс (5) с терминальным множеством М - подпространством Д".

Пусть и - некоторые одномерные взаимно ортогональные подпространства из ортогонального дополнения Ь к М(Ь + М ~ Дп), ^0 = ^1 + И'з,^ - ортопроекторы из Д" на = 0,1,2. Образуем последовательность функций

где - матрица первых производных векторной функции д{г) е Я™. Положим для каждого г е Д",1 — 1,2,

Т*{я,}) = ч>&>3> Р, Я)>3 = 0,1,2,...

= Г1шп{; е : Г»"(*.>') ^ {<ф)Ь<Ф) € И^}, * 10, если = {сф)},^ 6 ЛГ+,

«,«) = у»,-(г, А,(г), и, V) € Т^, </з0(2,«,г) = (^(г.и.г),^*,«,«)3' е Жо,

= Р,Я)>ч»{*Л, РЯ))Т>

и для г = 0,1,2, положим

Н*>и) = тттттах < ф,<р,(гг,«,и) ->,и € В{(г),

ф^ и€/г

где через В ¡(г) и 5,- будем обозначать соответственно замкнутые шар и единичную сферу иа И^ с центром в начале Дл, причем радиусы шаров В,-(г) равны «¿¿(г) = ваах^ I ^»С^»^ € -й",» ^

Для процесса (5) рассматривается глобальная задача уклонения траекторий. При этом раорешающие стратегии будут выбираться из классов либо кваоистратегий.

Сформулируем основные предположения и результат § 3.2.

Предположение 3.2.1. Существуют одномерные, взаимно ортогональные подпространства Wu Wi(Wü = W\ + W2) и область Ü с Rn с гладкой границей, содержащая в себе М, такие, что выполнено :

а) ki(z)ski = const,i = 1,2,(k¡ > í^), для всех гвйо = й\М.

б) функции <p¡(z,j,u, v) непрерывны по (z,u,v) e По * P * Q и непрерывно дифференцируемы по z € í2o при всех j = о, 1,2,..., k¡ -1, i = 1,2.

Заметим, что в силу определения k¡{z) все функции ip¿(z,j,u,v) не зависят от (u,v) е PxQ при j = 0, l,...,A¡(z)-l, афункции^(г,и,и),1 = 0,1,2, будем считать зависящими, по крайней мере, от v.

Предположение 3.2.2. к1>к2 и функция

No(z) = max minminmax < rb,tpn(z,u,v)-1 > >0 4 ' leftWVeSo u6P veQ 4 ' ' '

при всех z € Q0 . Кроме того существует непрерывная ветвь (селектор) l0(z) e E0{z) многозначного отображения

E0(z) = Arg шах \ü(z,lo),z € ÍÍq. ke Bo(z)

Предположение 3.2.3. кх > к^, функции

Ni{z)= max minminmax < ib,(p¡(z,u,v)-l¡ > >0 í,-6B¡(i) v>€5¡ «e<?

для всех z e fio в существуют непрерывные функции l¡(z) € E¡(z) = Arg max X¡(z,li),i= 1,2.

í¡fc.Oi^B J

Теорема 3.2.1. При выполнении для конфликтно управляемого процесса (5) предположений 3.2.1 и 3.2.2 или 3.2.1 и 3.2.3 глобальная задача уклонения траекторий разрешима в классах квааистратегий или Vе

Пример (Контрольный пример Л.С. Понтрягина с "форсированием").

Рассмотрим конфликтно управляемый процесс уклонения двух связанных между собой объектов X и У, описываемый уравнениями

X : х 4- ехх = ucos2 ¡ х — у |, Y : y-f ßy = veos | x - y ¡, (7)

где xby,u,v € R",v> 2,| «)< 1,| u|< l,a> 0,/?>0 - константы.

Процесс считается завершенным, если в некоторый конечный момент U > 0 x(tt) — y(U).

Замена переменных гх = у - ж, z2 = i, z3 = у, приводит (7) к виду (5)

h — - z2

■ ¿2 = ~az2 + И COS2 I Zx |= j(z, «,«). (8)

¿3=-/?z3 + ucos I Zj I

Терминальное множество M и его ортогональное дополнение L имеют вид {z = (zuz2,z3)T € Я3")

М = {г 6 Я3" : 01 = 0},L—{ze Я3" :z2 = z3 = 0}.

После необходимых вычислений устанавливается, что предположения 3.2.1 и 3.2.2 полностью выполняются для процесса (7) - (8), если положить По = {г е Я3": 0 <| zx |< |} , тогда ki(z) = 2,

N0(z) = (1 - cos I zi j)cos I zx |> 0 для всех z e ii0»i = 1,2,

imax(z) = lQ(z) = {-pzz + az2}Wo e W0,

Wo - произвольное двумерное подпространство из L = Я".

Значит по теореме 3.2.1 глобальная задача уклонения траекторий для (7) - (8) разрешима в классе стратегий

Заметим что iVo(z) = 0 при г б М, поэтому для (8) не выполнены условия работ19-26.

В параграфах 3.3 и 3.4 рассмотрена глобальная задача уклонения траекторий в предположении, что игроки могут использовать управления только из множества кусочно-постоянных функций, а уклоняющийся игрок в каждый момент времени знает значение управления преследователя в тот же момент.

Идея сужения классов управлений преследователя при изучении задач уклонения была, по-видимому, впервые применена М.С. Никольским29. Целью такого сужения было получение менее жестких достаточ-

39 Никольский М.С. Об одном критическом случае в о а даче уклонения от встречи. Кн.: "Пробл. анал. мех. теор. уст. и управления", М.: Наужа. - С. 230 - 234.

ных условий уклонения. В работе30 преследователю предписывались управления ио классов "инерционных" или "равностепенно непрерывных" функций и в указанных классах функций исследовалась глобальная задача уклонения траекторий.

Особый интерес представляет случай, когда оба игрока используют управления, пусть из суженных, но одинаковых классов функций. Такое сужение классов управляющих функций кажется весьма ограничительным, но, на наш взгляд, используемые ниже классы кусочно-постоянных функций полезны как в теоретических исследованиях, например, при формализациях дифференциальных игр7»18'19 , так и в вопросах численных расчетов задач конфликтного управления11»10'31

Эффективные достаточные условия уклонения траекторий ио любой начальной пооиции в классах кусочно-постоянных управляющих функций получены в § 3.3 и § 3.4. Эти условия отличаются от известных тем, что уклоняющийся игрок не имеет геометрического преимущества над преследователем.

В четвертой главе рассматриваются нелинейные конфликтно управляемые процессы (5) с дискретным терминальным множеством М, состоящим из не более чем счетного числа точек фазового пространства. Методы уклонения, изложенные в предыдущих главах, неприменимы, поскольку М не является подпространством, поэтому исследование глобальной задачи уклонения требует иных подходов22.

В § 4.1 исследуется глобальная задача уклонения при геометрических ограничениях, в § 4.2 - при интегральных ограничениях на управления игроков. Процесс уклонения от дискретного терминального множества осуществляется на основе способа уклонения по направлению.

Примеры, иллюстрирующие результаты §§4.1 - 4.2, приведены в §4.3. Одним ио них является "задача успокоения-раскачки" матема-

30 Сатимов Н.Ю. К теории дифференциальных игр убегания. Матем. сборних. -1977. - Т. 103 (145), N 3. - С. 430 - 444.

31 Красовсгий H.H., Крссовсхии А.Н., Третьяков В.Е. Управление динамической системой (матер, по мат. обесп. ЭВМ), УНЦ АН СССР, 1988. - 200 с.

тического маятника7.

Пусть для (5) терминальное множество имеет вид

М= и {"».}. т£бйЛ,ге//+ = {1,2,3...}. (9)

Положим (для простоты считаем, что содержат начала со-

ответственно Д? и № )

/»(ттг,-,и,и) = /(т,-,и,и)- /(пц,0,0),

Аи = {Ф е 3 : тахтт < У1,/*(т,-,и,и) > > 0}, неф «еР

Ац — {ф е 5 : пип тах < гр, /»(т,-, и, и) > > 0}. ибР «6<?

Всюду ниже считаем, что I = 1,2, г е

Предположение 4.1.1 (о разреженности М ). Существует е > 0 такое, что для всех г ^ к | тт - т* |> е, г, & е Я4".

Предположение 4.1.2. га > 2 и начало й™ Об п [соА1,исоА2;]. Теорема 4.1.1 Бели для конфликтно управляемого процесса (5) выполняются предположения 4.1.1 и 4.1.2, то из всех начальных позиций г0 е Л"\М возможно уклонение траекторий при всех ( >0 с оценкой

Ш>Ш если

где - константы, <£;(') - евклидово расстояние от г(<) до т».

В § 4.2 рассматривается глобальная задача уклонения траекторий конфликтно управляемой системы

г = д(г) - и + и, (10)

где гг,и, V е Ял,д(г) - непрерывная функция, дискретное терминальное множество имеет вид (9).

Измеримые управления игроков и = и(2) 6 Л",у = £ > 0, удовлетворяют интегральным ограничениям +оо +00

| |«(01аЛ<Л / |1)(0|2Л Р>0,<7>0. (11)

Предположим, что v имеет структуру v = {vq,o)T е Rq х RT'~q и dim В = dim е R1 :| vq |< 1} = q < п, R° = Rl, q е N+. Дополнительно к 5 4.1 обооначим

Sq = {и? е Rq :| vq |= 1}, А = {ф е S : ти <ф,у> > 0},

и пусть {a}t - первые q компонент вектора а е Д", К* - множество наборов Каратеодори ( К - наборов) "02,V'e+i} из векторов t/>; € Ati = 1,2,...,?+1, т.е. таких, что система $¡-01,.-чфд+х-фг - линейно нсоависима.

Л= sup mil) тъх<ф%^>,Ка = {ф?,....,ф%+1}.

Предположение 4.2.1.

a) \g(zi)-g(z2)\<y\zl-z2\,zuz2e ДЛ,7>0; б) q>2,

в) существует е > 0 такое, что для всех г ^ k | тТ-тк |> e,r,fc е N+.

Предположение 4.2.2. аХ > р.

Теорема 4.2.1. Если для конфликтно управляемого процесса уклонения (10)-(11) выполнены предположения 4.2.1 и 4.2.2, то разрешима глобальная задача уклонения траекторий и уклонение организуется циклами таким образом, что для расстояния &(f) =| z(t) - m; | выполняется оценка

'cj&(0)ll+l»"il8l"1. если 6(0)<ea.0<isTa, Ш > ' <*ец[1+ I I2]"1, если £(0) > е.1,0 < t <2, . сг£,>(1+ | m< |2]-1, ТТ < t < Tr+Ur = 3,4,...

где Тг +оо,г оо,с,-,е,> - константы, i е Лг+,0 < Т2 < Тг.... - последовательность, зависящая от хода процесса уклонения.

Приложение состоит из четырех разделов ( П1 - П4 ). В П1 рассмотрены способы наделения метрической структурой множества всех подпространств Д", необходимого для исследования функций преимущества^ § 1.3). Основной результат раздела П2 представляет теорема П2.4 об эквивалентности, используемая в третьей главе. В ПЗ доказана

лемма Л.С. Понтрягина13 о маневре обхода в многомерном случае, получены улучшенные оценки снизу для расстояний до терминального множества.

В П4 дано доказательство алпроксимационной леммы, когда задаваемые в условиях леммы функции Pi(t),t = 1,2, ...,тп, - измеримые и суммируемые. Лемма используется для установления факта разрешимости исходной задачи уклонения по информации возможности уклонения некоторой расширенной задачи.

ОСНОВНЫЕ ПУБЛИКАЦИИ

Основные результаты диссертации опубликованы в следующих работах.

Югай Л.П.:

I. Об i-уклонении от встречи в линейной дифференциальной игре многих лиц. // Дифференциальные уравнения. - 1979. - Т. 15, No 5. - С. 840-845.

II. Об уклонении "по направлению" в дифференциальных играх многих лиц с интегральными ограничениями на управления. // Прикладная математика и механика: Сб. н. тр. - Тсипкент. -1979. - Вып. 590. - С. 136-145.

III. Нелинейная задача уклонения с дискретным терминальным множеством. // III Всес. школа: "Понтрягинские чтения. Оптимальное управление.Пеометрия и анализ.":Тео.докл. - Кемерово. - 1990. - С. 223.

IV. Об одной дифференциальной игре с разреженным терминальным множеством. // IX вс. конф. "Проблемы теоретической кибернетики": Тез. докл., ч. 1. - Волгоград, 1990. - С. 117.

V. Linear differential evasion game without superiority. // Annals of diff. equations (China). - 1992. - No 2. - P. 158-163.

VI. К оптимизации параметров в нелинейных минимаксных задачах уклонения.// Spectral and Evolutional Problems. Proceedings of the 3-rd Crimean Fall Math. School-Symposium (CFMS-III). -

Simferopol (Laspi), Ukraine, 1993. - Vol. 3. - P. 125-126.

VII. Об убегании в квазилинейной дифференциальной игре при отсутствии преимущества. // Автоматика. - 1993. - No 1. -

С. 74-78.

VIII. Об оптимизации параметров убегания конфликтно управляемых систем. // Теория управления и экономика: Сб. н. тр. - Ташкент, 1994. - С. 7-12

IX. Optimal evasion parameters in deferential game. // Systems and Networks: Math. Theory and Appl., Proceedings of Int. Symp. MTNS'93 held in Regensburg, Germany, August 2-4, 1993. Vol. II, Invited and Contributed Papers. - Acad.Verlag,1994. - P. 583-584.

X. On a problem of vector optimization of evasion parameters in differential games. // The 3-rd Int. Workshop "Multiple Criteria Problems Under Uncertainty", Abstracts, Orekhovo-Zuevo, Russia, 1994. - P.100.

XI. О непрерывности и экстремальности функций преимущества. // Уобекский Математический Журнал. - 1994. - No 2. - С. 73-75.

XII. Оптимизация параметров уклонения в минимаксных конфликтно управляемых процессах. // Кибернетика и вычислительная техника: сложные системы управления. - Киев,1994. - Вып.97.

- С. 35-49.

XIII. Optimal evasion parameters in nonlinear conflict control processes. The 3-d Int. Congress on Industrial and Applied Mathematics, ICIAM-95, 2-7.07.1995, Hamburg, Germany, Book of Abstracts, Springer-Verlag, 1995. - P. 485.

XIV. К оптимизации параметров уклонения в квазилинейных дифференциальных играх. // Докл. РАН - 1996. - Т. 346 , No 4 .

- С. 452-454.

XV. Об одном достаточном условии уклонения по направлению. // Диф. уравнения. - 1996. - Т. 32 , No 9 . - С. 1291 - 1292.

XVI. Optimal sufficient conditions in minmax conflict control processes of evasion. Bull, of Korean Math. Society, 1996, v. 33, N 2 . - P. 10.

BRIEF INFORMATION Optimization of parameters and sufficient conditions in conflict controlled evasion processes

(Doctor of Science dissertation represented by L.P. Yugai to the maintenance in The Moscow State University).

The dissertation is devoted to the problems of trajectories' evasion and optimization of evasion parameters in nonlinear conflict controlled processes (CCP) described by ordinary differential equations.

The evasion problem in CCP was first formulated by L.S.Pontryagin and E.F.Miscenko12'13. Since then, this problem has been studied extensively by many authors and in various ¿¿récitons7-10'15-28.

For the conflict controlled evasion processes (CCEP) a problem of evasion parameters' optimization is posed and investigated. Existence theorems of optimal evasion parameters are proved for quazilinear and nonlinear CCEP.

New sufficient conditions of solvability of the global trajectories' evasion problem were also obtained. All the results were illustrated by well-known or new examples.

The work consists of introduction, four chapters, appendix and bibliography including 260 titles.

CONTENTS

Introduction

Chapters I. Optimal evasion parameters in quasilinear conflict controlled processes.

§ 1.1. Setting of global trajectories' evasion problem. Main sets of strategies.

§ 1.2. The structure of orthogonal complement to terminal set in quasilinear conflict controlled processes.

§ 1.3. Extremal properties of advantages' functions.

§ 1.4. Optimal evasion parameters. Existence theorem of optimal parameters, solving the global trajectories' evasion problem.

§ 1.5. Examples.

Chapter II. Optimization of parameters in nonlinear conflict controlled evasion processes.

| 2.1. Local-optimal evasion parameters in nonlinear conflict controlled processes.

§ 2.2. Sufficient conditions of the existence of local-optimal evasion parameters.

§ 2.3. Examples.

Chapter III. Sufficient conditions of trajectories' evasion in minmax conflict controlled processes.

J 3.1. On two main evasion methods in minmax conflict controlled processes.

S 3.2. Global trajectories' evasion problem in nonlinear conflict controlled processes.

S 3.3. Evasion in the direction in minmax conflict controlled processes under the absence of geometrical advantage.

$ 3.4. The bypass maneuver method in quasilineax conflict controlled evasion processes under the absence of geometrical advantage.

Chapter IV. Global problem of trajectories' evasion from discrete terminal set.

§ 4.1. Evasion from discrete terminal set under geometrical restrictions on controls.

§ 4.2. Evasion from discrete terminal set under integral restrictions on controls.

S 4.3. Examples.

Appendix.

Al. Some properties of the set of all subspaces with the opening metric.

A2. Minmax theorems.

A3. L.S. Pontryagin's bypass maneuver lemma in multidimensional case and concerned estimations.

A4. Approximation lemmas.

Bibliography.