Некоторые задачи теории дифференциальных игр группового преследования тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Попович, Мария АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1990 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Автореферат по математике на тему «Некоторые задачи теории дифференциальных игр группового преследования»
 
Автореферат диссертации на тему "Некоторые задачи теории дифференциальных игр группового преследования"

МОСКОВСКИЙ ОРДШ ЛЕНИНА И ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени ЫЛЗ. ЛОМОНОСОВА

Факультет вычислительной математики и кибернетики

На правах рукописи

ПОПОВИЧ Мария

УДК 519.8

НЕКОТОРЫЕ ЗАДАЧИ ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ ИГР ГРУППОВОГО ПРЕСЛЕДОВАНИЯ

01.01.02 - дифференциальные уравнения

Автореферат на соискание ученой степени кандидата физико-математических наук

Москва - 1990

Работа выполнена на факультете вычислительной математики и кибернетики Московского государственного университета вмени- №.В.Ломоносова.

Еаучюй: руководитель - доктор* физико-математических наугс,

профессор) Григоренко Б.Л. Официальные опонееты - доктор физико-математических наук,-

профессор Половинкин Е.С. - кандидат физико-математических наук, доцент Морозов В.В. Ведущая организация - Институт проблем механики АН СССР.

Зашита состоится " " t^XUL_ 199^ г. в ¿¿г

часов минут на заседании- специализированного совета

Д.053.05.37 при Московском государственном университете; имени- М.В.Ломоносова.

Адрес: 119 899, Москва, Ленинские горы, МГУ, 2-й учебный корпус, факультет вычислительной математики и кибернетики, аудитория

С диссертацией можно ознакомиться в библиотеке факультета ВМиК МГУ.

Автореферат разослан-: " " 199^ г.

Ученый секретарь Специализированного совета доктор", физико-математических наук,, профессор S.И.МОИСЕЕВ

ОБЩАЯ ХАРАКТЕРИСТИКА- РАБОТУ-

Актуальность теш. Теория дифференциальных игр является составной частью математической теории' управляемых процессов. Понятие дифференциальной игры было введена американским математиком Р. А'йзексом^Л Теория дифферевдиальных игр' исследует задачи управления в условиях конфликта или неопределенности. Источником этих задач явились реальные* задачи из области экономики, физики, механики и других областей человеческой деятельности.

Актуальность решения подобных задач обусловила быстрое развитие теории дифференциальных игр как в СССР, так и за рубежом. Здесь прежде всего следует выделить работы акаде-Д.С.Понтрягина и Н.й.Красовского, в которых были получены основополагающие результаты, положившие начало развития двух направлений в- исследовании дифференциальных игр, различающихся в основном математической формализацией игры, а также' классами стратегий игроков.

Крупный вклад в теорию внесли В.Ф.Мищенко, М.С.Никольский, Б.В.Пшеничный, Л.А.ПетросяН', А.И.Субботин-, Н.Сатимов, Ю.С.Осипов, А.Г.Ченцов, Ф.Л.Черноусько, А.А.Чикрий, Н.Л.Гри-горенют и др. Среди зарубежных ученых внесших большой вклад в теорию дифференциальных игр, следует выделить Д.Берковица, А.Фридмана и др. В ЧСФР теорией дифференциальных игр занимав лись и занимаются П.Бруновски, Я.Долежал и М.Медведь.

Пель работы. Разработка достаточных условий разрешимости дифференциальной игры преследования из данной начальной позиции для дифференциальной игры-с №. - терминальными множествами и для дифференциальной игры со специальным терми-

I/ Айзеке Р. Дифференциальные игры. - М.:Мир, 1967, 479 с.

нальным множеством;, разработка достаточных условий для завершения процесса преследования методом прочесывания двумя инерционными объектами одного безинерционного а также для разрешимости квазилинейной дифференциальной игры преследования группой преследующих, у которых нет динамического превосходства над убегающим.

Методика исследования. В работе используются результаты теории дифференциальных игр■/1-й прямый метод Д.С.Понтрягина, метод1 гарантированного неухудшения позиции/. Привлекаются понятия и факты из теории многозначных отображений, обыкновенных дифференциальных уравнений, выпуклого и математического анализа.

Научная н(?визна. В диссертации содержатся следующие новые научные результаты:

1. Для дифференциальной игры преследования с л<ъ терминальными множествами получена достаточные условия разрешимости задачи преследования из заданной начальной позиции.

2. Получены достаточные условия разрешимости линейной дифференциальной игры преследования со специальным терминальным множеством.

3. Получены достаточные условия для завершения процесса преследования методом прочесывания двумя инерционными объектами одного безинерционного объекта.

4. Разработаны достаточные условия разрешимости квазилинейных дифференциальных игр преследования группой преследующих, у которых нет динамического превосходства над убегающим.

Практическая ценность. Результаты диссертации можно использовать при решении задач, которые возникают при изучении различных реальных управляемых систем, функционирующих в условиях конфликта или неопределенности.

Апробация работа. Основные- результаты диссертации докладывались на научно-исследовательском семинаре кафедры оптимального управления факультета ВМиК МГУ, на Международной конференции выпускников советских вузов по специальности "прикладная математика" в Москве 1986 г., на кафедральном семинаре Кафедры математики и физики Высшей технической школы а Коши-цах, рабочее место Прешав в 1989 г. и на 5-ой научной конференции Электротехнического факультета ВТШ в Кошицах в секции математика в 1989 г.

Публикации1.. Основные; результаты опубликованы в работах

И - [5].

Структура и объем работы^ Диссертация состоит из введения,, трех глав, четырех приложений и списка литературы, включающего 93-, наименований. Объем работы составляет 206 машинописных страниц, включая 20 страниц рисунков, 50 страниц приложений и 9 страниц списка литературы.

СОДЕРЖАНИЕ РАБОТЫ

Во внедении дается краткий обзор литературы по теме диссертации, кратко изложено содержание диссертации' и сформулированы результаты получены в диссертации.

Первая глава посвящена одному классу задач многокритериальной оптимизации1. В §> I показано, как можно преобразовать задачу многокритериальной оптимизации с /гл. эквивалентными' критериями1 в задачу управления динамической системой с ггк терминальными множествами и формулируется следующая задача управления.

Пусть движевае вектора гв^еР-'"'описывается следующим дифференциальным уравнением1

/¡У = АШ ъ + Л«., (I)

матрица АШ непрерьшно зависит от I и функция непрерывна по совокупности аргументов. Они имеют специальный вид, который является следствием преобразования задачи многокритериальной оптимизации в дифференциальную итру преследования с /уа. терминальными множествами. . С} управления преследующего и убегающего, соответственно. Заданы терминальные множества Ми е ^ .

Контрстратегией будем называть отображение определенное на множестве произвольных векторов ^ , зависящее от уравнения (I) и множеств Мг. , ^»1,2,...) /»у и обладающее свойством: для люоого измеримого 1гС£*)е (3 . Ос^ 6 4 . а? 6 . ш а) = и; гО) как функция I измерима,

е Р и если (Т) = <уг (Г) почти всюду ДЛЯ О&Т 6 I .то V] С))- 17* ( лгг С)) почти

всюду ДЛЯ -Ь^О

Программным вектором неопределенных параметров назовем любую измеримую функцию

АгИ)

такую, что

Задача управления 1г Найти условия на параметры управляемого процесса (.1), при которых существует такая контрстратегия , что вектор гШ являющийся решением уравнения ¿61:)»

г(0)=г? •• приходит по крайней мере на одно из терминальных множеств М; . не позднее некоторого конечного

момента времени'.

Основные результаты этой главы формулируются в § 2 в виде следующих теорем. Пусть /Н положительная константа из [0,1] Введем следующие ооозначения:

м-а/п = п^ % ФСДО Р, г

[сг.ад. fCrM-ffr.p.fr),

rictí- mí ^ | rimlvfcr,plQ)dr.

o "

Пусть

-fc

corLqpctloUe +j w¡ a.voLT) n и! a) = 6 (2)

o

для всех C= ■f|2J... ,/w и для любого T> О

Предположение I. Существует константа такая,

что для Osf^-í. . множества WCt/ÍT) . М3СО

не пусты и существует непрерывная функция с Wft/Í") . Положим

Al гО- ÍА:: А , - я crL ф&о) JV¡ (№Г- MÍaín

о

л c^epc-t.r^ cr,pf/M«-)-f¡ а,ш

t

- fXiV) í) ÁiTiQO^O) + fc&lMr'MCo,í]}>

o

ftVU

zO- л Pa,

L =1

Предположение 2. Для заданой начальной позиции г" , для O^T^-t г Ь^О и для любого aré Q множество является не пустым компактом.

Дальше рассмотрим множество ) . Если оно

является невыпуклым, то метод решения приводится ниже в теореме 2. Теперь предложим метод для случая, когда ^^/Рушг) -выпукло.

Обозначим / ^м положительная константа из /

^и.т)- п %тюР,¿иг),

м-а) - и? *

о

Предположение 3. Существует константа /ие0),'13 такая, что для О^5^ ,-¿>0 множества , М3(1) не пусты

и существует непрерывная функция /^"(¿/Г) е Введем обозначение

[МЫ [А: ЛеЛ^/Г,*^),- АСТ! <й:ы>)г0 +

ь

+ 3 р^у)-^М)/

1гО) {¿СЬГт, 0

и через Т(г?) обозначим первый корень уравнения §«,£7 = 0 . Предположение 4. Для заданой начальной' позиции н." Теорема I. Если для дифференциальной игры (I) в позиции г° выполняются предположения I - 4, то для позиции г° разрешима задача управления I, причем Т(г.°) - гарантированное время преследования.

Далее рассмотрим случай, когда множество ^ невыпукло и рассмотрим функцию ~ п \

(М^ЬГъ [ а.^/м.г), (3)

где управление преследующего вектор следующего вида:

^ ли

. А» - гкеХаИ . ,

£<еР , - т.о. ? = , -О.*"-

м. -мерный симплекс. Введем обозначения

о

для 1= 4,2.,...,/ух. и уи е СС>1 -0 .

Предположение 5. Существует константа уЧеСО^] такая, что для . множества . МЧ-О не пус-

ты и существует непрерывная функция & "Й/С/^Т")

Обозначим

АСи^лг.гО-ли.«* [Л: ХеД-сС^Г.лг, а^-ДШ^Л

+ 1 мМпСКФСк.щсъ ц^-^а^иф},

и обозначим- через

14*)

первый корень уравнения Предположение 5. Для заданой начальной позиции г Теорема 2. Если для дифференциальной игры СО в позиции г" выполняются предположения I, 2, 5 и 6, то для позиции г° разрешима задача управления I в £ -окресности некоторого терминального множества, для любого £ >0 * причем ТОг?) -гарантированное время преследования.

В конце параграфа £ находятся два примера. Пример: I показывает, как можно свести дифференциальную игру преследования несколькими объектами к задаче конфликтного управления дина-

мической системой с несколькими критериями. Пример; 2 демонстрирует теорему I.

В параграфе 3 в виде теорем 3 и 4 формулируются достаточные условия разрешимости многокритериальной задачи конфликтного управления динамической системой с выполнением /с критериев. Для случая, когда множество Р)щт) является выпуклым множеством, определяется новая функция ^ (4., г°) и теорема 3 формулируется аналогично теореме I. То же имеет место для случая, когда множество Р( ушг) не-выпукло, для функции и теорем 4 и 2. В конце; параграфа рассчитан пример; по теореме 3.

Вторая глава посвящена дифференциальным играм со специальным терминальным множеством. В параграфе I приводится постановка задач, которые решаются в этой главе. Пусть движение вектора 2.(к)е. К."1" описывается дифференциальным уравнением

а =Сг + >а - и] (4)

где С - постоянная матрица размерности /И.Х/П , М-^Р , 1Г€ , Р , - ныпуклые компакты в Й™" . Задано

г°€ К* начальное состояние-, М - выпуклый компакт. Дифференциальную игру (4) будем считать законченой, если выполняется включение

Т, г се) е 11, еси 1 г.®)-О,

где некоторый момент времени. , $2 - матрицы

размерности /лх/к. , причем ОГг. отлична от нулевой.

, Задача преследования 2. Найти условия на параметры игры (4); (5), при которых существует такая контрстратегия преследова-

ния м?({) , что для вектора 2.С"0 являющегося решением уравнения ¿а) - с , ъсо)-, выполняется

вклвчение (5) при любом программном управлении убегавшего лг(4) не позднее некоторого конечного момента времени.

В § 2 приводится метод, с помощью которого можно решить задачу преследования 2. Введем обозначения: /К0"*О матрица размерности /И-Хлъ и К^гС-й! . иС0,91 положительный параметр

V/ Х(к)еС0"°рд т-йШъ^С!.

Предположение I, Для параметров дифференциальной игры (4) существует константа Т , 1^0, матрица непрерывна по -I: и положительный параметр К такие, что выполняется

а/ для всех е. СО |ТЗ -р

б/ - ЛСТ) е ЩТ^Ш и /иг СТ,^)е СГ,-Ь) измеримая функция 4: . для которой выполняется ~ ЛСГ) = \ /иг(Т^)сИ

/1 \ "'о

Обозначим через и> (Л) управление преследующего, являющееся

лексикографическим минимом решений следующего уравнения Г(К)еССТЛ,Ш = Д(ТЧШК)еСГ'Ъи)+«гСт^)) ^ Т]. Предположение 2. К моменту Т выполняется

Л (о, вст;с!))^сг)>о,

где Ь о; о) = + , ФМ- М'

с((0|й) _ хаусдорфово расстояние между множествами 0 л В . Предположение 3. В момент Т выполняется включение

- 10 -

М. л ЛЛ-

М з ОСТ) + 5Л1СГ) + ,

где

ОСТ) = ^ (А Сг-О-ЕЛ)Т(К) есСтч?)<3 , о

■р

Дг (Т) - л^х ]

Теорема 1Т Если для дифференциальной игры (4), (б) в позиции г" выполняются предположения I - 3, то для позиции разрешима задача преследования 2, причем Т - гарантированное время преследования.

В конце параграфа 2 приводится ряд примеров / дифференциальная игра мальчик и крокодил, игра двух крокодилов, контрольный пример Л.С.Понтрягина /. Предположения 1-3 приобретают конкретный вид для этих примеров. Исследована зависимость различных параметров и приводятся графики траекторий движения преследующего и убегающего.

Параграф 3 посвящен дифференциальной игре преследования группой преследователей одного убегающего со специальным терг-. минальным множеством. В основе метода лежит метод гарантированного неухудшения позиции. Основной результат сформулирован в: вида теоремы 2. В конце параграфа приводится пример, который демонстрирует использование теоремы 2.

В параграфе 4 рассматривается контрольный пример Л.С.Понтрягина. Пусть движение векторов хСО , в описывается дифференциальными уравнениями

Х'+ «¿х =

•• А (б>

^ -+ /Ь^ = Ь лг>

заданы начальные состояния х° , , х° , ; £ (Ь - положительные константы. Для параметров управления преследующего и убегающего справедливо, соответственно Р- [/й^ЙДЫ] , <3= ^ДГ.-ЦгЫ} . В Я* задано множество . Дифференциальный процесс (б) будем считать законче-ным, если выполняются следующие включения и равенство

х(9)у ^уЩ- + еСЛИ

х(9) + £>1 э у (9), если Их т = ^

X № = ^ (9)

где 9 >0 некоторый момент времени.

В основе метода, который предлагается для решения этой дифференциальной игры лежит метод предложенный Д.Зонневендом^Л Результаты сформулированы в виде теоремы 4.

Глава 3 посвящена некоторым вопросом дифференциальных игр со многими преследователями". В § I формулируются постановки тех задач, которые решаются в: следующих трех параграфах.

В параграфе 2 рассматривается следующая задача: в пространстве й2" имеем вектора

, движение

которых списывается дифференциальными уравнениями Хс=Д;, до

где £ — п, 2. . Заданы начальные состояния >(; , ,

= 0 . М-1 € £>2 = Р . лГе. 3 0. - управления преследующего и убегающего, соответственно. В К.2- заданы множества . Дифференциальную игру (8) будем считать

законченой, если выполняются следующие включения хотя бы для

I/ Зонневенд Д. Об одном методе преследования.- ДАН СССР, 1973, т. 208, Л 3, с. 520 - 523.

- 12 -одного ¡- , С = -1,2

(э)

У; (т) + £>1 э ^ (Т),

где Т* , Т , ум , Я - положительные константы, для которых выполняется и о") ~ постоянная

матрица.

Задача преследования Э. Найти условия на параметры дифференциального процесса (в), (э), при которых существует такая стратегия преследования - (м.*(&/ /С* (4:)) . что хотя вы для одного из векторов Х{Ш . являющихся решением уравнений (б) с управлением преследующих и при любом программном

управлении тбО е Ф , выполняются включения (э)-Введем обозначения

К И хЛт)11. ± е 3 С=4|2->

^ СО, -) Л1'- ) если > д, и о , если с А ,

Тг =

л §

Предположение I. Существуют положительные константы /и , Д. , для которых разрешимо относительно следующее урав-

нение

¿иЛ-ВДСт,*)- А1 к РгСПЧ/ВД)) V (Т{*~ "П) = 0}

где

- 13 -

р,сх) = Сх+, ас*)»

•и тг*>0 .

Пусть гшхп (Т^Т^*) , где

£

§

Г*

__. выполняется

N(7*) = I, ?Т*- -97; - 26" Ду %(т*)/ р^Ст;).

Обозначим

к-^-счеп-^)- Р, с-^+л1^ ает^/ас-р +

Предположение Зг В момент времени

т*

выполняются неравенства ¿2 > Я , £>ЛК. , у« > К. и' справедливы либо неравенства (ю), либо неравенства (.11)

11) * Р.ХШ- Я)? + 2<5-МСт*)),

' (ю)

N(Т*) ¿-<0 ) а1-£)Ч><о(<о'К) •> 4

где

Теорема 2. Если для дифференциального процесса (б), (э)

в позиции к,0 , х° , выполняются предположения I - Зг то для этих начальных позиций разрешима задача преследования 3 не позже времени Т , причем' Т-Т*+-}: -.гарантированное время преследования, где -к*»- (]|(Н(Т*)- 5 ^-(И(Т*)-<з1У?.

В § 3 мы рассматриваем квазилинейную задачу преследования, в которой есть преследователи разной инерционности, но у которых нет динамического превосходства над убегающим. В первой части параграфа в теореме 3 формулируются достаточные условия разрешимости дифференциальной игры преследования. Предлагаемый метод состоит в том, что часть преследователей осуществляет прочесывание некоторой области, а вторая часть преследователей удерживает убегающего в этой области^. Во второй части параграфа мы рассматриваем устойчивость этого метода. Достаточные условия устойчивости формулируются в теореме 4. В теореме 5 показано насколько близка решения исходной и воз-мущеной задачи.

В параграфе 4 мы решаем одну экстремальную задачу, которая возникает при решении дифференциальных игр со многими преследователями. При вычислении корней уравнения 0 . что является: одним из важнейших эталон решения дифференциальных игр преследования, необходимо решать следующую задачу

¡гк,

геф 4ге(5

- - (-Ь-Г) тиль т.Т.г, г",

Решение этой задачи рассматривается в § 4. Сначала мы фиксируем начальные положения и рассматриваем вычисление минимума в зависимости от ограничений на управление преследующих .

* " ' "' — -II- | *. . ||. .....—

I/ Григоренко НЛ. Дифференциальные игры преследования несколькими объектами.- М.: Изд-во Моск. ун-та, 1963, 79 с.

i" t2|~ ,/W- и-убегающего £~ . ßo второй части мы фиксируем

■ § . L=i|2r..)/w. и £ и рассматриваем вычисление минимума в зависимости от начальных положений. Результаты приводятся Вгтеоремах 6 - 14. Значение этих результатов особенно важно при численном решении дифференциальных игр» когда для вычисления корней выше написангаогсг уравнения не надо устраивать перебор с некоторым шагом управлений убегающего, для отыскания минимума с некоторой ошибкой, а можно вычислить точное значение минимума.

В конце параграфа приводится пример, в котором показана разница между результатами подсчитаными- в согласии1 с теоремами § 4, которые: дают точный ответ на задачу: гглхм. г) и результатами приблизительного поиска /wum. %г) некоторым перебором векторов U~£ Q

Дальше в диссертационной работе находятся четыре- приложения. В приложении I собраны в виде утверждений все основные факты, которые используются в этой работе.

В приложении 2 показано, как можно задачу преследования со специальным терминальным множеством, которая сформулирована в §1 главы 2, преобразовать в другую задачу преследования. У новой задачи- преследования нелинейность из условия окончания перешла в правую часть дифференциального уравнения, которое описывает движение системы. Для таких дифференциальных игр. разработана достаточно обширная теория решения.

Целью приложения 3 является показать широкие возможности теории дифференциальных игр при решении задач из практики. В параграфе I приводится математическая модель каскада водохранилищ, которая описана системой обыкновенных дифференциальных уравнений. Если мы захотим иметь математическую модель поточнее, придется вводить элемент запаздывания. Надо отметить.

что это является характерной чертой задач, описывающих реальные ситуации, так как обычно всегда нужно некоторое: время для того, чтобы появилась реакция или ответ на какой-либо импульс.

В § 2 построена математическая модель управления синтезом белка в бактериальных средах..

В § 3 приводится математическая модель в иммунологии. Математическое моделирование в иммунологии является одним из инструментов познания законов иммунитета, которые лежат в основе таких проблем как иммунотерапия, пересадка органов и тканей, инфекционные заболевания / особенно хронические / и рак. В этом параграфе приводится простейшая математическая модель - ПММ инфекционного заболевания. Интересным является и расширение ПММ на инфекцию нескольких разных вирусов: ¿.= ^,2,.--,М , что напоминает дифференциальные игры с несколькими участниками.

В приложении 4 находятся программы, по расчетам которых были" получены результаты и графики в параграфе 2 главы 2.

Автор- выражает глубокую благодарность профессору Григорен-ко H.JI. за постановку задач и внимание к работе. По теме диссертации опубликованы следующие работы:

1. Попович М. Эффективный метод решения одного класса дифференциальных игр многих лиц,- Резьюме докладов и сообщений КДУ - III, Русе, 1985, с. 99.

2. Попович М. К численному решению одного класса дифференциальных игр многих лиц,- Вестник МГУ, сер. 15, 1987, Ji I, с. 41 - 46.

3.- Попович М. Дифференциальные игры со специальным терминальным множеством,- Тезисы 1й международной научной конференции чехословацких аспирантов и студентов в СССР с участием молодых ученых социалистических стран, Москва, 1968,

с. 140 - 142.