Об одном методе преследования в теории дифференциальных игр

Карабаев, Эргашали Ортыкович

Об одном методе преследования в теории дифференциальных игр тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Карабаев, Эргашали Ортыкович АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Ташкент МЕСТО ЗАЩИТЫ

1984 ГОД ЗАЩИТЫ

01.01.02 КОД ВАК РФ

Диссертация по математике на тему «Об одном методе преследования в теории дифференциальных игр»

Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Карабаев, Эргашали Ортыкович

Введение.

Глава I. О методах преследования в дифференциальных играх.

§1. Постановка задачи и предварительные построенияЛб

§2. Об одном способе построения управления преследователя для одного класса линейных дифференциальных игр.

§3. Об одном обобщений третьего метода преследования в линейных дифференциальных играх

§4. Задача преследования для одного класса квазилинейных дифференциальных игр.

Г л а в а II. О преследовании по позиции в линейных дифференциальных играх.

§1. Постановка задачи и её решение в случае третьего метода.

§2. Обобщенные управления для задачи преследования в линейных дифференциальных играх

§3. Об улучшении времени преследования в линейных дифференциальных играх.

Г л а в а Ш . Квазилинейная задача преследования несколькими управляемыми объектами одного убегающего объекта.

Введение диссертация по математике, на тему "Об одном методе преследования в теории дифференциальных игр"

I. В настоящей диссертации исследуются некоторые задачи теории линейных и квазилинейных дифференциальных игр преследования.

Теория дифференциальных игр - новое направление математической теории управления, она тесно связана с математической теорией оптимальных процессов, теорией игр, вариационным исчислением и теорией дифференциальных уравнений. Проблемы теории дифференциальных игр имеют своим источником такие актуальние прикладные задачи, как преследование одного управляемого объекта другим, приведение управляемого объекта в заданное состояние при неизвестных заранее возмущающих силах, задачи военного характера, задачи из экономики и др. Актуальность этих задач и большой теоретической интерес, который они представляют, обусловили быстрое развитие теории дифференциальных игр. Предметом теории дифференциальных игр явля.ется изучение управления объектами в конфликтных случаях, движения которых описываются дифференциальными уравнениями.

Первые работы теории дифференциальных игр проявились в начале 50-х годов. Начиная с этого времени дифференциальные игры являются основным предметом исследований многих советских и зарубежных ученых. Одними из первых серезных исследований являются работы американского математика Р.Айзекса, который и ввел термин "Дифференциальная игра". Он в своей монографии/ I / развил оригинальный метод решения весьма общих дифферент циальных игр, рассмотрел целый ряд прикладных задач и получил интересные результаты. В настоящее время многие специалисты занимаются развитием и применением метода Р.Айзекса ( см., например работы / 2,8,13,28,36,40-44 /. Среди зарубежных исследований следует также отметить работы А.Фридмана / 33 / , У.Флеминга У 32 У и др.

Фундаментальный вклад в теорию дифференциальных игр внесли советские ученые, возглавляемые академиками Л.С.Понтрягиным и Н.Н.Красовским. В работрах Л.С.Понтрягина / 21 /, Н.Н.Красовского / 12,13 /, Е.Ф.Мищенко / 17,18 /, Б.Н.Пшеничного I 22/, Р.В.Гам-грелидзе и Г.Л.Хараташвили / 41 /, Л.А.Петросяна /20/ дифференциальные игры рассмотрены как конфликтно-управляемые системы и предложены различные их формализации.

В / 21 а),б / Л.С.Понтрягиным получены достаточные условия для возможности завершения преследования в линейных дифференциальных играх. В / 21 а / использован формализм принципа максимума - одного из центральных методов математической теории управления.

Упрощение результатов / 21 б /, полученное Л.С.Понтрягиным и Е.Ф.Мищенко / 17 /, в конечном счете привело к созданию Л.С.Понтрягиным первого и второго ( прямых ) методов решения задачи преследования для линейных дифференциальных игр / 21 в,г /.

В исследованиях Н.Н.Красовского / 12 /Д.И.Субботина /29/, А.Г.Ченцова / 34 / и их учеников и сотрудников-изучаются позиционные дифференциальные игры, для которых сформулированы задачи сближения и уклонения, предложены реализуемые на ЭВМ процедуры управления.

В / 22 а,б / Б.Н.Пшеничным рассмотрены нелинейные дифференциальные игры общего вида, для которых им предложена процедура, определяющая необходимые и достаточные условия разрешимости задачи преследования. Интересные результаты получены в 22 в / Б.Н.Пшеничным при исследовании линейных дифференциальных игр.

В продолжение первого и второго метода Л.С.Понтрягина в / 24 а / Н.Сатимовым предложен новый метод преследования в линейных дифференциальных играх. Этот метод, который мы называем третьим методом, подробно исследуется в настоящей диссертации.

В теории дифференциальных игр более общей является ситуация, когда в игре принимают участие несколько преследователей и несколько убегающих. В этом случае дифференциальная игра называется дифференциальной игрой многих лиц. Такие игры охватывают многие задачи,например,задачу убегания одного управляемого объекта от группы преследователей,задачу избежания столкновения с несколькими препятствиями и др. Задаче преследования в дифференциальных играх многих лиц посвящены работы Н.Л.Григоренко /б /, Б.Н.Пшеничного, А.И.Чикрия и И.С.Раппопорта / 22 а,23,3б,37 /, Н.Сатимова и А.Азамова / 26 /, Н.Сатимова и М.Ш.Маматова / 27 /, С.И.Тарлинского / 30 / и др.

В нашей диссертации мы следуем формализации дифференциальных игр, предложенной Л.С.Понтрягиным / 21 /. Поэтому кратко поясним ее на задаче преследования.

Пусть движения преследующего объекта X и убегающего объекта описываются дифференциальными уравнениями

X = f(x,tD, < о-1 ) где X € И и £ - фазовые векторы, Г - п - мерное евклидово пространство, U и параметры управления преследователя и убегающего соответственно. Обозначим через

Xi и геометрические положения объектов jT и j/ соответственно, а через и остальные их координаты.

Тогда имеем • Г (I)

Процесс преследования заканчивается в тот момент времени, когда впервые выполнено равенство

0.2) или неравенство llXi-tylui, (о.з) где £ - фиксированное положительное число. В первом случае (( 0.2 )) говорят о точной поимке, во втором случае (( 0.3 )) -об £ поимке.

В игре ( 0.1 ) управления II- tt(-fc) и 1?= удовлетворяют различным ограничениям. Например, они могут удовлетворять геометрическим ограничениям: г?ев , иеР, (о.4) где G 1& Р - некоторые подмножества в пространствах Т)Р и К или интегральным ограничениям ос оо r9 (о.з) о о где р и О1 - некоторые положительные числа.

В работах М.С.Никольского / 19 а,б /, А.Я.Азимова/3 а,б/, В.Н.Ушакова / ПММ, 36, №5, 1972, с. 15 - 23. /, А.З.Фазылова / 31 / и др. рассмотрены интегральные ограничения и другие виды ограничений.

В настоящей диссертации управляющие параметры удовлетвор

- 7 яют геометрическим ограничениям ( 0.4 )*

Пуоть (4(ОС,и) \

Ясно, что в этом случае уравнения ( 0.1 ) записываются в виде одного уравнения о.б) где TvG $ 9 tl и удовлетворяют условиям ( 0.4 ), V и G - непустые подмножества пространств И и соответственно. Соотношение ( 0.2 ) или ( 0.3 ) выделяет в фазовом пространстве И некоторое множество, обычно называемое терминальным множеством игры ( О.б ) и обозначаемое буквой Ж >

В работах Л.С.Понтрягина / 21 / и его последователей дифференциальная игра рассматривается отдельно с тоски зрения преследующего и отдельно с точки зрения убегающего. В нашей диссертации изучается лишь задача преследования, сформулированная в работах / б, 13, 21, 24 /. При решении этой задачи мы будем, отождествлять себя с преследователем. Тогда управляющий параметр USР находится в нашем распоряжении. Таким образом, в каждый момент времени ^ О мы должны конструировать значение функции U(ir) управления 1С 6 V * зная уравнения ( О.б ), значения функций %($>), ^S^ Ь , и ^(S) , ir ^ 9 А-6 + в^ так, что соответствующая управлениям U(i:) и т) траектория уравнения ( О.б ), исходящая из начального состояния попадает на Jt за время, не превосходящее тем • Число называется временем преследования.

Пусть y(-t) = [i-6,i] и I(i)-[i,t*£],i>0,£фиксированное неотрицательное число. Тогда вторая часть используемой для построения IL = И (t) информации запишется в виде ^^/ j-^;' Отображения У&) и Id) считаются заданными, т.е. они входят перечень правил игры. Из этих соображений следует считать, что дифференциальная игра преследования задана, если заданы: а) фазовое пространство игры ; б) области управления параметров U и ; в) функция F ; г) терминальное множество JH ; д) отображения У а) и е) классы допустимых управлений.

Дифференциальная игра ( 0.6 ) называется линейной дифференциальной игрой в случае, когда где С постоянная матрица, (X - некоторая точка из Ц ; квазилинейной дифференциальной игрой в случае, когда где Р * Q —> Л - непрерывное ограниченное отображение.

При изучении некоторых классов квазилинейных ( следовательно, и линейных ) дифференциальных игр завершение преследования понимается в следующем смысле.

ОПРЕДЕЛЕНИЕ 0.1. Пусть €Ц \ М.

Будем говорить,что из точки %о возможно завершение преследования за время Т(%0), если можно построить борелевски измеримую функцию и* и

7Y&?)> такую, что для любой измеримой функции решение, ( траектория ) %?

041 fa), уравнения попадает на

Ж , х.ъЛШЯ для некоторого f в (о, ту 7. В некоторых параграфах настоящей диссертации завершение преследования понимается в несколько другом смысле. А именно , под стратегией ( управлением ) преследователя понимается совокупность

Т,и?, НО*-'-)}, гд разбиение отрезка [О, Т], иО>—)--ЯП*№>Т]*в V > причем 21(^*9*борелевски измеримая функция при каждом фиксированном ДГ . Пусть !/(')' [О, е°) Q- произвольная измеримая функция. Каждой точке % & $ » стратегии преследователя и функции ставится в соответствие траектория XfaZ^^Zft0,** fr^U (-*-,-)} ,&(.)}) , фазовой точки Зг следующим образом. Сужение траектории » £ Т, - решение траектория ) уравнения сужение j[-t,траектории тб^Х ) 7 Т1 , решение; уравнения и т.д.,

Ьк 1 Т] ~ Решение уравнения

4>(U(%ttK^,%0),i, V-Ш), t/a)),

ОПРЕДЕЛЕНИЕ 0.2. Пусть € JL Будем говорить, что из точки %о возможно завершение преследования за время I если существует стратегия преследователя такая, что для произвольной измеримой функции Q траектория попадает на множество Л , т.е. для некоторого

Связб между определениями 0.1 и 0.2 очевидна.: если можно из точки %о завершить преследование в смысле определения 0.1, то из этой точки возможно завершение преследования и в смысле определения 0.2 ( достаточно положить Ю— {},

Уi^) ); разумеется, что обратное утверждение неверно.

Под задачей преследования понимают задачу нахождения начальных точек, из которых возможно завершение преследования в смысле того или иного определения.

2. В этом, пункте кратко изложим основные результаты диссертации.

Диссертация состоит из введения, трех глав и списка литературы.

Заключение диссертации по теме "Дифференциальные уравнения"

включение с &(Я>), ( 2.17) тогда в силу ( 2.15 ) - ( 2.17 ) включение ( 2.14 ) перепишется л; в виде Шй) с s а о). Из этого включения следует непрерывность Vf(-t) снизу. С другой стороны, из выпуклости и компактности множеств

М1 , Р и (л следует ограV ниченность и замкнутность множества ( см. леммы 2-8, стр. 30 - 33 из работы / 19 г / ). Тогда в силу работы / 5 /

Л/ см. теорему 5, стр. 63 ) множество Wft) полунепрерывно сверху ( см. также / 4 /, леммы 1,2, стр. 4,5 ). Тем самым не

А/ прерывность

WW доказана. Пусть S=5(1)CA, с (у, шг0-1))1. (2.18)

УТВЕРЖДЕНИЕ 2.4. Если , то максимум в 2.18 ) достигается на единственном векторе Ю •

Доказательство. Предположим от противного, т.е. имеются М И ^ такие, что 0 и т, ё(Ро е см, -wfrfo -1)л fcft,йа (<рЛ,жж-/;;.

Пусть

- 73

Тогда fi'/i ft, Ю= , £ <Г?о ~t) % J>

-Сс^^ШГ,^))- ССУя^Го-*)).

Так как , 1Гf?o-t)) 4 т.е. ^ sr^myc гижго-т

Последнее неравенство противоречит ( 2.18 ). Если же НФа II'= О , то легко проверить, что {-б^ЗО * Полученное противоречие доказывет единственность лП-УТВЕРЖДЕНИЕ 2.5. Пусть Тогда вектор функция в окрестности точки непрерывна по

-t и % .

Доказательства этого утверждения следует из работы / 13 а / ( см. стр. 584 ).

Теперь определим управление первого игрока следующим образом

I г ■> если f , 2Isn

В силу утверждения 2.1 множество (У^л/ выпукло и

- 74 Тогда в силу теоремы из работы / 5 / см. стр. 63 ) Uполунепрерывно сверху относительно включения.по совокупности а, #). Так как ( см. ( 2.4 ) и ( 2.19 ) ), то по определению 2.1 функция

U а, ю является допустимым управлением первого игрока.

ТЕОРЕМА. 2.2. Если to удовлетворяет условию ( 2.5 ), то управление UCi^) (( 2.19 )) гарантирует завершение игры за время 1о .

Доказательство. Пусть %* - некоторая точка из Т^ Обозначим через решение уравнения ( 2.1 ), соответствующего паре управлений Q и удовлетворяющее условию Z16), % *-> где - произвольное число из

Го> Го-а],

5 - определяется ниже. Пусть Ь t произвольная суммируемая функция со значениями из множества & . Рассмотрим решение

И[ш]>1?С')) уравнения ( 2.1 ), где

UmeUM)* произвольная суммируемая функция. Покажем, что вдоль траектории % ft], £ в, функция %ftJ) - lift], + £ , -убывающая.

Пусть 7гС1*]>0 , тогда существует положительное число

5 такое, что ftli:7 при всех в силу утверждения 2.4 существует единственная непрерывеая функция

1= P&Jf/t]), такая, что it (i7= J)

- C(V[t7, . ( 2.20 )

С другой стороны, по смыслу 'km существует точка такая, что 6 € - ) „ II £> (to-1)%*°- € сс, - т у/ ■

В силу утверждения 2.2 существует управление

U(t)6P9 такого, что с помощью управлений и Z^{-&)■> t* точка Шс е переводится в точку £(f0- € где U0)> .

Ясно, что тогда имеет место неравенство

Так как то из ( 2.20 ) получим

-ь^е, -t*

- (V£t*+eiy 6(£o-t)%> fЪ(t*

-t* т.е.

J (V&r+sh (u&y uf6])) ae . (2.21)

Ф/^г], (гуuffl)) ^ u. ( 2.22)

Обозначим через do минимальное из тех бС , для которых имеет место ( 2.22 ). Ясно, что в силу ( 2.4 ) имеет место неравенство Uo^O , тогда неравенство ( 2.21 ) имеет вид

Так как УМ и

Так как непрерывны на компактное множество, то существует такое число , что непрерывны на h£i*+ei £it,£i*i+ dot т.е.

Из произвольности следует справедливость утверждения.

Пусть преследователь применяет произвольное суммируемое управление

UI41 ИЗ U> 0^-6 4 "to . Поскольку ft[Ohh,(09%o)£ О ( см. ( 2.5 ) и ( 2.18 ) ), то для любого 4 € £О, ?ol И % £41= % ft, 0> %<?9 u[-h W) ) имеет место неравенство .Тогда из ( 2.18 ) получим, что

УМ, бсго-тм)^ c(№J,wfo-t)), о^-гг^о, т.е. € ,

Вчастности (0)%[й1 <Г Шо) или it%ff°] <? Mi. В силу ( 1.15 ) £ Jit • Теорема доказана.

II. Из ( 2.19 ) следует, что урравление W^P зависит от фазового состояния т.е. lift1=

Тогда уравнение ( 2.1 ) является нелинейным относительно . Это обстоятельство затрудняет решение поставленной задачи. Поэтому в этом пункте в каждом сегменте [4it4i+il* > -bo^O? , строится допустимое управление преследователя, зависящее только от фазового состояния С41гКё.) и переменного -Ь € £4i, 4i+il

Пусть сегмент £0, То! разделен точками на Л/ равных частей I4ly4t+ll, где ^as-Po.

Вычисляем величины = Xi), # = Hi)

Пусть

TJltth {и€Р'- (9i, ё(Го^)Р)} > С 2-23 > р , если

Uift), если 2.24 )

Ue(t)=\

Ui°(*)9 если О^ г^Л если

2.25) если

Выше мы доказали, что является допустимым управление . Аналогично доказывается, что и - допустимое управление.

Через обозначим о окрестность множества Л, т.е. Имеет место следующая теорема.

ТЕОРЕМА 2.3. Пусть , С^б^Ро произвольное суммируемое управление убегающего. Тогда для любого 0 можно указать такое б>0 , что управление XJg (( 2.25 )) переводит точку в М-Р

Доказательство. Пусть / ( 2,26 } о

Теперь докажем, что для любого можно указать такое £>Оу что для любого %e(t)€ (')>£)> Odzt^Po 1 существует такое, что

-max // $ . ( 2.27)

Предположим от противного. Тогда существует последовательность ц т О^-б^^о такая, что при оо > ® и шах И 2.28)

О ^ & с •> J. ~ % при любом где определяется соотношением ( 2.19 ). С другой стороны, из С 2.23 ) 2.25 ) следует, что %(TJejO)* - выпуклое компактное множества из К- . Тогда из последовательности I %• Ш можно выделить подпоследовательность сходящуюся к функции е%( U(■>%), +), от Я,.

Действительно,из ( 2.4 ) и ( 2.23 ) следует, что

UiG)- ЪуШ»), ti^Ui+ej.

Ясно, что при J00 имеем ° > см. ( 2.19 ) и ( 2.23 )). Из ( 2.26)следует, что %*&)€ %(U O^^fo.

Если теперь в ( 2.28 ) положим то о.

Это противоречие доказывает неравенство ( 2.27 ). Пусть

Го = -max -ткх [(&,& (й-т?7. означает максимальное расстояние от точки &CTo-t)%e (t)

V ^ до множества

Шй-i) при -t€[0,Pol.

Так как при имеем

О^б^То ( теорема 2.2 ), то из 2.27 ) получим Теорема доказана.

ПРИМЕР 2.2. Рассмотрим пример 2.1. Можно установить, что hi. = u&m+cfo- ытш)и-[-£+ <r(?o-ti)i, ц&{-и)*(£е-и)%.я МОП

Ui ft) =

Р ? если drO

O.yVi?**ели ht;>o где О - нулевой вектор из . Для управления убегающего выбираем функцию l/U)- ~ f г-ьг-^у. % луею-тои

Вычисления показывают, что То удовлетворяет уравнениюОь где и §л 6 т х ft) = (Xi ft), ОСfi rt-Jj т

Рис.I а. Пусть /=/£ ,

Хо= (го, 0)т, Хо=

•.е. %*СО)= fro ~ ПО, /of 0Т,

БЛОК-СХЕМА РЕШЕНИЯ ПРИМЕРА 2.2

Рис.1 б.

Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Карабаев, Эргашали Ортыкович, Ташкент

1. Айзеке Р. Дифференциальные игры. Мир, 1967, 480 с.

2. Батухтин В.Д., Субботин А,И. Об условиях завершения игры преследования. Изв. АН СССР,Техническая кибернетика,И,1972,с.3-8.

3. Коддингтон Э., Левинсон Н. Теория обыкновенных дифференциальных уравнений. М., ИЛ, 1958.

4. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М., Наука, 1968, 469 с.12. Красовский Н.Н.а) Игровые задачи о встрече движений. М. , Наука, 1970, 420 с.б) Дифференциальная игра сближения-уклонения I.

5. Изв. АН СССР, Техническая кибернетика, №2, 1973, с. 3-18.в) Дифференциальная игра сближения-уклонения II.

6. Изв. АН СССР, Техническая кибернетика, Ю, 1973, с. 22-42.

7. Сатимов Н., Рихсиев Б,Б. К полному исследованию обобщенного контрольного примера Л.С.Понтрягина. ДУ, т. ХУ, Ю, 1979, с. 436-443.

8. Сатимов Н., Азамов А. О задачах преследования и убегания в дифференциальных играх с произвольным числом игроков. ДАН УзССР, №10, 1979, с. 6-7.

9. Сатимов Н.,.Маматов М.Ш. Об одном классе линейных дифференциальных игр преследования и убегания. Труды ТашГУ, №670, 1981, с. 64-75.

10. Тарлинский С.И. Об одной линейной дифференциальной игре сближения нескольких управляемых объектов. ДАН СССР, 230, Ю, 1976, с. 534-537.

11. Фазылов А.З. О линейных дифференциальных играх преследования при различных ограничениях на управления игроков. Изв. АН УзССР, сер. физ.-мат. наук, £2, 1980, с. 79-80.

12. Ченцов А.Г. Об игровой задаче сближения в данный момент времени. Математ. сб., 99, №3, 1976, с. 395-420.

13. Черноусько Одна задача уклонения от многих преследователей. ПММ, 40, 1976, с. 14-24.

14. Чикрий А.А., Раппопорт И.С. Поимка убегающего несколькими преследователями. Теория оптимальных решений. Киев, 1978, с. 59-65.

15. Ъегп/шШ P. -Hn^ulae шг^сссг^ t^n cuf&wiu-а£ fycwtzi. L-eot. Jfbfab* Уп^ръш. М 3,19У?,р.1-33.а£ уалим. У JHcufi. cmrtcU. Wi, Р-10&-Н6.vrnwn, 1964, p. 195-Я 10. 41. &awkidcd$-e Я, г/., О Л. Л oU^eten

16. Ю The tosmPeZtymce pzv££ew foe (fyamlS I'ln: ^оСг^ШШг m ааш£ -th&ottf "Рыфьtied of еРайап uMth -wmltnzab wutot.

17. ШЛ. у. CwUt., 19Щ, P. Ш-Ш.

18. X) ЬэштрЬ. m putuu-t fhcOby. SttwlUz mat.,1. M, 196A, p, i-6.

19. PuazwU (^unU %€И. шси^с. W5 P, р/н>&п.

20. Ma,*., jfs Ъ, 1QW, p. H-U.