Об одном методе преследования в теории дифференциальных игр тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Карабаев, Эргашали Ортыкович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Ташкент
МЕСТО ЗАЩИТЫ
|
||||
1984
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
Введение.
Глава I. О методах преследования в дифференциальных играх.
§1. Постановка задачи и предварительные построенияЛб
§2. Об одном способе построения управления преследователя для одного класса линейных дифференциальных игр.
§3. Об одном обобщений третьего метода преследования в линейных дифференциальных играх
§4. Задача преследования для одного класса квазилинейных дифференциальных игр.
Г л а в а II. О преследовании по позиции в линейных дифференциальных играх.
§1. Постановка задачи и её решение в случае третьего метода.
§2. Обобщенные управления для задачи преследования в линейных дифференциальных играх
§3. Об улучшении времени преследования в линейных дифференциальных играх.
Г л а в а Ш . Квазилинейная задача преследования несколькими управляемыми объектами одного убегающего объекта.
I. В настоящей диссертации исследуются некоторые задачи теории линейных и квазилинейных дифференциальных игр преследования.
Теория дифференциальных игр - новое направление математической теории управления, она тесно связана с математической теорией оптимальных процессов, теорией игр, вариационным исчислением и теорией дифференциальных уравнений. Проблемы теории дифференциальных игр имеют своим источником такие актуальние прикладные задачи, как преследование одного управляемого объекта другим, приведение управляемого объекта в заданное состояние при неизвестных заранее возмущающих силах, задачи военного характера, задачи из экономики и др. Актуальность этих задач и большой теоретической интерес, который они представляют, обусловили быстрое развитие теории дифференциальных игр. Предметом теории дифференциальных игр явля.ется изучение управления объектами в конфликтных случаях, движения которых описываются дифференциальными уравнениями.
Первые работы теории дифференциальных игр проявились в начале 50-х годов. Начиная с этого времени дифференциальные игры являются основным предметом исследований многих советских и зарубежных ученых. Одними из первых серезных исследований являются работы американского математика Р.Айзекса, который и ввел термин "Дифференциальная игра". Он в своей монографии/ I / развил оригинальный метод решения весьма общих дифферент циальных игр, рассмотрел целый ряд прикладных задач и получил интересные результаты. В настоящее время многие специалисты занимаются развитием и применением метода Р.Айзекса ( см., например работы / 2,8,13,28,36,40-44 /. Среди зарубежных исследований следует также отметить работы А.Фридмана / 33 / , У.Флеминга У 32 У и др.
Фундаментальный вклад в теорию дифференциальных игр внесли советские ученые, возглавляемые академиками Л.С.Понтрягиным и Н.Н.Красовским. В работрах Л.С.Понтрягина / 21 /, Н.Н.Красовского / 12,13 /, Е.Ф.Мищенко / 17,18 /, Б.Н.Пшеничного I 22/, Р.В.Гам-грелидзе и Г.Л.Хараташвили / 41 /, Л.А.Петросяна /20/ дифференциальные игры рассмотрены как конфликтно-управляемые системы и предложены различные их формализации.
В / 21 а),б / Л.С.Понтрягиным получены достаточные условия для возможности завершения преследования в линейных дифференциальных играх. В / 21 а / использован формализм принципа максимума - одного из центральных методов математической теории управления.
Упрощение результатов / 21 б /, полученное Л.С.Понтрягиным и Е.Ф.Мищенко / 17 /, в конечном счете привело к созданию Л.С.Понтрягиным первого и второго ( прямых ) методов решения задачи преследования для линейных дифференциальных игр / 21 в,г /.
В исследованиях Н.Н.Красовского / 12 /Д.И.Субботина /29/, А.Г.Ченцова / 34 / и их учеников и сотрудников-изучаются позиционные дифференциальные игры, для которых сформулированы задачи сближения и уклонения, предложены реализуемые на ЭВМ процедуры управления.
В / 22 а,б / Б.Н.Пшеничным рассмотрены нелинейные дифференциальные игры общего вида, для которых им предложена процедура, определяющая необходимые и достаточные условия разрешимости задачи преследования. Интересные результаты получены в 22 в / Б.Н.Пшеничным при исследовании линейных дифференциальных игр.
В продолжение первого и второго метода Л.С.Понтрягина в / 24 а / Н.Сатимовым предложен новый метод преследования в линейных дифференциальных играх. Этот метод, который мы называем третьим методом, подробно исследуется в настоящей диссертации.
В теории дифференциальных игр более общей является ситуация, когда в игре принимают участие несколько преследователей и несколько убегающих. В этом случае дифференциальная игра называется дифференциальной игрой многих лиц. Такие игры охватывают многие задачи,например,задачу убегания одного управляемого объекта от группы преследователей,задачу избежания столкновения с несколькими препятствиями и др. Задаче преследования в дифференциальных играх многих лиц посвящены работы Н.Л.Григоренко /б /, Б.Н.Пшеничного, А.И.Чикрия и И.С.Раппопорта / 22 а,23,3б,37 /, Н.Сатимова и А.Азамова / 26 /, Н.Сатимова и М.Ш.Маматова / 27 /, С.И.Тарлинского / 30 / и др.
В нашей диссертации мы следуем формализации дифференциальных игр, предложенной Л.С.Понтрягиным / 21 /. Поэтому кратко поясним ее на задаче преследования.
Пусть движения преследующего объекта X и убегающего объекта описываются дифференциальными уравнениями
X = f(x,tD, < о-1 ) где X € И и £ - фазовые векторы, Г - п - мерное евклидово пространство, U и параметры управления преследователя и убегающего соответственно. Обозначим через
Xi и геометрические положения объектов jT и j/ соответственно, а через и остальные их координаты.
Тогда имеем • Г (I)
Процесс преследования заканчивается в тот момент времени, когда впервые выполнено равенство
0.2) или неравенство llXi-tylui, (о.з) где £ - фиксированное положительное число. В первом случае (( 0.2 )) говорят о точной поимке, во втором случае (( 0.3 )) -об £ поимке.
В игре ( 0.1 ) управления II- tt(-fc) и 1?= удовлетворяют различным ограничениям. Например, они могут удовлетворять геометрическим ограничениям: г?ев , иеР, (о.4) где G 1& Р - некоторые подмножества в пространствах Т)Р и К или интегральным ограничениям ос оо r9 (о.з) о о где р и О1 - некоторые положительные числа.
В работах М.С.Никольского / 19 а,б /, А.Я.Азимова/3 а,б/, В.Н.Ушакова / ПММ, 36, №5, 1972, с. 15 - 23. /, А.З.Фазылова / 31 / и др. рассмотрены интегральные ограничения и другие виды ограничений.
В настоящей диссертации управляющие параметры удовлетвор
- 7 яют геометрическим ограничениям ( 0.4 )*
Пуоть (4(ОС,и) \
Ясно, что в этом случае уравнения ( 0.1 ) записываются в виде одного уравнения о.б) где TvG $ 9 tl и удовлетворяют условиям ( 0.4 ), V и G - непустые подмножества пространств И и соответственно. Соотношение ( 0.2 ) или ( 0.3 ) выделяет в фазовом пространстве И некоторое множество, обычно называемое терминальным множеством игры ( О.б ) и обозначаемое буквой Ж >
В работах Л.С.Понтрягина / 21 / и его последователей дифференциальная игра рассматривается отдельно с тоски зрения преследующего и отдельно с точки зрения убегающего. В нашей диссертации изучается лишь задача преследования, сформулированная в работах / б, 13, 21, 24 /. При решении этой задачи мы будем, отождествлять себя с преследователем. Тогда управляющий параметр USР находится в нашем распоряжении. Таким образом, в каждый момент времени ^ О мы должны конструировать значение функции U(ir) управления 1С 6 V * зная уравнения ( О.б ), значения функций %($>), ^S^ Ь , и ^(S) , ir ^ 9 А-6 + в^ так, что соответствующая управлениям U(i:) и т) траектория уравнения ( О.б ), исходящая из начального состояния попадает на Jt за время, не превосходящее тем • Число называется временем преследования.
Пусть y(-t) = [i-6,i] и I(i)-[i,t*£],i>0,£фиксированное неотрицательное число. Тогда вторая часть используемой для построения IL = И (t) информации запишется в виде ^^/ j-^;' Отображения У&) и Id) считаются заданными, т.е. они входят перечень правил игры. Из этих соображений следует считать, что дифференциальная игра преследования задана, если заданы: а) фазовое пространство игры ; б) области управления параметров U и ; в) функция F ; г) терминальное множество JH ; д) отображения У а) и е) классы допустимых управлений.
Дифференциальная игра ( 0.6 ) называется линейной дифференциальной игрой в случае, когда где С постоянная матрица, (X - некоторая точка из Ц ; квазилинейной дифференциальной игрой в случае, когда где Р * Q —> Л - непрерывное ограниченное отображение.
При изучении некоторых классов квазилинейных ( следовательно, и линейных ) дифференциальных игр завершение преследования понимается в следующем смысле.
ОПРЕДЕЛЕНИЕ 0.1. Пусть €Ц \ М.
Будем говорить,что из точки %о возможно завершение преследования за время Т(%0), если можно построить борелевски измеримую функцию и* и
7Y&?)> такую, что для любой измеримой функции решение, ( траектория ) %?
041 fa), уравнения попадает на
Ж , х.ъЛШЯ для некоторого f в (о, ту 7. В некоторых параграфах настоящей диссертации завершение преследования понимается в несколько другом смысле. А именно , под стратегией ( управлением ) преследователя понимается совокупность
Т,и?, НО*-'-)}, гд разбиение отрезка [О, Т], иО>—)--ЯП*№>Т]*в V > причем 21(^*9*борелевски измеримая функция при каждом фиксированном ДГ . Пусть !/(')' [О, е°) Q- произвольная измеримая функция. Каждой точке % & $ » стратегии преследователя и функции ставится в соответствие траектория XfaZ^^Zft0,** fr^U (-*-,-)} ,&(.)}) , фазовой точки Зг следующим образом. Сужение траектории » £ Т, - решение траектория ) уравнения сужение j[-t,траектории тб^Х ) 7 Т1 , решение; уравнения и т.д.,
Ьк 1 Т] ~ Решение уравнения
4>(U(%ttK^,%0),i, V-Ш), t/a)),
ОПРЕДЕЛЕНИЕ 0.2. Пусть € JL Будем говорить, что из точки %о возможно завершение преследования за время I если существует стратегия преследователя такая, что для произвольной измеримой функции Q траектория попадает на множество Л , т.е. для некоторого
Связб между определениями 0.1 и 0.2 очевидна.: если можно из точки %о завершить преследование в смысле определения 0.1, то из этой точки возможно завершение преследования и в смысле определения 0.2 ( достаточно положить Ю— {},
Уi^) ); разумеется, что обратное утверждение неверно.
Под задачей преследования понимают задачу нахождения начальных точек, из которых возможно завершение преследования в смысле того или иного определения.
2. В этом, пункте кратко изложим основные результаты диссертации.
Диссертация состоит из введения, трех глав и списка литературы.
включение с &(Я>), ( 2.17) тогда в силу ( 2.15 ) - ( 2.17 ) включение ( 2.14 ) перепишется л; в виде Шй) с s а о). Из этого включения следует непрерывность Vf(-t) снизу. С другой стороны, из выпуклости и компактности множеств
М1 , Р и (л следует ограV ниченность и замкнутность множества ( см. леммы 2-8, стр. 30 - 33 из работы / 19 г / ). Тогда в силу работы / 5 /
Л/ см. теорему 5, стр. 63 ) множество Wft) полунепрерывно сверху ( см. также / 4 /, леммы 1,2, стр. 4,5 ). Тем самым не
А/ прерывность
WW доказана. Пусть S=5(1)CA, с (у, шг0-1))1. (2.18)
УТВЕРЖДЕНИЕ 2.4. Если , то максимум в 2.18 ) достигается на единственном векторе Ю •
Доказательство. Предположим от противного, т.е. имеются М И ^ такие, что 0 и т, ё(Ро е см, -wfrfo -1)л fcft,йа (<рЛ,жж-/;;.
Пусть
- 73
Тогда fi'/i ft, Ю= , £ <Г?о ~t) % J>
-Сс^^ШГ,^))- ССУя^Го-*)).
Так как , 1Гf?o-t)) 4 т.е. ^ sr^myc гижго-т
Последнее неравенство противоречит ( 2.18 ). Если же НФа II'= О , то легко проверить, что {-б^ЗО * Полученное противоречие доказывет единственность лП-УТВЕРЖДЕНИЕ 2.5. Пусть Тогда вектор функция в окрестности точки непрерывна по
-t и % .
Доказательства этого утверждения следует из работы / 13 а / ( см. стр. 584 ).
Теперь определим управление первого игрока следующим образом
I г ■> если f , 2Isn
В силу утверждения 2.1 множество (У^л/ выпукло и
- 74 Тогда в силу теоремы из работы / 5 / см. стр. 63 ) Uполунепрерывно сверху относительно включения.по совокупности а, #). Так как ( см. ( 2.4 ) и ( 2.19 ) ), то по определению 2.1 функция
U а, ю является допустимым управлением первого игрока.
ТЕОРЕМА. 2.2. Если to удовлетворяет условию ( 2.5 ), то управление UCi^) (( 2.19 )) гарантирует завершение игры за время 1о .
Доказательство. Пусть %* - некоторая точка из Т^ Обозначим через решение уравнения ( 2.1 ), соответствующего паре управлений Q и удовлетворяющее условию Z16), % *-> где - произвольное число из
Го> Го-а],
5 - определяется ниже. Пусть Ь t произвольная суммируемая функция со значениями из множества & . Рассмотрим решение
И[ш]>1?С')) уравнения ( 2.1 ), где
UmeUM)* произвольная суммируемая функция. Покажем, что вдоль траектории % ft], £ в, функция %ftJ) - lift], + £ , -убывающая.
Пусть 7гС1*]>0 , тогда существует положительное число
5 такое, что ftli:7 при всех в силу утверждения 2.4 существует единственная непрерывеая функция
1= P&Jf/t]), такая, что it (i7= J)
- C(V[t7, . ( 2.20 )
С другой стороны, по смыслу 'km существует точка такая, что 6 € - ) „ II £> (to-1)%*°- € сс, - т у/ ■
В силу утверждения 2.2 существует управление
U(t)6P9 такого, что с помощью управлений и Z^{-&)■> t* точка Шс е переводится в точку £(f0- € где U0)> .
Ясно, что тогда имеет место неравенство
Так как то из ( 2.20 ) получим
-ь^е, -t*
- (V£t*+eiy 6(£o-t)%> fЪ(t*
-t* т.е.
J (V&r+sh (u&y uf6])) ae . (2.21)
Ф/^г], (гуuffl)) ^ u. ( 2.22)
Обозначим через do минимальное из тех бС , для которых имеет место ( 2.22 ). Ясно, что в силу ( 2.4 ) имеет место неравенство Uo^O , тогда неравенство ( 2.21 ) имеет вид
Так как УМ и
Так как непрерывны на компактное множество, то существует такое число , что непрерывны на h£i*+ei £it,£i*i+ dot т.е.
Из произвольности следует справедливость утверждения.
Пусть преследователь применяет произвольное суммируемое управление
UI41 ИЗ U> 0^-6 4 "to . Поскольку ft[Ohh,(09%o)£ О ( см. ( 2.5 ) и ( 2.18 ) ), то для любого 4 € £О, ?ol И % £41= % ft, 0> %<?9 u[-h W) ) имеет место неравенство .Тогда из ( 2.18 ) получим, что
УМ, бсго-тм)^ c(№J,wfo-t)), о^-гг^о, т.е. € ,
Вчастности (0)%[й1 <Г Шо) или it%ff°] <? Mi. В силу ( 1.15 ) £ Jit • Теорема доказана.
II. Из ( 2.19 ) следует, что урравление W^P зависит от фазового состояния т.е. lift1=
Тогда уравнение ( 2.1 ) является нелинейным относительно . Это обстоятельство затрудняет решение поставленной задачи. Поэтому в этом пункте в каждом сегменте [4it4i+il* > -bo^O? , строится допустимое управление преследователя, зависящее только от фазового состояния С41гКё.) и переменного -Ь € £4i, 4i+il
Пусть сегмент £0, То! разделен точками на Л/ равных частей I4ly4t+ll, где ^as-Po.
Вычисляем величины = Xi), # = Hi)
Пусть
TJltth {и€Р'- (9i, ё(Го^)Р)} > С 2-23 > р , если
Uift), если 2.24 )
Ue(t)=\
Ui°(*)9 если О^ г^Л если
2.25) если
Выше мы доказали, что является допустимым управление . Аналогично доказывается, что и - допустимое управление.
Через обозначим о окрестность множества Л, т.е. Имеет место следующая теорема.
ТЕОРЕМА 2.3. Пусть , С^б^Ро произвольное суммируемое управление убегающего. Тогда для любого 0 можно указать такое б>0 , что управление XJg (( 2.25 )) переводит точку в М-Р
Доказательство. Пусть / ( 2,26 } о
Теперь докажем, что для любого можно указать такое £>Оу что для любого %e(t)€ (')>£)> Odzt^Po 1 существует такое, что
-max // $ . ( 2.27)
Предположим от противного. Тогда существует последовательность ц т О^-б^^о такая, что при оо > ® и шах И 2.28)
О ^ & с •> J. ~ % при любом где определяется соотношением ( 2.19 ). С другой стороны, из С 2.23 ) 2.25 ) следует, что %(TJejO)* - выпуклое компактное множества из К- . Тогда из последовательности I %• Ш можно выделить подпоследовательность сходящуюся к функции е%( U(■>%), +), от Я,.
Действительно,из ( 2.4 ) и ( 2.23 ) следует, что
UiG)- ЪуШ»), ti^Ui+ej.
Ясно, что при J00 имеем ° > см. ( 2.19 ) и ( 2.23 )). Из ( 2.26)следует, что %*&)€ %(U O^^fo.
Если теперь в ( 2.28 ) положим то о.
Это противоречие доказывает неравенство ( 2.27 ). Пусть
Го = -max -ткх [(&,& (й-т?7. означает максимальное расстояние от точки &CTo-t)%e (t)
V ^ до множества
Шй-i) при -t€[0,Pol.
Так как при имеем
О^б^То ( теорема 2.2 ), то из 2.27 ) получим Теорема доказана.
ПРИМЕР 2.2. Рассмотрим пример 2.1. Можно установить, что hi. = u&m+cfo- ытш)и-[-£+ <r(?o-ti)i, ц&{-и)*(£е-и)%.я МОП
Ui ft) =
Р ? если drO
O.yVi?**ели ht;>o где О - нулевой вектор из . Для управления убегающего выбираем функцию l/U)- ~ f г-ьг-^у. % луею-тои
Вычисления показывают, что То удовлетворяет уравнениюОь где и §л 6 т х ft) = (Xi ft), ОСfi rt-Jj т
Рис.I а. Пусть /=/£ ,
10
Хо= (го, 0)т, Хо=
•.е. %*СО)= fro ~ ПО, /of 0Т,
БЛОК-СХЕМА РЕШЕНИЯ ПРИМЕРА 2.2
Рис.1 б.
1. Айзеке Р. Дифференциальные игры. Мир, 1967, 480 с.
2. Батухтин В.Д., Субботин А,И. Об условиях завершения игры преследования. Изв. АН СССР,Техническая кибернетика,И,1972,с.3-8.
3. Коддингтон Э., Левинсон Н. Теория обыкновенных дифференциальных уравнений. М., ИЛ, 1958.
4. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М., Наука, 1968, 469 с.12. Красовский Н.Н.а) Игровые задачи о встрече движений. М. , Наука, 1970, 420 с.б) Дифференциальная игра сближения-уклонения I.
5. Изв. АН СССР, Техническая кибернетика, №2, 1973, с. 3-18.в) Дифференциальная игра сближения-уклонения II.
6. Изв. АН СССР, Техническая кибернетика, Ю, 1973, с. 22-42.
7. Сатимов Н., Рихсиев Б,Б. К полному исследованию обобщенного контрольного примера Л.С.Понтрягина. ДУ, т. ХУ, Ю, 1979, с. 436-443.
8. Сатимов Н., Азамов А. О задачах преследования и убегания в дифференциальных играх с произвольным числом игроков. ДАН УзССР, №10, 1979, с. 6-7.
9. Сатимов Н.,.Маматов М.Ш. Об одном классе линейных дифференциальных игр преследования и убегания. Труды ТашГУ, №670, 1981, с. 64-75.
10. Тарлинский С.И. Об одной линейной дифференциальной игре сближения нескольких управляемых объектов. ДАН СССР, 230, Ю, 1976, с. 534-537.
11. Фазылов А.З. О линейных дифференциальных играх преследования при различных ограничениях на управления игроков. Изв. АН УзССР, сер. физ.-мат. наук, £2, 1980, с. 79-80.
12. Ченцов А.Г. Об игровой задаче сближения в данный момент времени. Математ. сб., 99, №3, 1976, с. 395-420.
13. Черноусько Одна задача уклонения от многих преследователей. ПММ, 40, 1976, с. 14-24.
14. Чикрий А.А., Раппопорт И.С. Поимка убегающего несколькими преследователями. Теория оптимальных решений. Киев, 1978, с. 59-65.
15. Ъегп/шШ P. -Hn^ulae шг^сссг^ t^n cuf&wiu-а£ fycwtzi. L-eot. Jfbfab* Уп^ръш. М 3,19У?,р.1-33.а£ уалим. У JHcufi. cmrtcU. Wi, Р-10&-Н6.vrnwn, 1964, p. 195-Я 10. 41. &awkidcd$-e Я, г/., О Л. Л oU^eten
16. Ю The tosmPeZtymce pzv££ew foe (fyamlS I'ln: ^оСг^ШШг m ааш£ -th&ottf "Рыфьtied of еРайап uMth -wmltnzab wutot.
17. ШЛ. у. CwUt., 19Щ, P. Ш-Ш.
18. X) ЬэштрЬ. m putuu-t fhcOby. SttwlUz mat.,1. M, 196A, p, i-6.
19. PuazwU (^unU %€И. шси^с. W5 P, р/н>&п.
20. Ma,*., jfs Ъ, 1QW, p. H-U.