Методи розвязання диференцiально-рiзницевих iгор переслiдування тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Шелепало, Олег Александрович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Киев
МЕСТО ЗАЩИТЫ
|
||||
1993
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
р -,, Академія наук України
‘ 1’ Ін£г$тут кібернетики імені В, М. Глушкова
На правах рукопису ШЕЛЕПАЛО Олег Олександрович
УДК 518.9
МЕТОДИ РОЗВ’ЯЗАННЯ ДИФЕРЕНЦІАЛЬНО-РІЗНИЦЕВИХ ІГОР ПЕРЕСЛІДУВАННЯ
01.01.09 — математична кібернетика
Автореферат дисертації на здобуття наукового ступеня ' кандидата фізико-математичних наук
Дисертацією є рукопис.
Робота виконана в Інституті кібернетики імені В. М. Глуш-кова АН України. '
Науковий керівник: доктор фізико-математичних наук ОСТАПЕНКО В. В.
Офіційні опоненти: доктор фізико-математичних наук НАКОНЕЧНИЙ О. Г.,
кандидат фізико-математичних наук ' ПРОКОПОВИЧ п. в.
Провідна організація: Інститут математики АН України.
Захист відбудеться — 199 ^ р. о —-
год. на засіданні спеціалізованої вченої ради Д 016.45.01 при Інституті кібернетики імені В. М. Глушкова АН України за адресою:
252207 Київ 207, проспект Академіка Глушкова, 40.
З дисертацією можна ознайомитися в науково-технічному архіві інституту.
Автереферат розісланий 199
Р
Учений секретар спеціалізованої вченої ради
СИНЯВСЬКИЙ В. Ф.
Актуальність теми. Теорія диференціальних ігор стала одним з таких напрямків прикладно: математики,шо найбільш інтенсивно розвивається. Вона виникла на стику математичної теорії ігор і тісно пов"язана з теорією^ екстремальних задач диференціальних рівнянь. Диференціальні ігри маять своїм дже- , релом практичні задачі.
Ці задачі вкладаються в таку загальну схему. Маємо динамічну систему,що описується диференціальними рівняннями,які зв"язують її фазові координати з керуваннями та іншими силами. Частіша сил націлена на виконання деякої задачі. Інші можуть аавакати досягненню цієї мети.Толу процес трактується як гра двох протилежних сторін, яким приписується влада над тією або іншою групою сил. Прикладами диференціальних ігор є такі важливі проблеми, як досягання об”єкта, що рухається, або ухилення від нього, задача утримання траєкторії динамічної системі у визначеній множин і фазових станів. •
Вагомий і суттєвий внесок у розвиток,дослідження і вивчення диференціальних ігор зробили Понтряпн Л.С., Красовсь-кий М. М.,Пшеничний Б.М., Мішенко Є. Ф. та їхні учні.
У представленій дисертації розглянуті різні клзеи диференціально-різницевих ігор з точки зору £ - стратегій та із застосуванням методу Н - опуклих множин, який був запропонований Е В. Остапе нком
У дисертації описується постановка задачі диференціально-різницевих ігор. Далі веодиться поняття операторних конструкцій для таких ігор і догодиться ряд тверджень,ар відображають властивості операторних конструкцій.
Розглядаються два основних класи ігор з фіксованим і нефіксованим часом закінчення. . -
В роботі розглядаються лінійні диференціально-різницеві ігри і демонструється гастссування до них методу Н - опуклих множин.
У перших двох главах дисертації розглядаються ігри із
запізненням,тобто коли максимальна похідна змінних без запізнення більша за максимальну похідну змінних їй запізненням. На початку третьої глави досліджується гра нейтрального типу, коли вищезгадані максимальні похідні однакові кил собою.
Мета роботи.Розвиток теорії диференціальних ігор.Перенесення теорії £ - стратегій,операторних конструкцій і методу Н - опуклих множин на диференціально-різницеві ігри. Розгляд диференціально-різницевих ігор їв змінним запізненням.
Наукова новизна. Б дисертаці і розглянуто клас диференціально-різницеві« ігор,яким досі приділялося мало уваги. їх суттєвою відмінністю від диференціальних ігор є те,що початковими позиціями для гри стають не точки, а неперервні на деякому проміжку функції.Тобто гра проходить у банаховому просторі. • ■
Диференціально-різницеві ігри досліджувались за допомогою операторних конструкцій і £ - стратегій,які відчутно змінилися порівняно з диференціальними іграми. В роботі також опи- ' сані оптимальні стратегії першого і другого гравців,а також множини початковім позицій,сприятливих для кожного з них.
На розглянутий клзс ігег перенесені і вольтерровські оператори, за допомогою яких показано,шр інформаційна дискримінація другого гравця,зумовлена £ - стратегіями,не є суттєвою і переваги першому гравцю не дає.
Ефективним виявилось застосування методу Н - опуклих множин до лінійних диференціально-різницевих ігор. Для розв'язування задач,розглянутих у диференціально-різницевих іграх,гравці в загальному випадку повинні застосовувати неконструктивні стратегії.Користуючись же методом И - опуклих множин, ми по-будовали досить прості стратегії для достатньо широких класів диференціально-різницевих ігор.
Великий інтерес для подальших дослід®нь становлять ■ диферент аллно-різницеві ігри нейтрального типу та з випередженням. Перспективними є також ігри із змінним запізненням, які в дисертації представлені лише оглядово.
■ .Теоретична цінність. Отримані в дисертаційній роботі
результати розширюють класи диференціальних ігор,до яких можна застосувати вий відомі методи розв'язання диференціальних ігор.
Для окремих класів ігор ці методи Сули суттєво переопра-цьовані.др дозволило ефективно розв'язати ці ігри.
Апробація роботи.Основні положення дисертації доповідалися і обговорювалися на наукових семінарах у Київському державному університеті їм Т.Г. ШзЕченка; Інституті математики АН України; Інституті кібернетики їм. В. Л Глупкова АН України.
ліковані в трьох друкованих роботах.
Структура роботи. Дисертація складається з вступу,трьох' глав і списку основної використаної літератури (96 найменувань). '
У вступі обгрунтована актуальність обраної теми досліджень,описаний клас задач,що розглядаються,коротко викладений зміст дисертації по розділах.
В першій главі дисертації дається постановка задачі диференціально-різницевих ігор із запізненням. На цей клас ігор переносяться Є - стратегії і операторні конструюй і,які раніш-растосовувалися до диференціальних ігор без запізнення.
Розглядається динамічна система, що описується диферент -
п - ВИМІРНИЙ ЄЕКЛ1довий простір, ц(і) - У\ - вимірна неперер
- вимірювані функції із значеннями в II і V відповідно. ІД і V - компакги в євклідових просторах. Параметрами и і
V керують відповідно гравці ' Р (переслідувач) і £ (утікач) Крім рівняння (1) диференціальні ігри зближення-ухилекна описуються термінальною множиною М € £" і множиною фазових
Публікації. Основні результати дисертаці і були опуб-
ЗМІСТ РОБОТИ
■п
де і(і) - деяка п - вимірна функція із значеннями в Ь ; £
вна функція,ш задана на інтервалі , ОЛ ; іл(і) і у(і)
обыеженнь N с Е . Множини М i N вважаються замкненими,
причому Me М .
Розглядаються ігри э фіксованим і нефіксоваюім часом
закінчення. Зафіксуємо момент 9 > 0 .
У грі з фіксованим часом закінчення мета гравця Р -
досягти включення '2(6) с М при г(і) с N для будь-якого
ієГО, 91 ,тобто вивести траєкторію ка М в момент 8
римавши хі в множині N . "
У грі а иєфіксованим часом закінчення мета гравця Р -досягти включень 2 для деякого Í*
для всіх t £ СО, ±*J, тобто вивести траєкторію на М не пізні-
ше момента б .утримавши а в N .
• Мета гравця £ в обох іграх протилежна меті гравця Р . Структура диферент альн іх ігор в фіксованим і нефіксованим
часом закінчення описується відповідними сімействами операторів
{KJ 1 [%1 ,.¿££0,01.
На основі цих операторів будується стратеги гравців і . • описуються множини початкових позицій,стриятливих для того або іншого гравця.
Через FÍ позначимо множину неперервних функцій 1 te С-Ь, 03 , таких,шо ц> ( 0) є М .
.Наприклад, оператор Pt задається таким чином. Визначення. Через , £ і 0 , погкачимо оператор,щр
ставить у відповідність кожній замкненій множині неперервних функцій L .визначених на С -Ь , О 3 .множину PtL ■
всіх неперервних функцій 4,( ь) ,теІ-Ь ,0] .таких,до для В будь-якого допустимого керування v(£) , teto, а .гравця В існує допустиме керування u<t) .teLO.iJ .гравця Р , таке,їда відповідна траєкторія u(.),v(), ííí(O)
а початком в ifi (•) така,до існує функція L :
. J^ír + £)' *** г-ь , 0-0
0 при ь * £ .
<рйс*) = + í>,rff 0-h,03 при ti * £ .
• Через ÍV позначимо множину неперервних функцій vi*-) .
¿ЄІ -Ь, О] >Таких,щр <рСг-)е Ы для всіх £є[-Ь,0 7 .Позначимо Р(г,іі « (Р{[) Л ¡ї .
£_ , N звалаємо замкне талі множинами.
Нэхай ы = {т+і. —4ї»* -кінцеве розбиття інтервалу С О , і] . Позначимо:
Р^і. = Ряг, <Гі /V.* . .. Р^.-й і. ,
де # = Ті - Г,--* , І *і. ... , к .
Визначення. L * Р? І ,
Теорема. Справедливі рівності
+ ~ Ог,Ьі ^.¿л •
Визначення. £ - стратегією гравій Р будемо називати відображення ставить функції Ч (') ,
моменту ¥ і О .числу £ > 0 і керуванню чІ-)є УЮ, £) у відповідність керування иО)є ^го, О . .
Визначення. £ - страгепею гравця £ будемо назива-
ти пару об'єктів: розбиття ілі ~[“іГо-0...і*:..,ІтвсеїСО/“?) точками 27 ,шр не має кінцевих точок згусекня і відображення П ЫС-), ¿) ,цр ставить кожні я функції $ О) і цілому числу і >0 керування уО)є УСО, £ *• ) (де = 2у - Ті-І , Пкзд відомо,іир гра закінчиться до мам. .іту в .тоді розбиття . півосі С О , «о) можна замінити кінцевим розбиттям інтервалу
ПО, 61.
Розглянемо гру з фіксованим часом закінчення & .
Теорема. (1 )<&>(*.) £*Рв М .Тоді існує £ - стратегія гравця Р такз.юо для відповідної траєкторії г(і|^-)/иС-><^0с>) з початком в ф0 О) виконується •
(2)Нехай 1(аО)е Рд М . .Тоді існує £ -
стратегія гравця £ ,така,пр для відповідної траєкторії и(-) , іф« С*)) з початком в і?0£‘) виконується г(0.) є- М .
Аналогічні результати отримані і для гри з «¿фіксованим часом закінчення.
Розглянуті £ - стратеги гравця Р вимагають знан-
ня керування супротивника ка деякому інтервалі маї'бутчього. Показано еквівалентність £ - стратегій і стратегій,в яких
гравець Р в колииП момент вибирає своє керування и (і) знаючи початкову функцію і керування супротивника vCs) , S £ С 0, £ J .
У друг і ft главі дисертації за допомогою методу Н -
опуклих мномік розглядаються лінійні диференціально-різницеві ігри, динаміка яких описується рівнянням
г(і> = а г(<0 ♦ 6 гСі-h) *С(и, v),t?0, U >0, (
де u с Ц , V_ - керування гравців; г « £" г(і> = <Q (t) ; t е Z~b, 03 ; if (і) - v\ - мірна,
неперервна функція; С : Df * V -* Е" - неперервна за сукупністю змінних функція; U , V - компакги в євклідових просторах. .
Визначення. Нехай
¿(f)
- єдина функція а такими .
властивостями:a) k(t)=0, t<0 ,б) &(0)х{ t
в) i(t) € C°LO, °о) ,г) 4 (і) задовольняє рівняння
• ¿(b)* а ас t)+6 ku-h), t>o .
Теорема. Нехай ? (¿3 - неперервний розг"язок рівнян- -НЯ (І).ККЗО C°C-h,0] і70 при і >0
'h)+ fq(s)i(t +fk(iv(s))e(s .
•fc d •
, Нехай мнояша неперервних м - вимірних функцій
<f(t) , ¿¿€-h,0J ,тг-гйс,ас для будь-якого veV існує u* (v) € W : e -
-A(e-h)<t(o)+6f.*t(*)-&(0~s'hM*+J Ш-М*С(и*,v)z M ,
* ft- ~ ° л в®'’
Теорема. Pe M s fle M ,якад б * - '¿-’i, .
У другому' пункті ms і глави розглядаються лінійні ди-фвренціально-різнмцввіїгри.де за коефіцієнти взяті квадратні матриці.
Динаміка гри описується рівнянням ч
k(i)- A *(*) + 0 г (t -h)+ tfC(“.v), t>0, U>0 . (3)
Для розв'язання Z CO рівняння (3) за початкових умов ї (і) = yf ( *) справедлива формула
і (і) = (t(o)K(t-1>)* ej <t Cs>K(* *s‘ *0«fs * ) K(i-^uCs)'vfs))^
Чч ' e .
je K (•) - матрична функція 2 властивостям«: а) к(0 = 0 ,
i <0 ¡о К(0) = £ ; в) К С і) - неперервна на про-
лжу С О , о») ;г) К (t) гадогсльняє рівняння
йCfc) = АК(*) + S м, г >0 .
Сісористаємось таким визначенням.
Визначення. Нехай Hcfx^cXi Нх*ІІ*і] , X -
кінцевовишрний єбклідоний простір, ¡.{каміна М називається Н - опуклою,яктр її можна представити у вигляді
О /хєХ: <х,х*> ¿CCxVji
х'еН ‘ '
Д0 ~ скалярний добуток в X ,а величини
С''С **) можуть приймати значення + .
Нехай термінальна мноиіна гадається у вигляді ML а . =fi!€ ,де М - задана га.мкнена мно/ина в просторі X . >_
Нехай Р© *4 - множина неперервних и - вимірних
функцій Ч’Г*) , i«C-h,OJ .таких,ідо для будь-якого
V £ V існує U* (v) е С/ : р
-1* (о) К (8-■ «О ♦ б (в - s ■ *!К (& - ■№№*, v) £ М .
Псзначимо через Н© мне лину СГ'.НИЧЬИХ векторів х*£ X, таких,що:
3)j((s)V = ACs/Ox* для всіх SiCO, 6>J ;
б)при кожному фіксованому X* функція АОїХ* ) не змінює знак на всьому інтервал: L О, 9J .
Нехай тепер X * є власним вектором матриць А і б
одночасно з власними ьєкторамі \л і ^ а відповідно.
X*- є в цьому випадку власним вектором функції У. (•)
Тепер черев Не ло?начимо множину одиничних векторів X* .таких,що: ,
а) /IV -- Ад(х*;х* ; fiV = Аа<х Ь* ;
б)при будь-якому фіксованому X
Теорема. Нехай М - Не - опукла множина. Тоді якщо
Ч*і*) < Ре М ,то існує ЕізйСракенкя и»: V •* таке.шо.- _
а) и« ( ч (.ь)) . допустиме керування гравця Р ,як
шр V (г-) - допустиме керування грагцк Е ;
б)Лля відповідної керуванням і *( *)
траєкторії І(і) г початком (■) виконується включення г(в)егН .
В пункті 2.2 розглядається мшагок.каян власна функція рс?в"ягку однорідного рівняння ю© змінювати знак на кінцевому інтервалі кінцеву кількість разів.
. В пункті 2.4 мэтсд Н - онуках »гножин перекоситься
■ на гру з термінальною функцією шати. -
Б пункті 2.5 дослідк/гаьсг лінійні диференціально-різні
цеві ігри в кількома гапізненкгиа.
Е главі 3 розглядається ге калька класів Ігор до якій за стссовується метод Н - опуклих множин. Це диференціашю-рівні'цеві ігри неїйралького типу, диференціальна- рі зкицева гр »з аатзнєнням другого порядку, а також ігри е кефі«сованим часом закінчення.
Наприкінці третьої глави ї всієї дисертації метод £ -стратегія,операторних конструкцій та Н - опуклій мнояян переноситься на диферент алгно-рігюшев і ігри із змінним запізненням.
Динамічна система записується у внгдяді .
і(і> = V«)), И-О,
де при і с 02 і ЬСі) ? О
Ь(і) £ і , £ € С 0 , в] .
Розглянемо гру з фіксоганим часом закінчення.
Черев М позначимо мноіону неперервних функцій У(* ічІ~Ь(6), 01 ,таких,шр і((в) с М . Кножина М
замкнена, якф М - замкнена шагала.
Визначення. Через р£ , £ * О , позначиш оператор, вр ставить у відповідність кояній гаїкненій множині неперервних функцій І. , визначених ка £0-й(Є>, ©З , множину
Р( £. всіх неперервних &ункцій фі (т) , Те[9-С
Ь(0—є), 0—є], таких, що для будь-якого допустимого керування Х/^), ІЄ[0—8, 0], гравця Е існує допустиме керування и(1), ІЄ[0—е, 0] гравця Р, таке, що відповідна траєкторія г{і) з початком в срі(-) така, що існує функція ф0(-)ЄЬ:
, ч | фі (т), тЄ[—Ь(0),Є—е)
<М*) = ( 2(т),тЄІ0-е,0) , приЬ>є, •
фо(т)=г(т), ІЄ[0—Ь(0), 0] при Ь<є.
Далі для цього класу ігор отримані результати, аналогічні результатам, отриманим для випадку з постійним запізненням, з урахуванням специфіки.
Основні результати роботи
1. На диференціально-різницеві ігри перенесені є — стратегії і операторні конструкції.
2. Показано, що для диференціально-різницевих ігор е — стратегії еквівалентні вольтерровським стратегіям.
3. Для лінійних диференціально-різницевих ігор із запізненням використано метод Н-опуклих множин.
4. Докладно вивчені лінійні диференціально-різницеві ігри з постійними коефіцієнтами. Коли ж у грі за коефіцієнти взяті постійні квадратні матриці порядку п, ці результати використовуються для її дослідження.
5. Розглянутий один клас диференціально-різницевих ігор нейтрального типу.
6. Основні результати, представлені в дисертації, перенесені на диференціально-різницеві ігри із змінним запізненням.
Основні результати дисертації опубліковані у таких роботах:
1. Остапенко В. В,, Шелепало О. А. Операторные конструкции в дифференциально-разностной игре//Докл. АН Украины.— 1991, —№10. — С. 91—93.
2. Остапенко В. В., Шелепало О. А. Применение операторных конструкций в дифференциально-разностной игре // Кибернетика и системный анализ. — 1992. — № 4. — С. 54—60.
3. Шелепало О. А. Применение Н-выпуклых множеств к линейной дифференциально-разностной игре//Теория оптимальных решений. — Киев: Ин-т кибернетики им. В. М. Глушкова£АН Украины, 1992.— С. 78—80.
Підп. до друк. 22.12.93. Формат 60x84/16. Папір друк. №2. Офс. друк. Ум. друк. арк. 0,70. Ум. фарбо-відб. 0,82. Обл. вид. арк. 0,75. Тираж 100 прим. Зам. 1750.
Редакційно-видавничий відділ з поліграфічною дільницею -
Інституту кібернетики імені В. М. Глушкова АН України 252207 Київ 207, проспект Академіка Глушкова, 40