Квазилинейные конфликтно управляемые процессы переменной структуры тема автореферата и диссертации по математике, 01.01.10 ВАК РФ
Матичин, Иван Иванович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Киев
МЕСТО ЗАЩИТЫ
|
||||
2000
ГОД ЗАЩИТЫ
|
|
01.01.10
КОД ВАК РФ
|
||
|
Національна академія наук України Інститут кібернетики імені В.М. Глушкова
ГТ5 од
.......МАТИЧИН Іван Іванович
УДК 518.9
КВАЗШНІЙНІ КОНФЛІКТНО КЕРОВАНІ ПРОЦЕСИ ЗМІННОЇ СТРУКТУРИ
0,1.01.10 - дослідження операцій і теорія ігор
Автореферат дисертації на здобуття наукового ступеня кандидата фізико-математичних наук
Київ 2000
Дисертацією є рукопис.
Робота виконана в Інституті кібернетики імені В.М. Глушкова НАН України.
Науковий керівник: член-кореспондент НАН України,
доктор фізико-математичних наук, професор ЧИКРІЙ Аркадій Олексійович, Інститут кібернетики ім. В.М. Глушкова, завідувач відділу.
Офіційні опоненти:
доктор фізико-математичних наук, професор КИРИЧЕНКО Микола Федорович,
Інститут кібернетики ім. В.М. Глушкова, провідний науковий співробітник,
кандидат фізико-математичних наук, СМИРНОВ Сергій Анатолійович, Інститут космічних досліджень НАН та Національного космічного агентства України,
науковий співробітник.
Провідна установа:
Київський національний університет імені Тараса Шевченка, кафедра системного аналізу та теорії прийняття рішень.
Захист відбудеться засіданні спеціалізованої вченої
« $, / » {(() І
2000 ради Д 26.194.01
р. о
кібернетики імені В.М. Глушкова НАН України за адресою: Проспект Академіка Глушкова 40
03680 МСП Київ 187. .
11
при
_ год. на Інституті
З дисертацією можна ознайомитися в бібліотеці Інституту кібернетики імені В.М. Глушкова НАН України за адресою: Проспект Академіка Глушкова 40 03680 МСП Київ 187.
Автореферат розісланий « У »)й/ЬМ//$2000 р.
Учений секретар спеціалізованої вченої ради
МОІСЕЄНКО В.В.
С/.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. У різних галузях техніки часто виникають прикладні задачі, при розв’язанні яких доводиться розглядати керовані системи змінної структури. Хоча керовані системи змінної структури вже давно привернули увагу вчених, дослідженню таких систем, що функціонують в умовах конфлікту, досі було присвячено мало робіт. Вивченню керованих систем змінної структури поклали початок роботи російських вчених JLT. Ащепкова та С.В. Ємельянова, в Україні цими питаннями займається Ф.О. Сопрошок, яким, зокрема, на випадок змінної структури було узагальнено принцип максимуму Понтрягіна. У своїх дослідженнях Ф.О. Сопрошок істотно спирається на методи, розроблені М.Ф. Кириченком. ,
Першими досліджувати керовані системи змінної структури, що функціонують в умовах конфлікту, тобто диференціальні ігри змінної структури, почали російські вчені М.С. Никольський, М.Л. Григоренко та К.В. Демидов. У своїх роботах вони розглядали керовані системи, що можуть функціонувати в двох режимах, це означає, що під час гри відбувається лише одне перемикання, при цьому вимірність фазового простору вважалася незмінною впродовж всієї гри, тобто не змінювалася при перемиканнях. Базовими методами для досліджень були прямі методи J1.C. Понтрягіна та правило екстремального прицілювання М.М. Красовського, які є класичними методами теорії диференціальних ігор.
Логічним продовженням цих досліджень є дана дисертаційна робота, в якій досліджено та вивчено випадки, коли керована система має будь-яку скінченну кількість режимів функціонування, при переключенні яких змінюється вимірність фазового простору. Ці обставини є важливими з точки зору теорії, а також мають практичне значення. Методологічну основу для цих досліджень складає метод розв’язуючих функцій, розроблений А.О. Чикрієм*.
Зв’язок роботи з науковими програмами, планами, темами.
Основні результати даної дисертації були одержані з 01.01.95 по 31.12.98 р. під час роботи у відділі № 165 Інституту кібернетики імені В.М. Глушкова НАН України над темою ВФ 165.01 “Якісний аналіз і оптимізація конфліктно керованих процесів”.
Мста і задачі дослідження. Мета цієї роботи полягає у вивченні диференціальних ігор змінної структури, в яких керована система, має будь-яку скінченну кількість режимів функціонування, при перемиканні яких можливі розриви фазової траєкторій причому вимірність фазового простору в різних режимах є, взагалі кажучи, різною; постановці для цих диференціальних ігор задач зближення з термінальною множиною; розробці для них стратегій переслідування, а також у знаходженні за допомогою розроблених стратегій достатніх умов розв’язності задач зближення.
'ChikriiЛ.А. Conflict Controlled Processes, Kluwcr Academic Publishers. - ßoston-l.ondon-Dordre^hf, 1997 *121
P-
Наукова новизна одержаних результатів. Наукова новизна і цінність представленої роботи полягає в тому, що в роботі:
1. Вивчено керовані об’єкти змінної структури, що можуть функціонувати в скінченній кількості режимів.
2. Досліджено диференціальні ігри змінної структури, для яких вимірність фазового простору коже змінюватися при перемиканнях. .
3. Розглянуто ситуацію, коли під час перемикань відбуваються стрибки фазової змінної (тобто фазова траєкторія має розриви) і досліджено їх вплив на перебіг гри. Для випадків, коли вектори стрибків визначає переслідувач або утікач, запропоновано відповідні стратегії переслідування.
4. Запропоновано і досліджено ігрову задачу, яка дозволяє переслідувачу закінчити гру не виконуючи всіх перемикань.
Всі запропоновані в роботі стратегії переслідування базуються на методі розв’язуючих функцій, якиіЬє більш ефективним порівняно з іншими методами переслідування, що використовувалися раніше.
Слід зауважити, що всі теоретичні результати проілюстровано на модельних прикладах, які показують, що використання змінної структури та запропонованих в роботі методів дозволяє скоротити час переслідування, або навіть досягти поїмки там, де це було неможливо.
Практичне значення одержаних результатів. Теоретичні результати дисертаційної роботи можуть бути використані для розв’язання задач, які часто постають перед інженерами - розробниками авіаційно'^ ракетної і космічної техніки і мають ігровий характер та можуть бути формалізовані саме у вигляді диференціальних ігор змінної структури. Як приклад можна навести задачу виведення на орбіту штучного супутника за допомогою багатоступеневої ракети за наявності зовнішніх збурень, а також задачу підвищення точності бомбардування за наявності вітрових збурень, тощо. У першому випадку структура динамічної системи змінюється щоразу, як відбувається відстрелення чергового ступеня ракети, в другому - зміна структури відбувається після скидання літаком частини вантажу.
Апробація результатів дисертації. Основні результати дисертації доповідалися на міжнародній конференції “Питання оптимізації обчислень” (Київ, 6-8 жовтня 1997), а також на Восьмій кримській осінній математичній школі-симлозіумі (КРОМШ-8, Севастополь, Ласпі, 18-29 вересня 1997), на семінарах з теорії керування та динамічних ігор Інституту кібернетики (керівник - член-кореспондент НАН України А.О. Чикрій) у 1996-1999 рр., на семінарі кафедри системного аналізу та теорії прийняття рішень Київського національного університету імені Тараса Шевченка (керівник — професор О.Г. Наконечний) 16 грудня 1999 р.
Публікації Основні положення дисертації були опубліковані у роботах [1-6]. ‘
Структура дисертації Дисертація складається із вступу, чотирьох розділів, висновків, списку використаних джерел, що мстить 95 найменувань. Заіаіьнніі обсяг дисертації становить 121 сторінку.
з
ЗМІСТ РОБОТИ
У вступі обгрунтовано актуальність роботи, наукову новизну проведених досліджень за темою диференціальних ігор змінної структури. Наведено мету виконаної роботи, відображено практичну цінність одержаних результатів.
РОЗДІЛ І. Огляд літератури за тематикою диференціальних ігор та керованих процесів змінної структури Наведено огляд літератури за темами, суміжними з темою дисертації, а саме: диференціальні ігри, диференціальні ігри переслідування-втечі, диференціальні ігри переслідування-втечі за участю групи гравців, змінна структура в керованих процесах та диференціальних іграх. Окреслено основні етапи розвитку наукової думки за цією тематикою. Проаналізовано сучасний стан проблематики диференціальних ігор змінної структури та зроблено висновки щодо необхідності проведення подальших досліджень.
Показано, що диференціальні ігри змінної структури є новим та перспективним напрямком досліджень. У попередніх дослідженнях розглядалися диференціальні ігри змінної структури лише з одним перемиканням. У зв’язку з цим видасться доцільним приділити увагу вивченню диференціальних ігор змінної структури, в яких керована система може функціонувати у кількох режимах. Крім того, досі при розв’язанні задач, пов’язаних з керованими системами змінної структури, мало застосовувався метод розв’язуючих функцій, використання якого є більш ефективним порівняно з іншими методами. Саме в цих напрямках проводилися дослідження, результати яких наведені у дисертації, що розглядається. '
Крім того, в першому розділі наводяться деякі означення і пов’язані з ними твердження із теорії многозначних відображень, опуклого та функціонального аналізу і теорії керування, необхідні для подальшого викладення.
РОЗДІЛ 2. Квазілінійні диференціальні ігри змінної структури зі скінченною кількістю перемикань Поставлено задачу зближення з термінальною множиною для диференціальної гри змінної структури зі скінченною кількістю перемикань. Нехай рух об’єкта змінної структури описується системами іи) = Аи)ги) +<ри)(ии),у). /є[г ,г ),
(1)
^)(гі-,) = С,^-,)( г. де /=) ,...,Л?; гу - момелти перемикань, такі, що
0 = го <г, <...< гл-_, < г* =оз; и - вектори параметрів у перемиканнях, що мають и. компонент, вони можуть бути як заданими заздалегідь, так і
визначатися одним з гравців; - сталі матриці розміру и^ хя^ і
п]хп]-\> відповідно, тобто матриці С(Л є, взагалі кажучи, прямокутними; ии\ V - вектори керувань переслідувача і утікача, відповідно, при цьому ии) є и{,) є), Vє К єК(К?), де К(И'1) - сукупність усіх непорожніх компактів з простору Я"; <р^}хК ->11"' - неперервні за сукупністю змінних функції.
При цьому будемо вважати, що С(|) = Еп^щ - одинична матриця
порядку и,, </, = 0, 2(|)(0) = 2(0,(0) = г°.
У просторі II"" задана термінальна множина вигляду
М'=М°+М, (2)
де М° — лінійний підпростір з К”"; М ~ непорожній компакт з ортогонального доповнення Ь до М° у просторі І*"" .
Мета переслідувача полягає у тому, щоб вивести траєкторію процесу
(1) на множину М* за найкоротший час, мета утікача - ухилити цю траєкторію від зустрічі з множиною М* га усьому напівнескінченному інтервалі часу. Тут і надалі будемо вважати, що переслідувач використовує квазістратегії, тобто вибирає своє керування у вигляді
иіл(і) = ии)(і,г°, у,(-))> / є[згу_,,г-у), у = 1..И, де
у,() = {у(5):у(і)єК,і є [0,/],у(«)~вимірна} - передісторія керування утікача в момент (, -/)(г',^°, V,(•)) - відображення, що ставить у відповідність
початковому стану г°, моменту / є|УуЧ,г;) і довільній передісторії керування утікача у,(-) вимірну функцію із значеннями з
множини Будемо також вважати, що утікач використовує програмне
керування.
Будемо позначати через ж - ортопроектор, що діє з И" ' на І., а через ел' - фундаментальну матрицю однорідної системи і = Аг. Нехай г = (г„...,гл._,).
Для диференціальної гри (1), (2) на базі методу розв’язуючих функцій побудовано стратегію переслідування і знайдено достатні умови розв’язності задачі зближення з термінальною множиною. Для цього розглядаються матриці .
ХСІМЛ'"’,
де у = 1... - 1; 5є[г>.,,г;); / є[Гд,.|,оо);
де є[гчгє[гчи,со);
■ zU)(t,T) = eAÍN)u'ZN-')CiN)eA{N'')(rN-''TN-'l)C{N~').X
x Cu+')e‘4U4Trrj-,),
Де y = 2../є[гдг_„<о);
Zw(',r) = ^("W'\
де ÍS [tw_„ oo).
Крім того, розглядаються многозначні відображення:
■ Wa)(t,s,T,v) = xZU)(t,s,z)q>u)(UU),BU)(Tj -s)v),
де у=1,...,ЛГ-1; 5є[гу.,,гу);/£[*•*_,,<»); ve^.
(/, í, г, v) = яг(ЛГ) (í, а, т)р(#) (С/(ЛГ!1, Bw (t - s)v), де / є [r *_,,<»); veV. Тут Bu\t), /є[0,оо), - деякі
матричні функції порядку q, де q - вимірність вектора v.
Нехай
r(f,5>r)=n^0)(í,s,r,v))
\eV
де j = 1,..., N-, se [тн ,Tj) (se [rv_,, /] для/=Я); t e [ry_,, oo).
Умова 1. (Умова Л.С.Понтрягіна) Існують неперервні матричні функції Bu\t), t є[0,оо), у=1......N такі, що fV(t,s,r)*0 для всіх s є [0,í],
t Є^.,,«). •
Нехай <р(л(t,s,т,и(J>, v) = <р(л(и<;), v)- tp(1)(и{і),B(j)(Tj - s)v), де j = s є[гн,т,); t €[r„_,,co); и0) eU0); veV;
(p^N){t,s,T,4<-N), v) = <p(fl\u{N) ,v) - <p(N\uiN\ B{N\t - s)v), дєїє[ги,/]; t e[rw_,,oo); u>~N)eU(N)\ veV .
Розглядається многозначне відображення
лм т/ .
A/(í,r) = A/f £ )лZij\t,s,r)íp(J\t,s,T,U^\V)ds +
t
+
¡лї,т)ут (ґ, ї, т, ит, У)сії г*-і .
Умова 2. Для вищезгаданих матричних функцій 5(у)(/), у = 1,...,N многозначне відображення М(ґ, г) ^ 0 дня всіх І є [гм_,, оо).
Відображення IV(і, з, т) є півнеперервним зверху по і на ділянках між перемиваннями, а огже - борелівським. Таким чином, існує щонайменше один борелівський по 5 селектор /(ї,5,г), у(і,$,т)єЦг(і,5,т), /є[Гл,_|,'Х>)> л є[0,/]. Позначимо через Г = {/():х(г,5,г)є^(/,а,г),/є[гА,.,,оо)>іє[0,/]) -сукупність борелівськнх по ,ї селекторів многозначного відображення
Нехай
4(t,T,z,d,y( )) = х
• xC^K.^'^C^e^z + f^xZ^^dj +
;=2
/
+ $y(t,s,T)ds,
О
де =(t/2.....dN); te[rjv.,,00); zeR'; г(')єГ.
Розглядається розв’язуюча функція:
а(/,î, т, v, z,d,/(■)) = sup {a 2 0 : [fVij) (/, 5, r, v) - y(t, і, г)] П П a[M(t, T)-4{t,r,z,d, y (•))] * 0},
Де У = 1...ЛГ; 16^,,,^) (setr^.i] дляу-jV); t є [гл._,,оо); veK ; zeR\
У(-)єГ.
Якщо для деякого fe[rw_,,co) ^(/,r,Z,üf,y(-))e М((,т), то a(/,5,r,v,z,if,^()) = +oo для всіх іє[0,г], veF. Якщо ж £(/, T,z,d,y(-))£ M(t,r), то розв’язуюча функція набуває скінченних значень і є рівномірно обмеженою по s є[0,?], veV. Крім того, у дисертаційній роботі показано, що якщо для конфліктно керованого процесу (1), (2) виконуються умови 1, 2 і для t є [rJV_1 ,°о); z є R"'; у(-)єГ та деяких наборів т, d 4(t,T,z,d,y(-))eM(t,T), тоді розв’язуюча функція борелівська по (s,v), .їє[0,г], veF і півнеперервна зверху по v, veV, а функція inf a(/,s,T,v,z,d,y(-)) - вимірна по s, s є [0, (], а отже (враховуючи її
veK
обмеженість) - сумовна.
Розглядається множина
де геИ"1; у(-)єГ.
Центральним результатом розділу є теорема 1 про достатні умови розв’язності задачі зближення, яка наведена нижче: .
Теорема 2.3.1. Нехай для конфліктно керованого процесу (І), (2) виконуються умови 1, 2, множина М - опукла, для початкового стану г° єК"1, деякого селектора У°(-) є Г і деяких наборів г° і й{) 7Хг°,г°,с/0,/°(-)) Ф 0. Тоді для будь-якого Т є 7’(г0,20,с/°,у0(-)) траєкторія
процесу (1) може бути виведена з початкового стану на термінальну множину в момент Т.
Четвертий підрозділ другого розділу присвячений випадкам, коли розв’язуючу функцію можна знайти у явному вигляді.
У наступному, п’ятому, підрозділі другого розділу вивчаються випадки, коли вектори “стрибків" у перемиканнях - сі 1 - зазнають впливу
переслідувача або утікача. Для цих випадків побудовано стратегії переслідування які дозволяють в першому випадку покращити час переслідування, а у другому - вивести траєкторію системи на термінальну множину незалежно від того, яким чином утікач вибирає вектори г/,.
Теоретичні результати розділу проілюстровані на модельному прикладі, у якому динаміка переслідувача до перемикання є динамікою “крокодила”, а після перемикання рух переслідуюча с простим, рух утікача є простим упродовж усієї гри. При цьому гра завершується в момент, коли переслідувач і утікач зближуються на відстань меншу або рівну є. Для цього прикладу побудовано стратегію переслідування для будь-яких £ £ 0 і визначено у явному вигляді точний час закінчення гри. Розглянуто випадки, коли вектор параметрів с/у перемиканні вибирає переслідувач або утікач. Для цих випадків також у явному вигляді визначено точний час поїмки і показано, що при виборі вектора стрибка переслідувачем використання запропонованого у дисертаційній роботі підходу дозволяє мінімізувати час поїмки по сі. •
РОЗДШЗ. Метод проміжних термінальних множин для квазілінійних диференціальних ігор змінної структури зі скінченною кількістю перемикань
Розглядається задача зближення для диференціальної гри змінної структури зі скінченною кількістю перемикань за участю одного переслідувача і. одного утікача. Нехай рух об’єкта змінної структури описується системами '
¿и) = /1І-/)2(/) + <рІЛ(ии\ V), /є[г7_,,г^),
де г1-*1 є И"'; г; - моменти перемикань, такі, що
0 = г0 <г, <...<гл_, <тл. =оо; Ли),Си) - сталі матриці розміру лу хму і п: х п]Л, відповідно, тобто матриці С<л є, взагалі кажучи, прямокутними,
ґс!{> І о 4
при цьому вони мають вигляд С(/) =
0 \С'»,
де С</> - невироджена
квадратна матриця порядку т, а т - натуральне число таке, що т<п)у ] = 1,..,,#; и{)\у - пектори керувань переслідувача і утікача, відповідно, при цьому //0) є ии) єК(Пр’), уєКєКСГ); <ри)(иа)^):ІГ0) -
неперервні за сукупністю зміньчх функції.
Покладемо С(,) = , а г(,)(0) = г(0)(0) = 2°. Надалі через будемо
позначати вектор, що складається з т перших компонент вектора а через - вектор, що складається з решти {п/ — т) компонент.
Нехай М' — деякий опуклий компакт у просторі И". Задача переслідувача полягає у тому, щоб вибираючи вимірне керування ии\і)&ии), Гє[Гу.,,^), j = досягти для деякого у є {1,
виконання співвідношення
г,(у)єМ', (4)
це означає, що
7(Л еМ) = Му+Л/°, (5)
де єК"7 :г\л =о|; Мі єIV^ єМ'.г^1 =о|. При цьому
Мі а ¿у, де = {г(-') єЯ"у = о| - ортогональне доповнення до лінійного підпростору А/“ у просторі Я"-1.
Задача утікача полягає в тому, щоб не допустити виконання включень (4), (5) на всьому напівнескінченному "інтервалі часу. При цьому переслідувач використовує квазістратегії, а утікач - програмне керування. Вибір моментів перемикань г;., у = 1....N -1, здійснює переслідувач.
Основна відмінність такої постановки задачі від задачі, сформульованої у попередньому розділі, полягає у спеціальній структурі матриць перемикання Си) і спеціальних умовах закінчення гри (4), (5). Слід зауважити, що завдяки цьому переслідувач може виконувати не всі перемикання і поїмка, взагалі кажучи, може відбутися в будь-який момент
і є [0, сю), на відміну від постановки задачі що розглядалася у розділі.2.
Для розв’язання поставленої задачі запропоновано стратегію переслідування, що полягає у поступовому наближенні траєкторії системи (3) до термінальної множини завдяки запровадженню так званих “проміжних термінальних множин”. На кожному з етапів гри переслідувач, використовуючи метод розв’язуючих функцій, виводить траєкторію системи (3) на одну з проміжних термінальних множин, після чого виконує перемикання. Таким чином, гра триває доти, поки траєкторію системи не буде виведено на термінальну множину.
Будемо надалі позначати через л) ортопроектор з її"' на Ь..
Розглянемо деякі матричні функції Віл(І), / є[0,со),у-1,...,ЛГ, порядку ц, де д - вимірність вектора V.
Уведемо многозначні відображення
де_/= 1.Л', г є [0, сс), \> є V.
^(0=ПиОС,-у)*
veV
nej=\,...,N, te[0,да).
Умова 3. (Умова Л.С.Понтрягіна) Існують такі неперервні матричні функції B^J\t), t є[0,со),/=1,...Д що Wj(t) * 0, t e[Q,<xj),j=l,...,N.
Покладемо ¡p(J)(t,uu),v) = <pij\u(j)— , Bu)(¡)v'
де_/=1,...Д, /є[0,оо), veV, «<y) є t/1-0.
Нехай M\, ecoK(R") - непорожні опуклі компакта з
простору R" такі, ідо M¡ aMJ 2---Э M'N -М'. Будемо позначати М; = ^(Л € R"' :z¡7) є (с,(/+|))'’Af', = о).
Розглянемо многозначні відображення
Mj(t) = Mj * frr¡e*n’pu\s,Uu\V)ds,
О
де/=1.....N, гє[0,оо).
Умова 4. Для згадатос матричних функцій B^J\t), t є[0,со),і деякого набору множин M¡, М'г,...,М'ы многозначні відображення Mj(t) * 0,_/=1,...Д для всіх t є[0, оо).
Многозначні відображення Wj(t), /є[0, оо) - півнеперервні
зверху через неперервність відображень Wj(t,v). А оскільки
півнеперервність зверху забезпечує вимірність за Борелем, то, за властивостями многозначних відображень, для кожного у є {1,...,jV} відображення lVj(t) має щонайменше один борелівський селектор /¿(¡), /j(t)eWj(t), te[ 0, оо). Будемо позначати через
= {уj(-) '-У jit) є є [0,со)} - сукупність борелівських селекторів
многозначного відображення Зафіксуємо деякий селектор уj() є і
покладемо
4j(t,z{J),yj(-)) = K1eA<‘)iz{>) + jVy(í>*,
О
дej=l,...,N, /є[0,оо), zu) eR"', yjOeFj.
Розглянемо розв’язуючі функції
ax¡¡ (?,6-,z0),v,/,(•)) = sup {а > 0 :[Wj(t -s,v)~yj{t -s)]f|
Па[Л//()-^(?,2(л,^(-))]^0І
де r є [0, оо), s є [0,f], zÍJ) eR";, veV, у;(-) є Г,.
Якщо ^(/,го),уу(-))єЛ//(0, то а^(г,і,2(у),у,^(-)) = +<» для всіх
j є[0,/], veV. Якщо ж 4j(t,zu),/;(■))£ Мj(t), то розв’язуюча функція набуває скінченних значень і є рівномірно обмеженою по se[0,/], veV. Крім того, у дисертаційній роботі показано, що якщо для конфліктно керованого процесу (3)-(5) виконуються умови 3, 4 і для деяких j, t, ги), Yj( •), таких, що je{\,...,N], /є( 0, сю), z0) є R"y, Гу(-)єГу
4j(t,ziJ)Mj{t), тоді розв’язуюча функція борелівська по (s,v), se[0,t], veV і півнеперервна зверху по v, veV, а функція inf агг (/,s,z(j\v,/<(•)) - вимірна по s, s є [0,/].
»єЙ і *
Розглянемо функції:
7}U0),/,(-)) = infj/2:0: {¡nfOjjj (t,s,z(n,v,yj(-))ds >l|, (6)
деу=1,...Д, z0) є R'J, yj{-) є Гj.
Якщо нерівність у фігурних дужках не виконується для всіх t є [0, со), то покладемо (•)) = +<». У дисертаційній роботі показано, що якщо
для конфліктно керованого процесу (3)-(5) виконані умови3 > 2j і для деяких z(J> eR"J, у j (•) є Г; Tj(zu\yj (•))<+«>, тоді нижня межа за часом у виразі
(6) досягається.
Нехай Zu\f, 'о. М). UlJ\ V) = + jeAU4l-syj)(Uu>,V)ds -
*0
множина досяжності керованого об’єкта (3) в момент f£f0 з множини початкових положень М0 за всіх можливих керувань переслідувача і утікача. Нехай Z(1)(0 = Z(l)(/;0,z°,l/(l),F), а Г, = Г,(г,(-)) = Tt(z°,/,(■)). Позначимо £>2(Г,) = C(2)Z(,i (Г,) П (С«М, + М2°). Аналогічним чином визначимо усі величини Tj, множини Dj(Tj_i) і многозначні відображення Zu)(t), t ^ 7^_,, 7=2,... Д:
£>ДГ,_,) = CU)ZU~'\T^ ) П (си)Л/,_, + М)),
. 7'>=Т,(/у(.))= sup Tj(zU) ,у j()),
Z°>(0 = ZW)(/; Tj_), Dj (T;_,), t/°>, F).
У мова 5. Для деяких борелівських селекторів у® (■),/= 1,... Д (•) є Гу
Tj = Г,(у° (•))<+».
Головним результатом розділу є нижченаведена теорема про достатні умови розв’язності задачі зближення:
Теорема 3.3.1. Нехай для конфліктно керованого процесу (3)-(5), початкового стану г°, деяких селекторів у®(•) та деяких множин М\, виконано умови 3-5. Тоді включення (4), (5) може бути
N
виконане не пізніше моменту Т =
Теоретичні результати третього розділу ілюструються на двох модельних прикладах, у яких при перемиканні структур поступово зменшується інерційність переслідувача. Застосовуючи метод проміжних термінальних множин переслідувач поступово зменшує відстань до утікача врешті решт досягаючи точної по“мки. У другому прикладі переслідувач до перемикання використовує динаміку “крокодила", а після перемикання -динаміку “хлопчика”. Рух утікача у цьому прикладі є простим впродовж всієї гри. Умовою закінчення гри є точне співпадання координат переслідувача і утікача. Для цього прикладу сформульовано обмеження на початкові умови, за яких використання змінної структури і запропонованих у роботі підходів дозволяє досягти виграшу у часі.
РОЗДІЛ 4. Задача зближення для квазілінійних диференціальних ігор змінної структури з одним перемиканням у випадку групи переслідувачів
Розглядається задача зближення для диференціальної гри змінної структури з одним перемиканням, в якій беруть участь кілька переслідувачів
і один утікач.
Нехай рух т керованих об’єктів змінної структури до перемикання г, г є [0,оо), описується системами:
2?\0)=гї,
а після перемикання: ■
¿¡2)=А{2)2}2)+р}2)(и}2},у), Гє[г,со),
де /' = 1.ш; 2((|) є І*"', г,(2) є Іі'”1; аР\АІ2),С/ - сталі матриці розміру
пі х П-, тІ х тІ і т,хи,., відповідно, тобто матриці С, є, взагалі кажучи, прямокутними; - вектори керувань переслідувачів і утікача,
відповідно, при цьому м)0 є і/,!1’ є К(іг'’' *), и,<2) є и)1) є К(ІІР'2’),
уєУєК(^); ^І)(и;і)1у):(/і,І)хГ-)Г', íp<2,(и<2),v):t/(<2, х V -> Я"1 -
неперервні за сукупністю змінних функції.
Термінальна множина М’ складається з множин ММ'т, М" а Ят‘, і = 1які мають вигляд:
м;=м?+міг (9)
де А/® - лінійний підпростір з К"', а Л/( - опуклий компакт, що належить ортогональному доповненню І, до підпростору М? у просторі Я"'. Будемо
говорити в цьому випадку, що термінальна множина М‘ складається з т циліндричних множин. Гра (7) - (9) вважається закінченою, якщо хоча б для одного і, / є {і,..., от}, виконується включення гі2> є М'. При цьому переслідувачі використовують квазістратегії, а утікач - програмне керування. Вибір моменту перемикання структур г здійснюють переслідувачі. Слід зауважити, що перемикання структур усіх т керованих об’єктів виконується одночасно.
Для цієї диференціальної гри на основі методу розв’язуючих функцій побудовано стратегію переслідування і одержано достатні умови розв’язності задачі зближення з термінальною множиною.
Для цього вводяться многозначні відображення:
деот, /є[0,а>), уеУ;
ІУ™«, у) = угієаГ',р!2)(^2\В^(Оу), де і=1 (є[0,со), ує ^;
Тут ВУ'О), і є[0,«),_/= 1,2, - матричні функції порядку q, де
q - вимірність вектора V.
И'/'Чо-ПиЛ'’).
у&У
де /= 1....т, Г є[0,оо);
ж/2чо=П
де 1=1..... * є[0,со).
Умова 6. (Умова Л.С.Понтрягіна) Існують такі неперервні матричні
функції В(о,(0» 1 є[0,оо), у=1,2, /=1.....т, що ^/л(ґ)*0, Г є[0,оо), у-1,2,
/=1,...,от.
Покладемо рУ>(і,иУ),у) = рїл(иІл,у)-<р1л(иУ>,В<л({)у), де у=І,2, М,...,от, /є[0,со), уєК, и\л є.и\л.
Нехай А/,, /V, є соК(к'1'), і = 1,...,т, - деякі опуклі компакти з просторів Я"1'.
Розглянемо многозначні відображення
^,(0=м, * і.і/,*",»')*,
■ 0
де /-І * є[0, со);
М, (І,т) ■- Л/, ї |л:1.е'4і'3,('-і)^(2Ч/ - х,и!2),Уїк ,
де 1=1,...,«, t є[г,оо), re[0,f].
Умова 7, Для згаданих матричних функцій / є[0,оо), ;=1,...,/л,
многозначні відображення N,(1) * 0, і=1,...,т, для всіх /є[0,оо), а
многозначні відображення 0, і-1,...,т, д.іявсіх t є [г, оо), re[0,f].
В силу припущень щодо параметрів процесу (7), (8) многозначні відображення WfJ) (t),j=\,2, і~\,...,т, /є[0,оо) -півнеперервні зверху. Тому
для кожної пари (i,j), і є (1.......т}, j є {1,2}, існує щонайменше один
борелівський селектор гІл(0, уУЧО € (?) > /є[0,оо). Позначимо через
Г<'> = {уУ1 (■)(І)єWf'](t),tє[0,со)} - сукупність борелівських селекторів многозначного відображення ІУ^ЧО- Зафіксуємо деякі селектори /,0)(-)>
/У’(-), Уі'Ч') є Г/'\ И2>(-)єГ<2), а також деякі вектори Д, Д є R*1, і покладемо
■ 0
де і= 1,... ,т, t є [0,»), Z, є R"‘, є Г/°; ;
• Т
де і=\,...,т, t є[т,со), гє[0,/], Д є R'”', yj2)(4) є Г/1}.
Розглянемо розв’язуючі функції
а,ш (/,5, z,, (•)) = sup{ar > 0: [К'а> (I -s,v)~ /,0) (/ - j)} П
де і=1/є[0,оо), J6[0,/], Zf є R"', veV, є Г(ш.
Якщо є ^,(0. то al'>(t,s,zi,v,}'l')(-)) = -nx для всіх
іє[0,/], veV. Якщо ж 4!')и>гі<Уі>>(’')) i ^,(/), то розв’язуюча функція набуває скінченних значень і є рівномірно обмеженою по se[0,/], v є V. Крім того, в роботі показано, що якшо для конфліктно керованого процесу
(7), (8) виконуються умови 6, 7 і для деяких і, /, z,, /,(|>(-), таких, що /є{1,i€(0,«)), г,.є R\ ?}»(-) є г'0 tf'Ht.wPOiefyO), тоді розв’язуюча функція борелівська по (s,v), se[0,i], veF і півнеперервна зверху no v, v є F, а функція inf а ¡’4?, s, z,, v,у,-''(•)) ~ вимірна no s, s є [0, f]. Введемо функції: '
qi(t,zi) = rinfa'"(i,s,z,,v,>-,("(-)>*. o'*1' '
де /=!,..,,w, f e[0, «), z(. є R"'.
Розглянемо ще один набір розв’язуючих функцій:
а?) ('. -s. г, А, v, /Г’ (•)) = sup{a і О Щ(2) (t-s,v)~ yf2)
Па[М,.(і,т)-£,(2>«,г,А,г!2)т*0}
деі=1,...,т, t є[т-,со), s є [г,/], г є[0,/], Д eR’1, уєК, ^}2)(')єГ/2>.
Якщо £(2).(Г,г,А,^(2)(-))єМ,(/,г), то a\1){t,s,T,p„v,y]2)(•)) = +«> для всіх se[r,t], v$V. Якщо ж 4Іг)(t,T,(■)) Є Л/Дг,г), то відповідна розв’язуюча функція набуває скінченних значень і є рівномірно обмеженою по s є[г,Г], veF.
У роботі показано, що розв’язуючі функції aj2)(t,s,T, Д, v,y^(-)) борелівські по (s,v), s є [г,ґ], v є F і півнеперервні зверху по v, veF, а функції inf a!21 (t,s,r, Д, v, yj2> (•)) -вимірні ПО S, S є [г,/].
veK
Розглянемо функцію
/
p(t,r,fi,y(2}(-))= inf max [a\2)(t,s,r,fit,v(s),y}r>(-))ds,
V( )e(iy 1-1.m *
де /є[г,оо], r є [О,/], /3 = (Д.....Д,), Д Є R"', y<24) = (ri2>(-),.--.rL2,0).
yj2)(-) є Г,!2\ тут = {v(-): v(t) є К, / > 0, v(f) -- вимірна}.
Якщо для деякого і а\2)(/,J,г,Д,v(s),y}2).(0) = +°° для ve[r,f], veF, t
будемо вважати, що |а/2>(/,^,г,Д,у(5),/,-2)(’)У'5 = +с0 * р((,г,Д1у,2)(')) = +00
Г
для всіх t € [г,со]. '
Умова 8. Для початкових положень z(°, і=zf є R"', існують такі моменти 7’°, г°, 0 < г° < Г0, множини N(, і=\,...,т, N, є coK(R"'), селектори у\Л('), у=І,2, і=\,...,т, РУ'*(■) є що справедливі наступні твердження:
а) ^(г°,2,°)>1 для всіх і—\,...,т;
б) />(Г0,г°,Д,^(2)(-)) ^ 1 для всіх Д є Аг,, і=\,...,т.
Головним результатом розділу є наведена нижче теорема про достатні умови розв’язності задачі зближення.
Теорема 4.3.1. Нехай для конфліктно керованого процесу (7)—(9) з початковішії положеннями zf, і=1,...,т,, для деяких моментів Г0, г°, 0<г°<Г°. множин Njf мі. Л', є coK.(R"'), /на селекторів
7= 1,2, уУ’І-) є Г(1у>, виконані умови 6-8. Тоді принаймні для одного і,
і с траєкторія процесу (7), (8) може бути виведена з початкового
стану г,(І на відповідну термінальну множину М’ є момент Т°.
Теоретичні результати четвертого розділу ілюструються на модельному прикладі. Нехай до перемикання рух трьох переслідувачів і утікача описується рівняннями (і є [0, т)):
Початкові значення: л,(0) = х°, ІДО) = і,0, >’(0) = у0. При цьому
вважається завершеною, якщо в деякий момент Т, Т є[г,оо), принаймні для одного і, і є {1,2,3}, виконується рівність X/ (Т) = у(Т).
Для цього прикладу завдяки використанню викладених у попередніх підрозділах результатів побудовано стратегію переслідування, щр дозволяє здійснити точну поїмку утікача за скінченний час з будь-яких початкових положень.
Тим часом для системи (10) точна поїмка неможлива, а для системи
(11) поїмка можлива лише з початкових положень, що задовольняють умові
запропонованих у цій роботі методів дозволяє завершити гру точною поїмкою з будь-яких початкових положень навіть тоді, коли поїмка була неможлива або можлива за істотних обмежень на початкові умови.
(10)
а після перемикання (л є (г,°о)) —
(П)
у0 є ігіїсо и!*,0 }■ Таким чином, використання змінної структури і
./»1.2,3
ОСНОВНІ РЕЗУЛЬТАТИ РОБОТИ ТА ВИСНОВКИ
1. На основі методу розв’язуючих функцій побудовані стратегії переслідування для трьох видів дифференціальних ігор змінної структури, в яких вимірність фазового простору змінюється при перемиканнях.
2. Для вищезгаданих диференціальних ігор змінної структури за допомогою
апарату теорії многозначних відображень сформульовано і доведено теореми про достатні умови зближення траєкторій ігор з циліндричною термінальною множиною. .
3. Побудовано стратегії переслідування для диференціальних ігор змінної структури зі скінченною кількістю перемикань та розривами траєкторій, обумовленими стрибками фазової змінної. Вивчено випадки, коли вектори стрибків визначаються одним з гравців.
4. Для диференціальної гри змінної структури зі скінченною кількістю перемикань сформульовано і розв’язано задачу зближення, у якій від переслідувача не вимагається виконання всіх перемикань.
5. Запропоновано нову стратегію переслідування одного утікача групою переслідувачів, що мають змінну структуру.
6. Теоретичні результати проілюстровано на модельних прикладах, які показують, що використання змінної структури і викладених у роботі підходів дозволяє або покращити час переслідування, або закінчити гру за скінченний час у випадках, коли це було неможливо.
ОСНОВНІ ПОЛОЖЕННЯ ДИСЕРТАЦГ ОПУБЛІКОВАНІ У ТАКИХ
ПРАЦЯХ:
1. Матичин І.І. Квазілінійні диференціальні ігри зближення змінної структури // Праці міжнар. конф. “Питання оптимізації обчислень”. - K.: Ін-т кібернетики ім. В.М. Глушкова НАН України. - 1997. - С. 188-192.
2. Чикрий A.A., Матичин И.И. Квазилинейные конфликтно управляемые процессы с переменной структурой // Проблемы управления и информатики. - 1998. -№6. - С. 31-41.
3. Матичин И.И. Линейные игровые задачи с переменной структурой// Теория и приложения методов оптимизации. - Киев: Ин-т кибернетики им. В.М. Глушкова НАН Украины. - 1998. - С. 29-34.
4. Matychyn I.I. Quasilinear variable structure differential games ofkind// Proc. of the 8lh Crimean Autumn Mathematical School-Symposium (KROMSH-VI1I). - Simferopoi. - 1998. - P. 224-228.
5. Матичин И. И. Об одном классе игровых задач сближения с переменной структурой И Проблемы управления и информатики. - 1999. -№4. - С. 62-70.
6. Матичин И. И. Задача сближения для квазилинейных дифференциальных игр с переменной структурой // Доп. НАН України. -2000.-№2.-С. 19-24.
Матичин І.І. Квазілінійні конфліктно керовані процеси змінної структури. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата фізико-математичних наук за спеціальністю 01.01.10-дослідження операцій і теорія ігор. - Інститут кібернетики імені В.М. Глушкова НАН України, Київ, 1999.
Дисертаційна робота присвячена конфліктно керованим процесам змінної структури, а саме квазілінійним диференціальним іграм змінної структури. У роботі розглянуто і досліджено три види квазілінійних диференціальних ігор змінної структури, для яких вимірність фазового простору може змінюватися при перемиканнях, "окрема досліджено ігри зі скінченною кількістю перемикань та розривними траєкторіями, а також ігри за участю групи гравців. Для цих ігор на базі методу розв’язуючих функцій побудовано стратегії переслідування, які дозволили одержати достатні умови зближення траєкторій ігор з циліндричною термінальною множиною. Для диференціальних ігор змінної структури зі скінченною кількістю перемикань сформульовано і розв’язано задачу зближення, у якій від переслідувача не вимагається виконання усіх перемикань.
Теоретичні результати проілюстровано на модельних прикладах, які демонструють ефективність запропонованих у роботі підходів.
Ключові слова: конфліктно керований процес, диференціальна гра, змінна структура, перемикання, термінальна множина, задача зближення, стратегія переслідування.
Матичин И.И. Квазилинейные конфликтно управляемые процессы с переменной структурой. ~ Рукопись. •
Диссертация на соискание ученой степени кандидата физикоматематических наук по специальности 01.01.10 - исследование операций и теория, игр. - Институт кибернетики имени В.М. Глушкова НАН Украины, Киев, 1999.
Диссертация посвящена конфликтно управляемым процессам с переменной структурой, а именно квазилинейным дифференциальным играм с переменной структурой. В виде дифференциальных игр с переменной структурой могут быть формализованы многие процессы, в которых объект управления находится под влиянием двух или нескольких управляющих воздействий и может функционировать в нескольких режимах. При этом переход от одного режима функционирования к другому происходит скачкообразно.
Важной особенностью рассматриваемых в диссертационной работе дифференциальных игр является то, что размерность их , фазового пространства может произвольно меняться при переходе от одного режима функционирования к другому, т.е. при переключениях. В работе исследуется три вида дифференциальных игр с переменной структурой. Во-первых -дифференциальная игра с конечным числом переключений, фазовая траектория которой претерпевает разрывы, поскольку при переключениях происходят скачки фазовой переменной. Для данной игры рассмотрены
случаи, когда векторы скачков выбирает преследователь или убегающий. Во-вторых - для дифференциальной игры с конечным числом переключений сформулирована и решена задача сближения с терминальным множеством, в которой от преследователя не требуется выполнение всех переключений. В-третьих - рассматривается дифференциальная игра, в которой участвует группа преследователей, обладающих переменной структурой, и один убегающий. Для всех вышеназванных игр на базе метода разрешающих функций построены стратегии преследования, позволишие сформулировать достаточные условия сближения с терминальным множеством цилиндрической структуры.
Все теоретические результаты диссертационной работы иллюстрируются на модельных примерах, демонстрирующих эффективность предложенных подходов. Из примеров видно, что использование переменной структуры и изложенных в работе методов позволяет либо улучшить время преследования, либо закончить игру за конечное время там, где это было невозможно.
Ключевые слова: конфликтно управляемый процесс,
дифференциальная игра, переменная структура, переключение, терминальное множество, задача сближения, стратегия преследования.
Matychyn I.I. Quasilinear Conflict Controlled Processes with Variable Structure. - Manuscript.
Thesis for a candidate’s degree by speciality 01.01.10 - Operations research and game theory. - V.M. Glushkov Institute of Cybernetics NAS of Ukraine, Kyiv, 1999.
The dissertation is devoted to the conflict controlled processes with variable structure, namely quasilinear differential games with variable structure. In the paper three kinds of quasilinear differential games with variable structure, for which the dimension of phase space can change by switches, are considered and investigated. So the games with discontinuous trajectories and finite number of switches as well as games with participation of several players are studied. For these games on the basis of the Method of Resolving Functions pursuing strategies are designed, which allowed obtaining the sufficient conditions of approach with the terminal set. For the differential games with variable structure with finite number of switches the approach problem is formulated and solved, in which the pursuer is not obliged to make all switches.
Theoretical results are supported by model examples demonstrating efficiency of approaches presented in the paper.
Keywords: conflict controlled process, differential game, variable structure, switch, terminal set, approach problem, pursuing strategy.