Линейные дифференциальные игры преследования с возможными нарушениями в динамике преследователя тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Пэн Чженсян АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1995 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Автореферат по математике на тему «Линейные дифференциальные игры преследования с возможными нарушениями в динамике преследователя»
 
Автореферат диссертации на тему "Линейные дифференциальные игры преследования с возможными нарушениями в динамике преследователя"

Р Г Б ОД

2 2 МАЙ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В.ЛОМОНОСОВА_

ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ

На правах рукопис и УДК 519.7

Пэн Чжэнсян

ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ ПРЕСЛЕДОВАНИЯ С ВОЗМОЖНЫМИ НАРУШЕНИЯМИ В ДИНАМИКЕ ПРЕСЛЕДОВАТЕЛЯ

01.01.02 - дифференциальные уравнения

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

Москва • 1995

Работа выполнена на факультете вычислительной математики и кибернетики Московского государственного университета имени М.В.Ломоносова.

Научный руководитель -

доктор физико-математических наук профессор М.С.Никольский

Официальные оппоненты -

доктор физико-математических наук, профессор Е.С.Половинкин, кандидат физико-математических наук, доцент И.А.Смольникова

Ведущая организация -

Вычислительный центр РАН

Зашита дис сертации состоится 1995 г.

в /¡.(¡.ти ов минут на заседании диссертационного Совета К053 05.87 в Московском государственном университете имени М.В.Ломоносова по адресу. 119899, Москва, Воробьевы горы, МГУ, 2-й учебный корпус, факультет вычислительной математики и кибернетики, аудитория 685.

С диссертацией можно ознакомиться в библиотеке факультета ВМиК МГУ.

Автореферат разослан "_____" _____________" 1995 г.

Ученый секретарь диссертационного Совета

доцент уф, В.М.Говоров

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В.ЛОМОНОСОВА

ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ

На правах рукописи УДК 519.7

Пзн Чжэнсян

ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ ПРЕСЛЕДОВАНИЯ С ВОЗМОЖНЫМИ НАРУШЕНИЯМИ В ДИНАМИКЕ ПРЕСЛЕДОВАТЕЛЯ

01.01.02 - дифференциальные! уравнения

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

Москва • 1995

Общая характеристика работы

Актуальность темы. Основы теории дифференциальных игр двух игроков с противоположными интересами были заложены в работах Л.С.Понтрягина, Н.Н.Красовско-го, Ю.С.Осипова, Е.Ф.Мищенко, Ф.Л.Черноусько, А.И.Субботина, Б.Н.Пшеничного и их учеников. В настоящее время эти результаты используются при построении и анализе различных новых задач управления с неполной информацией. Например, некоторые понятия, методы и результаты теории дифференциальных игр были использованы в работах [1], [2] М.С.Никольского для исследования процессов управления с возможными нарушениями в динамике управляемой системы. Развивая идеи работ [1], [2], мы естественным образом приходим к дифференциальным играм преследования-убегания с возможными нарушениями в динамике (с возможным отключением управления преследователя). Такие дифференциальные игры представляют интерес для приложений, так как в результате их исследования можно получить практические рекомендации для построения "осторожного" управления преследователя, учитывающего возможность отключения управления догоняющего игрока на неизвестном заранее отрезке [в, в -+- /¿], где ¡1 > 0 —величина, характеризующая длительность нарушения, а в > 0 —начальный момент нарушения.

Настоящая диссертация посвящена изучению линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя.

Игра описывается следующими уравнением и начальным

условием

х = Ах — ag(t)u + v,

х(0) = х0> X € it", и е Р, v £ Q,

где х 6 Л" — п -мерному евклидову арифметическому пространству, А —матрица размерности п х п, Р л Q —непустые выпуклые компакты из Rn, и и v — управляющие векторы . Вектором и распоряжается догоняющий игрок, вектором v распоряжается убегающий игрок, (ïe{t) —скалярная функция, моделирующая появление нарушения в процессе игры (1), определяемая следующим образом :

где в > 0 —начальный момент нарушения, к > 0 — константа, характеризующей длительность нарушения, общая для всех функций no(t).

Для игры (1) будем рассматривать следующие два слу-1ая:

I). Терминальное множество М есть непустое выпуклее замкнутое множество из П". Цель догоняющего игрока состоит в том, чтобы побыстрее вывести фазовую точку 1:(г) из хо на терминальное множество М. На счет информированности предположим, что догоняющему игроку 1звестны уравнение (1), начальное состояние хц , константа /г > 0 , множества Р, Ц и М, при каждом ; > 0 значение ои функция «(«) при ¿' £ [0,<], которую мы обозначим через «<(■). Момент в > 0 заранее 1еизвестен.

II). Терминальное множество М есть непустой выпуклый компакт из Я". Цель догоняющего игрока состоит в том, чтобы вывести фазовую точку х(1) из хц на терминальное множество М в фиксированный момент времени Т > 0. На счет информированности будем предполагать, что догоняющему игроку известны уравнение (1), начальное состояние а-о, фазовое состояние х(1) при каждом t, константа к > 0 , множества Р, С} и Л/, функция г>(.ч) при .ч £[/,/ + б], / > 0, где б > 0 задается убегающим игроком произвольным образом, и при каждом / > 0. Момент в > 0 заранее неизвестен.

Соответственно этим обстоятельствам, будем заниматься следующими задачами, которые принято называть задачами качества:

1). Найти те начальные состояния, для которых догоняющий при произвольной измеримой функции у(£) (=£?,/> 0 и произвольном в > 0 может гарантировать по доступной ему информации попадение соответствующего решения уравнения (1) на терминальное множество М за конечное время.

2). Найти те начальные состояния, для которых догоняющий при произвольной е -стратегии убегающего игрока и произвольном 0 > 0 может гарантировать по доступной ему информации попадение соответствующего решения уравнения (1) на терминальное множество М в точности в момент Т.

Научная новизна. В диссертации получены следующие результаты:

- для линейных дифференциальных игр преследова-

нпя с возможными нарушениями в динамике преследователя разработаны два эффективных метода решения задачи качества на базе альтернированного интеграла Л.С.Понтрягина;

- для линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя разработан абстрактный метод решения задачи качества с фиксированным временем окончания игры на базе конструкций Л.С.Понтрягина и Б.Н.Пшеничного;

- изучены два интересных класса линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя.

Цель работы. Разработка методов решения линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя. Получение достаточных условий для решения задачи качества 1), получение необходимых и достаточных условий для решения задачи качества 2).

Общая методика исследования. Для обоснования результатов, содержащихся в диссертационной работе, использованы результаты из теории обыкновенных дифференциальных уравнений, теории многозначных отображений, а также аппарат теории дифференциальных игр.

Теоретическая и практическая ценность. Полученные результаты могут быть использованы для исследований задач теории управления при наличии возмущающих факторов и нарушении в динамике.

Практическая ценность работы заключается в возможности применения полученных результатов к решению задач,

возникающих в технике и экономике.

Апробация. Результаты работы докладывались на научных конференциях "Понтрягинские чтения-V" (Воронеж, 1994 г.), "New computer technologies in control systems" (Переславль-Залесский, 1994 г.), на семинарах под руководством профессоров М.С.Никольского, В.И.Благодатских и Н. JI. Григоренко.

Публикации. Основные результаты диссертации опубликованы в работах [9]-[12].

Структура и объем работы. Диссертация состоит из введения и двух глав. Объем работы - 78 машинописных страниц, библиография - 21 наименований.

Содержание работы

Диссертация состоит из введения u двух глав.

Во введении указывается актуальность поставленных задач, дается краткое описание структуры диссертации и основные результаты.

В первой главе рассматриваются линейные дифференциальные игры преследования с возможными нарушениями в динамике преследователя для вышеупомянутого случая I) с помощью альтернированного интеграла Л.С.Понтрягина (см.[3, 4]) в нестационарном варианте (см.[5, 6]). Исследуется задача качества. Получены достаточные условия для решения этой задачи. Даются примеры, иллюстрирующие применение полученных результатов.

В параграфе 1.1 дана постановка задачи, рассматриваемой в данной главе, введено определение класса управлений

догоняющего игрока с памятью и постановка задачи качества для случая I).

Определение 1. Обозначим через С однопараметри-ческое семейство отображений vt(-)) во множество

Р , определенных V t > 0 на множестве измеримых функций v(s) £ Q, 0 < s < t, и обладающих свойством суперпозиционной измеримости: функция u(t) = vt(-)) измерима при t > 0 для произвольной измеримой функции v(s) £ Q, s > 0.

В качестве допустимых стратегий догоняющего мы будем рассматривать пары

и = №(•),

где /"î(-) £ С, ^ ^ V 0 > 0. Решение задачи Кошн

(1) при фиксированных Ы,в > 0 и измеримой функции v(t) £ Q, t > 0 понимается так.

При 0 < t < 9 оно совпадает с: решением y{t) следующей задачи Коши :

1/(0) = х0.

ITiïii t > 0 оно с:овпадает с решением z(t) следующей задачи Коши:

i = Az - C*g(t)F°(t, Vt{-)) + v(t), z(6) = v(6).

В силу сделанных соглашений любая тройка U, в > 0 и измеримая функция v(t) G Q,t > 0 , однозначно определяет момент первого попадения соответствующего решения x(t,U,9,v(-)) задачи Коши (1) на терминальное

множество М , его мы обозначим через T(x0,U,e,v(-) (если x(t,U,9,v(-)) М при всех t > 0 ,то полагаеь Т( x0,U,9,v(-)) = +oo).

Задача качества. Найти начальные точки xq , дш которых

infsupsupT(a;o,W,ö,v(-)) <+оо. (2'

и 0>О «(•)

В параграфе 1.2 излагаются некоторые факты и результаты, касающиеся операций алгебраического суммирования множеств " +" и геометрической разности множеси *

" — ", элементы теории многозначных отображений, которые непосредственно используются в последующих параграфах данной диссертации.

Параграф 1.3 посвящен изучению задачи качества с использованием первого приближения альтернированного интеграла Л.С.Понтрягина. Доказывается достаточность полученных условий для завершения игры преследования с возможными нарушениями за конечное время. Результаты данного параграфа заключаются в следующей теореме.

Теорема 1 Пусть при O<t<r,0>O

We{t, т) =(м + J e(T-sy>Aae(s)Pds^ - ]e^AQds,

W(i,r)= П We(t,r)

ее M

и для данного xq £ М существует такое tq > 0.

что выполнены включение eT°AXQ (Е ^(О,^) и следующие предположения:

1) для любого t : 0 < t < tq, существует г 6 tq] такое, что для него имеет меспю равенство (условие регулярности)

W(t,T0) = Wr(t,T0)i

2) для любых t G [О, Го], в 6 [t, то] выполняется следующее соотношение (условие полного выметания):

То Го

Weit,го) + / e(T°-s)AQds = М + / e^Ta~s'>Aao(s)Pds. i i

Тогда существует такая стратегия Uq, что supsupT(xo,Uo,0, v(-)) < Гц.

в>0 v( )

В параграфе 1.4 продолжается исследование задачи качества с помощью альтернированного интеграла Л.С.Понтря-гина. Даются более слабые, чем в параграфе'1.3 условия для возможности завершения рассматриваемой нами дифференциальной игры.

Пусть на отрезке [?),</]> где р < q, заданы измеримые многозначные отображения U(t),V(t), равномерно ограниченные на [р, </]. Пусть в R" фнкси1)овано некоторое непустое замкнутое выпуклое множество В —концевое множество интегрирования.

Рассмотрим разбиение со отрезка [р, </] : р = т0 < Т\ < ... < Tk = (j. Ему сопоставим следующее множество

Е* = f • • • (Д + / U(r)dr) - 1 V(t) dr) + 7' U(r) dr)

\ \ n-l ) Tt-l J Tt-2 /

- 7 V(r) dr) + ■ ■ ■ + 1 U(t) dr) - ? V(r) dr,

Tlc-2 J To ) T0

которое называют альтернированной суммой.

Определение 2. Будем называть пересечение множеств £ы по всем возможным разбиениям и отрезка \p,q] альтернированным интегралом Л.С.Понтрягина (в нестационарном варианте, см.[5, б]). Обозначим его символом

в,ч

j [U(t)(It - V(t)c1t]. р

Построим альтернированный интеграл

М,т

We(t,t)= j [е{т-^аав(*)р(1х - est-s)aqds], , <

где 0 < t < т, 9 > 0, Wo(t, т) = М. Положим

W(t,r)= П We(t,T). ee[t,r]

Тогда справедлива следующая теорема.

Теорема 2 Пусть для некоторого xq fi Ad существует такое tq > 0, при котором выполняется следующее включение

еТаАхо 6 W(0, то).

Пусть для любого £б[0,То] существует 7б[/,Го] такое, что для него имеет место равенство

W(t,t0) = W,(t,T0).

Тогда игру преследования (1) можно закончить за время tq при любом измеримом управлении убегающего игрока v(t) Е Q,t > 0 и при любом в > О, т.е. выполняется соотношение (2).

В параграфе 1.5 рассмотрено несколько примеров, демонстрирующих применение полученных в параграфах 1.3, 1.4 результатов. Среди них есть пример, показывающий неравносильность условий теорем из этих параграфов.

Вторая глава посвящена исследованию линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя с более абстрактным подходом. Здесь кроме альтернированного интеграла Л.С.Понтрягнна мы пользуемся еще некоторыми построениями и идеями Б.Н.Пшеничного для получения необходимых и достаточных условий окончания игры преследования за фиксированное время.

В параграфе 2.1 даются постановка задачи, рассматриваемой в данной главе, определения ( -стратегий убегающего и догоняющего игроков для дифференциальной игры (1) и нижеследующих вспомогательных игр (3), (4), описание хода игры, определение задачи качества для случая

Для изучаемой дифференциальной игры (1) с нарушениями рассмотрим следующие две вспомогательные игры для фиксированного О 6 [О, Т] :

Задача качества состоит в том, чтобы найти начальные состояния :г0, для каждого из которых существует стратегия догоняющего игрока такая, что при произвольной стратегии убегающего игрока и произвольном в > 0 фазовая

II).

у - Ау - и + v,

1/(0) = а-0, 0 < г < 0,

г — Аг — о^(£)и + г>,

т = у(*), * > о.

(4)

(3)

точка х(Ь) системы (1) может попасть на множество М точно в заданный момент Т > 0.

В параграфе 2.2 с помощью конструкций Л.С.Понтрягина и Б.Н.Пшеничного мы строим некоторое фазовое ограничение для вспомогательной игры (3).

Для уравнения (1) при фиксированном 9 > 0 определим следующие операторы:

где 0 < »'1 < Г2 < Т\

ци т, 9)М = ПП(<, п, 6)ЩП, /2,9) • • • П(/дг_,, Т, 9)М,

где 0<t<T, u = {t<t\<■■■< < Т} —разбиение отрезка [¿,Т], а пересечение по и в правой части берется по всевозможным разбиениям отрезка [<, Г]. Положим

Тогда £?(/) имеет следующее свойство.

Лемма 1 Пусть М —выпуклый компакт, и С(^) ф 0 при I € [0,Т]. Тогда многозначное отображение полунепрерывно сверху по 2 на [0,Т].

В параграфе 2.3 вместо исходной игры (1) мы рассматриваем вспомогательную игру (3) с построенным в параграфе 2.2 фазовым ограничением (?(<). Для такой игры мы строим некоторое множество начальных состояний, из которых

Щгиг2,9)М =

((

и

£(*) = т, г)м при * е [о,т].

вспомогательная игра может быть закончена за фиксированное время Т. Полученное таким образом множество начальных состояний и оказывается решением поставленной нами исходной задачи.

Для игры (3) определим следующие операторы:

где 0 < < /2 < Г, Л' С С?(<2).

Пусть I) < 1 < Г < Т, и> = {г0 = г < t\ < ■ ■ ■ < tl^, = »•} -разбиение отрезка [£,?']. Полагаем

П"(иг)Х = П'(<0, <.)П'(/ь ■ ■ • П'(*лг_ь *л№ Щ,г)Х = Г)П"((.,г)Х,

где пересечение берется по всевозможным разбиениям и! отрезка [<, г].

Теорема 3 Пусть .х'ц £ П(0, Т)М. Тогда изучаемая диф-фчрнпциалыи 1Я игра (1) с возможными нарушениями а динамике преследователя может быть закончена точно и момент Т при любой стратегии убегающего игрока и любом в > 0.

Если хо ^ П(0, Т)М, то существует такая стратегия убегающего игрока и такой момент нарушения В £ [0, Г], что для любой стратегии догоняющего игрока, игра (1) не может быть закончена в момент Т.

В заключение отметим, что при написании диссертации были использованы некоторые понятия и результаты из монографий [7], [8].

Список литературы

[1] Никольский М.С. О задаче управления линейной системой с нарушениями // ДАН СССР. -1986. -т.287. N.6. С.1317-1320.

[2] Никольский М.С. Об одной задаче управления с нарушениями в динамике // Труды МИАН СССР. -1988. -Т.185. С.181-186.

[3] Понтрягин J1.C. О линейных дифференциальных играх.2 // ДАН СССР. -1967. -Т.175, N.4. -C.764-76G.

[4] Понтрягин JI.C. Линейные дифференциальные игры преследования // Мат. сб. Нов. сер. -1980. -Т.112, Вып.З. -С.307-330.

[5] Никольский М.С. Нестационарные линейные дифференциальные игры // Вестник Моск. Университета, сер. математика, механика, 1969, N.3, С.65-73.

[6] Половинкин Е.С. Неавтономные дифференциальные игры //Диф. уравнения, 1979, том XV, N.6, с. 1007-1017.

[7] Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.:Наука, 1974.

[8] Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. -Киев, Наукова думка, 1992.

[9] Никольский М.С., Пэн Чж. Одна дифференциальная игра преследования с возможным нарушением в динамике //Вестн. МГУ, сер. 15, Вычисл. Математика и кибернетика. 1994. N.2

[10] Никольский М.С., Пэн Чж. Дифференциальная игра преследования с нарушением в динамике //Диф. уравнения. 1994, том XXX, N.11, с.1923-1927.

[11] Пэн Чж. Об одной дифференциальной игре преследования с возможным нарушением в динамике / / Понтря-гннские чтения-V. Весенняя Воронежская математическая школа. Тезисы докладов, Воронеж, 1994.

[12] Zhengxiang Peng' Он a differential pursuit game with possible disturbances iu dynamics //New computer technologies in control systems, Proceedings of the international workshop, July 1994. Pereslavl-Zalessky, Russia