Линейные дифференциальные игры преследования с возможными нарушениями в динамике преследователя тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Пэн Чженсян
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1995
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
Р Г Б ОД
2 2 МАЙ
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В.ЛОМОНОСОВА_
ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ
На правах рукопис и УДК 519.7
Пэн Чжэнсян
ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ ПРЕСЛЕДОВАНИЯ С ВОЗМОЖНЫМИ НАРУШЕНИЯМИ В ДИНАМИКЕ ПРЕСЛЕДОВАТЕЛЯ
01.01.02 - дифференциальные уравнения
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва • 1995
Работа выполнена на факультете вычислительной математики и кибернетики Московского государственного университета имени М.В.Ломоносова.
Научный руководитель -
доктор физико-математических наук профессор М.С.Никольский
Официальные оппоненты -
доктор физико-математических наук, профессор Е.С.Половинкин, кандидат физико-математических наук, доцент И.А.Смольникова
Ведущая организация -
Вычислительный центр РАН
Зашита дис сертации состоится 1995 г.
в /¡.(¡.ти ов минут на заседании диссертационного Совета К053 05.87 в Московском государственном университете имени М.В.Ломоносова по адресу. 119899, Москва, Воробьевы горы, МГУ, 2-й учебный корпус, факультет вычислительной математики и кибернетики, аудитория 685.
С диссертацией можно ознакомиться в библиотеке факультета ВМиК МГУ.
Автореферат разослан "_____" _____________" 1995 г.
Ученый секретарь диссертационного Совета
доцент уф, В.М.Говоров
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В.ЛОМОНОСОВА
ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ
На правах рукописи УДК 519.7
Пзн Чжэнсян
ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ ПРЕСЛЕДОВАНИЯ С ВОЗМОЖНЫМИ НАРУШЕНИЯМИ В ДИНАМИКЕ ПРЕСЛЕДОВАТЕЛЯ
01.01.02 - дифференциальные! уравнения
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва • 1995
Общая характеристика работы
Актуальность темы. Основы теории дифференциальных игр двух игроков с противоположными интересами были заложены в работах Л.С.Понтрягина, Н.Н.Красовско-го, Ю.С.Осипова, Е.Ф.Мищенко, Ф.Л.Черноусько, А.И.Субботина, Б.Н.Пшеничного и их учеников. В настоящее время эти результаты используются при построении и анализе различных новых задач управления с неполной информацией. Например, некоторые понятия, методы и результаты теории дифференциальных игр были использованы в работах [1], [2] М.С.Никольского для исследования процессов управления с возможными нарушениями в динамике управляемой системы. Развивая идеи работ [1], [2], мы естественным образом приходим к дифференциальным играм преследования-убегания с возможными нарушениями в динамике (с возможным отключением управления преследователя). Такие дифференциальные игры представляют интерес для приложений, так как в результате их исследования можно получить практические рекомендации для построения "осторожного" управления преследователя, учитывающего возможность отключения управления догоняющего игрока на неизвестном заранее отрезке [в, в -+- /¿], где ¡1 > 0 —величина, характеризующая длительность нарушения, а в > 0 —начальный момент нарушения.
Настоящая диссертация посвящена изучению линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя.
Игра описывается следующими уравнением и начальным
условием
х = Ах — ag(t)u + v,
х(0) = х0> X € it", и е Р, v £ Q,
где х 6 Л" — п -мерному евклидову арифметическому пространству, А —матрица размерности п х п, Р л Q —непустые выпуклые компакты из Rn, и и v — управляющие векторы . Вектором и распоряжается догоняющий игрок, вектором v распоряжается убегающий игрок, (ïe{t) —скалярная функция, моделирующая появление нарушения в процессе игры (1), определяемая следующим образом :
где в > 0 —начальный момент нарушения, к > 0 — константа, характеризующей длительность нарушения, общая для всех функций no(t).
Для игры (1) будем рассматривать следующие два слу-1ая:
I). Терминальное множество М есть непустое выпуклее замкнутое множество из П". Цель догоняющего игрока состоит в том, чтобы побыстрее вывести фазовую точку 1:(г) из хо на терминальное множество М. На счет информированности предположим, что догоняющему игроку 1звестны уравнение (1), начальное состояние хц , константа /г > 0 , множества Р, Ц и М, при каждом ; > 0 значение ои функция «(«) при ¿' £ [0,<], которую мы обозначим через «<(■). Момент в > 0 заранее 1еизвестен.
II). Терминальное множество М есть непустой выпуклый компакт из Я". Цель догоняющего игрока состоит в том, чтобы вывести фазовую точку х(1) из хц на терминальное множество М в фиксированный момент времени Т > 0. На счет информированности будем предполагать, что догоняющему игроку известны уравнение (1), начальное состояние а-о, фазовое состояние х(1) при каждом t, константа к > 0 , множества Р, С} и Л/, функция г>(.ч) при .ч £[/,/ + б], / > 0, где б > 0 задается убегающим игроком произвольным образом, и при каждом / > 0. Момент в > 0 заранее неизвестен.
Соответственно этим обстоятельствам, будем заниматься следующими задачами, которые принято называть задачами качества:
1). Найти те начальные состояния, для которых догоняющий при произвольной измеримой функции у(£) (=£?,/> 0 и произвольном в > 0 может гарантировать по доступной ему информации попадение соответствующего решения уравнения (1) на терминальное множество М за конечное время.
2). Найти те начальные состояния, для которых догоняющий при произвольной е -стратегии убегающего игрока и произвольном 0 > 0 может гарантировать по доступной ему информации попадение соответствующего решения уравнения (1) на терминальное множество М в точности в момент Т.
Научная новизна. В диссертации получены следующие результаты:
- для линейных дифференциальных игр преследова-
нпя с возможными нарушениями в динамике преследователя разработаны два эффективных метода решения задачи качества на базе альтернированного интеграла Л.С.Понтрягина;
- для линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя разработан абстрактный метод решения задачи качества с фиксированным временем окончания игры на базе конструкций Л.С.Понтрягина и Б.Н.Пшеничного;
- изучены два интересных класса линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя.
Цель работы. Разработка методов решения линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя. Получение достаточных условий для решения задачи качества 1), получение необходимых и достаточных условий для решения задачи качества 2).
Общая методика исследования. Для обоснования результатов, содержащихся в диссертационной работе, использованы результаты из теории обыкновенных дифференциальных уравнений, теории многозначных отображений, а также аппарат теории дифференциальных игр.
Теоретическая и практическая ценность. Полученные результаты могут быть использованы для исследований задач теории управления при наличии возмущающих факторов и нарушении в динамике.
Практическая ценность работы заключается в возможности применения полученных результатов к решению задач,
возникающих в технике и экономике.
Апробация. Результаты работы докладывались на научных конференциях "Понтрягинские чтения-V" (Воронеж, 1994 г.), "New computer technologies in control systems" (Переславль-Залесский, 1994 г.), на семинарах под руководством профессоров М.С.Никольского, В.И.Благодатских и Н. JI. Григоренко.
Публикации. Основные результаты диссертации опубликованы в работах [9]-[12].
Структура и объем работы. Диссертация состоит из введения и двух глав. Объем работы - 78 машинописных страниц, библиография - 21 наименований.
Содержание работы
Диссертация состоит из введения u двух глав.
Во введении указывается актуальность поставленных задач, дается краткое описание структуры диссертации и основные результаты.
В первой главе рассматриваются линейные дифференциальные игры преследования с возможными нарушениями в динамике преследователя для вышеупомянутого случая I) с помощью альтернированного интеграла Л.С.Понтрягина (см.[3, 4]) в нестационарном варианте (см.[5, 6]). Исследуется задача качества. Получены достаточные условия для решения этой задачи. Даются примеры, иллюстрирующие применение полученных результатов.
В параграфе 1.1 дана постановка задачи, рассматриваемой в данной главе, введено определение класса управлений
догоняющего игрока с памятью и постановка задачи качества для случая I).
Определение 1. Обозначим через С однопараметри-ческое семейство отображений vt(-)) во множество
Р , определенных V t > 0 на множестве измеримых функций v(s) £ Q, 0 < s < t, и обладающих свойством суперпозиционной измеримости: функция u(t) = vt(-)) измерима при t > 0 для произвольной измеримой функции v(s) £ Q, s > 0.
В качестве допустимых стратегий догоняющего мы будем рассматривать пары
и = №(•),
где /"î(-) £ С, ^ ^ V 0 > 0. Решение задачи Кошн
(1) при фиксированных Ы,в > 0 и измеримой функции v(t) £ Q, t > 0 понимается так.
При 0 < t < 9 оно совпадает с: решением y{t) следующей задачи Коши :
1/(0) = х0.
ITiïii t > 0 оно с:овпадает с решением z(t) следующей задачи Коши:
i = Az - C*g(t)F°(t, Vt{-)) + v(t), z(6) = v(6).
В силу сделанных соглашений любая тройка U, в > 0 и измеримая функция v(t) G Q,t > 0 , однозначно определяет момент первого попадения соответствующего решения x(t,U,9,v(-)) задачи Коши (1) на терминальное
множество М , его мы обозначим через T(x0,U,e,v(-) (если x(t,U,9,v(-)) М при всех t > 0 ,то полагаеь Т( x0,U,9,v(-)) = +oo).
Задача качества. Найти начальные точки xq , дш которых
infsupsupT(a;o,W,ö,v(-)) <+оо. (2'
и 0>О «(•)
В параграфе 1.2 излагаются некоторые факты и результаты, касающиеся операций алгебраического суммирования множеств " +" и геометрической разности множеси *
" — ", элементы теории многозначных отображений, которые непосредственно используются в последующих параграфах данной диссертации.
Параграф 1.3 посвящен изучению задачи качества с использованием первого приближения альтернированного интеграла Л.С.Понтрягина. Доказывается достаточность полученных условий для завершения игры преследования с возможными нарушениями за конечное время. Результаты данного параграфа заключаются в следующей теореме.
Теорема 1 Пусть при O<t<r,0>O
We{t, т) =(м + J e(T-sy>Aae(s)Pds^ - ]e^AQds,
W(i,r)= П We(t,r)
ее M
и для данного xq £ М существует такое tq > 0.
что выполнены включение eT°AXQ (Е ^(О,^) и следующие предположения:
1) для любого t : 0 < t < tq, существует г 6 tq] такое, что для него имеет меспю равенство (условие регулярности)
W(t,T0) = Wr(t,T0)i
2) для любых t G [О, Го], в 6 [t, то] выполняется следующее соотношение (условие полного выметания):
То Го
Weit,го) + / e(T°-s)AQds = М + / e^Ta~s'>Aao(s)Pds. i i
Тогда существует такая стратегия Uq, что supsupT(xo,Uo,0, v(-)) < Гц.
в>0 v( )
В параграфе 1.4 продолжается исследование задачи качества с помощью альтернированного интеграла Л.С.Понтря-гина. Даются более слабые, чем в параграфе'1.3 условия для возможности завершения рассматриваемой нами дифференциальной игры.
Пусть на отрезке [?),</]> где р < q, заданы измеримые многозначные отображения U(t),V(t), равномерно ограниченные на [р, </]. Пусть в R" фнкси1)овано некоторое непустое замкнутое выпуклое множество В —концевое множество интегрирования.
Рассмотрим разбиение со отрезка [р, </] : р = т0 < Т\ < ... < Tk = (j. Ему сопоставим следующее множество
Е* = f • • • (Д + / U(r)dr) - 1 V(t) dr) + 7' U(r) dr)
\ \ n-l ) Tt-l J Tt-2 /
- 7 V(r) dr) + ■ ■ ■ + 1 U(t) dr) - ? V(r) dr,
Tlc-2 J To ) T0
которое называют альтернированной суммой.
Определение 2. Будем называть пересечение множеств £ы по всем возможным разбиениям и отрезка \p,q] альтернированным интегралом Л.С.Понтрягина (в нестационарном варианте, см.[5, б]). Обозначим его символом
в,ч
j [U(t)(It - V(t)c1t]. р
Построим альтернированный интеграл
М,т
We(t,t)= j [е{т-^аав(*)р(1х - est-s)aqds], , <
где 0 < t < т, 9 > 0, Wo(t, т) = М. Положим
W(t,r)= П We(t,T). ee[t,r]
Тогда справедлива следующая теорема.
Теорема 2 Пусть для некоторого xq fi Ad существует такое tq > 0, при котором выполняется следующее включение
еТаАхо 6 W(0, то).
Пусть для любого £б[0,То] существует 7б[/,Го] такое, что для него имеет место равенство
W(t,t0) = W,(t,T0).
Тогда игру преследования (1) можно закончить за время tq при любом измеримом управлении убегающего игрока v(t) Е Q,t > 0 и при любом в > О, т.е. выполняется соотношение (2).
В параграфе 1.5 рассмотрено несколько примеров, демонстрирующих применение полученных в параграфах 1.3, 1.4 результатов. Среди них есть пример, показывающий неравносильность условий теорем из этих параграфов.
Вторая глава посвящена исследованию линейных дифференциальных игр преследования с возможными нарушениями в динамике преследователя с более абстрактным подходом. Здесь кроме альтернированного интеграла Л.С.Понтрягнна мы пользуемся еще некоторыми построениями и идеями Б.Н.Пшеничного для получения необходимых и достаточных условий окончания игры преследования за фиксированное время.
В параграфе 2.1 даются постановка задачи, рассматриваемой в данной главе, определения ( -стратегий убегающего и догоняющего игроков для дифференциальной игры (1) и нижеследующих вспомогательных игр (3), (4), описание хода игры, определение задачи качества для случая
Для изучаемой дифференциальной игры (1) с нарушениями рассмотрим следующие две вспомогательные игры для фиксированного О 6 [О, Т] :
Задача качества состоит в том, чтобы найти начальные состояния :г0, для каждого из которых существует стратегия догоняющего игрока такая, что при произвольной стратегии убегающего игрока и произвольном в > 0 фазовая
II).
у - Ау - и + v,
1/(0) = а-0, 0 < г < 0,
г — Аг — о^(£)и + г>,
т = у(*), * > о.
(4)
(3)
точка х(Ь) системы (1) может попасть на множество М точно в заданный момент Т > 0.
В параграфе 2.2 с помощью конструкций Л.С.Понтрягина и Б.Н.Пшеничного мы строим некоторое фазовое ограничение для вспомогательной игры (3).
Для уравнения (1) при фиксированном 9 > 0 определим следующие операторы:
где 0 < »'1 < Г2 < Т\
ци т, 9)М = ПП(<, п, 6)ЩП, /2,9) • • • П(/дг_,, Т, 9)М,
где 0<t<T, u = {t<t\<■■■< < Т} —разбиение отрезка [¿,Т], а пересечение по и в правой части берется по всевозможным разбиениям отрезка [<, Г]. Положим
Тогда £?(/) имеет следующее свойство.
Лемма 1 Пусть М —выпуклый компакт, и С(^) ф 0 при I € [0,Т]. Тогда многозначное отображение полунепрерывно сверху по 2 на [0,Т].
В параграфе 2.3 вместо исходной игры (1) мы рассматриваем вспомогательную игру (3) с построенным в параграфе 2.2 фазовым ограничением (?(<). Для такой игры мы строим некоторое множество начальных состояний, из которых
Щгиг2,9)М =
((
и
£(*) = т, г)м при * е [о,т].
вспомогательная игра может быть закончена за фиксированное время Т. Полученное таким образом множество начальных состояний и оказывается решением поставленной нами исходной задачи.
Для игры (3) определим следующие операторы:
где 0 < < /2 < Г, Л' С С?(<2).
Пусть I) < 1 < Г < Т, и> = {г0 = г < t\ < ■ ■ ■ < tl^, = »•} -разбиение отрезка [£,?']. Полагаем
П"(иг)Х = П'(<0, <.)П'(/ь ■ ■ • П'(*лг_ь *л№ Щ,г)Х = Г)П"((.,г)Х,
где пересечение берется по всевозможным разбиениям и! отрезка [<, г].
Теорема 3 Пусть .х'ц £ П(0, Т)М. Тогда изучаемая диф-фчрнпциалыи 1Я игра (1) с возможными нарушениями а динамике преследователя может быть закончена точно и момент Т при любой стратегии убегающего игрока и любом в > 0.
Если хо ^ П(0, Т)М, то существует такая стратегия убегающего игрока и такой момент нарушения В £ [0, Г], что для любой стратегии догоняющего игрока, игра (1) не может быть закончена в момент Т.
В заключение отметим, что при написании диссертации были использованы некоторые понятия и результаты из монографий [7], [8].
Список литературы
[1] Никольский М.С. О задаче управления линейной системой с нарушениями // ДАН СССР. -1986. -т.287. N.6. С.1317-1320.
[2] Никольский М.С. Об одной задаче управления с нарушениями в динамике // Труды МИАН СССР. -1988. -Т.185. С.181-186.
[3] Понтрягин J1.C. О линейных дифференциальных играх.2 // ДАН СССР. -1967. -Т.175, N.4. -C.764-76G.
[4] Понтрягин JI.C. Линейные дифференциальные игры преследования // Мат. сб. Нов. сер. -1980. -Т.112, Вып.З. -С.307-330.
[5] Никольский М.С. Нестационарные линейные дифференциальные игры // Вестник Моск. Университета, сер. математика, механика, 1969, N.3, С.65-73.
[6] Половинкин Е.С. Неавтономные дифференциальные игры //Диф. уравнения, 1979, том XV, N.6, с. 1007-1017.
[7] Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.:Наука, 1974.
[8] Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. -Киев, Наукова думка, 1992.
[9] Никольский М.С., Пэн Чж. Одна дифференциальная игра преследования с возможным нарушением в динамике //Вестн. МГУ, сер. 15, Вычисл. Математика и кибернетика. 1994. N.2
[10] Никольский М.С., Пэн Чж. Дифференциальная игра преследования с нарушением в динамике //Диф. уравнения. 1994, том XXX, N.11, с.1923-1927.
[11] Пэн Чж. Об одной дифференциальной игре преследования с возможным нарушением в динамике / / Понтря-гннские чтения-V. Весенняя Воронежская математическая школа. Тезисы докладов, Воронеж, 1994.
[12] Zhengxiang Peng' Он a differential pursuit game with possible disturbances iu dynamics //New computer technologies in control systems, Proceedings of the international workshop, July 1994. Pereslavl-Zalessky, Russia