Дифференциальные игры с неполной фазовой информацией тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Константинов, Роман Викторович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Долгопрудный МЕСТО ЗАЩИТЫ
1998 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Дифференциальные игры с неполной фазовой информацией»
 
Автореферат диссертации на тему "Дифференциальные игры с неполной фазовой информацией"

Р Г 6 О Д ПРаваХ рукописи

2 2 СЕН 1Ь9И

Константинов Роман Викторович

ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С НЕПОЛНОЙ ФАЗОВОЙ ИНФОРМАЦИЕЙ

01.01.09 - математическая кибернетика

АВТОР^ФЕР\Т

диссертации на соискание ученой ст епени кандидата физико-математических наук

Долгопрудный • 1998

Работа выполнена на кафедре высшей математики Московского физико-технического ин титута

Научный руководитель:

доктор физико-математических наук,

профессор Половинкин Е. С.

Официальные оппоненты:

доктор физико-математических наук,

профессор Никольский М. С.

кандидат физико-математических наук,

доцент Орлов М. .В.

Ведущая организация:

Институт математики и механики УрО РАН

Защита состоится «_» _ 1998 г. в_ч. на заседании Диссертационного совета К 063.91.03 при МФТИ в Московском физико-техническом институте по адресу: К1700, г. Долгопрудный, Моск. обл., Институтский пер., д. 9.

С диссертацией можно оэтакомиться в библиотеке МФТИ. Автореферат разослан «{Л» 1998 г.

"Ученый секретарь специализированного совета

доктор физико-математических наук Самыловский А. И.

/ ктуальность работы. Построите математических моделей конфликтно управляемых процессов в условиях неполной информированности игроков является одним из интенсивно развивающихся направо- ений теории дифференциальных игр. По сути рассматривается задача оптимального управления с неопределенностью, которая вызвана двумя факторами: во-первых, вредная помеха, или, в терминах теории дифференциальных игр, второй игрок, стремящийся помешать достижению оптимального результата; во-вторых, неполная информация о фазовом векторе системы. Для исследования зада I оптимального управления с вредной помехой, но полной информацией о состоянии системы, Л. С. Понтрягиным, Н. Н. Красовским, Б. Н. Пшеничным и их последователями была разработана теория дифференциальных игр. Задачи оптимального управления с неполной фазовой информацией при отсутствии вредных помех рассматривались в работах Р. Е. Калмана и других, где была развита теория наблюдаемости.

На практике, однако, возникают игровые задачи, где имеет место неполная информированность игроков о фазовом состоянии управляемой системы, когда измерение части компонент фазового вектора либо невозможно, либо производится с ошибками. Как отмечено в монографии Л. А. Петросяна и Г. В. Томского, существуют два принципиально отличных друг от друга подхода постановки игровых задач с неполной фазовой информацией. В первом слу.^е цели участников конфликта описываются с помощью функционала, зависящего не от конкретных реализаций конфликтно-управляемого процесса, но от совокупностей реализаций, составляющих его информационные состояния. В этой постановке удается свести задачу к уже хорошо исследованному случаю с полной фазовой информацией. Во втором случае цели участников конфликта описываются с помощью функционала, существенно зависящего от конкретных реализаций процесса. При этом функция выигрыша может принимать различные значения для реализаций, входящих в одно и то же информационное состояние.

Первые публикации, посвященные постановке и решению игровых задач с I ¡полной фазовой информацией, относятся к началу 70-х ю-дов и принадлежат Н. Н. Красовскому, Ю. С. Осипову, А. Б. Куржан-скому, А. В. Кряжимскому, А. И. Субботину, М. С. Никольскому и другим. В работах Н. Н. Красовского, Ю. С. Осипова, А. В. Кряжим-ского, А. И. Субботина для решения дифференциальных игр преследования с неполной фазовой информацией рассматривалось обобш»'

нии теории стабильных мостов Н. Н. Красовского. Линейные дифференциальные игры преследования с неполной фазовой информацией рассматривались в работах М. С. Никольского, где было предложено обобщение первого прямого метода преследования Л. С. Понтрягина, и в работах А. Б. Куржанского, где даны достаточные условия, при выполнении которых определен гарантированный результат и построена оптимальная кусочно-программная стратегия первого игрока. В работах О. И. Никонова сформулированы достаточные, уловия успешного окончания лннейной дифференциальной игры убегания и построена оптимальная гарантированная стратегия убегающего как многозначная функция информационных областей, совместимых с реализовавшимся наблюдением. При исследовании дифференциальных игр с неполной фазовой информацией естественно возникает задача определения информационной области, совместимой с реализовавшимся наблюдением, и даже фазового состояния управляемой системы по наблюдению, решение которой дает дополнительные возможности для применения известных методов теории дифференциальных игр на рас-сматр- ваемый случай с неполной фазовой информацией.

Цель работы.

1. Изучение линейных дифференциальных игр преследования (убегания) с неполной фазовой информацией на фиксированном отрезке времени. Формулировка условий успешного окончания преследования (убегания) в классе кусочно-программных стратегий. Построение кусочно-программной гарантированно" стратегии игроков.

2. Обобщение альтернированной суммы и альтернированного интеграла Л. С. Понтрягина дли линейных дифференциальных игр »ре-следования (убегания) с ьлюлной фазовой информацией. Исследование свойств обобщенной альтернированной суммы и обобщенного альтернировавши интеграл и

3. Изучение нелинейных дифференциальных игр преследования (убегания) с терминапьным функционалом. Решение задачи построения оптимального гарантированного результата преследователя (убегающего) в классе кусочно-программных стратегий, исследование его свойств.

Научная новизна.

I. Исследование задачи восстановления начального фазового состояния неавтономной линейной управляемой системы по наблюдению на отрезке. Основная проблема щш использовании теории на-

б.п1гцаемости Р. Е. Калмана для задач с помехой состоит в том,- что даже для вполне наблюдаемых на отрезке систем помеха не позволяет точно восстановить начальное значение фазового вектора, исходя иг наблюдения. Преодолеть данную трудность позволяет условие идеальной наблюдаемости линейной управляемой системы с наблюдением, впервые введенное Л. С. Понтрягиным и изученное в работах М. С. Никольского для автономных линейных управляемых систем с наблюдением. Получены необходимые и достаточные условия идеальной наблюдаемости неавтономной линейной управляв. ;ой системы с наблюдением на отрезке. Следует отметить, что в неавтономном случае свойство идеальной наблюдаемости на отрезке вообще говоря не позволяет восстановить всю траекторию движения фазового вектора системы, исходя из наблюдения, рассматривается соответствующий пример. Введены специальные условия и— и V—определенной!* рассматриваемой системы в точке, позволяющие конструктивно решить данную задачу.

2. П ^строение многозначных отображений, обобщающих альтернированную сумму и альтернированный интеграл Л. С. Понтрягина для рассматриваемых задач преследования (убегания) с неполной фазовой информацией. Формулировка условий успешного окончания преследования (убегания), при выполнении которых проведено конструктивное построени кусочно-программной гарантированной стратегии преследователя (убегающего). При эпределенных условиях доказывается сходимость в метрике Хауодорфа введенной обобщенной альтернированной суммы к обобщенному альтернировангэму интегралу.

3. Исследование нелинейных дифференциальных игр с терминальным функционалом. Построение оптимального гарантированного результата преследователя (убегающего) в классе кусочно-программных стратегий на основе метода динамического программирования. При определенных условиях доказана поточечная сходимость гарантированного результата для фиксированного разбиения рассматриваемого отрезка времени к оптимальному гарантированному результату пре-следоват гя (убегающего).

Научно - практическое значение.

1. Формулировка условий и— VI V-определенности в точке неавтономной линейной управляемой системы с наблюдением, которые позволяют соответственно 'убегающему и преследователю конструктии-но решить задачу восстановления начального фазового состояния р;н:-

см;.триваемой системы по наблюдению на отрезке при отсутствии информации об управлении противника. Выпс шеиие указанных условий значит ашю упрощает численное моделирование решения этой задачи на ЭВМ, что имеет важное значение для эффективного построения кусочно-программной гарантированной стратегии игроков.

2. В первой главе предложено обобщение альтернированной суммы Л. С. Понтрягииа для линейной дифференциальной игры преследования (убегания) с неполной фазовой информацией при выполнении некоторых условий идеальной наблюдаемости рассматриваемой линейной управляемой системы. Это позволяет в перспективе применить-полученные результаты для численного моделирования предложенных конструкций на ЭВМ с целью построения игровых множеств достижимости и кусочно-программной гаралтиров;..шой стратегии игроков.

3. Во второй главе проведено построение оптимального гарантированного результата преследователя (убегающего) для нелинейных дифференциальных игр с неполной фазовой информацией. Рассматриваемая постановка удобна для численной реализации, так как информация о фазовом векторе поступает в виде наблюдений в определенные до начала игры дискретные моменты времени, и которые игрок осуществляет' коррекцию своего управления. Полученные результаты проиллюстрировав .л на примере вычисления оптимального гарантированного результата игроков для линейных дифференциальных игр преследования (убегания). Вычисление введенных во второй главе множеств возможных фазовых состояний и возможных наблюдений линейной управляемой системы с наблюдением может быть эффективно реализовано на ЭВМ, что позволяет в перспективе применить полученные результгты для решения практических задач.

Апробация работы. Результаты, составляющие содержание диссертационной ; гботы, докладывались на XXXVIII научной конференции МФТИ (Долгопрудный, 1994 г.), на ХЬ научной конференции МФТИ (Долгопрудный, 1997 г.), на математической школе «Понтря-гинские чтения'- IX» (Воронеж, 1998 г.), на научном семинаре иисть тута математики и механики УрО РАИ (Екатеринбург, 1998 г.).

По теме диссертации опубликовано пять работ, список которых приводится в конце автореферата.

Структура и объем работы. Диссертация состоит из введения, двух глав, разбитых на параграфы, и списка литературы из 60 наименований.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

1. Линейные дифференциальные игры с неполной фазовой информацией.

В первой главе исследуются линейные дифференциальные игры преследования (убегания) на фиксированном отрезке времени при неполной информированности преследователя (убегающего) о фазовом состоянии управляемой системы. Даются достаточные условия успешного окончания игры в конечный момент времени.

Будем рассматривать следующую линейную управляемую систему с наблюдением

= A{t)x(t) + B(t)u(t)-rC(t)v{t), (1.1)

y(t) = D(t)x(t), • (1.2)

где х € M" - фазовый вектор; у € R1 - наблюдаемый вектор (/ < n); t -время, t € [0О,0]; и Ç Rp - управление первого игрока (преследователя); и £ К' - управление второго игрока (убегающего); A{t), B{t), C(ï) и D(t) - г. тгрицы размеров nxn, пх р, пхди/хп соответственно. Матрицы A(t) и D(t) имеют непрерывные, a B(t) и C(t) - изк-еримые ограниченные компоненты на отрезке [i?o, Щ- Ранг матрицы D(t) равен I для любого t 6 ['?о, 0]-

Допустимыми управлениями игроков будем называть измеримые на [0о,0) функции и(-) и и(-) такие, что

■«(0 € У, v(t) б Q, п. в. t € [0О,

где ? С и Q С R® - выпуклые компакты. Множества всех допустимых управлений преследователя и убегающего, определенных на полуинтервале [То,Т), обозначим U[Tq, Т) и V[7o, Т).

Заданы матрица проектирования П размера гахпи выпуклое компактное терминальное множество С С Rm.

Задача первого игрока состоит в том, чтобы в конечный момент времени •<) проекция фазового вектора управляемой системы попа а па терминальное множество-, ffx(t)) € M. Задача второго игрока противоположная: Пх{0) £ Ж.

Введем разбиение отрезка [X¡i,T|:

ы[Г0) Г] = {<*}*!, Т0 = f i < t2 < • ■ • < ík = Т. (1.3) Меткостью разбиения и'р'о.Т] пачопем \uj[Tq,T]\ -- *,иах — /д.).

Обозначим С(ро, Т], К') пространство непрерывных на [Т0, Т] функций со значениями в К', снабженное вир-но^мой.

Определение 1.1. Пусть до < <о < 4 < 1?. Кусочно-программной стратегией преследователя на т5] назовем разбиение о»^,«?] = управление «!(•) 6 И[£о>*1) и отображение Гр{к,щ(-),ук{-)), ставящее в соответствие каждому номеру к е 1, К — 1, управлению иц(-) е £*) и соответствующему наблюдению ук{-) € К')

управление и*и(-) 6

Определение 1.2. Пусть дц < Ц < < < Кусочно-программной стратегией убегающего на [¿,1?] назовем разбиение 1?] = управление € я отображение Гс(к,щ(-),Ук(-)), ставящее

в соответствие номеру к 6 1, К —7, управ.'гнию Ьк(-) £ я соответствующему наблюдению уь(-) С управление

ь'ш(-) €

Игра преследования. Решается задача построения в классе кусочно-программных стратегий допустимого управления преследователя, гарантирующего попадание проекции фазового вектора на терминальное множество в конечный момент времени. Преследователю известны уравнения (1.1), (1-2), матрица проектирования П, множества СР, <3, М. В каждый молвит времени t € [Аь преследователю становится известным вектор наблюдения у{1). Требуется найти момент времени I 6 (^а, "О) и кусочно программную стратегию преследователя на [4,1?], применение которое для построения допустимого управления преследователя гарантирует Пх(\)) € Ти.

Игра убегания. Решается задача построения в классе кусочно-программных стратегий д( пустимого управления убегающего, гарантирующего уклонение проекции фазового вектора от попадания на терминальное : ыожество, в конечный момент времени. Убегающему известны уравнения (1.1), (1.2), матрица премирования Я, множества У, .0, М. В каждый момент времени £ € [гЭ(), г)} убегающему становится известным вектор наблюдения т/(£). Требуется найти момен» времени í с {■Оо, и кусочно программную стратегию убегающего па [1,19], применение которой для построении допустимого управления убегающего гарантирует Пх(д) 0 М.

Пусть Ф(<, т) - нормированная фундаментальная матрица решений однородной линейной системы

(1.4)

с

Применим к фазовому вектору системы (1.1) стандартное преобразование:

*(*).= <Р(д, *)*(«). (1.5)

В терминах вектора (1.5) задача первого игрока записывается как Пг(д) £ М, задача второго - Пг{6) $ М.

1.1. Определение фазового вектора линейной управляемой системы с наблюдением.

Определение 1.3. Систему (1.1), (1.2) назовем идеально V га-блюдаемоП (и-наблюдаемой) на отрезке [То, Т], если можно однозначно восстановить вектор х(То) по наблюдению у(-) и управлению и(-) (и(-)) на [То, Т], не имея информации о реализовавшемся допустимом управлении ь(-) (и(-)).

Если система (1.1), (1.2) является идеально ^-наблюдаемой (и-наблюдаемой) на отрезке [То, Г], то фазовый вектор х(Т0), соответствующий наблюдению у(-) и управлению и(-) 6 И[То, Т) (и(-) 6 \>[Т0,Т)) будем

обозначать Хр[Т0,Т,у(-),и(-)) (Хе(Т0,Т,у(-),у{-))У Вв:аду симметричности понятий идеальной и- и «-наблюдаемости системы (1.1), (1.2) на отрезке, далее будем изучать свойство идеальной ^-наблюдаемости.

Напомним, что суммой двух множеств Л и Ъ из Жт называется Множество Л + ® = {а + 6 : а е Л, Ь е Ъ]. Обозначим Щ%,Т) множество измеримых на ро,Т). функций, принимающих для почти всех 4 € [Т'о, Т) значения в О + (—0). Определим функцию

5: [Т0,Т] х К" х ЩТ},Т) -4 М!

следующим образом: для любых £ 6 ро,Т], л 6 К", ги(-) € У^[Т0, Т)

(

5(<, *,№(•)) = £>(<)Ф(<,7о)г+ /1?(<)Ф(<,г)С(г)Цг)^т-. (1.6)

г„

Предложение 1.1. Система (1.1), (1.2) являете? идеально ь-на-блюдаемой на ро,Т] тогда и только тогда, когда для любого нетривиального г 6 К" и для любой функции ■ш(-) € "М[То, Т) существует *е[То,Т]:«5(<,г,Ц-))^0.

Определим функцию Д: К" Ж следующим образом:

Д(г) - м | /|5(г,«>(-))Г <гг: «;(•) € юрь.т) |. (1.7) 7

Лредложение 1.2. Система (11), (1.2) является идеально «-наблюдаемой на [То, Т] тогда и только тогда, когда Д(-) имеег в нуле стропы локальный минимум.

Напомним, что опорной функцией множества А из Rm называется cr(p,A) = sup((p,a;) : х € Л}, где р € R"1. Введем обозначения:

H(t) = P(t,Ta)D-(t)D(t)0(t,To), <fi{t,w()) = J <HTo,r)C(r)w{r)dT.

T*

Предложение 1.3. Система (11), (1-2) является идеально v-на-блюдаемоИ на [Tg, Т] тогда и только тогда, когда для любого нетривиального z 6 R" н для любой функции ы(-) € W[7q, Т), таких, что для п. в. t € ро,Т) выполнено равенство

"(КО. ОД), t)C(t)(ü + (-Q)}) = (р{1), , (1.8)

i

где p(t) = / Шт)(г + ^(r,w(-)))dr, (1.9)

г

г

справедливо неравенство J (z -г <,i(¿, u;(-)), //(í)^z -f <ji(t, u)(-))J^) lií > 0.

Ta

Пусть система (1.1), (1.2) является идеально и-наблюдаемой на отрезке [То,Т]. Пусть ti(-) € 'tl[То, Т), а у(-) - соответствующее наблюдение. Наша цель - найти А',,(То,Т, у(-), и(-))- Для этого, следуй работе М. С. Никольского (ДАН СССР, 1970, Т. 191, № 6, С. 1224-1227), ргосмотрим вспомогательную задачу оптимальною управления: ми-

X 2

"имизировать ДD(t)x(t) — у(1)) Ч на множестве управлений V[T(,,T)

и соответствую них допустимых траекторий х(-) (1.1) на [То,Т]. Пусть (x( ),v( )) - решение этой задачи. Тогда Хг(Го,Т, y{ ),u(-)) = z(Tc¡). Применяя для решения этой задачи принцип максимума Л. С. Поп-трягина можно показать, что для определения х(2'о) необходимо найт.. «(•) 6 V[To,T), удовлетворяющее соотношению

<(р(<),С(<М0) = cr(p(0, C(t)Qh И. в. t € [7Ь,Г), (1.10) i

где p(t) — f Ф*(т, t)D'{T)(D(r)x(r) ~ j(r))dr. а затем воспользоваться т

следующей формулой:

х(Т0) = О-*(Т0,Т) (/ 4Ц?,1)1У{т)у{т)Лт+

Хт° ч (1-11)

/(С(Г0,0 - С(Т0, Г)ЖГо, <)(В(0«(0 + С(1)»(0)Л ,

Го /

г

где введена матрица С(То, Т) = ^ Я(()Л. Построенный алгоритм поис-

г0

ка Хр(То,Т, у(-), «(•)) для идеально «-наблюдаемой на [Т0,Т] системы (1.1), (1.2) имеет существенный недостаток: отсутствие конструктивного решения уравнения (1.10) относительно «(•). Сформулируем теперь дополнительные условия на систему (VI), (1.2), которые позволят конструктивно определить Хр(Т0,Т,у(-),и(-)у. Будем считать, что однородная система (1.4), (1.2) является вполне наблюдаемой на [То, ¿] для любого < е (Т0, Г]. Для произвольных г0 £ К". «(•) 6 И [То, Т), ь(-) 6 'У[То, Т) рассмотрим задачу Коши для (1.1) на отрезке [То, Т] с начальным условием х(Тц) = хд. Пусть х(-) - решение этой задачи, а у(-) - соответствующее ему наблюдение (1.2). Определив матрицу С(Т0) ¿) = ССГо.г^Го.О, для любого < е (Т0,Т) находим:

ь,<)( /

\ т»

x(t) = G-\%,t) ( <P-(r,Tü)D-(T)y(T)dT+

(1.12)

/ G(T0,r)(B(r)u(r) + C(r)v(r))drj.

To /

Определим матрицу D+(i) = Z)*(i) (£>(i)Z)*(i))_1. Тогда для любого i 6 [To, T] справедливо равенство:

= + (1.13)

Обозначим Bm = { x e Rm : |r| < 1 } единичный шар в Rm. Напомним, что хаусдорфоным расстоянием м. хду множествами А и Ъ из R'" называется h{A, В) = inf [г > 0 : А С Ъ + гВт, 3 с А -г гВт}.

Опрг ;еление 1.4. Систему (1.1), (1.2) назовем и-опрслелешюН в точке То 6 [00, 0), если существует Va(T0) € К" такое, что предел

JmJh - D+(t)D(t)) / G-1(To,i)C(To,T)C(r)Qdr

То

суадествуег в смысле метрик я Хпусдорфп и равен {Vo(7o)}.

9

Эпределение 1.5. Систему (1.1), (1.2) назовем «-определенной в точке То 6 [t30, t9), если существует Со(То) 3 Кп такое, что прешел

tKmJln - D+(t)D(t)) / G~l(T{), t)G(T0, т)В{т)Ыт

io

существует в смысле метрики Хаусдорфа и равен {[/¡¿(То)}.

Если система (1.1), (1.2) является «-определенной в то 1ке То, то из (1.12) и (1.13) следует, что существует предел

Ур(То,т,у(-),«(•)) = - D4t)D(t))G-l(Ta,t)x

J(<P(t,T0)D'(t)v(t) ~ G(Tg, т)В(т)и(т))с1г.

Го

При этом фазовый вектор x(Tq) вычисляется по формуле:

ХР(Т0,Т, у(-), «(•)) = D+(T0)i/(T„) + У,(То, Г, у(-), «(■)) + ВД)-

(Ы4)

Ясно, что из ^-определенности системы (1.1), (1.2) в точке То следует ее идеальная ^-наблюдаемость на любой отрезке [То, То + 6], где 5 6 (О, Г-Т0].

Если система (1.1), (1.2) является «-определенной в точке То, то из (1.12) и (1.13) следует, что существует предел

К.(Г0,Т,у(.),1»(0) =? ,]™0(/п- 0+(<)£>(0)б-'(2и,£)х

■ J(Ф" (t,Tq)D'(т)у(т) + G(Tq, r)C(r)i;(T))<ir. т»

При этом фазовый вектор x(Tq) вычисляется по формуле:

Хе(Т0,Т,у(-), „(•}) = D+(T0)y(Tc) + Ve(To,T,y{-),v[-)) + ЩЩ).

(1.15,

Ясно, что из u-определенности системы (1.1), (1.2) в точке То следует ее идеальная «-наблюдаемость на любом отрезке [То, То + <5], где S 6 (0,Т-Г0].

Как показано в работе М. С. Никольского (ДАН СССР, 1970, Т. 191, № 6, С. 1224-1227), для автономной системы (1.1), (1.2) свойство идеальной наблюдаемости не зависит от отрезка времени [То, Т] и поэтому

nr>3 оляет восстановить не только значение фазового вектора х(Тд), но и всё решение r(£), t G [7o, Т]. Приводимый ниже пример показывает, что для неавтономной системы это вообще говоря не так. Пример 1.1. Рассмотри^ линейную систему

где х = ^ ^ € R2 ; у € R; t € [0, Г]. Множество допустимых значений

управления v - отрезок: Q = [vj, «г], где < t>2-

Можно показать, что данная система является и-определенной в нуле и не является идеально и-наблюдаемой на-любом отрезке [Го, Г], где 0 < То < Т. Тем не менее, всё решение x(t), t £ [0,Т] в рассматриваемом случае вообще говоря определить нельзя. Действительно, зафиксируем начальную точку то и упр^зление v(-) € V[0, Т). Пусть х(-) - соответствующее решение на [0, Т]. Пусть

v~ = ess inf v (í), v+ = ess sup v(t). te[o,T) <е[о,Г)

Тогда для любого v S [vi — V~,V2 — и для почти всех t € [0,7^) справедливо включение v(t) + v 6 Q, т. e. v(-) + й G Т[0, Т). Пусть х(-) - решение на [0,Т], соответствующее управлению v(-) + v и £(0) = xq. Тогда находим:

¿i(t) = zi(í), x2{t) - x2{t) + í¿, V¿e[0,T].

Следовательно, если v ф 0, то различным решениам х(-) и х(-) соответствует одно и то же наблюдение у(-) на [0,Т].

1.2. Решение линейной дифференциальной игры преследования. Пусть система (1.1), (1.2) является идеально и-наблюлаемой на отрезке [То, Г]. Пусть х(-) - решение (1.1) на [То, Т], соответствующее некоторому х0 = x(Tq) и управлениям и(-) в ?í[To, Т), v(-) € V[To,T). Введем следующие обозначения (ft [То, Щ):

E(t) = t)D+(t)D(t) Щ, б), E(t) =In- E(t) i t U{To,t,u(-)) = ¡4{e,r)B(T)u{r)dr, V(T0, <,"(•)) = ¡Щ,т)С{т)ь{т)Лт, r0 n

Wp(T0,t,y{-)..n(.)) = <P(tí,t)D+(t)y(t)-

B(t)(<P(d,To)XJ,(To)TIy(.),uí.)) + f/(7b,f, «(•))),

„(•).«(•» = Ф(0,Т)О+{Т)у(Т)+

Ё(Т)(ф(#, То)Хр(То, Т, I/(•), «(•)) + и(То, т,«(.))). Можно показать, что для любого t € [io,T] справедливо соотношение f?(i)V(T0l t, «(•)) = И^(Го, «,»(•), «(•)).■ (1-16)

а для векторов z(7o) и г(Т) (1.5) имеют место равенства

^(7o,T,j/(-),u(0) = Z(T0) + U(To,T,v0))+E(T)V(To,TM-)), (1-17) z(T) = Zh{T0,T,y(.)M-)) + E(T)V{T0,T,v(.)). (1.18)

Следовательно, множеством допустимых на [То, Т) управлений убегающего, совместимых с реализовавшимся упрамлением преследователя «(•) и наблюдением у(-), является множество

{«(■) € V(T0lT) : E(i)V(T0, *,«(•)) = WP(T0, «,»(■).«(•)) Vt 6 [Т0,Г|}.

Обозначим произвольную точку этого множества и[То,Т,у(-),«(-)](•). Для л" )бого и(-) £ V[To, 71) определим следующие множества:

V(7b,7>(-)) =

{«(•)6V[r0,T): i;(t)r(T0,i, (5-»)(•))= 0 Vi 6 [TU,TJ }. Q(r0,T,v(-)) = { ЩГ)У(Г0,Г,*(-)) : €(•) € V(T0,T,v(-)) }.

Множество Q(To,T,v(-)) есть выпуклы.! компакт в R"1. Применяя соотношения (1.16), (1.17), (1.18), окончательно находим:

Пх(Т) е nZp(Ta, Т, у{-), u(')) + 0(Го, Т, г[Г0, Т, у(-), и(-)](-)). (1.19)

Оценка (1.19) вектора Hz(T) является наилучшей в смысле той информации (управление и( ) и наблюдение !/(■)), коюрой обладает преследователь на отрезке [То, Т].

Напомним, что геометрической разностью двух множеств А и 23 из К"1 называется множество А - В = {с С S'" : с + В С Л}. Зафиксируем число е, 0 < £ < д - ¿>0. Для произвольного i € [i?o + е, •О) и разбиения г?] — {t*)it=i ощоделим многозначные отображения V[ifc_i,iA) -V 2s'" и множества Kt(w[i,i?]) С где к е 1, К — 1, ta-t— е, следующим образом:

.^l.fK-i(-)) = (м - (Ok + Ojf-1 ("К'-!(->))) + (-?*).

f()6V¡l»-i.<»)

= (Nui(w[í,i»l)-йкЫ-))) + (-?*+>).

где wjt(-) € tk). Были использованы следующие обозначении:

У(т) = ГЩ4, г)В(г)3>, Q(г) = ПФ(д, r)C(r)Q, Vr G 0);

Ii t»

У* = / V(r)dr, Qk = / Q(r)(/r, VA.' G r,7v';

'4-1 <t-l

= V(tt.„i»,«(•)). Vf(-) € - «(■)). Vf (•) € îiffc-b <*)•

Множества M*(uï[M>], vj(-)) и >f*(w[<, i9]), к ç 177?~t, являются hu-пуклыии компактами (быть может пустыми) в Rm.

Теорема 1.1. Пусть t G [i?0 -f e,i?). Цусть =-- (MÍ--] - puj-

биете (1.3), a t<¡ t ~ f. Пусть система (1.1), (l.'J) ян ¡inoren идеально v-паб.тюдаемоН на отрезках [ít_i>íi] для всех к Ч 1 ,К. Пусть щ(-) 6 К[ío, t) - управлении прсследоиателя, a t/i(■ ) 6 C([/<i, ij, К1) - соответствующее ему наблюдение (1.2). Пусть

nZpfa,, t,Vi (•),"«()) GM, (wMJ, »[((,,*,"»,(.), «,(■)](•))■ O-204

Тогда существует кусочно-программная стратегия преследователя на [t, i?) такая, что преследование может быть успешно закончено ' момент 0.

Многозначное отображение М| (w[f, t?], •) обобщает альтернированную сумму Л. С- Понтряпша для рассматриваемой .задачи преследования, имеет иыпуклые компактные (быть может пустые) значения. Для любого t € [ft, + е, Ù) и произвольного г>() € V[t — е, £) определим множество

Mf(i,«(.)) - elf U M,(«ммо)), Í1.21)

VM /

где объединение берется но всевозможным разбиениям отрезка [¿,0]. Множество ЛТ.^t,»'(')) является выпуклым компактом (быть может пустым) в ¡K.'".

Теорема 1.2. Пусть * е [«?о г £,»?), существуют <5< > 0, г, > О такие, что для любою разбиения а>[£, т9] = мелкости < 6(

справедливы соотношения:

(М [О/с + Ок-1(^-1(-))]) -П®т ф 0 (1-22)

-г.В"1 ф 0 (1.23)

для всех г*(-) 6 6 V[tя_2,t^f-l), к 6 1,К-2. Тогда

для любого и(.) € Т[£ - е, <) справедл иво.равенство

И (*,»(•)) = ,иш; ЗУСх(Ш[4, »(•)),

|*>М|-»0

где предел берется ио разбиениям отрезка [£,0].

Заметим, что соотношения (1.22) и (1-23) в условии теоремы 1.2 выполнен! для всех достаточно мелких разбиений отрезка [¿,0], если они выполняются хотя бы для одного разбиения этого отрезка. Таким образом, справедлива следующая

Теорема 1.3. Пусть* € [во+е,^). Пусть существуют число гц> О и разбиение и>о[<, 0] = гакие> что справедливы соотношения:

(М -1 + 0А-0_1(и/гв_1Л))]) -2гоВ'л ф 0 (1.24)

(^.цЦМ)) -0*(г>*(-))) -2г0Вт ф 0 (1.25)

для всех »*(■) € V[í^1,40>), б к €

Тогда существуют &t > 0, г( == го такие, что для любого разбиения и>[/, 0] —- мелкости < & справедливы соотношения (1-22)

и (1.23).

1.3. Решение линейной дифференциальной игры убегания.

Пусть система (1.1), (1.2) является идеально «-наблюдаемой на < т-резке [То,Т). Пусть а(-) - решение (1.1) на [То,У], соответствующее некоторому хо = х(То) и управлениям и(-) 6 и[Т0,Г), »;(■) 6 \7[Т0,Т). Введем следующие обозначения (( 6 [То, Т]):

Е(<) (ф(0, т0)хе(т0, т, г/С), «(■)) + У(т0,1,«(.))),

2<(То, Т, »(•), »(■)) = т Т)0*(Т)у(Т)+

Ё(Т)(<Р{д,Ть)Хе(П,Т,у(.), «(•)) + У(Г0,Т, «(•)))■

Можно показать, что для любого 2 £ [То, Т] справедливо соотношение

£(*){/(Т„, *,«(■));«И^То, «,»(•),«(•)). (1.26)

а для векторов г(То) и г(Т) (1.5) имеют место равенства

ад,Т- »(•), «(•)) = *(Т0) + ^(ТЬ, Т.!,(.)) ■+■ Е(Т)и{Т0, Т,«(-)), (1-27) 2(Г) = ^(Го,Т,у(.),«(-)) + ЬЧТ)С/(То,Г,иО). (1.28)

Следовательно, множеством допустимых на [То,Т) управлений преследователя, совместимых с реализовавшимся управлением убегающего «(•) и наблюдением у(-), является »■ тожество

{«(•) 6 И [То, Т) : Е(1)1'{%, «,«(■)) = ^,(Т0,е, у(-)А)) V* € [Т0,Т]}.

Обозначим произвольную точку этого множества ц[То,Т, у(-), «(•)](•)• Для любого и(-) € ЩГо, Т) определим следующие множества:

й(Т0, Г, «(•)) =

{ й(-) € и[Т0,Т) : ЕиЩТ0,и(й -«)(•)) = 0 У* £ [Т0,7') ). ^ЯьГ.иО) = { ПЁ(Т)и(Тц,Т, й(-)) : й(-) € ЩТ„,Т,и{')) ¡-

Множество р(То,Т,и(-)) есть выпуклый компакт в Нш. Примет. 4 соотношения (1.20), (1-27), (1.28), окончательно находим:

Пг{Т) 6 Яад.Т, у{-), »(•)) + ЦТ0,Т, и[Т0,Т, у(-), *(•)](•))■ (1.29)

Оценка (1.21>/ вектора Яг(Т) является наилучшей в смысле той информации (управление у(-) и наблюдение у[-)), которой обладает убегающий на отрезке [То,Т].

Зафиксируем число с, 0 < с < -О — чЗа. Для произвольного £ € [Со -I-е, 1?) и разбиения 0} = определим многозначные отображе-

ния #],•): 2я"' и множества ЭДьЦ*, ь4]) С К'", где

к € 1 £, следующим образом:

Мк-1(и>М],ик-1(-)) = (-3»*) +

жк{ш{1,1?], «*(•)) = (^{ЧМ])+ (-?*(«*(•)))) -QM,

где tit(-) 6 </t), :P*(tijt(-)) = y(h~i,tk, «*(•)) (остальные обозначе-

ния определены в предыдущем пункте). Множества 3Ytt(w[i,iJ], «*(•)) и t?]), Л' 6 1, А" — 1, являются выпуклыми компактами (быть

может пустыми) в Rm.

Теорема 1.4. Пусть t 6 [i?o+ e,i?). Пусть = {t*}^=1- разбиение (1.3), a to = t — е. Пусть'система (1.1), (1.2) является идеально ti-иаблг даелюй на отрезках [ifc-i,<*] для всех к 6 1, К. Пусть !>[(•) € V[t0,t) - управление убегающего, ау\(-) 6 С((<о,<],К') - соответствующее ему наблюдение. Пусть

IlZcltaJ,^'-)^-)) $ (1-30)

Тогда существует кусочно-программная стратегия убегающего на [i, t?] такая, что игра убегания может быть успешно закончена в момент

Многозначное отображение Mi(w[i,i?}, •) обобщает альтернированную сумму JI. С. Понтрягина для рассматриваемой задачи убегания, имеет ъыпуклые компактные (быть может пустые) значения. Для любого t 6 + £,0) и произвольного и(-) 6 U[i — с, 4) определим множество

ж.(f,«(•))= л м^М],«(•)). (i.3i)

цм]

где пересечение берется по всевозможным разбиениям отрезка [¿, 0]. Множество M£(f,u(-)) являет ~я выпуклым компактом (быть может пустым) u Е'".

Теорема 1.5. Пусть t £ [i>0 -f £,0), существуют > 0, rt > 0 гак ¡к?, что дня любого разбиения u>[t, i9] — {tkjkii мелкости |w[i, i?]j < St справедливы соотношения:

Si*(w[i,0],«(•)) -r,Bm ф 0, V«(.) 6 Uftfc-i,<*). VA € 1 JT^I.

(1.32)

Torna для любого u(-) 6 U[( — e,i) справедливо равенство

Mc(f.,v(-)) ^ Um М,(ыМ], «(•)),

ja.[l,t9J|-+0

t;sr предел берется но разбиениям отрезка [£,0].

16

. 2. Нелинейные дифференциальные игры с неполной фазовой информацией.

• Во второй главе исследуются нелинейные дифференциальные игры преследования (убегания) на фиксированном отрезке времени при неполной информированности преследователя (убегающего) о фазовом состоянии управляемой системы. Строится оптимальный гарантированный результат преследователя (убегающего) в классе кусочно -программных стратегий.

Будем рассматривать динамическую сис : :му с наблюдением следующего вида

^ = f(t,x,u,v), (2.1)

у == g(t,x, ti,v), (2.2)

где х € R" - фазовый вектор; у € К' - вектор наблюдения; t £ (iVtfj - время; и £ Rp, й 6 St'1, v б К', v £ R' - управляющие параметры. Заданы компактные множества Х0 С R\ У С Rp, Q С W, У С R»\ Q С R'.

Функция f(t.,x,u,v) определена на [t?t„ i?] х R" х ЕУ х R», является измеримой по t и удовлетворяет условию Липшица по (г, и, и) с константой /(•) £ Существуют а > О н /)(■) € ]Li([i?o, ¡?], К) такие, что

\f{t,x,v,v)\<n\x\ + p(t) (2.3,

при почти всех t 6 [t'o, ii], при всех i G 2", u € 7!, v £ Q. Миожегча

J(t,r.,u,Q) = { f(t,x,u,v) : v £Q } (2.1)

J(t,x,7,v) - j f(t,x,u,v) : tie?} (2.5)

выпуклы при всех t £ [t?n, * £ R", и £ "P, v E Q.

Функция f)(t, x,ii, v) определенна [t?o, !?]xK"xK,/xRi и непрерывна по совокупности переменных ((, x,ii, С).

Управляющие параметры и и й находятся в распоряжении первого игрока (преследователя), a v и v - в распоряжении второго игрока (убегаюд. го). Допустимыми управлениями игроков будем называть измеримые на [i\i, i^i функции «(•) и v(-) такие, что

Р v(t) £ Q, п. B.i£[iM],

н произвольные функции «(•): [t9n i9] —> S', О(-): -> Q. Для лю-

бого отрезка [7о, Т] С [t?o, определим множества

U[r0,71 = {«(•) G Ц[7о,Т],Г) : u(í) £ 7, п. в. i € [Г0,Г]}, V[r0l Т] = {"(■) 6 LadrcTl.R») : v(t) £ Q, п. в. i £ [Т0,Т]}.

При выполнении сформулированных условий для любого отрезка [То, Т] С [tfo, 0] и произвольных € К", u(-) £ tí[7o, Т], v(-) £ V[7*0, T¡, на отрезке [7о, 7'] существует единственное абсолютно непрерывное решение х(-) уравнения (2.1), удовлетворяющее начальному условию а:(7о) = Хц. Обозначим x(t) = <¿>(t;7o,xo,ti(-),u(-)), где t £ [7b, Т].-

Далее будем считать, что значение фазового вектора в начальный момент времени Úq удовлетворяет включению x(t3q) 6 DCq.

Задан терминальный функционал ')(■): К'1 -> Е. Задача первого игрока состоит в том, чтобы минимизировать значение 7(1(1?)). Задача второго игрока противоположной! - максимизировать значение 7(1(19)).

Для произвольного К € N определим разбиение

"к = {**}£,о = А) = te < ti < • • • < tK = ■д.

Мелкостью разбиения назовем |а>/(| — ^nmx^ (t¡¡ — íjt_i). Определим также множества

Пк = { (*о.....*кг) : ''о = 'о < tj < • • • < = }, Í1 = U П*.

Ке N

Пк = {(to.....tK) ■• *o = k<h<-~<tK = 0}, п = U

Определение 2.1. Обобщенной кусочио-программпоИ стратеги-elt иреслщовителя назовем разбиение шк = {¿ц}^

-0' управление щ € 3*

п отображение Pp(k\ уо,..., ун\uoO> • • • >ut -i(-);ño, ■• •, ставящее в соответствие номеру k е 0, К - 1, наблюдениям у, = ¡/(t,) 6 М', упра--u'jcunmi u¡(-) £ U[¿,,í,h¡, = ü(tg) £ 3J, где i € 0, fc — 1, s G управлении щ(-) 6 H[í*, f¡u 1] н ii¡n = ü(í* + i) G 1P.

Определение 2.2. Обобщенной куапно-програмшой стратегией убегающею назовем разбиение шк — ц> управление щ € Q и огображеиие ¡/о, • • - »S/Jt;«о(-). • • ■, Wfc-i(-);С,ь... ,£*), ставящее в соответствие номеру к £ 0, ЙГ— 1, наблюдениям у, — y(ts) G Кг, управлениям r¡(-) 6 V[t;,í.,+i] и б, — v(/,) £ Q, где i 6 0, /г — 1, s G 0, fc, управления г*(-) 6 V[<t, ¿t ♦ 1] я ''tu - 5(f*-»-i) е Q.

. Определение 2.3. Пусть щ С Р - управление преследователя, Уо € fl(t?o, Х0. uo, Q) - соответствующее наблюдение. Число 7Р(»/о, <<о) (конечное или определенного знака бесконечность) назовем оптимальным гарантированным результатом преследователя, если

1) для любого числа у+ > ~(р{уо, '¡о) существует обобщенная кусочно-программная стратегия преследователя, гарантирующая неравенство у(х(0)) <7+.

2) для любого числа < 7,,(yoi "о) любая обобщенная кусочн<ь программная стратегия щххлеяователя г- гарантирует неравенство

Определение 2.4. Пусть Ри 6 Q - управление убегающего, уц G g(ßu, Xq, У, г»о) - соответствующее наблюдение. Число yr(yo, i'u) (конечно с или определенного знака бесконечность) назовем оплтальным гарантированным результатом убегающг'У), если

1) для любою числа 7_ < ус(уо,Ьо) существует обобщенная кусочно-программная стратегия убегающего, гарантирующая неравенство у(х(0))>у.,

2) для люС >го 4iic.ua 7+ > уе(уо, ¡>о) любая обобщенная куспчно-про-граммная стратегия убегающего не гарантирует неравенство у(х(0)) > 7+2.1. Построение оптимального гарантированного результата

преследователя. Пусть шк — {'к}*=о Для каждою номера.

к € Т^К, любых векторов у, £ К', управлений н,(-) б ll[£,, i] и rtj С 3', где I 6 Ö7F- 1, определим множество возможных фазовых состояния системы (2.1) в момент времени t¡¡:

Хк(ь>к;уо. ■ -.,Ук-й ««(О.-- iut-i(-);öo,- ■ -, üjt-i) = { Хк 6 R" :

. V» е 6ГГ~I з х,- б х0 6 з «,(■) е v[f„ <й,]. эг, е Q,

- ";(•)> "»(•)). fi - ä(tt,Xi,üi,v,) j.

Также для любых векторов € К', управлений u,(-) е fi+i], ü, t 3' и 6 У, где i 6 О, к — 1, определим множество возможных наблюдений (2.2) в момент времени t>;:

Ук(ик\У0.---,Ук-1\щ>(-),...,щ-1(-);щ,..-,йк) ~ { Ук е К" :

Эхк е ;?/(),.. .,Ук-1\Иц(-),. ..,u*-i(-);wo, •••,«1-1)1

3 щ € Q, ук - g(tk, хк, ¿Ц, t't) |.

Далее, для любого и) к £ Пк и длг каждого номера к £ О, К — 1 определим по индукции следующие функции

ta-i(wa-; уо, ■ ■ ■, ук-i'i «о(-). • • •. «jr-2(0; "о. • • •»««■-») =

inf sup 7(x)i

ux-I( )€UIIK-I,IX] xeXjt(uK;vo.....VK-I;uo( ).....UK_I();CO, -.HK-I)

7*-i(v/e; yo, ■ ■ ■ ,Ук-1\«о(-), • • •»«*-г(-); «о, • • •, "*-i) = inf inf sup

.и] «»б? .....«»-I (■);««••-."*)

7*(wjc;yo,..., з/jfe; u0( ),..., u*-i(-); «¡0, • •, йк).

Теорема 2.1. Пусть щ 6 У - управление преследователя, уо £ g(i9o,X0lii0l Q) соответствующее наблюдение. Тогда оптимальный гарантированный результат преследователя вычисляется по формуле:

■ ъ(уо,щ) - inf Tt)(w;yo;uo)- (2-6)

Wgll

Теорема 2.2. Ьусть щ £ У - управление преследователя, у0 £ g(i')о,Хо,йо,0) - соответствующее наблюдение. Пусть функция у(-) является полунепрерывной сверху. 'J. М'ди справедливо равенство:

7р(уо, "о) - lirn Уо;щ). (2.7)

М-.0

2.2. Построение оптимального гарантированного результата убегающего. Пусть и/с — € Для каждого номера А е

1, /?. любых векторов у, е Ж1, управлений !»,(•) £ "V[<,,и i, £ Q, где i € 0, к — 1, определим множество возможных фазовых состояний системы (2.1) в момент времени tk:

..........i't-i) - { Xk £ Ж" :

v»eМ- 1 ЭцеК", rue3C0, 3«f(-)еU[t;,fi(.,], Зй.еР,

зш = «¿(О."»(•)). я* - }.

Также для любых векторов yi 61', управлений vt(-) £ V[ij, t^-i], щ £ Q и £ Q, где i £ ОД' — 1, определим множество возможных наблюдений (2.2) в момент времени tk:

lU(~,K;yu,.-.,i/fc-i;««(,).-'4vik-i(-);i'ft.• ••>'"'*) = {j/neR":

3xk e Xk{u/c,yo,. - - ,y*~i; «•'()(■), •• • u.> • • ■, 'Vi),.

e У,

Далее, для любого и к Ç Пк и для каждого номера fc € О, К — Ï определим по индукции следующие функции

7*-i(w/c; уо, ■.. ,Ук-Иfo(0. • • ■ ,VK-2{-)\«о, • • •, t»a"-l) -

sup inf 7(x),

«*-I(,)€'V(î*.I1«K| i€ÎK(ui/(;tfc.....).■••.A-i)

7*-i(w/c;j/o.....Ук-иМ')< ■ ■ • .fk-a(-):°o. ■ • • • c*-i) ='

sup sup inf

n-iH^l'i-iA] .....vt-i();4>.....'"»)

7*(wA';yo.....yk\ fo(-), • • •, "*->(•); Co, •• •, t't).

Теорема 2.3. Пусть щ € Q - управление убегающего, а уЛ о g (г) о, Хо, У, Со) - соответствующее наблюдение. Тогда оптимальный гарантированный результат убегающего bl. числяется по формуле:

7г(Уо,«о) - sup7o(w;î/oiСо)- (2.8)

Теорема 2.4. Пусть щ Ç Q - управление убегающего, tji, б p(i?o, Хо, 'Р, iy) - соотьетствующес наблюдение. Пусть функция 'у(-) является полунепрерывной снизу. Тогда справедливо равенство:

7е(Уо, ®о) ~ ljm 7o(w; у0; v0). (2.0)

Kl-о

2.3. Построение оптимального гарантированного результата в линейных дифференциальных играх. Применим полученные результаты для построения оптимального гарантированного резуль гд-та в линейных дифференциальных играх с неполной фазовой информацией. Рассмотрим линейную управляемую систему с наблюдением следующего вида

= B(t)v(t) + C{t)v(t), (2.10)

y{t) = D(t)x(t) + ô(i)u(i)+C(0y(i), (2.11)

ГдеВ(1), C(t), D(t), B(t) и C'(t) - матрицы размеровnxp, nx.q,lxn,lxp и I х q соответственно. Матрицы D(t), B(t) и C(t) имеют непрерывные, a B(t) и C(t) - измеримые ограниченные компоненты на отрезке [г?0, ¡9]. Р..1нг матрицы D(t) равен I< п для любого t С; [ч?о,0].

Заданы матрица проектирования Я размера m х п и терминальное множество M с R"'.

ï

Задача первого игрока состоит в том, чтобы в конечный момент времени т) проекция фазового вектора управляемой системы попала на терминальное множество: Пх(д) 6 М. Задача второго игрока противоположная: Пх($) £ М. Пусть ф(-, М) - индикаторная функция множества М. Тогда терминальный функционал имеет вид: 7(х) = ф(Пх,М). Для произвольного разбиения и>к — {<*}*^о> управлений и^(-) £ и ик(-) € "У^Л-н). где к 6 О, ЛГ — 1, введем следую-

щие обозначения:

'»+1 (»+1 щ = / В(0и4(0<Й. = / С(0»4(<)Л,

«4 1»

?к = I вц)т, ок = I с щам, и

Рк = = Ъ = {1П - 0+(Ь)0(1к))№.

Игра иреследоиания. Сделаем замену вектора наблюдения: у(1) = у(1)~ В{1)й(1). Тогда для произвольного разбиения шд- = {()с}^=0 соответствующие миожества возможных фазовых состояний и возможных наблюдений рассматриваемой системы имеют вид (с естественной заменой £ на щ 6 » 6 О, К - 1):

Я* ("к; Уо; «о) = Хо п (£>+(<о) (уо - Оо) 4 ¿о) + щ 4 Оо,

%кп(ик\Уо.....Ук\щ,-■ -

уо, • • ■ ,ук-1\ щ, ■ ■ ■ П (Ук - 0*) + 1к) 4 ьк + й*,

Ызд; Уо.....у*-г, "о, • • •, «*-0 =

1>(<к)Х*(и>к; у0, • • •, Ук-1; "о, • • ■, и*-0 4 О*,

где к € 1, — 1. Определим также множества

%к(ь>к\ Уо,..., у*; "о, • • •, Щ-\) =

.,ук-1\щ,..., 1) П {0+ (<*) (ук - О*) + Ьк),

так что для любого ¿61,^—1 справедливо равенство: X* и (^л", уо, • • •,Ук", «о, ■ • •, Щ) =

; уо, ■.., ¡¡к; и0,..., «а-1) 4 щ 4 О*.

Для .каждого к 6 1, К — 1 определим по индукции следующие множества:

МК-1(шк\Уа,-- -,УК-1',Щ.....нЛ-_2) =

[М луо,.■ ..ук-И «о, • • • + + (-/№*-.))

Мк-1{ык;$о,- ■ -.Ук-г.щ,- -.«»-г) =

и

»»-i«?*-!

. П «о.....«»-О

Тогда для любого к € О, К — 1 справедливо равенство:

7к{ь>К\УИ,---,Ук\ «О.••■ ,Ик-1) = Ф (о. У0> - ■ •> Ук\ • • • I "*-!)) ■

Определив множество М?(уи) = и ¿/о), найдем выражение для

оптимального гарантированного результата преследователя: %{Уо) -Игра убегания. Сделаем замену вектора наблюдения: — у(() — С(4)0(«). Тогда для произвольного разбиения и>к = соот-

ветствующие множества возможных фазовых состояний и возможных наблюдений рассматриваемой системы имеют вид (с естественной заменой € »,>,) на V{ € Он г € О, Л'.- 1):

= 5оП (£>+Ы (#> - Уо) + ¿о) + «о + 'Д,

ЭС^+^и-л-; уо. • ■ • - Ы »'о, • • ■,щ) =

. ХП^к; уо,... ... П (ук - %) 4- Ц) -I- и4 + 34,

Уо, ■ ■ ■ ,Ук~1! «о, ■. ■, г*.|) =

0(1к)Хк(и}К; уо,..., ук-1\ vo,■■■, 0 + Уд,,

где.к б 1, К — I. Определим также множества

%к(шк',Уо.....о, • • -,-

Уо,---, $&-}"> vo,..., ¡) П (ш - Уд) Ь 1>,),

так что для любого к 6 1, справедливо равенство: "Хк>г\{ъ>к', <Уо> - • •. У к, щ,. ■., к/-) =

Уо.....Ук\ 1'0, -

Для каждого к € 1 ,К — i определим по индукции следующие множества:

Jvte-i (wft-i уо, ■ ■ ■, ук-1; i>o. • • •. "к-2) =

[м + (-П)(2л^(шк,уо.....т-г,ц,.....t'A-z) 4-^аг-I)] -ITQk-I-

• • •, Vk-i\wo, • • •. Ч-г) =

П

U МьЦ'1 Уо,...,Ук)V0,.. ,

Тогда для любого к € О, К - 1 справедливо равенство:

уо, • • • t У*> Ч), •..., ffc-i) = v (0, y0,. •., у*; t>o, • • •, •

Определив множество М,(уо) = (~| Mo(w;j7o), найдем выражение

wen

для оптимального гарантированного результата убегающего: те(Уо) =

V' (0,Ме(уо)).

Основные результаты работы.

1. Исследована задача восстановления начального фазового состояния неавтономной линейной управляемой системы по наблюдению на отрезке. Доказаны необходимые и достаточные условия идеальной наблюдаемости неавтономной лицейной управляемой системы с наблюдением на отрезке. Показано,- что в неавтономном случае свойство идеальной наблюдаемости на отрезке вообще говоря не позволяет восстановить всю траекторию движения фазового вектора системы, исходя из наблюдения.

2. Определены условия и— и и—определенности в точке неавтономной линейной управляемой системы с наблюдением, позволяющие конструктивно решить задачу восстановления начального фазового состояния рассматриваемой системы по наблюдению-на отрезке (приведена явная формула).

3. Предложены многозначные отображения, обобщающие альтернированную сумму и альтернированный интеграл JI. С. Понтрягина дня рассматриваемой линейной дифференциальной игры преследования (убегания) с неполной фазовой информацией. При определенных условиях доказана сходимость в метрике Хаусдорфа введенной обобщенной альтернированной суммы к обобщенному альтернированному ин тралу.

4. Для линейнбй. дифференциальной игры преследования (убегания) с неполной фазовой информацией сформулированы условия успешного окончания прёследовання (убегания), при выполнении которых проведейо конструктивное построение кусочно-программной гарантированной стратегии преследователя (убегающего).

5.' Для нелинейных дифференциальных игр с неполной фазовой информацией'построен оптимальней гарантнроваяный результат преследователя (убегающего) в классе кусочно-программных стратегий.

' При определенных условиях доказана поточечная сходимость гарантированного, результата для фиксированного разбиения рассматриваемого отрезка времени к оптимальному гарантированному результату преследователя (убегающего).

Автбрвыражает глубокую благодарность своему научному руководителю профессору Е. С. Половинкину за постановку задачи, ценные советы и постоянное внимание к работе.

Основные результаты диссертации опубликованы в работах:

1. Консташ шов Р. В. Об условиях определения фазового состояния линейной наблюдаемой системы // Некоторые проблемы фундаментальной и прикладной математики: Междувед. сб. / МФТИ. М. 199Ü. С. 132-141.

2. Константинов Р. В. Решение дифференциальной игры преследования с неполной информацией // Некоторые проблемы фундаментальной и прикладной математики: Междувед. сб. / МОТИ. М. 1997. С. 110-123.

3. Константинов'?. В. Об одной дифференциальной игре с неполной информацией // Дифф. уравн. 1997. Т. 33. № 11. С. 1502-1506.

4. Константинов Р. В. О дифференциальных играх с неполной информацией // Современные проблемы фундаментальной и прикладной физики и математики / Тез. докл. XL науч. конфер. МФТИ. Вып. 1. 1908. С. 55.

5. Конс-антнпоп Р. В, О дш|х}н рснциальных играх с неполной фазовой информацией // Современные методы в теории краевых задач / Тез. докл. Воронеж, матем. школы "Понтряпшские чтения - IX" .,1998. С. 105.

МфТИ JCcKCLb ijibl тир. SO