Обобщенное уравнение Айзекса-Беллмана в теории дифференциальных игр тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Никитин, Федор Федорович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
2009
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
Санкт-Петербургский Государственный Университет
На правах рукописи
Никитин Фёдор Фёдорович
Обобщённое уравнение Айзекса-Беллмана в теории дифференциальных игр
01.01.09 — дискретная математика и математическая кибернетика
Автореферат диссертации на соискание учёной степени кандидата физико-математических наук
Санкт-Петербург — 2009
003468063
Работа выполнена на кафедре математической теории игр и статистических решений факультета прикладной математики - процессов управления Санкт-Петербургского Государственного Университета.
Научный руководитель:
Официальные оппоненты:
Ведущая организация:
доктор физико-математических наук, профессор Чистяков Сергей Владимирович
доктор физико-математических наук, доцент Петров Николай Никандрович (Удмуртский Государственный Университет)
кандидат физико-математических наук, доцент Скитович Владимир Викторович (Санкт-Петербургский Государственный Университет)
Институт Математики и Механики Уральского отделения Российской Академии Наук
Защита состоится ¿¿¿оду.» 2009 г. в ^ ч. ^^ мин. на за-
седании совета Д-212.232.59 по защите докторских и кандидатских диссертаций при Санкт-Петербургском Государственном Университете по адресу: 199034, Санкт-Петербург В. О., Средний пр., 41/43, ауд. 513.
С диссертацией можно ознакомиться в научной библиотеке им. М. Горького Санкт-Петербургского Государственного Университета по адресу: 199034, Санкт-Петербург, Университетская наб., 7/9.
Автореферат разослан « » ял>) 2009 г.
Учёный секретарь диссертационного совета, доктор физико-
математических наук, профессор Ногин В. Д.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Теория дифференциальных игр изучает задачи конфликтного управления при наличии двух или более сторон, имеющих свои интересы и располагающих средствами воздействия на динамическую систему, описываемую системой дифференциальных уравнений. Практические задачи из области экономики, экологии, биологии, управления механическими системами, а также военного дела являются лишь некоторыми приложениями теории дифференциальных игр. Как показали исследования дифференциальных игр важнейший их класс образуют изучаемые в диссертации антагонистические дифференциальные игры, к решению которых сводится и решение формально более общих, неантагонистических (бескоалиционных) дифференциальных игр.
Принципиальное отличие дифференциальных игр от задач оптимального управления состоит в том, что их решение в общем случае необходимо искать в классе стратегий, устроенных по принципу обратной связи или в каких-то других подобных классах (например, в классе кусочно-программных стратегий). В известной мере это предполагает предварительное построение функции значения (функции Беллмана) дифференциальной игры. Предложенное Р. Айзексом для её отыскания уравнение в частных производных первого порядка в рамках классического метода характеристик требует, чтобы она была дифференцируемой, однако обычно это не имеет места. В связи с этим в теории дифференциальных игр появились направления, в которых изучаются либо определённые обобщённые решения уравнения Айзекса-Беллмана (вязкостные решения Лионса-Крэндалла, минимаксные решения А. И. Субботина), либо определённые обобщения самого уравнения Айзекса-Беллмана, в частности, дифференциальные неравенства А. И. Субботина, уравнения Ченцова-Чистя-кова.
Последние уравнения составляют основу метода программных итераций, возникшего в связи с исследованиями нерегулярных дифференциальных игр и связанной с ними проблемой построения максимальных стабильных мостов — одного из основных конструктивных элементов решения дифференциальной игры по рецептам теории позиционных дифференциальных игр Красовского-Субботина. В ходе упомянутых исследований попутно были обнаружены предпосылки использования этих уравнений и метода программных ите-
раций в целом в качестве новой основы построения теории дифференциальных игр.
Целью диссертационной работы является развитие метода программных итераций и построение элементов теории дифференциальных игр, базирующейся на теореме о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана. При этом рассматриваются следующие три класса дифференциальных игр: игры с фиксированной продолжительностью и терминальным выигрышем (игры сближения в заданный момент времени), игры на перехват и игры с интегральным выигрышем на бесконечном промежутке времени.
Научная новизна. В каждом из трёх рассматриваемых классов дифференциальных игр получено новое доказательство теоремы существования и единственности решения обобщённого уравнения Айзекса-Беллмана, и на этой основе описана новая версия теории дифференциальных игр, включающая в себя известные результаты метода программных итераций для игр сближения в заданный момент времени и установленные в диссертации их аналоги для игр на перехват (с неразделённой динамикой) и игр с интегральным выигрышем на бесконечном промежутке времени. Принципиальная новизна полученных в диссертации результатов состоит в том, что представленные доказательства теорем о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана, в отличие от ранее известных, не опираются на какие-либо теоремы о существовании значения и оптимальных или е-оптимальных стратегий дифференциальной игры. Более того, последние теоремы оказываются простыми следствиями первых и других результатов метода программных итераций.
Теоретическая и практическая ценность. Работа носит теоретический характер. Её результаты могут быть использованы для дальнейших исследований теории дифференциальных игр, некоторые из них ранее использовались в исследованиях неантагонистических дифференциальных игр с интегральными выигрышами на бесконечном промежутке времени1.
1 Адрианов А. А., Чистяков С. В. Об одном классе бескоалиционных дифференциальных игр с неограниченной продолжительностью. // Вестник С.-Петерб. ун-та. Сер. 10, 2005. Вып. 1.
Апробация работы. Результаты диссертации докладывались и обсуждались на XXXIV и XXXVI научных конференциях «Процессы управления и устойчивость» факультета прикладной математики — процессов управления (г. Санкт-Петербург, апрель 2003 г. и апрель 2005 г.), международной конференции «Устойчивость и процессы управления», посвящённой 75-летию В. И. Зубова (г. Санкт-Петербург, июнь-июль 2005 г.), международном семинаре «Теория управления и теория обобщённых решений уравнений Гамильтона-Якоби», посвящённом 60-летию академика А. И. Субботина (г. Екатеринбург, июнь 2005 г.), международной конференции «Дифференциальные уравнения и топология», посвящённой 100-летию академика JI. С. Понтрягина (г. Москва, июнь 2008 г.), а также на семинаре отдела управляемых систем Института Математики и Механики Уральского Отделения Российской Академии Наук и семинаре Центра Теории Игр при Санкт-Петербургском Государственном Университете.
Публикации. Основные результаты диссертации опубликованы в шести работах, три из которых — в изданиях, рекомендуемых ВАК.
Структура и объём работы. Диссертация состоит из введения, 3 глав, 16 параграфов, заключения и списка литературы. Объём работы составляет 135 страниц. Список литературы включает 69 наименований.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обсуждается актуальность и новизна полученных в диссертации результатов, а также их место в теории дифференциальных игр.
Первая глава состоит из 6 параграфов и посвящена исследованию позиционной дифференциальной игры сближения в заданный момент времени:
dx
— = f(t,x,u,v) (1)
(t £ [t0,T],x £ Rn, и £ P £ CompRm, v £ Q £ CompR1),
x(to) = xo, (2)
H(x{-)) — H(x(T)) —> min max/max min, (3)
(u) (u) (v) (u)
где #(•) 6 С (Я'1), а х(-) — траектория системы (1) с начальным условием (2), порождённая теми или иными управлениями игроков, первый из которых распоряжается управлением у, а второй — управлением и, при этом предполагается, что оба игрока в каждый момент времени Ь обладают полной информацией о текущей позиции (¿, х({)).
Относительно правой части системы (1) считаются выполненными следующие предположения. Функция /(•) : [¿о, Т] х Л" х Р х С) —> В.п
1) непрерывна по совокупности переменных;
2) локально липшицева по х с константой, независящей от управлений, т. е. для любого компактного подмножества К с Л™ существует константа Ь, что N/4 е [¿о,Т],Ух',х" е К,\/и £ Р,Мь е
Я
Шх',и,у) - ¡(1,х",и,у)\\ < Ь\\х' - х'%
3) удовлетворяет условию продолжимости решений: ЗА > 0, Ш 6 [1о,Т]Ух е Дп,Уи е е д
\\/(1,х,и,у)\\<Х(1 + \\х\\У,
4) удовлетворяет условию седдовой точки в маленькой игре, т. е.
тахтт{¿,/(г,:г, и, и)) = тттах{1, /^,х,и,у)), «€<2 иеР иЕР veQ
Vt€[to ,Т]^хеЛп,У1еЛп.
Седловую точку функции (I, ${1, х, и, у)) переменных и и у, существование которой гарантировано условием 4), будем называть ситуацией равновесия в маленькой игре с параметрами .т, /).
Игровая задача управления (1)-(3) обозначается 2;0) и вместе с упомянутыми предположениями относительно /(•) описана в §1. Наряду с игрой Г (и,, ^о) рассматривается также семейство игр Г(Г>) = 6 Т>}, где V — отрезок интегральной ворон-
ки, исходящей из позиции (¿о,.то).
Во втором параграфе первой главы кратко описываются известные положения метода программных итераций Ченцова-Чистякова,
при этом итерационные операторы (операторы значения) на пространстве UC(V) равномерно непрерывных функций w(-) определяются по правилам
Ф1 0 w(tt,x*) = max maxinf w{t,x(t,tt,x*,u(-),v)), (4) te[t.,T] veQ «(•)
Ф1 0 wit*, x*) = min min sup w(t,x(tA*,x*,u,v(-))) (5)
+ t£[t.,T]u€P„(.)
((t.,x.)eV).
Основным объектом исследования в первой главе является следующая система функциональных уравнений
Ф1 о w(-) = w(-), (б)
Ф^ои>(.) = Ц.). (7)
Как установлено С. В. Чистяковым, система уравнений (6)-(7) равносильна уравнению
Ф1оЦ.) = Ф^оЦ-) (8)
и обобщает уравнение Айзекса-Беллмана на случай негладкой функции цены игры. Поэтому уравнение (8) можно назвать обобщённым уравнением Айзекса-Беллмана. В работах А. Г. Ченцова и С. В. Чистякова установлено, что для решения уравнения (6) могут быть использованы последовательные приближения
u/n)(.) = ф^ ou/n-1)(-) (9)
с начальным приближением
w{°](U,x,) = maxinf H(x(T,t*,xt,u(-),v)). (10)
v6Q «(■)
Аналогично для решения уравнения (7) может быть использован метод последовательных приближений
хи£\') = Фс+ои>%-1)(-) (11)
с начальным приближением
w+\u,x*) = minsup H(x(T,tt,x*,u,v(-))). (12)
Представленное в диссертации доказательство существования решения обобщённого уравнения Айзекса-Беллмана существенно опирается на следующую, доказанную в §2, а ранее в статье [2], лемму.
Лемма 7. Каждое из последовательных приближений решения уравнения (6)(соотв. (7)) с начальным приближением (10)(соотв. (12)), включая и само это начальное приближение, является решением уравнения (7)(соотв. (6)), т. е. для любого к
ФС_0№«(.)=^»(.), ow^(-) =
В третьем параграфе первой главы по аналогии с одной оценкой из монографии Н. Н. Красовского и А. И. Субботина1 доказана следующая лемма, играющая решающую роль для доказательства единственности решения обобщённого уравнения Айзекса-Беллмана.
Лемма 9. Пусть (tt,x^),(t*,x+) е V, а (u*,v*) G Р х Q — ситуация равновесия в маленькой игре с параметрами (t*,x-,l), где I = х+ — £_. Тогда для любых допустимых и(-) и v(-) справедлива оценка
\\x(t, + 5,tt,,x+,u*,v(-)) - x(t, + ö,U,x_,u(-),v*)\\2 <
< (1 + ß6)\\x+- x-\\2 + ф(5)6,
где ß, <f>(i5) не зависят от позиций (t„, х+), (t», х_) и управлений и(-) и v(-), при этом
lim ф(6) = 0.
Основным результатом §4 и всей первой главы в целом является следующая
Теорема 3. Обобщённое уравнение Айзекса-Беллмана (8) с краевым условием
w(T1x) = H{x) (13)
имеет единственное решение в пространстве UC(D).
1 Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М., Наука, 1974
Следствие. Решение уравнения (8) с краевым условием (13) является как равномерным пределом последовательных приближений (9) с начальным приближением (10), так и равномерным пределом последовательных приближений (11) с начальным приближением (12), и следовательно
lim ™ln)(-)= lim
п—*+оо n—»+oo
Пятый параграф первой главы посвящен обоснованию того, что теорема 3 вместе с другими известными результатами метода программных итераций естественным образом может быть положена в основу построения теории позиционных дифференциальных игр сближения в заданный момент времени. Доказательство этого положения опирается на тот факт2, что конструкции последовательных приближений (9) и (11) с начальными приближениями (10) и (12) доставляют определённый способ построения универсальных е-оптимальных позиционных стратегий. Для его описания положим
20е*) = {(*,«) е V\w(?\t,x) > w{*](t,x) + а(п - к)},
cV^k\a)=V\D^{a) (а > 0, п > к > 0)
и индуктивно определим последовательность {Im^(X>)}5iLi систем множеств в которой
z{-)(V) = {B{-)(a),Biw)(a)}, где в[^\а) = V[ö\a) и b[q\ol) = cV{^\a), а система
строится по системе
= {BtLiW.-.iüoW}
2 Чистяков С. В. Программные итерации и универсальные е-оптимальные стратегии в позиционной дифференциальной игре // ДАН СССР, 1991, т. 319, N6.
следующим образом:
и для любого целого k,Q < к < п — 1
Лемма 11. При любых п > 0 и а > 0 система множеств образует разбиение множества V.
Определим последовательность позиционных стратегий Vn : Т> -* Q, п = 0,1,2,..., считая, что стратегия Vq всякой позиции ставит в соответствие один из векторов, реализующий максимум в правой части равенства (10), а стратегия Vn(n — 1,2,...) каждой позиции ставит в соответствие один из векторов, реализующих максимум по v € Q в правой части следующего равенства
= max maxinft*,х»,«(•),«)). te[t.,T] v€Q «(•)
Наконец с учётом леммы 11 определим позиционную стратегию Vna: Vna(t,x) = Vk{t,x) (t,x) € В${а).
По аналогии с позиционной стратегией Vna первого игрока, используя последовательные приближения (11), (12) и надлежащим образом построенную последовательность
разбиений
множеств Т>, определяется позиционная стратегия Una второго игрока.
Пусть Vna) и x(tf,xt, Una) — пучки движений, исходящие
из позиции (t,,x„) и порождаемые, соответственно, стратегиями Vna и Una3.
Лемма 13. Пусть «;*(•) — предел последовательных приближений (9) с начальным приближением (10), а «;+(•) — предел последовательных приближений (11) с начальным приближением (12), тогда каково бы ни было е > О
3В диссертации используется определение пучков движений, данное в монографии Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М., Наука, 1981.
1) для любых п Е N и а > 0 таких, что *«*(•)) < е/2 и
а < е/2п
Н(х{Т))>ю*_(и,х*)-е, (14)
Уж(-) € х{и,хт,Упа), У(*„х.) € Р;
для любых п е N и а > О таких, что и>+(-)) < е/2 и
а < е/2п
Я(®(Г))<ш;(^,®.) + £. (15)
Ух(-) ех{1*,хг,ипа), У(1,,х*)ет>.
Последняя лемма доказана без предположения о справедливости условия седловой точки в маленькой игре. В предположении справедливости этого условия из теоремы 3 и леммы 13 вытекают следующие утверждения.
Теорема 4. Позиционная дифференциальная игра гше-
ет решение в классе позиционных стратегий.
Теорема 5. Единственным решением обобщённого уравнения Айзекса-Беллмана, удовлетворяющим условию (13) является функция значения семейства игр Г(V).
Теорема 6. Пусть е > 0. Тогда для любых а > 0 и п > 0 таких, что < е/2,а < е/2п стратегии Упа и ипа являются универсальными для семейства игр Г (О) е-оптималъными позиционными стратегиями соответственно первого и второго игроков.
В шестом, заключительном параграфе первой главы метод программных итераций иллюстрируется на примере решения нерегулярной дифференциальной игры сближения в заданный момент времени, известной под названием "задача о мальчике и крокодиле".
Вторая глава состоит из 4 параграфов и посвящена дифференциальным играм на перехват, в которых в отличие от игры (1)-(3) функционал качества имеет вид
П(х(-))= шЯ(т,х(т)), (16)
т€|со,Т|
где #(•) е C([ío,T] х Rn). Как и прежде для обозначения игры и соответствующего семейства игр используются символы r(í0,£o) и
Г(2?).
Пусть UC]¡(T>) — подпространство пространства ЫС(Т>), каждый элемент которого удовлетворяет дополнительному условию
tu(í«,a:*) < V(í*,rr*) е V.
Операторы значения на пространстве ЫСн(Т>) определяются равенствами
Ф1оto(t*,x*) = max maxinfminí min H(T,x(T)),w(t,x(t))}, (17)
te[t.,T] veQ «(•) re[t.,t]
Ф+ o w(tt, xt) = min minsupmini min Н(т, x(r)),tu(í,a;(í))} (18) te[t.,T] «eP „(.) re[t,,t]
и, как показано в диссертации, отображают ЫСц(Т>) в себя. На пространстве 1АСц{Т>) с естественно введённым порядком — для любых wi(-),w2(•) G UCH{V): wi(-) < w2(-) wi(U,x*) < w2(f*,a;*) для любой позиции (í„, ж») 6 D — показано, что операторы значения а) монотонны, в том смысле, что Ф1 о w(-) > w(-) и Ф^ о ад(-) < ад(-), б) сохраняют порядок, т. е. w\(-) < w2(-) Ф1 о < Фс_ ° W2O) и
owi(•) < Ф^огу2(-), в) удовлетворяют условию Липшица в смысле метрики равномерной сходимости.
Для игр на перехват рассматриваются последовательные приближения
«¿к)(-) = Ф1°«'-~1)(-)> (19)
«,^(-) = Фс+о«,^-1>(.) (20)
с начальными приближениями
w^\tt,xt) = maxinf min H(t,x(t,tt,x*,u(-),v)), (21) veQ u(-)te[t.,T]
w+\t*,x+) = minsup min H(t,x(t,t*,xt,u,v(-))). (22) u&p te[t.,T]
Теорема 1. Для любых начальных приближений <^(-)> 9+\~) S UCh(D) последовательные приближения д^(-) = Ф1 ff^(-) = Ф+ о сходятся равномерно на V соответственно
к решениям уравнений Фс_°д{-) = д(-) и Ф+ од(-) = д(-); причём эти решения принадлежат пространству ЫСн{Т>).
Основным результатом второй главы является
Теорема 2. Система уравнений
Ф1 о w(-) = w(-), Ф+ о w(-) = w(-) с краевым условием
w(T,x) = H{T, х) (23)
имеет единственное решение в пространстве UCn(V).
Последняя теорема дополняется следующими утверждениями.
Следствие 1. Уравнение
Фс_ о ги(-) = Ф+ о ги(-) (24)
с краевым условием (23) имеет единственное решение на пространстве UCh{T>).
Следствие 2. Единственным решением уравнения (24) с краевым условием (23) является как равномерный предел последовательных приближений (19) с начальным приближением (21), так и равномерный предел последовательных приближений (20) с начальным приближением (22), и следовательно
lim = lim ш!п)(-).
71—> + 00 П—»+00
Отметим, что следствие 1 аналогично теореме о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана в игре с терминальным функционалом, рассматриваемой в первой главе.
На основе теоремы 2 и последовательных приближений (19) и (20) с начальными приближениями (21) и (22) получено конструктивное доказательство теоремы о существовании решения игры на перехват в классе рекурсивных стратегий.4
Пусть — закон формирования управляющих воздействий, предписывающий в каждой позиции (¿*, я») выбор одного из векторов, реализующих максимум в выражении (21), И^ — закон, пред-
4Формальное определение рекурсивных стратегий, дифференциальной игры в классе рекурсивных стратегий, а также минимизурующей и максимизирующей последовательностей рекурсивных стратегий см. Чистяков С. В. Операторы значения антагонистических дифференциальных игр. СПб. 1999.
писывающий каждой позиции (t+. xt ) один из векторов, реализующих минимум в выражении (22). Рассмотрим — отображение, которое каждой позиции (£*,£«) 6 V ставит в соответствие паРУ где значения и находятся как значения, доставляющие максимумы (минимумы) в правой части формулы
= шах maxinfmin{ min H(t,x(t)),w^ l\t,x(t))} te[i.,r] veQ u(-) re[t»,t]
(w+\t*,xt) = min minsupmin{ min Я(т,х(т)),ги?_1\<;,х(ШП.
V + te[t.,T] ueP „(.) re[t.,t] + W'V
Определим рекурсивные стратегии V^ = (a^,vifc-1^) и =
Теорема 3. 1) Каждая из игр r(t*,:r*) е Г(Т>) имеетп решение в классе рекурсивных стратегий, а общая неподвижная точка операторов Ф1 и Ф+, удовлетворяющая краевому условию (23), является функцией цены семейства игр Т(Т>).
2) Последовательность является максимизирующей
последовательностью рекурсивных стратегий максимизирующего игрока в игре Г (V), а последовательность является минимизирующей последовательностью рекурсивных стратегий минимизирующего игрока в этой же игре.
Третья глава состоит из 6 параграфов и посвящена антагонистическим дифференциальным играм с неограниченной продолжительностью и интегральным функционалом платы:
г+СО
И(®(-), «(■),«(•))= / h(T,x(T),u(T),v(T))dT, (25) J to
где h(-) € C([io,+oo) x Rn x P x Q), при этом предполагается, что существует такая неотрицательная, суммируемая на [tQ, +оо) функция G(-), для которой справедливо неравенство \h(r,x,u,v) \ < G(t), Vr € [¿о5 +оо), х € Rn, ueP,veQ. Считается выполненным также условие седловой точки в маленькой игре:
max min [(¿, /(£, х, и, v)) + ah(t, х, и, и)] = v€Q иеР
= min max [(i, f(t,x,u,v)) + ah(t,x,u,v)}, ueP veQ
V« е [<0,+оо),Ух е я.пУи е Р,Уи е д.
Для рассматриваемой дифференциальной игры во втором параграфе приводится теорема существования решения игры, полученная на основе идеи об аппроксимации играми с ограниченной продолжительностью .
В §§3-6 третьей главы при несколько более сильных, чем указано выше, предположениях относительно функции /г(-) представлено развитие метода программных итераций в рассматриваемом классе игр. А именно, здесь определены операторы значения Ф1 и Ф+, изучены их свойства, исследованы сходимость методов последовательных приближений решений максиминного (Ф1 ои)(-) = и минимаксного (Ф+ ош(-) = «>(•)) уравнений, в частности установлена равномерная их сходимость и доказана теорема о существовании и единственности общей неподвижной точки операторов значения. В шестом параграфе главы продемонстрировано как последняя теорема может быть положена в основу конструктивного доказательства существования решения игры в классе рекурсивных стратегий.
В заключении формулируются результаты, выносимые на защиту, а также отмечаются актуальные, по мнению автора, проблемы, примыкающие к тематике исследований представленной диссертационной работы.
ОСНОВНЫЕ ПОЛОЖЕНИЯ ДИССЕРТАЦИИ, ВЫНОСИМЫЕ НА ЗАЩИТУ
1. Для игр сближения в заданный момент времени получено новое доказательство теоремы о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана, которое не использует известных конструктивных элементов решения рассматриваемых игр и не опирается на ту или иную известную теорему о существовании решения дифференциальной игры. Аналогичная теорема доказана также для игр на перехват и дифференциальных игр с интегральным функционалом на полубесконечном промежутке времени, при этом в последнем классе игр она установлена впервые.
2. Для игр на перехват с неразделённой динамикой и дифференциальных игр с интегральным функционалом на бесконечном промежутке времени представлено развитие метода программных итераций Ченцова-Чистякова, включающее исследование свойств опе-
раторов значения и доказательство теорем о равномерной сходимости последовательных приближений решений минимаксного и мак-симинного обобщённых уравнений Айзекса-Беллмана.
3. На базе теоремы о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана и развития результатов метода программных итераций в трёх упомянутых выше классах дифференциальных игр описан новый подход к построению основных элементов теории дифференциальных игр.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в изданиях, рекомендуемых ВАК
1. Никитин Ф. Ф. Об общей неподвижной точке операторов значения в игре на перехват // Вестник СПбГУ. Сер. 10, вып. 1. 2008. С. 65 - 74.
2. Никитин Ф. Ф., Чистяков С. В. Теорема существования и единственности решения обобщённого уравнения Айзекса-Беллмана // Дифференциальные уравнения. Т.43, N 6. 2007. С. 757 - 766.
3. Никитин Ф. Ф., Чистяков С. В. Об антагонистических дифференциальных играх с неограниченной продолжительностью // Вестник СПбГУ. Сер. 3, вып. 1. 2004. С. 38 - 45.
Публикации в других изданиях
1. Никитин Ф. Ф., Чистяков С. В. Задача об асимптотическом сближении // Тр. межд. конф. «Дифференциальные уравнения и топология», М.: Издательский отдел фак-та ВМиК МГУ, 2008, С. 417 - 418.
2. Никитин Ф. Ф., Чистяков С. В. Теорема существования и единственности решения обобщённого уравнения Айзекса-Беллмана // Тр. межд. семинара «Теория управления и теория обобщённых решений уравнений Гамильтона-Якоби», Екатеринбург: Изд-во. Ур-ГУ, 2005, С. 116 - 118.
3. Fedor Nikitin and Sergey Chistyakov A theorem on existence and uniqueness of generalized Isaacs-Bellman equation // Тр. межд. конф. «Устойчивость и процессы управления», СПб.: Изд-во. СПбГУ, 2005. С. 663 - 665.
Подписано к печати 02.04.09. Формат 60 х 84 '/is. Бумага офсетная. Гарнитура Times. Печать цифровая. Печ. л. 1,0. Тираж 100 экз. Заказ 4426.
Отпечатано в Отделе оперативной полиграфии химического факультета СПбГУ 198504, Санкт-Петербург, Старый Петергоф, Университетский пр., 26 Тел.: (812) 428-4043,428-6919
ВВЕДЕНИЕ
Глава I. ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С ФИКСИРОВАННЫМ
МОМЕНТОМ ОКОНЧАНИЯ
§1. Постановка задачи и основные предположения.
§2. Основные положения метода программных итераций.
§3. Вспомогательная оценка.
§4. Теорема существования и единственности решения обобщённого уравнения Айзекса-Беллмана
§5. Существование и структура решения игры в классе позиционных стратегий.
§6. Задача о мальчике и крокодиле.
Глава II. ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ НА ПЕРЕХВАТ
§1. Постановка задачи.
§2. Операторы значения и их свойства.
§3. Обобщённое уравнение Айзекса-Беллмана.
§4. Конструкция решения игры в классе рекурсивных стратегий
Глава III. ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С НЕОГРАНИЧЕННОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ
§1. Постановка задачи и операторы значения.
§2. Теорема существования цены дифференциальной игры
§3. Свойства операторов значения.
§4. Последовательные приближения и их сходимость.
§5. Обобщённое уравнение Айзекса-Беллмана и теорема существовагния и единственности решения.
§6. Существование и структура решения игры в классе рекурсивных стратегий.
Актуальность темы. Теория дифференциальных игр изучает задачи конфликтного управления при наличии двух или более сторон, имеющих свои интересы и располагающих средствами воздействия на динамическую систему, описываемую системой дифференциальных уравнений. Практические задачи из области экономики, экологии, биологии, управления механическими системами, а также военного дела являются лишь некоторыми приложениями теории дифференциальных игр. Как показали исследования дифференциальных игр, важнейший их класс образуют изучаемые в диссертации антагонистические дифференциальные игры, к решению которых сводится и решение формально более общих неантагонистических (бескоалиционных) дифференциальных игр.
Существенный вклад в развитие теории дифференциальных игр внесли отечественные научные школы, и, прежде всего, школы академиков JI. С. Понтря-гина [15, 21, 22, 23, 29]1 и Н. Н. Красовского [1, 9, 10, 11, 13, 14, 34, 35, 36, 37, 38, 39, 42, 43, 68]. Первой из них разработаны методы изучения игр сближения-уклонения, сходных по своей постановке с задачами управляемости в теории управления. Второй школой построена теория позиционных дифференциальных игр, которые обобщают задачи оптимального управления. Представляемая диссертация непосредственно примыкает ко второму из упомянутых направлений исследований дифференциальных игр.
Принципиальное отличие задач теории дифференциальных игр от задач оптимального управления состоит в том, что их решение в общем случае необходимо искать в классе стратегий, устроенных по принципу обратной связи или в каких-то других подобных классах (например, в классе кусочно-программных стратегий). В известной мере это предполагает предварительное построение функции значения (функции Беллмана [54]) дифференциальной игры. Предложенное Р. Айзексом [3] для её отыскания уравнение в частных производных первого порядка в рамках классического метода характеристик требует, чтобы она была дифференцируемой, однако обычно это не имеет места. В связи с этим в теории дифференциальных игр появились направления, в которых изучаются либо
ХК работам школы Понтрягина тесно примыкают оригинальные исследования киевской школы [30, 31, 32, 55]. определённые обобщённые решения уравнения Айзекса-Беллмана (обобщённые решения Кружкова [12], вязкостные решения Лионса-Крэндалла [56, 57, 65, 66], минимаксные решения А. И. Субботина [13, 14, 36, 38]), либо определённые обобщения самого уравнения Айзекса-Беллмана, в частности, дифференциальные неравенства А. И. Субботина [34, 36], уравнения Ченцова-Чистякова [42, 43, 46, 51].
Последние уравнения составляют основу метода программных итераций [37, 42, 43, 45, 46, 51], возникшего в связи с исследованиями нерегулярных дифференциальных игр и связанной с ними проблемой построения максимальных стабильных мостов — одних из основных конструктивных элементов решения дифференциальной игры по рецептам теории позиционных дифференциальных игр Красовского-Субботина [9, 11, 35]. В ходе упомянутых исследований попутно были обнаружены предпосылки использования этих уравнений и метода программных итераций в целом в качестве новой основы построения теории дифференциальных игр.
В диссертации рассматриваются дифференциальные игры, описываемые системой дифференциальных уравнений с ограничениями на управления геометрического характера2. = f(i,x,u,v) t е [t0) Т), Т < +оо3, х е Rn,ue Р е ComPRm, v е Q е CompR1) из некоторого начального состояния x(t0) = Xq на конечном или полу бесконечном промежутке времени.
Качество процесса управления оценивается некоторым функционалом
•),«(•)) —* maxmin/minmax, («) («) («) И при этом здесь предполагается, что первая сторона, распоряжающаяся управлением v, стремится достичь как можно большего значения функционала Л,
2Наряду с геометрическими ограничениями в теории дифференциальных игр рассматриваются также интегральные ограничения на управляющие функции [40].
3Здесь [to,T) = [i0,T], если Т < +оо и [г0,Т) = [£ц, +оо), если Г = +оо. вторая же, распоряжающаяся управлением it, стремится максимально этому воспрепятствовать, т. е. стремится достичь как можно меньшего значения того же функционала.
Предполагается также, что в ходе развития конфликта игроки в каждый момент времени t располагают полной информацией о текущей позиции игры (t,x(t)).
В диссертации рассматриваются три вида антагонистических дифференциальных игр с различными функционалами платы. В первой главе изучаются дифференциальные игры с ограниченной продолжительностью на промежутке времени [io,T] и функционалом терминального типа
И(®(-)) = Щх(Т)).
Во второй главе рассматриваются дифференциальные игры на перехват с функционалом
Щх(-)) = min Н(т, х(т)). те i*o,J j
Третья, завершающая глава, посвящена дифференциальным играм на полубесконечном промежутке времени [io, +00) с функционалом интегрального тина г+оо
7ф(0Х0Х0)= / Нт,х(т),и(т),у(т))с1т. Jto
Впервые метод программных итераций был описан для игр сближения в заданный момент времени [42, 48]. При их изучении внимание исследователей долгое время было привлечено к тому, как вдоль определённых „условно-оптимальных!' траекторий изменяется функция программного максимина ги^(-), supinf H(x(T,t*,x*,u(-),v(-))). v(-) «(■)
В играх преследования её значения имеют привлекательную геометрическую интерпретацию [9, 27], которой не обладают значения двойственного аналога этой функции — функции программного минимакса w^(-), inf sup Ff(x(T,t*,x*,u(-),v(-))). v(-)
Именно этим обстоятельством, вероятно, и было обусловлено то, что последняя была обделена вниманием исследователей, несмотря на то, что обе эти функции имеют ясную, двойственную друг другу теоретико-игровую интерпретацию: значение первой из них в той или иной заданной позиции представляет собой гарантированный выигрыш первого, максимизирующего игрока в классе программных стратегий, а значение второй — гарантированный проигрыш второго, минимизирующего игрока в том же классе стратегий, другими словами — точную верхнюю оценку проигрыша второго игрока в этом классе стратегий.
В определённом регулярном случае, т. е. в случае, когда второй игрок может гарантировать себе, что его проигрыш будет не больше программного мак-симина в начальной позиции, естественным образом можно заключить, что у первого игрока имеется оптимальная программная стратегия, а сама величина программного максимина в этой позиции является значением (ценой) игры, т. е. оптимальным количественным исходом конфликта. Поиску условий регулярности были посвящены многие исследования. К числу первых из них относятся работы Л. А. Петросяна [27], а наиболее изящные для линейных игр сближения были установлены Н. Н. Красовским [9].
В середине 70-х годов для исследований нерегулярных игр сближения и связанной с ними проблемы построения максимальных стабильных мостов — одних из основных конструктивных элементов решения дифференциальной игры по рецептам теории позиционных дифференциальных игр Красовского-Субботина, А. Г. Ченцовым [42] и независимо С. В. Чистяковым [48] на некотором множестве непрерывных функций был введён следующий максиминный оператор Ф: $ о iu(t„ = max supinf ui(t, x(t, t*, .т», u(-), v(-))) te[u,T} u(-) и определяемое им уравнение (максиминное уравнение)
Ф о w(-) = w(-).
Предложенный ими метод исследования нерегулярных игр получил название метода программных итераций, который в функциональной его форме4 представляет собой метод последовательных приближений решения максиминного уравнения с начальным приближением — функцией программного максимина w^(-). Основным результатом метода программных итераций является теорема о сходимости последовательных приближений
4А. Г. Ченцовым рассматривалась и определённая теоретико-множественная его форма. именно к тому решению максиминного уравнения, которое является функцией значения семейства игр на определённом множестве начальных позиций V. А. Г. Ченцовым было показано [43] также, что функция значения игры является минимальным элементом множества всех решений максиминного уравнения, удовлетворяющего естественному краевому условию w{t,x)\t=r = Н(х).
С. В. Чистяков [44], наряду с максиминным уравнением, предложил рассматривать минимаксное уравнение ф+ого(.) = го( •)> задаваемое с помощью оператора Ф+
Ф+ о iu(t*, ж*) = min inf sup ж(£, i»,ж*, «(•), «(•))), при этом было показано, что при выборе функции программного минимакса в качестве начального приближения для решения минимаксного уравнения последовательные его приближения сходятся именно к тому решению минимаксного уравнения, которое, как й в. случае последовательных приближений максиминного уравнения, является функцией значения рассматриваемого семейства игр. Было показано также, что функция значения является единственной общей неподвижной точкой операторов Ф и Ф+, удовлетворяющей упомянутому выше краевому условию. Более того, было установлено, что пара уравнений, состоящая из минимаксного и максиминного уравнения, эквивалентна уравнению
Ф оги(-) = Ф+ ow(-), которое, как вытекает из [46], можно назвать обобщённым уравнением Айзекса-Беллмана. Следует отметить, что факт сходимости к функции значения как последовательных приближений минимаксного уравнения, так и аналогичных последовательных приближений максиминного уравнения вытекает из сравнения этих последовательных приближений с двумя последовательностями многошаговых игр, используемых в работах Флеминга [61, 62] и многочисленных его последователей [26, 41, 58, 60, 66, 69] для доказательства различных теорем существования решения дифференциальной игры. Известные доказательства [49, 51] того, что функция значения дифференциальной игры является единственной общей неподвижной точкой операторов Ф и Ф+ или, что тоже самое, единственным решением обобщённого уравнения Айзекса-Беллмана (с соответствующим краевым условием) также опираются на факт существования решения дифференциальной игры. Доказательства упомянутых выше теорем существования решения дифференциальной игры на основе её аппроксимации многошаговыми играми являются достаточно громоздкими и уже поэтому представляется целесообразным получение независимого (от факта существования решения дифференциальнй игры) и более компактного доказательства теоремы существования и единственности решения обобщённого уравнения Айзекса-Беллмана. Кроме того, из работы [50] нетрудно усмотреть, что теоремы существования решений дифференциальной игры и ряд других фактов теории дифференциальных игр5, в свою очередь, могут быть получены как следствия теоремы существования и единственности решения обобщённого уравнения Айзекса-Беллмана и других результатов метода программных итераций. Таким образом представляется возможным положить теорему существования и единственности решения обобщённого уравнения Айзекса-Беллмана в качестве новой основы построения теории дифференциальных игр.
Говоря далее о методе программных итераций, будем понимать под ним построение как последовательных приближений минимаксного уравнения, так и построение последовательных приближений максиминного уравнения. При этом следует иметь в виду, что последовательные приближения максиминного уравнения могут быть использованы для построения е-оптимальных (при любом е > 0) рекурсивных6 стратегий максимизирующего игрока, а последовательные при
5В частности, описание структуры решения дифференциальной игры в различных классах •стратегий, обоснование условий регулярности и техники решения дифференциальной игры „в малом", предложенное Айзексом.
6Рекурсивная стратегия отличается от хорошо известной [27] кусочно-программной стратегии тем, что в них моменты коррекции управления выбираются не в начале игры, а в ходе ближения минимаксного уравнения могут быть использованы для построения с-оптимальных рекурсивных стратегий минимизирующего игрока. Поэтому к методу программных итераций будем относить также построение разрешающих стратегий игроков по соответствующим последовательным приближениям.
В работе [46] рассматривались определённые модификации минимаксного и максиминного операторов значения Ф1, Ф+7, для которых остаются справедливыми все основные положения метода программных итераций и, главное, последовательные приближения модифицированного минимаксного уравнения при любом е > 0 позволяют находить е-оптимальные позиционные стратегии максимизирующего игрока, а последовательные приближения модифицированного максиминного уравнения позволяют находить е-оптимальные позиционные стратегии минимизирующего игрока, чего нельзя сказать про исходные операторы значения Ф, Ф+.
В настоящей работе рассматриваются упомянутые модифицированные операторы значения и соответствующие им уравнения.
Научная новизна. В каждом из трёх рассматриваемых классов дифференциальных игр получено новое доказательство теоремы существования и единственности решения обобщённого уравнения Айзекса-Беллмана, и на этой основе описана новая версия8 теории дифференциальных игр, включающая в себя известные результаты метода программных итераций для игр сближения в заданный момент времени и установленные в диссертации их аналоги для игр на перехват и игр с интегральным выигрышем на бесконечном промежутке времени. Принципиальная новизна полученных в диссертации результатов состоит, в частности, в том, что представленные доказательства теорем о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана, в отличие от ранее известных, не опираются на какие-либо теоремы о существовании значения и оптимальных или е-оптимальных стратегий дифференциальной игры. Более того, последние теоремы оказываются простыми следствиями первых и развития конфликта, точнее в каждый момент коррекции управления выбирается следующий момент коррекции и программное управление между этими моментами времени.
7Формальное их определение будет дано ниже.
8К числу других известных её версий относятся, в частности, версия, базирующаяся на идее аппроксимации дифференциальной игры многошаговыми [26, 41, 58, 60, 61, 63, 69] и позиционная версия Красовского-Субботина, основанная на теореме об альтернативе [9,11,35]. других результатов метода программных итераций.
Теоретическая и практическая ценность. Работа носит теоретический характер. Её результаты могут быть использованы для дальнейших исследований теории дифференциальных игр, некоторые из них ранее использовались в исследованиях неантагонистических дифференциальных игр с интегральными выигрышами на бесконечном промежутке времени [2].
Апробация работы. Результаты диссертации докладывались и обсуждались на XXXIV и XXXVI научных конференциях «Процессы управления и устойчивость» факультета прикладной математики - процессов управления (г. Санкт-Петербург, апрель 2003 г. и апрель 2005 г.), международной конференции «Устойчивость и процессы управления», посвящённой 75-летию В. И. Зубова (г. Санкт-Петербург, июнь-июль 2005 г.) [67], международном семинаре «Теория управления и теория обобщённых решений уравнений Гамильтона-Якоби», посвящёпном 60-летию академика А. И. Субботина (г. Екатеринбург, июнь 2005 г.) [20], международной конференции «Дифференциальные уравнения и топология», посвящённой 100-летию академика JI. С. Понтрягина (г. Москва, июнь 2008 г.) [19], а также на семинаре отдела управляемых систем Института Математики и Механики Уральского Отделения Российской Академии Наук и семинаре Центра Теории Игр при Санкт-Петербургском Государственном Университете.
Публикации. Основные результаты диссертации опубликованы в шести работах [16, 17, 18, 19, 20, 67], три [16, 17, 18] из которых — в изданиях, рекомендуемых ВАК.
Содержание работы по главам. Диссертация состоит из 3 глав. Каждая глава использует независимую нумерацию параграфов, лемм, теорем и формул. При ссылках на результаты других глав, соответствующая глава указывается явно в тексте.
Первая глава посвящена играм сближения в заданный момент времени — антагонистическим дифференциальным играм с ограниченной продолжительностью и терминальным функционалом платы. В первом её параграфе приводится постановка задачи и формулируются основные предположения относительно управляемой системы и функционала качества. Во втором и третьем параграфах приведены известные результаты метода программных итераций и доказаны вспомогательные утверждения, необходимые для обоснования основного результата этой главы — теоремы о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана. Доказательство этой теоремы приведено в четвёртом параграфе. В следующем параграфе доказана теорема о существовании решения дифферециальной игры в классе позиционных стратегий и, по схеме, предложенной С. В. Чистяковым [50], описана структура этого решения на основе последовательных приближений решения обобщённого уравнения Айзекса-Беллмана. Глава заканчивается примером применения метода программных итераций и связанного с ним обобщённого уравнения Айзекса-Беллмана для решения нерегулярной задачи преследования-уклонения.
Во второй главе рассматривается антагонистическая дифференциальная игра на перехват, при этом она исследуется не в классе позиционных стратегий, а в классе рекурсивных стратегий, т. е. в классе кусочно-программных стратегий с выбором моментов переключений (§1). Кроме того, по сравнению с предыдущей главой здесь приводятся полные доказательства основных положений метода программных итераций (§2), таких как свойства операторов значения, теорема о равномерной сходимости последовательных приближений минимаксного и максиминного последовательных приближений и др.9 Основной результат второй главы — теорема о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана в игре на перехват, доказана в третьем параграфе. Главу завершает параграф, посвящённый доказательству существования решения игры на перехват в классе рекурсивных стратегий и описанию его структуры в этом классе.
Последняя глава диссертации посвящена антагонистическим дифференциальным играм с интегральным функционалом на бесконечном промежутке времени, формальная постановка которой приводится в первом её параграфе. Теорема существования решения рассматриваемой дифференциальной игры ранее была доказана в статье [16], там же была описана и схема построения решения этой игры. Результаты этой статьи приводятся во втором параграфе. Отметим, что доказательство существования и построение решения исследуемой в этой
9Для игр на перехват доказательство этих утверждений приводились ранее [45] только для случая разделённой динамики игроков, в то время как в диссертации рассматривается общий случай неразделённой динамики. главе игры не вызывает принципиальных трудностей в связи с тем, что в силу условий накладываемых на подынтегральную функцию данная игра может быть „приближена" игрой с ограниченной продолжительностью с наперёд заданной точностью. Вместе с тем представляет также интерес и вопрос о том, в какой мере возможен прямой способ доказательства этой теоремы и описание разрешающих стратегий, базирующихся на результатах метода программных итераций. В связи с этим в §3 исследуются свойства операторов значения рассматриваемой игры, в §4 доказывается сходимость последовательных приближений решений максиминного и минимаксного уравнений, и, наконец, в §5 при определённых предположениях устанавливается теорема существования и единственности решения обобщённого уравнения Айзекса-Беллмана.
В заключении диссертации кратко перечисляются результаты, полученные в работе, а также нерешённые и интересные по мнению автора проблемы и возможные направления дальнейших исследований.
ЗАКЛЮЧЕНИЕ
Основные положения диссертации, выносимые на защиту, состоят в следующем.
1) Для игр сближения в заданный момент времени получено новое доказательство теоремы о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана, которое не использует известных конструктивных элементов решения рассматриваемых игр и не опирается на ту или иную известную теорему о существовании решения дифференциальной игры. Аналогичная теорема доказана также для игр на перехват и дифференциальных игр с интегральным функционалом на полубесконечном промежутке времени, при этом в последнем классе игр она установлена впервые.
2) Для игр на перехват с неразделённой динамикой и дифференциальных игр с интегральным функционалом на бесконечном промежутке времени представлено развитие метода программных итераций Ченцова-Чистякова, включающее исследование свойств операторов значения и доказательство теоремы о равномерной сходимости последовательных приближений решений минимаксного и максиминного обобщённых уравнений Айзекса-Беллмана.
3) На базе теоремы о существовании и единственности решения обобщённого уравнения Айзекса-Беллмана и развития результатов метода программных итераций в трёх упомянутых выше классах дифференциальных игр описан новый подход к построению основных элементов теории дифференциальных игр.
В заключение отметим интересные на взгляд автора проблемы, связанные с предметом, рассматриваемым в диссертации, оставшиеся за пределами работы.
Во-первых отметим, что хотя для игр на перехват речь идет об обобщённом уравнении Айзекса-Беллмана автору этих строк не встречалось в русской и иностранной литературе уравнение Айзекса-Беллмана для данной постановки задачи. Вывод соответствующего уравнения из обобщённой формы при условии дифференцируемое™ цены и изучение решения уравнения классическими методами Айзекса или использование методов минимаксных и вязкостных решений может вызывать определённый интерес.
Как отмечалось существуют два пути обобщения результатов Айзекса на негладкий случай цены дифференциальной игры. Первый из них — обобщение понятия решения, что сделано в рамках теории неклассических решений уравнений типа Гамильтона-Якоби, второй же продемонстрирован в данной работе и заключается в получении некоторого функционального уравнения обобщающего уравнение Айзекса-Беллмана. Очевидно существование связи между этими двумя различными подходами. На взгляд автора было бы интересно изучение этой связи. Другими словами было бы интересно получение прямого доказательства того, что решение обобщённого уравнения Айзекса-Беллмана есть неклассическое решение уравнения Айзекса-Беллмана и наоборот. Косвенно этот факт очевиден в силу того, что оба решения — суть функция цены дифференциальной игры.
За рамками диссертации осталась неописанной схема построения универсальных позиционных стратегий игроков на основе метода программных итераций в дифференциальной игре на перехват. Адаптация соответствующей конструкции, описанной для дифференциальных игр с терминальным выигрышем, может представлять интерес для исследований.
В конце отметим, что в теории антагонистических дифференциальных игр существует отпостительно мало результатов, связанных с играми с неограниченной продолжительностью. В тоже время существуют содержательные прикладные постановки задач, приводящие к подобным дифференциальным играм. Отметим здесь задачу асимптотического сближения-уклонения, в которой догоняющий игрок стремится приблизиться к убегающему игроку в асимптотическом смысле на полубесконечном интервале времени. Убегающий же игрок стремится избежать подобного сближения. Рассмотренный в третьей главе класс дифференциальных игр не включает в себя подобные задачи в силу того, что для дифференциальных игр асимптотического сближения-уклонения условие мажо-рируемости подынтегральной функции суммируемой на полубесконечной оси, вообще говоря, не выполнено. Отказ от последнего условия в постановке задачи и применение техники операторов значения для подобных игр может служить полем для дальнейших исследований в теории антагонистических дифференциальных игр с неограниченной продолжительностью.
1. А вербух Ю. В. Метод программных итераций в задачах наведения для автономных конфликтно-управляемых систем // Дифф. уравнения и процессы управления. 2007. N 1.
2. Адрианов А. А., Чистяков С. В. Об одном классе бескоалиционных дифференциальных игр с неограниченной продолжительностью // Вестн. С.-Петерб. ун-та. Прикладная математика, информатика, процессы управления. 2005. Вып. 1.
3. Айзеке Р. Дифференциальные игры. М.; Мир, 1967.
4. Барбашин Е. А. Введение в теорию устойчивости. М.; Наука, 1980.
5. Варга Док. Оптимальное управление дифференциальными и функциональными уравнениями. М.; Наука, 1977.
6. Воробьев Н. Н. Лекции по теории игр для экономистов-кибернетиков. Л.; Изд-во ЛГУ, 1974.
7. Зорин В. А. Математический анализ. М.; Изд-во МЦНМО, 2002.
8. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. М.; Наука, 2004.
9. Красовский Н. Н. Игровые задачи о встрече движений. М.; Наука, 1970.
10. Красовский Н. Н. Управление динамической системой. М.; Наука, 1985.
11. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.; Наука, 1974.
12. Круснсков С. Н. Обобщённые решения уравнений Гамильтона-Якоби типа эйконала, I // Мат. сб. 1976. Т. 98, N 3.
13. Лахтин А. С., Субботин А. И. Многозначные решения уравнений с частными производными первого порядка // Мат. сб. 1998. Т. 189. N 6.
14. Лахтин А. С., Субботин А. И. Минимаксные и вязкостные решения разрывных уравнений с частными производными первого порядка // ДАН. 1998. Т. 359. N 4.
15. Мищенко Е. Ф. Задачи преследования и уклонения от встречи в теории дифференциальных игр // Изв. АН СССР, Техн. кибернетика. 1971. N 5.
16. Никитин Ф. Ф., Чистяков С. В. Об антагонистических дифференциальных играх с неограниченной продолжительностью // Вестн. С.-Петерб. унта. Математика, механика, астрономия. 2004. Вып.З.
17. Никитин Ф. Ф. Об общей неподвижной точке операторов значения в игре на перехват // Вестн. С.-Петерб. ун-та. Прикладная математика, информатика, процессы управления. 2008. Вып. 1.
18. Никитин Ф. Ф., Чистяков С. В. Теорема существования и единственности решения обобщенного уравнения Айзекса-Беллмана // Дифф. уравнения. 2007. Т.43, N 6.
19. Никитин Ф. Ф., Чистяков С. В. Задача об асимптотическом сближении // Тр. межд. конф. „Дифференциальные уравнения и топология". М.; Издательский отдел фак-та ВМиК МГУ, 2008.
20. Никитин Ф. Ф., Чистяков С. В. Теорема существования и единственности решения обобщённого уравнения Айзекса-Беллмана // Тр. межд. семинара „Теория управления и теория обобщённых решений уравнений Гамильтона-Якоби". Екатеринбург; Изд-во УрГУ, 2005.
21. Никольский М. С. О применении первого прямого метода Понтрягина в играх преследования // Изв. АН СССР, Технич. кибернетика. 1972. N 10.
22. Никольский М. С. Первый прямой метод JI. С. Понтрягина в дифференциальных играх. М.; Изд-во МГУ, 1984.
23. Никольский М. С. Краткий обзор работ JI. С. Понтрягина по дифференциальным играм // Вестн. Моск. ун-та. Вычисл. матем. и киберн. 1993. Вып. 3.
24. Обей Ж.-П., Экланд И. Прикладной нелинейный анализ. М.; Мир, 1988.
25. Пашков А. Г. Об одной игре сближения // ПММ. 1970. Т. 34, N 5.
26. Петров Н. Н. О существовании значения игры преследования j j ДАН СССР. 1970. Т. 190, N 6.
27. Петросян Л. А. Дифференциальные игры преследования. JL; Изд-во ЛГУ, 1977.
28. Петросян Л. А., Томский Г. В. Динамические игры и их приложения. Л.; Изд-во ЛГУ, 1982.
29. Понтрягин Л. С. Избранные научные труды.-М.; Наука, 1988.
30. Пшеничный Б. П. О линейных дифференциальных играх // Киберн. сб. 1968, N 1.
31. Пшеничный Б. Н. Структура дифференциальных игр // ДАН СССР. 1969. Т. 184, N 2.
32. Пшеничный Б. Н., Остапенко В. В. Дифференциальные игры. Киев: Нау-кова думка, 1992.
33. Сансоне Дж. Обыкновенные дифференциальные уравнения. М.; ИЛ, 1953.
34. Субботин А. И. Обобщение основного уравнения теории дифференциальных игр // ДАН СССР. 1980. Т. 254, N 2.
35. Субботин А. И., Чепцов А. Г. Оптимизация гарантии в задачах управления. М.; Наука, 1981.
36. Субботин А. И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М.; Наука, 1991.
37. Субботин А. И., Ченцов А. Г. Итерационная процедура построения минимаксных и вязкостных решений уравнений Гамильтона-Якоби // ДАН. 1996. Т. 348, N 6.
38. Субботин А. И. Обобщённые решения уравнений в частных производных первого порядка. Москва-Ижевск; Ин-т комп. иссл-ий, 2003.
39. Субботина Н. Н. Универсальные оптимальные стратегии в позиционных дифференциальных играх // Дифф. уравнения. 1983. Т. 19, N 11.
40. Ухоботов В. И. Метод одномерного проектирования в линейных дифференциальных играх с интегральными ограничениями: учеб. пособие. Челябинск; Челяб. гос. ун-т, 2005.
41. Фридман А. Об определении дифференциальных игр и существовании значения игры и седловых точек // Киберн. сб., новая серия. 1972. Вып. 9.
42. Ченцов А. Г. О структуре одной игровой задачи сближения // ДАН СССР. 1975. Т. 224, N 6.
43. Ченцов А. Г. Об игровой задаче сближения в заданный момент времени // Мат. сб. 1976. Т. 99, вып. 3.
44. Чистяков С. В. О дифференциальных играх N лиц // Математические методы в социальных науках. Вильнюс. 1976. Вып. 8.
45. Чистяков С. В. К решению игровых задач преследования // ПММ. 1977. Т. 41, вып. 5.
46. Чистяков С. В. О функциональных уравнениях в играх сближения в заданный момент времени // ПММ. 1982. Т. 46, N 5.
47. Чистяков С. В. Программные итерации и универсальные е-оптимальные стратегии в позиционной дифференциальной игре // ДАН СССР. 1991. Т. 319, N 6.
48. Чистяков С. В., Петросян Л. А, Об одном подходе к решению игр преследования // Вестник ЛГУ. Математика, механика, астрономия. 1977. Вып. 1.
49. Чистяков С. В. К решению дифференциальных игр преследования-уклонения // Дисс. на соискание учёной степени канд. ф.-м. наук, Л., 1978.
50. Чистяков С. В. Программные итерации и универсальные е-оптимальные стратегии в позиционной дифференциальной игре // ДАН СССР. 1991. Т. 319, N 6.
51. Чистяков С. В. Операторы значения антагонистических дифференциальных игр. СПб; НИИ Химии СПбГУ, 1999.
52. Чистяков С. В. Операторы значения в теории дифференциальных игр // Известия ин-та математики и информатики УдГУ. 2006. Вып. 3, N 37.
53. Basar Т., Olsder G. J. Dynamic noncooperative game theory. New York; Academic Press, 1995.
54. Bellman R. Dynamic programming. Princenton, New Jersey; Princenton Univ. Press, 1957.
55. Chikrii A. A. Conflict-Controlled Processes. Dordrecht, Boston, London; Kluwer Acad. Publ., 1997.
56. Crandall M. G., Lions P. L. Viscosity solutions of Hamilton-Jacobi equations // Trans. Am. Math. Soc. 1983. Vol. 277, N 1.
57. Crandall M. G., Ishii H., Lions P. L. A user's guide to viscosity solutions // Bull. Am. Math. Soc. 1992. N 27.
58. Danskin J. M. Values in differential games // Bull. Am. Math. Soc. 1974. Vol. 80, N 3.
59. Differential games and related topics eds. Kuhn H. W., Szego G. P. Amsterdam; North-Holland Publishing Company, 1971.
60. Elliot R. J., Kalton N. J. The existence of value in differential games // Mem. Am. Math. Soc. 1972. N 126.
61. Fleming W. H. The convergence problem for differential games //J. Math. Anal. Appl. 1961. N 3.
62. Fleming W. H. The convergence problem for differential games II // Ann. Math. Stud. 1964. N 52.
63. Friedman A. Differential games. New Jersey; Wiley-Interscience, 1971.
64. Fershtman C., Nitzan S. Dynamic voluntary provision of public goods. // European Economic Review. 1991. N 35.
65. Lions P. L. Generalized solutions of Hamilton Jacobi equations. Boston; Advanced Publishing Company, 1982.
66. Lions P. L., Souganidis P. E. Differential games, optimal control and directional deriavatives of viscosity solutions of Bellman's and Isaacs' equations j j SIAM J. Control Optim. 1985. N 23.
67. Nikitin F. F., Chistyakov S. V. A theorem on existence and uniqueness of generalized Isaacs-Bellman equation // Тр. межд. конф. „Устойчивость и процессы управлений'. СПб; Изд-во СПбГУ. 2005.
68. Subbotin A. I. A theory generalized solutions to first-order PDEs with the emphasis on differential games // Advances in Nonlinear Dynamics and Control. 1993. Vol. 47.
69. Varaiya P. On the existence of solutions to a differential games j j SIAM J. Contr. and Optimiz. 1967. Vol. 5, N 1.