Линейно-квадратичные кооперативные дифференциальные игры тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Марковкин, Михаил Викторович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
2006
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
С,ШКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Линейно-квадратичные кооперативные дифференциальные игры
Специальность 01.01.09 - дискретная математика и математическая кибернетика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Марковкин Михаил Викторович
Санкт-Петербурі 2000 г.
Работа выполнена на кафедро Математической теории игр н статистических решений факультета Прикладной математики - процессов управления Санкт - Петербургского Государственного Университета.
Научный руководитель: доктор фи иіко-матоматических паук.
профессор Петросян Леон Апшесовпч. Официальные оппоненты: доктор фп 5нко-математнческнх наук,
профессор Захаров Виктор Васильевич
кандидат фи шко-математнческнх паук, додент Смирнов Николай Васильевич
Ведущая организация: Институт проблем механики РАН (г. Москва)
'Зашита состоится ”?Т " 200С г. в I £ час. па заседании дис-
сертационного совета К-212.232.07 по іаїцпте диссертаций на соискание ученой степени кандидата фн шко-мятематнческнх наук при Сапкт- Петербургском го-(■уііірсіненном .»нннерсніеіе но адрису. 19000-1, Санкт-Петербург. В.О., Средний пр., д.-11.43. ауд. . І2І-А'
С диссертацией можно ознакомиться в библиотеке СПбГУ
им. А.М. Горького по адресу: С.Петербург, Университетская наб.. 7/9.
Автореферат раюслан "2-і 11 СбЖ-ЯД-'^?<~/С200в г.
Учены II секретарі) диссертационного совета, доктор <1)н !.-маі. наук, профессор В. Ф, Горьковой
гсое /}
/#&/-/
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Существенным разделом математической теории игр является теория дифференциальных игр. Она имеет большое количество приложений, так как основным объектом исследования этой теории выступает математическая модель конфликтно-управляемого процесса, который развивается непрерывно с течением времени. Именно благодаря этому свойству, управление процессом оперативно реагирует на изменения системы.
Основным инструментом исследования построенной математической модели является система дифференциальных уравнений, которая описывает динамику развития процесса во времени. Цели, преследуемые игроками, описываются с помощью функций выигрыша, которые имеют различный вид, что позволяет онн-сагь множество конфликтно-управляемых процессов в терминах теории дифференциальных игр.
Одной из первых работ но теории дифференциальных игр является "Дифференциальные игры" Р. Айзекса. В работе были предложены общие подхода к решению дифференциальных игр; одним из таких подходов является решение основного уравнения дифференциальных игр, которое часто называют уравнением Айзекса-Веллмана.
В развитие теории дифференциальных игр свой вклад в различное время внесли Красовский H.H., Понгряпш Л.С., Зубов В.И., Субботин А.И., Никольский М.С.. Петросян Л.А, Данилов H.H., Томский Г.В., Basar Т., Olsder G.J.,Yeung
D. W. K. Большинство работ но дифференциальным играм посвящено некооио-ративпым играм, в которых в качестве решения используется равновесие но Нэшу (неаитагопистичсскпй случаи) и ситуация равновесия (антагонистический случай).
Развитие исследования решения линейно-квадратичных дифференциальных игр связано с выходом в свег работы "Dynamic noncooperative game theory", Basar Т., Olsdcr G.J.. В этой работе большое внимание уделено исследованию бескоалиционных линейно-квадратичных дифференциальных игр многих лиц, а также шрам двух лиц. Дальнейшие работы направлены на более детальное изучение таких игр с дополнительными ограничениями. Дня этих частных случаев выведены условия существования решений бескоалиционных игр в различных классах допустимых унравлений(нрограмных, синтезирующих), также рассматриваются
„ РОС. НАЦИОНАЛЬНАЯ
á БИБЛИОТЕКА
С.-Петербург ОЭ 20(£ акт
ПЫЧПСДШС ІЬПІ.іе >U 11СКТЫ Построения решения. Более ДОТаЛЫЮ НССЛеДОВаПО п<>-педошн' решения ішіснио-кнадраінчпьіх дифференциальных играх п скатяріюм е.п має.
Зачастую, еамоіі постановкой многих ¡адач. формаліп\емьі\ как днфферепип-а.іьиме тіш. чикт\ется необходимость объединения шроков п коалипііи. полом} исслечование кооперативных дифференциальных нір-дейсіинтельно актуальная іадачл.
13 коопераіивпоп георпн дн<1)ферепиііальііьіх игр п ¡начально предполагается, что игроки, действуя сообща, выбирают управления. оптимальные п смысле максимизации іуммариого иышрыша. и вопрос ¡аключаегся п оиречелеппн "спранеч-.итого" (оптимального) дележа отого суммарного выигрыша. В классической статической теории кооперативных ні р сформутнровапы многочисленные принципы огітпмальпосі и (С-ядро, пек тор Шеплн. ММ-решение). Очпако. попытки переноса и шестых и сгатпческой теории принципе» оптимальности на рачлігчіпле виды дифференциальных игр беї дополнительного исследования невозможны. так как почти всегда могут привести к выбору іаведомо lie реали іуемьіх решений. Эго спя чию с потерей динамической устойчивости (состоите, п.поетп по прем<чш) принципов оптимальности. ’-)го обсгоягельсто было впервые обнаружено Петросяном .4. А. 11 \і же предложен мет од регуляри іацин. основанный на построении процедуры распределения дележа (ПРД). приводящий к динамически устойчивым решениям. Этот метод впервые применяется дія реіулярн киши решений линейноквадратичных кооперативных дифференциальных игр.
Основной целью работы является нахождение решении линейпо-кватрагичных кооперативных чнфферешшальных игр с бесконечным л конечным временем окончания. Построение с ¡той целью характеристической функции ратдичпых видов к ктасее сіраіеі піі. гарап і пр\ющпх жспонепцна.іьпУіо устойчивое її. реатп-¡уемых траєкторнії, дія игр с неограниченной продолжите іі.посі ыо. Построение состоятельных во времени (чнпамнчеекп устойчивых) оптимальных че.іежеіі п со-отвснтв.\ юшнх нм ПРД. Пывоч необходимых у.юішіі. іарапінрующих ие\бьііоч-но( гь кооперативною пове.ч<чіпя при неблагоприятных сценариях рашшпя нг-]>ы (условие Д.В.К. Яша) тля липейио-кначрашчпых кооперапишых чнффереп-ннальных пі р с бесконечным временем окончания.
Научная новизна. В рабоїе впервые построены основы іеорпн лннейпо-кна і-
ратнчных кооперативных дифференциальных игр как с конечным, так и с бесконечным временам окончания. Эю потребовало вырабогкн новых подходов для построения характеристической функции и решений, получаемых на её основе. Предложена новая модификация метода последовательных приближений В.И. Зубова для нахождения управлений оптимальных в смысле максимизации суммарного выигрыша игроков, входящих в коалицию. Произведена регуляризация классических принципов оптнмалыюсгн кооперативной теории применительно к данной ■задаче, исследованы свойства решений.
Практическая ценность. Результаты, полученные в диссертационной работе, могут быть положены в основу теории лииейио-квадратичиых кооперативных дифференциальных игр. Практическая ценность работы обусловлена областью применения линейно-квадрашчпых дифференциальных игр. Такие игры применяются при математическом моделировании взаимодействия подвижных объектов в условиях конфликта технических и технологических процессов, а также при моделировании развития сложных социально-экономических сио см. Поэтому сферу применения полученных результатов можно оценить описанной областью применения линейно-квадратичных дифференциальных игр, в которой имеет содержательный смысл кооперации игроков.
Основные положения, выносимые на защиту:
1. вывод необходимых и достаточных условий для существования набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалпцни" для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания при дополнительном условии экспоненциальной устойчивости реализуемых траекторий движения,
2. построение метода последовательных приближений для определения набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалиции" для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,
3. построение сунерад дитивной характерисгнческой функции для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем
окончания.
-1. пооіроопно < остоятельного «о промоин доложи и процедуры распределении дележа. которая соответствует отому тележу. и определение пеобхолнмых чсловня пя выполнения \оюпня Д.П.К. Япга для лннейно-кпадрагнчных корнера і пнных дифференциальных игр о бесконечным променем окончания.
0. вывоч нообхочимых H достаточных условий для с\ іцествоваїїня набора \ нрав-леїіпіі оптимального в смысле макснмн ¡ацнн выигрыши коалиции при фиксированном наборе л нрав іопніі "антнкоалпцип" пя липоііпо-кпатрагичных коопера гнвкых чнффорепцггальпмч rrr j» с конечным временем окончания
Апробация работы. Основные реіулматг.і были чоложены на со\ншара\ кафе тры ма тематической георнн игр и статистических решений, на семинаре кафеч-ры теории управления, семинарах Центра теории нір. на Международном семинаре "Теория управления н теория обощоппых ])ошоний уравнений Гамнльтона-Якоби" (Екатеринбург. 200о). па Межлунарочиой конференции "Устойчивость и процессы управления" (Саик т-Петерб\ рг. 2005). на "Summer School on Game Theory in Computer Science" (Аагішь. Denmark. 2000). на семинаре "Россписко-фнпекой летной школы "Динамические игры п многокритериальная on гимн ia-цпя" (Ileipo¡аводск. 2U00). па сомпнаре Воронежской весенней математической школы "ІІоптряі нпекпе чтоння-XY" (Воронеж. 2001). XXXIV научной конференции "Процессы Управлення н \ с гойчіівосп>" (Санкт-Петербург. 2003 г.). XXXV научной конференции "Процессы управления н усгойчппоотьм(Оанкг-Петербург. 200-1 г.).
Публикации работы. Маюрна іьі исследований опубликованы в |1 5|.
Структура п объем работы. Диссертационная работа состоит id ввечепня. чвух глав (1 1 парат рафов). списка пспо.п>¡уемоіі .niiepsmpw и приложения. Общий объем чіксергацнп НЮ ст])аннцы. Список исно. и> ¡уемоіі лніораіу]>ьі вк ноча-ег >0 наименований.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во ппедешш обоснована актуальность іемьі. поставлена цель после тованнй. дан краткий об юр шюрап ры по ю\ю дні сертацнн. еформу шрогмпы по южонпя.
Ъ
выносимые на защиту, показаны теоретическая ценность и практическая значимость представленных в работе материалов.
В первой главе рассматриваются линейно-квадратичные кооперативные дифференциальные игры с, бесконечным временем окончания. Приводится постановка задачи, определяется линейно-квадратичная дифференциальная игра с бесконечным временем окончания. Выведены необходимые и достаточные условия существования характеристической функции, которая построена как нанлучший ответ коалиции на Нэш-равновесие, используемое игроками антнкоалицин. Сформулирован метод последовательных приближений для вычисления характеристической функции. Построена еунераддипшная характеристическая функция для функционалов особого вида. Построена процедура распределения дележа, а также выведены необходимые условия для выполнения условия Д.В.К. Янга.
В § 1.1 поставлена задача: приведена система дифференциальных уравнений, являющаяся основным объектом исследования, определены функционалы, которые являются функциями выигрыша игроков. Описан класс допустимых наборов управлений. Определена лннейно-квадратнчная дифференциальная игра с бесконечным временем окончания Г(0, .т0), начинающаяся в момент времени 1 = 0 из состояния Жо-
Рассматривается система дифференциальных уравнений
х = P{t)x + Q(t)(ui + и2 -Ъ ... + и„) (1)
с начальным условием
х(0) = .т0>
где;|;-т- мерный вектор (ж1, —,хт), и,—г- мерный вектор для любого г = 1, ...,п; Р(1) и Q(t) - (тхт)-н (т х г)-магрицы соответственно, имеющие вещественные, непрерывные и ограниченные при I € [0, со) элементы.
Предположим, что заданы функционалы
ОО
J, = J (xTA,(t)x + u'?Ct(t)u,)dt.,i = 1.и, (2)
о
где Л¡(t) и C,(t) -(in х т) - и (г х ?■)- матрицы соответственно, имеющие вещественные, непрерывные и ограниченные при t е [0, оо) элементы при любом г = 1,...,п. Матрицы C,(t) будем считать отрицательно определенными при любом г 1, ..., п.
Определение 1. Набор цираоЛі НІІІІ (.т)ч
{u, = M,(l)xJ = 1.....п} (.'І)
бцОем >ш-)ы<юп)ъ donцстимым. tr.ui аыпо.цп ны целом/«: 1) М,(1) - (г хт) — матрицы имеют ш »// стм иные, ш прерывные a ограни'н н-ные при і є [0. ое) лнмчппы, dm любого і = 1,...,» J) системи (1). лилплпрнип ліпим побором цнриь.и ниіі. та їсть іисітлш
П
і = (Я(/)+ <?(/)£ Л/,(/)).г 1-І
лкепонснцнально і/сшоіпшьа.
Пусті. N = множество игроков. Игроки выбирают управлення вила
иг = Л/,(/).к. іі, если набор управленні!
{îî. = А 1,(1)х, і = 1,...,«}
допустим в смысле определения 1. го игроки получают пышрышп. раВПЫе J,. то есть выигрыш 7-ого игрока полагается равным J,. Каждый игрок стремится максими шрошпв свои выигрыш. Так как сисіема (1) ітіеііна. а кажчьпі ч: т-даппых функцпопа. юв имсеї квадраіігіпуїо ( грукгуру. и> такая игра палы пае гея лппоГшо-квадрагичпои. Обозначим се Г(0,.і'о). Эго обошачеппе покаи.шаот. чго игра началось в момент времени / = 0 и s состояния .i:0.
В fcj 1 .‘2 ирппелеиа лемма о допустимом наборе управлении. Дія определения оптимальных стратегии чсобхолпмо каким-то обра ¡ом варьировать управления игроков, однако ’-ллі іпмопеиня не должны вывоглпь наборі.і управленні! ні класса допустимых в смысле определения 1. Иначе творя, нужно пока saiь пргг каких условиях множество лопустпмых наборов у нравлеппіі неиуч ю.
Лемма 1. Ее.ш dm системы (1) еі/щігть.і/і т сот» бы odun допустимый набор i/tipao.iciii/à ыи)а (3). то О.ы нового S С N a Оля любого кобо/к/ (г х т)~митриа, К}{1). j Є S с асщестої иными, нспрсрычными и огрчнччі иными при І є (О.оо) .) клієнтами суща таре т си > 0 такое, что d і.я любого d < t'o набор un ¡ми іениіі
{к, = М,(1)х, і І S: «j = (ЩО + eK,(0)*J Є 5}
бі/0< ні àaiiiji ти \’ы м.
В Теореме 1 § 1.3 формулируются необходимые и достаточные условия существования равновесия по Нэшу в игре Г(0, х0). Набор управлений, являющийся равновесием по Нэшу, используется в дальнейшем для построения характеристической функции при решении кооперативного варианта игры Г(0, л0)-
Теорема 1. Для того чтобы в дифференциальной игре Г(0, х0), существовало равновесии по Нэшу, пообходимо и достаточно, чтобы система матричных '¡цнхв-пепий
в, + (р-^о-^Ге:)Твг+
I et(P - ^C~1QT9j) + A¡- QiQCt~1QTQ¡ = 0, i = 1, ...,n
имела решение, заданное при t > 0, в виде вещественных, непрерывных, ограниченных а симметричных матриц 9i(t),¿ = 1, ...,п такое, что набор управлений
{«¡ = -C;lQrQiX, і = 1,..., n} (4)
был бы допустимым в смысле определения 1.
Тогда набор управлений (4) будет являться 'равновесием по Нашу в игре Г(0, ж0).
В Теореме, 2 11.4 формулируются необходимые и достаточные условия существования набора управлений оптимального и смысле макснмизашш выигрыша коалиции при фиксированном наборе управлений, который используется "ангико-алицией". В Следствии 1 выведено явное представление выигрыша коалиции при выполнении условий Теоремы 2.
Теорема 2. Для того чтобы существовал набор управлений
{и? = є 5),
доставляющий максимум Js — Л пРи фиксированном наборе управлениіі
¡es
{и, = Ñj(t)x,j i S}, необходимо и достаточно, чтобы уравнение
Vs + (p + qZаУтЪ + ys(p + QЕЛ7Л + Ел‘ -ЕysQc‘1QTVs =0 (s>
}<ts lis tes íes
имі.ю pi wt mit . .wdmwot при і > 0. ь виОі и т/ттыаноіі. ип\рі ршлип’ї. o/jhiiui-чінноО // пі м\н трнчиоіі кип^рицы I# тими', что набор <//і(нн>.ниіії/
umax = i'h = МЛ*)*-] І S;u® = -C'-lQrVsr.i Є S]
бы.1 С)Ы ОоПІ/СІПІІЛІ ft С.МЫС.Ч lllipt Or. n hum 1.
Следствие 1. Ec.ru нынатсны i/с.юы/л Теоремы 2. wo лшкеилш,>ыюс .tiw'it mu Js ыл'шемн шея по формі/.к:
./ ' ( М,пах ) ~ ^ 0 ^ О
В Ц I.Ö сформу.іпрованьї теоремы. аналогичные теоремам 1 и 2. %ія функипо-иа топ особої о ппда:
00
J, = J(хтЛ,х + 2и{ В,(і)х + uJCi(l)u,)dl, і = 1,
о
Т])удііо('п. иахожтепня решения уравнения (■')) заключается и том. что иен j-веспи.і січ» начальные условия. жнтому д ія построения решения псио п.іуются приближенные методы. Представленный її ij 1.0 метод последовательных приближении является распространением метода D.II. ’Зубова для отыскания опінмаль-ного стабп.ти !iij)yioiH(4'o управлення.
Пусть ¡аланы система дифференциальных уравнений (1) н набор функционален (2). В отличии от нредедутцнх параграфов, предположим, что квадратичные формы потожнте.тыго определенны для любого і =
Дополни к1.1ыю предположим, что квадрат пчнме формы /,,*’ = 1,.... п по южн-те. 1ЫЮ определены, где
}, = хгЛ,(1)х + и[С,(1)и„ і = 1, ..., п.
В ОІ.ТПЧНЄ от ¡іідачп. по< іавдоптіоп в предед\щпх параграфах. каждый ш]>ок стремится мннмми тропить своіі J,.
’?атача: посіроить последовательность приближении
К}.' es
для набора хттран тепиП. мпппми шр.мопкчо ,JS пі>н <1>пкспровапном наборе управлении
{'О = ЩО-^J І SilO
Замкнем систему (1) набором управлений {щ = M3(f)x,j <р 5}
i = (P(t)x + Q(t) £#,(/))* + Qj^u,. (6)
Jts teS
Введем обозначение:
P=F(i) + Q(0^%)-
Пусть набор управлений
{и, = Mj(t,)xJ £ S, ukt = M*{t)x,ie S}
допустим в смысле определения 1.
Тогда система
* = (P(t) + Q(t))(£ ЛЩ + ¿2 (7)
ns ¡es
экспоненциально устойчива, следовательно можно построить квадратичную форму
vs(t,x) = xTV^x,
обладающую свойством
dvg(t., х)
(?) ,es
dt
Тогда Vß опредслясгси из уравнения
vi+(р+<з(Е +Е))r^s+^ (pw+wxE ^ (*)+
its tes jçiS
+E Af‘w) = - E^+(Mifcwf )
îG5 iG5
Виедом а рассмотрение фуикцноиал
t
Lk = vLs(1,x) + E / /.(f- ^«.)•
•^0
Построим набор управлений
{«.}.€$
оптимальный в смысле демпфирования то есть
(■[
ГГ [І! Ті Î t!
-wiliMD/on i.'tn; mi xiKj nd no -<Іш хі'ш'ігшігш.кі.іффт/ хі'шііішкії'шім-оїш.шііг тип -lidusi о loiiuiuvidoLiooH щт.шьні іішьхкГіооц myo.xmo l'iinunuo ¿ i í¡ .«[)!•<[ luifiMi £]
•icnii.ui.Hvcii пш.нпуо ііоніиі.іііинігі) innjoti- <> /'x (ш'п-щщ.юншо oiuI.iivoiwikI 'gf liivi'intiiliiiiii-iiiviiitiuv •niiit.nvixhi/i lithynii ;i к.міпро.г.> {(.r‘/).Ÿîl} чнімшчі .)іііоі)ор.)г.ши wmut нпіш.юи от •ііпн.н нтІШІ ііоупн nnivuuiJliimp
{S Э l'Jn 's ÿ Ç'ÂlYn = rn}
a і-g ізічосіоох ■üi\rf<lo.u KWjiou'ï.ar.) (H.WH. ьмічц
■s э ? ЧллЬх'о- = ,. YVv
4J..W 0.1, ■Illlll.)M'llI.’9Il(lu Х1ЧІІЧІ )OU .»/ОІ.Ж II It¡¡n = 'П ІМІЖОГОЦ
'S => ! jô,-Э- = '»
‘"0
те
•’ri’+ (’rtg)‘Sa*¡MMfi)— = —
' <? г/с
"S' Э !‘('п'х‘1)у =
(0)
JE
шн udyo
оіііюіінш 090 і\л>г.шд
S* SO»
i’n'jln + + (('" 2 0 + =
,95» S’-*»
= + *'Vj}r)'ji + j,('n2 Ö + -'У)?Л.,5 +
S3*
irtaoj.
' (% $Л,г;г + х*Л |,r!' + xl'\jx =
(o)
№
(х{})лp
«э‘ (0)
/p
(0)
JE
IP
В ¡i 1.7.1 ihm i pocMUi так n,i шгшсмог проноршюп.амте решение ко трое не Требуй llocipiiellllH \ilp,IK lepm гпче< Koii (|)УПКШ1П.
ПреШО IOAUM. 410 111 роки. 'TOI оПорШЯШК I, О ООПМССТПОН игре, leiicnnioi на (осп|/М4ше максимального с\ мхмрного пмшрмша:
N
t-i
Г1уси>
ъ.тах _ / ..mas >,иии\
U — \«1 )*
и;,ш-£=.л/,т“(/).г,/= 1....и,
итах _ a].g тах jN'
Топа. се.ui набор \ прапленнн итах eyinecnsxer. го
H™« = -C,-1Q'IVw.r,i = l......п,
где W согласно геороме 2. решение следующего урашюппя
П П
VN + PrVN + VNP + £ /1, - £ VsQC, ‘Ог^ = О
1-1 г-1
Jov'ia максимальное ¡пачсинс Ул\ согласно слелсмшю 1 icopcwbi иудег
JN U, =
Для ВЫННСЛСППЯ пропоршюпалыюго реШеИИЯ необходимо пыннсипь оптнмть пы<* {нн'кчшм (])уш(поиа. юн каждого игрока, при тенггенн его нропт набора \ »ран .ieiiiiii и"хах. го ее 1Ь
й, = argma xj,(uma:c/и,), i =
Kt
Toi (а. если унраплепне й, сущее гг,ует. то
й, = -CtlQTVl.\\i = I,...,«,
i ie Г,, coi.ianio теореме 2. решение следующею \ раипеипя
Й + (Р + QY, М?пх)Т К + ЩР + Q J2 Л1"шх) + Л, V.QC, lQrV, = 0. jf i st<
l-'i
Используя следствие 1 теоремы 2, получаем
Мита*/й,)=ХоК^О-
Введем обозначения
А, = Л(ита7й,), г = 1,
л = £а„
1=1
Тогда, согласно нронорцнональнальному решению дифференциальной ш'ры, выигрыш каждого игрока будет определяться следующим образом:
а,,го” =
Очевидно, что
п
£ а3™” = ^(и,тх).
•=1
Вектор
аРГОР = (а^Г0„..арго„)
будем называть пропорциональным решением дифференциальной игры.
В §1.7.2 приведено правило построения характеристической функции. Значением характеристической функции дая коалиции 5 принимается оптимальное в смысле максимизации значение выигрыша коалиции при условии, что "антпкоа-лиция" N/3 использует набор управлений, который входит в набор управлений, доставляющий фиксированное равновесие по Нэшу.
То есть, для определенной ранее линейно-квадратичной дифференциальной игры Г(0, а.'0) характеристическую функцию
1.(5,0) :2м -» Я
будем строить по следующему правилу:
11(5,0) = тах ^(иКЕ/и3).
щ,1€$
где (ил’Е/и5) = {и^Е,з <£ 5;м„? 6 5}.
В общем случае посгроенная таким образом характеристическая функция не является еуиерадднлшной.
= argmax J-'(«'vty«'s’)-
Jii.iCb
Тотта. если набор хправ. innifi
{»; = i 6 S}
<>щсс[вич, И) согласно К'ореме 2
m;(i) = -c, 1qtVjc,
l ie V* вещее! венная. непрерывная. ограниченная и симметричная матрица. >a-РШШЯ при I > 0. являющаяся решением \равнения
V' + (P + Q J2 MjN!:)TV' + V‘(p + q'$2 M?e)+
jis MS
+I>,-;£>’qci-iqiv**=o
!f S its
Пснолыуя С ТеДСТГШе 1 ТОореМЫ 2. имеем
JS{uNE/4'%) = 4v\Е0, I € S.
Соыасно определению характеристической функпнн получаем
¡’(5,0) = хЦУхц.
После определения "характеристической функции для каждой коалиции мы можем вопюльюпаш-я любым и) hjbo< пгах пршшнпов онтматълостп для нахождения решения.
ii ¡.Я чаггы онре (слепня процедуры раг-преутопия чележа и состоятельного во времени челел<а. Теорема 6 1.8 представляет собой правило построения проце-ч\ры распределения дележа так. чтобы до юж. которому она соответствует. был соетяю.шпым во времени для . ишенио-квачратчпон кооперативной дифферента тыюн игры с бесконечным временем окончания.
11\еп, Г(f,■>•'(/))- почытра птры Г(0,.г0). кою1>ая пачнпаек-я в момент времени I И! состяпия x'(f). 1 че -¡'*(/)- траектория. которая реа.ш ¡имея п]>п нсполь-юваппп набора \ прав lerniii. опгнматьпою по отношению к макенмптипн JN. го е< г|) он I пмалвпо! о попеденпя максима lbiioii коатпцпн, Он I пматьныи » смысле выбранною принципа оптимальности чележ н -ион почыгре обозначим
^¡,.<■*(/)) = (^(/,..-(0)........¿„о.-гтт
Определение 2. Вектор
позовем процедурой распредмепш дмежа (ПРД), если
ОС
^,(0,хо)= J ß,(t)dt,i = l,...,n
О
Определение 3. Дележ
<Л(0,®о) = (v>i(0, a^j).v»n(0, ar0))
называется состоятельным во времени, если в состоянии (t,x*(t)) при любом t > 0 выполняется следующее равенство
t
<Pi{ 0,xö) = J ßt{r)dr + v?i(f,a:*(fc)) о
для всех г = 1, еде ß(t) = (öj (£), ...,ßn(t)) — ПРД, соответствующая этому делешсу.
Теорема 4. Пусть <р(1, *'*(/-)) дифференцируем по t при I € (0, оо), тогда дележ МО, ®о) = (<Pi (°. ®о) <Рп( 0, ®о))
будет состоятельным во времени, если соответствующая ему ПРД строится по следующему правилу:
ih{t) - —ipi(t,x'(t)),i= 1 (8)
Определение дележа, удоьлетворяющ&'о условию Д.В.К, Янга, введено в § 1.9. Также в этом параграфе выведены необходимые условия того, чтобы дележ удовлетворяет условию Д.В.К. Янга.
Определение 4. Состоятельный во времени делеою
¥>(0,жо) = (yi(0, з?о), ...,</?п(0, х’о))
удовлетворяет условию Янга, если выполнено неравенство i
Jß,(T)dr + v(i,t) > v(i,0),i = 1 ,...,n (9)
о
при любом t > 0, где ß(t) = (ßi(t), ,...ß„(t)) ПРД, еоответствуюгция дележу </?( 0, а;0).
SM Л'5>
о = ад 2 - ’іу'го, ь 2 3>
.s')' St>c St>!
+v 3 + ^ 3^ + + s^Jfiy^Ö + </) + s/l
g f o/oooir ircp :i)iur >p міно оитчщп'пшішо ¡,Q n'nnduiniv ,ç Э ; mmjmr игр (¡
мш.п'ошіиіі dntjim пічікхії.іі'ііі/і.і дг Э g ііп'піи-ію.ч игр iqaoiiii, огош аі'}ґ -g шмосіоох
:лі тші.чіи тмюілім .) ou «и nod і -> iw» ло оишмллф оіл.'і.^милті.шпчії.'у
Kiiiwoduou iwiidojrn .»км« і ч = і i\o«joii- mlu h.umivh < (to‘()] Э І ті» отшоышЫ.ю u oi«iiitii<uI>xIii.>ii мин
-ll.MU.WTIWil .MllIWMIVIl 4)llll.)!ll.)J.)!JJOO) ІЧЇІШІ П!П -(./X./) II - (и/ X III)- (/)/,.) II (/)'(' ‘>1'J
uoriiiKimi'iii \<|> ULL іітічилф ііоч.),>і,н і->iuU> i.mücIux мопшшіь'пкитл.) и шит -(«i.L.),miС) кииоюл mi.rtr.xaulii oj-j и \і\<шоіі ■ijnuuiuiil1n,d.m\.> юіокти і;і і,>ш .ні штнилф ki’M.mijii.iikI.iimivIi'n <- _> і í¡ її \t\inun' шин \<і штіи «її кнші.кхії к»ц
ііііц.ші>піШ /т-нч >Н )({’ >р.н!ш> />//'>rті/> цента j нЬтІшіт
‘{S’ $ f‘3íl)rN = fn -S Э i ‘•'■■(/)0Vv = '«}
ДГ ') 5 HIV ILtllll.lliVll! oyo 1\,»/0ЦЦ
Stt-'ilÿ :>•”» . ,
■j/* UJUl XT3UI = (g)a
ИЪ + {Р + ЯЕ л/?)г иъ + иъ(Р+<з £ л/?) + £>.+
165 1€5 ¿£5
+ Е 5>4?№Я - Е И'аОПГ^7-^ = О,
165 А-65 ¿(!5
где Л/,° = -0?~^^;М, = -П|'1дт^5, имеет решение, заданное при t >
О, в виде вещественных, непрерывных, ограниченных и симметричных матриц Кг, УУ5 такое, что набор управлений
{и, = -еГ1дТУвх, г € 5; щ = -Я$~'<Эт\Г3,з 4 5} ■
был бы допустимым в смысле определения 1.
<
Вторая глава посвящена рассмотрению ликейко-квадрапгшых кооперативных дифференциальных игр с конечным временем окончания.
В § 2.1 поставлена задача: приведена система дифференциальных уравнений, являющаяся основным объектом исследования, определены функционалы, которые являются функциями выигрыша ш роков. Описан класс допустимых наборов управлений. Определена линейно-квадратичная дифференциальная игра с конечным временем окончания Г(0, х0,Т), начинающаяся в момент времени /. = 0 из состояния ж0 и заканчивающаяся при 4 = Т.
Рассмотрим систему дифференциальных уравнений
х = Р(£)х + + щ 4-... + ип) + /(£), (10)
с начальным условием
х(0) = х0
где ж—т— мерный вектор (ж1, ...,жп), и,—г— мерный вектор для любого г = 1^ Р(/) и 0(1)- (т х от) -и (т х 7')-матрицы соответственно, имеющие вещественные, непрерывные и ограниченные при í е [0, Т) элементы.
Предположим, что заданы функционалы
Г
7, = хт(Т)Ф,(Т)х(Т) + 1(хГАг{1)х + «^С,(0«,)*,1 = 1,
о
где А,(() и С,(<)-(т хот)- и (г х г)- симметричные матрицы соответственно, имеющие вещественные, непрерывные н ограниченные при t е [0,Т] элементы при
UdÚiAI І - 1..п: Ф,-( ИММОТрИЧПЫС МаТрШШ мри иобом І = 1....../І. МіІТрІШЬІ
С\(І) б\до\і і чигать отрицательно опреде іепішми прн побом і = 1.
Определенно 5. Набор ціцнміппііі ып)о
будім шпывить Отп/стамыл/. ir.ni
І) (гХ)п)-м<//прг/цы ЛІ,(І). имеют чсш/сшы иные, непрерывные и ограниченные при і 6 (O.Tj .и (ли mm,і dut .lidioso і —
J)itcnmrpn N,(l). pa./ верностью г. имеют ei щестоитыс, m прерывные и игра-ннчтные при І є [0,Т) лимпппм О.щ любо/о i =
ОпреДОЛПМ ПЧІРрЬ ТпффереПНИаЛЬПуіО игру.
Пусть N = -мпожесгпо пгрокоп. Игроки выбирают управления ппча
и, = М,(і) + N¡(t)x. н. осли набор управ.ччшіі
ДОГП'ППМ 1Í смысле ОПрЄДЄЛЄИИЯ 7. го игроки получают выигрыши, равные Jt. то еегъ выигрыш ¡-от игрока полагается равным
В Теореме 8 Ç2.2 сформулированы необ\однмыо и '(остаточные \словпя еутце-спюттппя равновесия по Ihniy п тире Г(1),.го,Т). Набор .міравлеші/і. являющийся равновесном по ІЬтну. бучот исполыовап к дальнейшем чля построения характеристической ф\пкцин прн решении кооперативного варианта іігрт.і Г(0,j:q,T).
Теорема 6. Дія /пол) чтобы в диффсреицча./ыюЬ игре Г(0,.tq,T) сі/іціствова-і набор i/прав. tcitaii
необходимо и достаточно, чтобы решите {0'VA, г = 1,..., íí} системы матрнч-ны.г t/jiueiH ііаі/
(И)
{u*K = M?E(t)x + N,NE(t)}, і = 1. ■■■■ ».
(121
в?Е(Т) = Ф„г = 1,...,п,
било бы продомкимо па весь промежуток [О, Т\.
В Теореме 9 § '2.3 сформулированы необходимые и достаточные условия существования набора управлений оптимального и смысле макенмюащт выигрыша коалиции при фиксированном наборе управлений, который используется "антикоалицией" .
Теорема 7. Для того чтобы существовал набор управлений
K = A/t0(i)* + JV?(i),<€5}, (14)
доставляющий лшкеимум Js, при фиксированном наборе управлений
{и, = І 5}, (15)
необходимо и достаточно, что бы решение Qs{t) уравнения
©5 + (Р + ЕЙЛТ&3 + е^р + Е+ Ел* - Е ®sQ(ct)-lQTQs = 0 (16)
]<ts j$S ■€S i€S
удовлетворяющее условию
Є5(Т) = Ефь
1 es
было продолоісимо па весь промеоісуток [0, Т]
В § 2.4 описаны правила построения решения линейно-квадратичных кооперативных дифференциальных игр с конечным временем окончания.
ПО ТЕМЕ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ СЛЕДУЮЩИЕ
РАБОТЫ:
1. Марковмш М.В. С) лниеМпо-кпатратнчпих пеантагонпсгичес кпх тпффероп-ц!м тьнмх пrpa\. Tjmiii XXXIV тнчноП конференции аспирашоп и ci\тентов "Процессы \ правления и мтоПчмиооть", 111 ta i<>. гьс- rno Санк1-Г1оюрб> ргекото \ ии-веренича. 200.5. С. -">17 - "и,
2. Марковкнп М.13. I 1оет роение с\ пораддн nmnoii характеристической фхикцнп в лппеипо-кпадратичпых дифференциальных играх. Трудт,! ХХХ\' паушои конференции aeriripaiiюн н студентов "Процессы управления н ,u roii4iinocii>". Пг(а-тслытво Санк1-Поторбур]екого ynimej)cnгота. 200-J, С'. (¡18 - GoO.
'■). MapKoriKiiii М.В. Проверка условия Л. Яш а для лннонпо-квачращчных чнф-форенцнальмых игр. Труды межд> на]>одного семинара "Теория управления и теория обобщенных рсшеппН уравнении Гамильтона-Якоби". Екатеринбург. Пгд-во Уральского \mni-ia. 200G. сгр. 2-12-218.
I. Марковкнн M.D. Условие Д.В,К. Янга .тля лшкч'Ию-гамдр.тгн'шых днфф<>-решша 1ьпых иг]). 'Груш международной конференции "Устойчивость и процессы управления". Слнкг-Г1егерб\рг. 2005. СПбГУ. НИИ ВМ и НУ Т.1. стр. ’)03-571.
■1. Марковкнп М.В. Лииенно-квл трагичные иоаптагоипотичоскне дифференциальные игры. Современные методы теории краевых мчпч. Материалы Воронежском весенней матемашческоА школы "Понтрятпнекпо чтения - XV". 1Ьда-пмьспи) Воронежский > оеупнверептег. 2001. С. 1-12,
Подписано в печать 18.09.2006.
Формат бумаги 60 х 84 1/16. Бумага офсетная.
Печать ризографическая. Уел. печ. л. 1,0. Тираж 100 экз. Заказ 3848.
Отпечатано в отделе оперативной полиграфии НИИХ СПбГУ. 198504, Санкт-Петербург, Старый Петергоф, Университетский пр.26
¿ochó А
Введение.
Глава 1. Линейно-квадратичные дифференциальные кооперативные игры с бесконечным временем окончания.
§ 1.1 Постановка задачи и определение дифференциальной игры
§ 1.2 Лемма о допустимом наборе управлений.
§ 1.3 Теорема о существовании равновесия по Нэшу.
§ 1.4 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов
§ 1.5 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов с перекрестными слагаемыми.
§ 1.6 Метод последовательных приближений.
§ 1.7 Построение решений кооперативной игры.
§ 1.7.1 Пропорциональное решение.
§ 1.7.2 Решения, основанные на построении характеристической функции.
§ 1.8 Процедура распределения дележа.
§ 1.9 Условие Янга.
§ 1.10 Построение супераддитвной характеристической функции
Глава 2. Линейно-квадратичные дифференциальные кооперативные игры с конечным временем окончания
§ 2.1 Постановка задачи и определение дифференциальной игры
§2.2 Теорема о существовании равновесия по Нэшу.
§ 2.3 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов
§2.4 Построение решений кооперативной игры.
§2.4.1 Пропорциональное решение.
§2,4.2 Решения, основанные на построении характеристической функции.
Актуальность темы. Существенным разделом математической теории игр является теория дифференциальных игр. Она имеет большое количество приложений, так как основным объектом исследования этой теории выступает математическая модель конфликтно-управляемого процесса, который развивается непрерывно с течением времени. Именно благодаря этому свойству, управление процессом оперативно реагирует на изменения системы.
Основным инструментом исследования построенной математической модели является система дифференциальных уравнений, которая описывает динамику развития процесса во времени. Цели, преследуемые игроками, описываются с помощью функций выигрыша, которые имеют различный вид, что позволяет описать множество конфликтно-управляемых процессов в терминах теории дифференциальных игр (см.[26])
Одной из первых работ по теории дифференциальных игр является [1]. В работе были предложены общие подходы к решению дифференциальных игр; одним из таких подходов является решение основного уравнения дифференциальных игр, которое часто называют уравнением Айзекса-Беллмана.
В развитие теории дифференциальных игр свой вклад в различное время внесли Красовский Н.Н., Понтрягин Л.С., Зубов В.И., Субботин
А.И., Никольский М.С., Петросян JI.A, Данилов Н.Н., Томский Г.В., Basar Т., Olsder G.J.,Yeung D. W. К. Большинство работ по дифференциальным играм посвящено некооперативным играм, в которых в качестве решения используется равновесие по Нэшу (неантагонистический случай) и ситуация равновесия (антагонистический случай) (см.[9, 10, 18,. 19, 20, 21, 28, 31, 32, 36]).
Развитие исследования решения линейно-квадратичных дифференциальных игр связано с выходом в свет работы [36]. В этой работе большое внимание уделено исследованию бескоалиционных линейно-квадратичных дифференциальных игр многих лиц, а также играм двух лиц. Дальнейшие работы направлены на более детальное изучение таких игр с дополнительными ограничениями. Для этих частных случаев выведены условия существования решений бескоалиционных игр в различных классах допустимых управлений(програмных, синтезирующих), также рассматриваются вычислительные аспекты построения решения (см. [4, 34, 35, 37, 38, 40, 41]). Более детально исследовано поведение решения линейно-квадратичных дифференциальных играх в скалярном случае (см. [39, 42, 43]). В [44, 45] показаны примеры применения линейно-квадратичных дифференциальных игр в экономической сфере.
Зачастую, самой постановкой многих задач, формализуемых как дифференциальные игры, диктуется необходимость объединения игроков в коалиции, поэтому исследование кооперативных дифференциальных недействительно актуальная задача (см.[7, 25, 29, 49, 50]).
В кооперативной теории дифференциальных игр изначально предполагается, что игроки, действуя сообща, выбирают управления, огггимальные в смысле максимизации суммарного выигрыша, и вопрос заключается в определении "справедливого" (оптимального) дележа этого суммарного выигрыша. В классической статической теории кооперативных игр сформулированы многочисленные принципы оптимальности (С-ядро, вектор Шепли, NM-решение) (см. [17, 30, 48]). Однако, попытки переноса известных в статической теории принципов оптимальности на различные виды дифференциальных игр без дополнительного исследования невозможны, так как почти всегда могут привести к выбору заведомо не реализуемых решений. Это связано с потерей динамической устойчивости (состоятельности во времени) принципов оптимальности. Это обстоятельство было впервые обнаружено Петросяном J1.A. (см. [22 ,23, 24, 26, 27]). Им же предложен метод регуляризации, основанный на построении процедуры распределения дележа (ПРД), приводящий к динамически устойчивым решениям. Этот метод впервые применяется для регуляризации решений линейно-квадратичных кооперативных дифференциальных игр.
Основной целью работы является нахождение решений линейно-квадратичных кооперативных дифференциальных игр с бесконечным и конечным временем окончания. Построение с этой целью характеристической функции различных видов в классе стратегий, гарантирующих экспоненциальную устойчивость реализуемых траекторий, для игр с неограниченной продолжительностью. Построение состоятельных во времени (динамически устойчивых) оптимальных дележей и соответствующих им ПРД. Вывод необходимых условий, гарантирующих неубыточность кооперативного поведения при неблагоприятных сценариях развития игры (условие Д.В.К. Янга) для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания.
Научная новизна. В работе впервые построены основы теории линейно-квадратичных кооперативных дифференциальных игр как с конечным, так и с бесконечным временем окончания. Это потребовало выработки новых подходов для построения характеристической функции и решений, получаемых на её основе. Предложена новая модификация метода последовательных приближений В.И. Зубова (см.[6]) для нахождения управлений оптимальных в смысле максимизации суммарного выигрыша игроков, входящих в коалицию. Произведена регуляризация классических принципов оптимальности кооперативной теории применительно к данной задаче, исследованы свойства решений.
Практическая ценность. Результаты, полученные в диссертационной работе, могут быть положены в основу теории линейно-квадратичных кооперативных дифференциальных игр. Практическая ценность работы обусловлена областью применения линейно-квадратичных дифференциальных игр. Такие игры применяются при математическом моделировании взаимодействия подвижных объектов в условиях конфликта технических и технологических процессов, а также при моделировании развития сложных социально-экономических систем. Поэтому сферу применения полученных результатов можно оценить описанной областью применения линейно-квадратичных дифференциальных игр, в которой имеет содержательный смысл кооперации игроков.
Основные положения, выносимые на защиту:
1. вывод необходимых и достаточных условий для существования набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений 11 антикоал иции" для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания при дополнительном условии экспоненциальной устойчивости реализуемых траекторий движения,
2. построение метода последовательных приближений для определения набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалиции" для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,
3. построение супераддитивной характеристической функции для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,
4. построение состоятельного во времени дележа и процедуры распределения дележа, которая соответствует этому дележу, и определение необходимых условия для выполнения условия Д.В.К. Янга для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,
5. вывод необходимых и достаточных условий для существования набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалиции" для линейно-квадратичных кооперативных дифференциальных игр с конечным временем окончания.
Апробация работы. Основные результаты были доложены на семинарах кафедры математической теории игр и статистических решений, на семинаре кафедры теории управления, семинарах Центра теории игр, иа Международном семинаре "Теория управления и теория обойденных решений уравнений Гамильтона-Якоби" (Екатеринбург, 2005), на Международной конференции "Устойчивость и процессы управления" (Санкт-Петербург, 2005), на "Summer School on Game Theory in Computer Science" (Aarhus, Denmark, 2006), на семинаре "Российско-финской летней школы "Динамические игры и многокритериальная оптимизация" (Петрозаводск, 2006), на семинаре Воронежской весенней математической школы "Понтрягинские чтения-XV" (Воронеж, 2004), XXXIV научной конференции "Процессы управления и устойчивость" (Санкт-Петербург, 2003 г.), XXXV научной конференции "Процессы управления и устойчивость"(Санкт-Петербург, 2004 г.).
По материалам диссертации опубликованы работы:[12]-[16].
Структура и объем работы. Диссертация состоит из введения, двух глав, разбитых на параграфы, приложения и списка используемой литературы.
1. Айзеке Р. Дифференциальные игры.-М.:Мир, 1967.
2. Григоренко H.JI. Дифференциальные игры преследования несколькими объектами.-М.: Изд-во МГУ, 1983.
3. Дзюбенко Г.Ц. Линейные дифференциальные игры с запаздыванием информации.-Кибернетика, 1973, №6, с. 81-86.
4. Жуковский В.А., Чиркий А.А. Линейно-квадратичные дифференциальные игры. Киев: Наукова думка, 1994.
5. Зенкевич Н.А. Дифференциальные игры с дискретным поступлением информации одному из игроков,- В кн.: Вопросы механики и процессов управления. Вып. 2. Управление динамическими системами. Л.: Изд-во Ленингр. ун-та, 1978, с. 78-90.
6. Зубов В.И. Лекции по теории управления.Главная редакция физ.-мат. литературы изд-ва "Наукаи,М.,1975.
7. Клейменов А.Ф. К кооперативной теории бескоалиционных позици-оныых дифференциальных игр // Докл. АН СССР, 1990. Т. 32. №1. С.32-35.
8. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993.
9. Красовский Н.Н. Игровые задачи о встречи движений.-М.: Наука, 1970.
10. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
11. Ляпунов A.M. Общая задача об устойчивости движения. М.,Гостехиздат, 1950.
12. Марковкин М.В. О линейно-квадратичных неантагонистических дифференциальных играх. Труды XXXIV научной конференции аспирантов и студентов "Процессы управления и устойчивость". Издательство Санкт-Петербургского университета, 2003. С. 547 551.
13. Марковкин М.В. Условие Д.В.К. Янга для линейно-квадратичных дифференциальных игр. Сборник трудов международной конференции "Устойчивость и процессы управления", Санкт-Петербург, 2005, СПбГУ, НИИ ВМ и ПУ, Т.1, стр. 563-571.
14. Нейман Д., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970, 709 с.
15. Никольский М.С. Линейные дифференциальные игры преследования при наличии запаздываний. Диф. уравнения, 1972, т. 8, №2, с. 260-267.
16. Петросян Л .А. Дифференциальные игры преследования. JL: Изд-во Ленингр. ун-та, 1977. 224 с.
17. Петросян Л.А. Дифференциальные игры с неполной информацией.-Докл. АН СССР, 1970, т. 195, №3, с. 558-561.
18. Петросян Л.А. Дифференциальные игры с неполной информацией.-В кн.: Успехи теории игр. Вильнюс, 1973, с. 227-233.
19. Петросян JI. А. Устойчивость решений в дифференциальных играх со многими участниками // Вестник Ленинградского унив-та, 1977, сер. 1, вып. 4, № 19, с. 46-52.
20. Петросян Л.А. Данилов Н.Н. Устойчивость решений неантагонистических дифференциальных игр с трансферабельными выигрыша-ми//Весн. Лениг. ун-та.Сер.1. 1979. Т.1.№1.
21. Петросян Л.А. Данилов Н.Н. Кооперативные дифференциальные игры.- Томск: Изд-во ТГУ, 1985.
22. Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. М.: Высшая школа, 1998, 300 с.
23. Петросян Л. А., Кузютин Д. В. Игры в развернутой форме: оптимальность и устойчивость. СПб.: Изд-во С.-П. университета, 2000, 292 с.
24. Петросян Л.А., Томский Г.В. Дифференциальные игры с неполной информацией.- Иркутск: Изд-во Иркут. ун-та, 1984-188 е.
25. Петросян Л. А., Шевкопляс Е. В. Кооперативные дифференциальные игры со случайной продолжительностью // Вестник С.-П. гос. университета, СПб.: Изд-во С.-П. гос. университета, 2000, сер. 1, вып. 4, с. 18-23.
26. Печерский С. Л., Яновская Е. Б. Кооперативные игры: решения и аксиомы. СПб.: Изд-во Европ. унив-та в С.-Петербурге, 2004, 459 с.
27. Понтрягин Л.С. Линейная дифференциальная игра убега-ния//Труды МИАН СССР, 1971. Т. 112. С.30-63.
28. Понтрягин JI.С. Линейные дифференциальные игры преследования. Математический сборник. Новая серия, 1980. Т. 112. Вып. 3. С.307-330.
29. Смирнов Е.Я. Стабилизация программных движений.СПб: Издательство С.-Петербургского университета, 1997. 308 с.
30. Abou-Kandil, Н., Freiling, Bertrand, P., Analytic solution fos a class of linear-quadratic open-loop Nash games, International Journal of Control 43(1986), 997-1002.
31. Abou-Kandil, H., Freiling, G., Jank, G., 1993. Necessary a nd sufficient conditions for constant solutions of coupled Ricatti equations in Nash games, System and Control Letters 21, 295-306.
32. Basar Т., Olscler G.J. Dynamic noncooperative game theory. London: Academic Press, 1982.
33. J.C. Engwerda. An equivalence in linear-quadratic theory. Automatica 39(2003)355-359.
34. J.C. Engwerda. Computational aspects of the open-loop Nash equilibrium in linear quadratic games. Journal of Economic Dynamics and Control, 22(1998) p. 1487-1506.
35. J.C. Engwerda. Feedback Nash equilibrium in the scalar infinite horizon LQ-games. Automatica 36(2000) p. 135-139.
36. J.Engwerda "LQ Dynamic Optimization and Differential Games",Wiley, 2005
37. J.C. Engwerda. On the open-loop Nash equilibrium in LQ-games. Journal of Economic Dynamics and Control, 22(1998) p. 729-762.
38. J.C. Engwerda. Solving the Scalar Feedback Nash Algebraic Riccati Equations: Eigenvector Approach.IEEE TRANSACTIONS ON AUTOMATIC CONTROL. Vol. 45, NO. 12, May 2000.
39. J.C. Engwerda. The Solution of the N— Player Scalar Feedback Nash Algebraic Riccati Equations, IEEE TRANSACTIONS ON AUTOMATIC CONTROL. Vol. 45, NO. 12, December 2000.
40. J.C. Engwerda, Bas van Aarle, J.E.J. Plasmans. Cooperative and non-cooperative fiscal stabilization policies in the EMU, Journal of Economic Dynamics and Control, 26(2002) p. 451-481.
41. J.C. Engwerda, Bas van Aarle, J.E.J. Plasmans. The (in)finite horizon open-loop Nash LQ game: An application to EMU, Annals of Operation Research 88(1999)251-273
42. Leon A. Petrsojan. The Shapley Value for Differential Games,Annals of the International Society of Dynamics Games, Volume3, 410-417.
43. Leon Petrosjan, Georges Zaccour, Time-Consistent Shapley Value Allocation of Pollution Cost Reduction, Journak of Economic Dynamics & Control, 27(2003), 381-398.
44. Shapley, Lloyd S., "A value for n-person Games "in Contributions to the theory of games, vol.11, H.W.Kuhn and A.W. Tucher, editors, Ann.Math. Studies 28, Princeton University Press, Princeton, New Jersey,1953.
45. Yeung D.W. К., Petrosyan L.A. Cooperative Stochastic Differential Games. Springer Series in Operations Research and Financial Engineering, 2005.
46. Yeung D.W. K., Petrosyan L.A. Subgame consistent cooperative solutions in stochastic differential games // Journal of Optimization Theory and Applications, 2004, vol. 120, no. 3, pp. 651-666.