C-ядро в кооперативных играх группового преследования тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Панкратова, Ярославна Борисовна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
2012 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Диссертация по математике на тему «C-ядро в кооперативных играх группового преследования»
 
Автореферат диссертации на тему "C-ядро в кооперативных играх группового преследования"

САНКТ-ПЕТЕРВУР1 СКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ПАНКРАТОВА Ярославна Борисовна

С-ЯДРО В КООПЕРАТИВНЫХ ИГРАХ ГРУППОВОГО ПРЕСЛЕДОВАНИЯ

Специальность 01.01.09 - дискретная математика и математическая кибернетика.

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических паук

На правах рукописи

2 9 НОЯ 2012

Санкт-Петербург 2012 г.

005055785

Работа выполнена на кафедре Математической теории игр и статистических решений факультета Прикладной математики - процессов управления Санкт - Петербургского Государственного Университета.

кандидат физико-математических наук, доцент Тарашнина Светлана Ивановна

доктор физико-математических паук, профессор Клейменов Анатолий Федорович, Институт математ ики и механики УрО РАН

кандидат физико-математических наук, Зятчин Андрей Васильевич, Высшая школа менеджмента, Санкт-Петербургский государственный университет1

Институт прикладных математических исследований Карельского научного центра РАН (г. Петрозаводск)

Защита состоится "19" декабря 2012 г. в 17:00 час. на заседании диссертационного совета Д 212.232.59 по защите диссертаций на соискание ученой степени кандидата физико-математических наук при Санкт-Петербургском государственном университете по адресу: 190034, Санкт-Петербург, В.О., Средний пр., д. 41/43, ауд. 511.

С диссертацией можно ознакомиться в библиотеке СПбГУ им. A.M. Горького по адресу: Санкт-Петербург, Университетская наб., 7/9.

Автореферат разослан " ^ " ftOcßSj^ 2012 г.

Ученый секретарь диссертационного совета, доктор физ.-мат. наук, профессор

Научный руководитель:

Официальные оппоненты:

Ведущая организация:

В. Д. Ногин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Теория дифференциальных игр представляет собой интенсивно развивающийся раздел современной математики. Ее развитие, в частности, обусловлено расширением спектра исследуемых задач и сфер их приложения: от задач военного характера к задачам из экономики, механики, биологии и других областей жизнедеятельности человека. В классической постановке игры преследования описывают антагонистические конфликтные ситуации.

Антагонистические дифференциальные игры преследования впервые были подробно описаны в монографии Р. Айзекса, изданной в 1965 году и переведенной на русский язык в 1967 году. Среди работ этого периода следует также отметить работы В. Флеминга и JI. Берковича.

Основополагающий вклад в развитие теории дифференциальных игр внесли H.H. Красовский и JI.C. Понтрягин. Также фундаментальные результаты в области теории дифференциальных игр преследования получены в работах Э.Г. Альбрехта, М. Барди, Т. Башара, Р. Беллмана, А. Брайсона, H.JI. Григоренко, Р.В. Гам-крелидзе, В.И. Жуковского, М.И. Зеликина, А.Ф. Клейменова, А.Н. Красовского, A.B. Кряжимского, В.Н. Лагунова, O.A. Малафеева, A.A. Меликяна, Е.Ф. Мищенко, М.С. Никольского, Г. Ольсдера, Ю.С. Осипова, H.H. Петрова, JI.A. Петросяна, Б.Н. Пшеничного, А.И. Субботина, Г.В. Томского, А. Фридмана Ф.Л. Черноусько, A.A. Чикрия, C.B. Чистякова и многих других.

Неантагонистические дифференциальные игры преследования являются в настоящее время недостаточно изученными. Здесь следует отметить работу Л.А. Петросяна и В.Д. Ширяева, в которой впервые задача преследования формализована как неантагонистическая дифференциальная игра преследования с одним преследователем и двумя убегающими на плоскости, получившая свое развитие в работах С.И. Тарапгаиной.

Принципиальное отличие неантагонистических игр от антагонистических заключается в возможности сообщения или сговора между игроками, то есть в возможности образования коалиций. Таким образом, проблема исследования целесообразности кооперации игроков в игре группового преследования является также актуальной задачей и позволяет "адаптировать" игры преследования к решению экономических задач.

Основа теории кооперативных дифференциальных игр была построена

Л.А. Петросяном, в развитие которой в различное время свой вклад внесли H.H. Данилов, Дж. Заккур, В.В. Захаров, H.A. Зенкевич, В.И. Жуковский, С. Йор-генсен, А.Ф. Клейменов, А.Ф. Кононенко, Дж.А. Филлар, С.В Чистяков, Д.В.К. Янг и многие другие.

В диссертации рассматриваются два класса неантагонистических дифференциальных игр группового преследования, для исследования которых используются как некооперативный, так и кооперативный подходы. Некооперативный подход состоит в формализации процесса преследования как неантагонистической игры и описания в ней множества равновесных по Нэшу ситуаций. Обычно в играх преследования под захватом подразумевается уничтожение противника, и такие игры находят широкое применение в военном деле. Однако, задачи принятия решений в экономике и других областях человеческой деятельности предполагают наличие многих участников, интересы которых не являются строго противоположными. В диссертационной работе под захватом понимается встреча игроков, например, с целью передачи друг другу некоторой информации или товара. Кооперативный подход состоит в объединении всех игроков (преследователей и убегающих) в единую коалицию с целью получения максимального суммарного выигрыша и последующего распределения его между игроками. Осуществляется построение С-ядра как решения кооперативной игры преследования. Для одного из рассматриваемых классов игр преследования доказывается динамическая устойчивость С-ядра. Свойство динамической устойчивости, введенное Л.А. Петросяном, означает, что игроки в каждый момент игры не имеют причин отклоняться от первоначально выбранного "оптимального" поведения.

Основной целью работы является исследование двух классов неантагонистических игр группового преследования на плоскости: с одним убегающим и тп преследователями и с одним преследователем и т убегающими, с использованием некооперативного и кооперативного подходов. В диссертационной работе решается задача нахождения некооперативных (в форме равновесия по Нэшу) и кооперативных (в форме С-ядра) решений рассматриваемых игр, построения динамически устойчивого С-ядра.

Научная новизна. В диссертационной работе впервые предложен новый подход к решению неантагонистических игр группового преследования п лиц, состоящий в возможности кооперации игроков; для неантагонистической игры преследо-

вания с одним убегающим и т преследователями построено равновесие по Нэшу и доказано его существование для любых начальных местоположений игроков; определен класс кооперативных игр преследования с одним убегающим и ш преследователями и дано аналитическое описание С-ядра для случая максимального числа крайних точек, доказана его непустота и динамическая устойчивость; для неантагонистической игры простого преследования с одним преследователем и ш убегающими введено понятие области эффективности стратегии наказания преследователя; определен класс кооперативных игр преследования с одним преследователем и тп убегающими, построено С-ядро и доказана его непустота;

Практическая ценность. Полученные в диссертации результаты представляют теоретический и практический интерес. Кооперативные дифференциальные игры преследования являются удобными математическими моделями для описания процессов, происходящих в экономике, менеджменте и прочих сферах человеческой деятельности, например, для описания "динамической версии" задачи о коммивояжере.

Основные положения, выносимые на защиту:

1. Найдено множество ситуаций равновесия по Нэшу в неантагонистической игре преследования с одним убегающим и т преследователями.

2. Для неантагонистической игры преследования с одним убегающим и т преследователями предложена формализация в виде кооперативной игры группового преследования с трансферабельными полезиостями.

3. Доказано, что в кооперативной игре группового преследования с одним убегающим и т преследователями существует непустое С-ядро для любых начальных местоположений игроков.

4. Получено аналитическое описание С-ядра для случая максимального числа крайних точек в кооперативной игре группового преследования с одним убегающим и т преследователями.

5. Доказана динамическая устойчивость С-ядра в кооперативной игре группового преследования с одним убегающим и т преследователями.

6. Для неантагонистической игры простого преследования с одним преследователем и т убегающими предложена формализация в виде кооперативной

игры группового преследования с трансферабельными полезностями.

7. Доказано, что в кооперативной игре группового преследования с одним преследователем и 771 убегающими существует непустое С-ядро для любых начальных местоположений игроков.

Апробация работы. Основные результаты работы представлены на семинарах кафедры математической теории игр и статистических решений Санкт-Петербургского государственного университета, на семинарах Центра теории игр, на 3-й международной конференции "Spain Italy Netherlands Meeting on Game Theory" (Мадрид, 2007), на 2-й, 3-й и 4-й Международных конференциях "Game Theory and Management" (Санкт-Петербург, 2008, 2009, 2010), на Всероссийской конференции "Устойчивость и процессы управления", посвященной 80-летию со дня рождения В.И. Зубова (Санкт-Петербург, 2010), на 24-й Европейской конференции по исследованию операций (Лиссабон, 2010), на 25-й Европейской конференции по исследованию операций (Вильнюс, 2012), на семинаре института прикладных математических исследований Карельского научного центра РАН (г. Петрозаводск).

По материалам диссертации опубликованы работы [1-11].

Структура и объем работы. Диссертация состоит из введения, двух глав, разбитых на параграфы, заключения, списка используемой литературы и двух приложений. Общий объем диссертации 131 страница. Список используемой литературы включает 61 наименование. Работа содержит 27 рисунков и 1 таблицу.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, обозначена цель исследований, дан краткий обзор литературы по теме диссертации, сформулированы положения, выносимые на защиту, показаны теоретическая ценность и практическая значимость представленных в работе материалов.

В первой главе рассматривается неантагонистическая игра группового преследования с одним убегающим и т преследователями. Формулируется задача, определяются классы стратегий и выигрыши игроков, строится множество ситуаций равновесия по Нэшу, выводятся аналитические формулы для вычисления координат точек пересечения окружностей Аполлония. Описывается кооперативный

вариант игры, доказывается суперадцитивность характеристической функции построенной игры. Строится С-ядро игры, доказывается его непустота для любых начальных местоположений игроков и доказывается его динамическая устойчивость.

В § 1.1 вводится определение игры простого преследования с одним убегающим и т преследователями.

Рассмотрим игру простого преследования, в которой участвуют т преследователей Рь ..Рт и один убегающий Е. Преследование происходит на плоскости. Игроки имеют ограниченные по модулю скорости. Максимальные скорости игроков обозначим через аь ..., ат и /3, соответственно, причем /3 < тт{аь ..., ат}. Игра начинается в момент времени ¿0 = 0 из положений Р° = .., Рг° = Е° = 2°. Каждый игрок в момент Ь > 0 выбирает направление своего движения (вектор скорости) из своего множества допустимых управлений. Множества допустимых управлений игроков определяются следующим образом

иР, = { иР, = (и),., и\) : (и),.)2 + {и\)2 < а]}, з = Т^,

иЕ = { иЕ = К, 4) : К)2 + («|)2 ^ И2).

Игроки Р1,...,Ртч Е двигаются на плоскости с ограниченными скоростями, выбирая в каждый момент времени параметры ир, 6 1)Рг,..., иРт 6 иРт и иц е и е-

Движение игроков описывается следующей системой дифференциальных уравнений _

г, = ир3, и/>. Е иР], з = 1,т, ^

г = иЕ, ив е иЕ с начальными условиями

г1(0) = *°, ..., zm(0) = z°m, *(0) = г°. (2)

Обозначим через Р{ = Р,ЕП = Е1 = ?} местоположения игроков в

произвольный момент f при движении из начальных точек 2?, ..., г°п, Будем рассматривать случай полной информации, то есть игрокам в каждый момент времени í при выборе направления своего движения известно время £ и фазовые состояния — свое и остальных игроков. При этом предполагается, что преследователи РЬР2,... ,Ртв каждый текущий момент £ обладают информацией о выборе вектора и'Е убегающим Е в этот же момент. В этом случав говорят, что игрок Е дискриминирован.

Под стратегией игрока будем понимать функцию, зависящую от времени и текущих местоположений всех игроков. Другими словами, стратегией игрока Е является функция ив(1, ..., г1т1 г'), удовлетворяющая системе (1) с начальными условиями (2). Множество стратегий убегающего Е обозначим через Ые- Из условия дискриминированности игрока Е следует, что стратегия преследователя Pj — это функция, зависящая от времени, местоположений игроков и вектора скорости убегающего Е, т.е. ир^, ..., г', и^). Обозначим через Ыр1 множество допустимых стратегий игрока = 1, то).

Определим момент окончания игры. Будем считать, что убегающий пойман преследователем Р,, если местоположения игроков Р^ и Е в некоторый момент времени совпадут. Тогда время поимки преследователем Р, убегающего Е определяется следующим образом

..., 2°, иР1 (•),..., «/>„(•). ив(0) = : 2] = .7 = М"-Если такого í не найдется, то будем считать ¿р3 = +оо.

Пусть иР,(-),..., иРт(-),иЕ{-)) = .•., £рт}. Здесь гв — пер-

вый момент встречи убегающего Е с одним из преследователей. Игра заканчивается в момент времени Ье-

Выигрыш убегающего Е определим как время встречи с первым из преследователей, умноженное на число 7 (7 > 0) — "цену" единицы времени. Тогда

КЕ(г°;..-, Л «*(•), ■ • •,«*.(■),«в(-)) = (3)

= 7 • (•),..., «а.(•), «*(•))■

Выигрыш игрока Р3 (] = 1 ,т) положим равным

г», иР1 (•),..., ид. (■), «*(•)) = = -7 " ^(г?>■ • •.(О.-- -."Рт(О.Ив('))-Рассматриваемая игра преследования может быть формализована в виде неантагонистической игры в нормальной форме ..., 2°) = {/V, где N = {Рь ..., Рт, Е} — множество игроков, ¿^ — множество допустимых стратегий г-го игрока и К{ - функция выигрыша г-го игрока (г 6 М), определяемая формулами (3) и (4).

В § 1.2 определяются координаты точек пересечения окружностей Аполлония и доказываются некоторые вспомогательные результаты.

Для нахождения решения построенной игры преследования важно знать координаты точек пересечения соответствующих окружностей Аполлония. Множество всех точек пересечения окружностей Аполлония в игре Г(г°,..., 2^, 2°) запишем в виде А = {гу}, г ^ j, I,] — 1 ,т, при этом через ¿у будем обозначать наиболее удаленную от Е точку пересечения окружностей Аполлония и А(г°,г°).

Зафиксируем момент времени Ь и построим подыгру ..., г1т, г1), которая отличается от первоначальной игры только начальными местоположениями игроков. В работе выводятся формулы для вычисления координат точек пересечения окружностей Аполлония в произвольный момент времени £ > 0.

Для определения траекторий движения точек пересечения окружностей Аполлония в процессе преследования доказывается следующая лемма.

Лемма 1 Для любой подыгры Т(г{,..., г^, г1) игры преследования Г (г?,..., 2°) выполняется равенство

|| (!"£)■ II *°-*ц||,

где — точка пересечения окружностей Аполлония Л(2°,2°) и А(г°,г°), г ф

= 1 ,т, и г' лежит на отрезке, соединяющем точки 2° и 2у, т.е. расстояние от убегающего Е в момент времени t > 0 до любой точки пересечения окружностей Аполлония линейно по г зависит от расстояния между убегающим в начальный момент времени и той же точкой Аполлония.

В § 1.3 находится некооперативное решение вышеуказанной игры в форме равновесия по Нэшу.

Приведем теорему существования ситуации равновесия по Нэшу в построенной неантагонистической игре преследования Г^,..., 2°„, 2°).

Теорема 1 В игре Г(г?,..., г°) существует ситуация равновесия по Нэшу (и'Рг,..., и"Рт,и'Е), которая предписывает игрокам следующее поведение:

• игрок Е движется прямолинейно с максимальной скоростью в точку 2, где г = а^тах || 2° - 2у ||, г г,] = 1 ,т,

_ точки пересечения окружностей Аполлония, которые попадают в пересечение всех кругов Аполлония;

О

• игроки Р\,..., Рт используют стратегию параллельного сближения.

В § 1.4 строится кооперативный вариант игры группового преследования и доказывается, что характеристическая функция построенной кооперативной игры является супераддитивной.

Каждой неантагонистической игре Г(гУ,..., г^, z°) поставим в соответствие некоторую кооперативную игру в форме характеристической функции ,..., z°). Предположим, что каждый преследователь использует стратегию параллельного сближения. Характеристическую функцию игры определим следующим образом:

||20 - 2о|| _

v{{Ph}, Z«, = -7 • О—JL J1 = i>m,

a3 1 — p

v({Ph,E},z°,...,z^,z0) = 0, л = T~m,

»({^.p*},*?,...,*»,*0) = -27- i ji,П = ji ф л,

v{{Ph,Ph,E), .....z°m, z°) = -7 • li2" = ii.J'a = Л * h,

v{{Ph .....}, z?,..., 2», z°) = -(m - 1)7 • "г = -(m - Ш?,..,^,

jl, • • • , jm-l = lim, jl • • • Ф jm-l,

v{{Ph, Ph,..., Pjm_t, E}, z°,...,z°m,z0) = -(m- 2)7 • H2" И = _(m - 2)5?..^..,,

jl,... , jm-l = 1, m, jl Ф . . . ф jrn-1,

v({Pu..., Pmh 4, • • •, *S., = ~m7 • l|2"~211 = -mg0,

v({Pu. ..,Pm, E], z°,..., z°m,z°) = -(m - 1)7 • llf^fi = -(m - 1)<Л

(5)

где

'3132 = argmin ||z° - z||, ji,j2 = l,m, ii ^ j2,

.....jm_t = arg min |[z° - z|(, jь ..., jm_i = l,m, л ^ ... ф jm-l,

zaa(Ahn...nAim_1)

z= argmin ||z° —z||, z€d(Ain...riAm)

= arg шах ||z° - z||, j'i, J2 = l,m, zeA^nAfr

2,-,...;m-i = argmax ||z° - z|| , j 1,... ,jm-1 = 1 ,m, j\ ф . ■. ф jm-1.

2 = argmax ||z° — z||, 2еЛгП...ПДт

через 9(ЛЛ П ... Л обозначается граница множества Ai П ... П Ат.

Под кооперативным поведением понимается поведение, которое предполагает движение всех игроков с максимальной скоростью в точку z — ближайшую к начальному местоположению игрока Е точку, лежагцую на границе множества пересечения всех кругов Аполлония.

Определение 1 Пару (N, v(S; z°u ..., z°m, z°), 5 С N), где N = {Pit..., Pm, E} -множество игроков и» — характеристическая функция, определяемая формулами (5), будем называть кооперативной игрой преследования или ТП игрой, соответствующей игре Г(г?,..., z°), и обозначать Г„(г?,..., г®,, z°).

Теорема 2 В игре ..., характеристическая функция v, определяе-

мая формулами (5), является супераддитивной.

В § 1.5 строится решение кооперативной игры в форме С-ядра и доказывается его непустота. Получено аналитическое представление С-ядра для случая максимального числа крайних точек.

В качестве решения кооперативной игры преследования Г„(zj1,..., z{J,, z°) рассматривается С-ядро Cv(zf,... z°). Главным недостатком этого решения является тот факт, что оно не всегда реализуемо, т.е. может оказаться пустым. Доказывается, что С-ядро для игры r„(zj,..., zjj,, z°) непусто для любых начальных местоположений игроков.

Теорема 3 В кооперативной дифференциальной игре преследования Г„(г°,..., существует непустое С-ядро для любых начальных местополо-

жений игроков.

В § 1.6 доказывается динамическая устойчивость С-ядра.

В динамической игре существование непустого С-ядра в начальный момент времени не является достаточным для того, чтобы считать С-ядро приемлемым решением. В процессе движения в каждый текущий момент времени t игроки

попадают в некоторую подыгру со своими начальными местоположениями и продолжительностью. Это означает, что с течением времени изменяются условия конфликта и возможности участвующих в нем сторон, и выбранное изначально решение может перестать отвечать их интересам.

Теорема 4 В кооперативной дифференциальной игре преследования ..., г°) С-ядро является динамически устойчивым.

Для доказательства динамической устойчивости С-ядра используется аналитическое представление С-ядра, построенного для случая максимального числа крайних точек. С-ядро в игре Г„(г?,..., г^, г°) представляет собой выпуклую линейную оболочку следующих дележей:

г,1 = (-9°,-<Л-..,-<Л-гЛ<?0),

Г1т = 9*1 —<?*> • • • > ~9*> —9°>9°)>

гГ+1 = 9?! ~9*1 • • • > ~9*1 —9*>9?)'

тГ+2 = (—9*> • • • > ~9*1 —9*>9г)>

П2т = (-9',-9',---,-9',-д°т,-90т),

г)2т+1 = (-9?, 9?-29°,.--,-9*,-9*. 29°-9*),

^Зт—1 = (-д°,-д-,...,-д-,д<{-2д0,2д0-д-),

Т>3т = (9°2 -29°, -92°- •••,-9*, -9*, 29° -9*),

Чт'+2 = (9° -29°, -9*. •••,-9*.29°-9*),

В § 1.7 рассматриваются примеры, иллюстрирующие полученные результаты. Во второй главе рассматривается неантагонистическая игра группового преследования с одним преследователем и т убегающими.

В §2.1 вводится определение неантагонистический игры простого преследования с одним преследователем и т убегающими.

Рассмотрим неантагонистическую игру простого преследования, в которой участвуют преследователь Р и убегающие Е1,...,Ет. Игра происходит в плоскости, движения игроков простые. Будем считать, что игроки Е\,..., Ет дискриминированы, т. е. преследователь в каждый момент времени знает направления движения (векторы скоростей) убегающих игроков в этот же момент времени. Движение игроков начинается в момент времени 4 = 0 из начальных положений г°Р, ..., Пусть а — максимальная скорость преследователя Р, /3; — максимальная скорость убегающего Е{ (г = 1, т), причем а > тах /?;. Обозначим через Е\ = г\ — местоположение убегающего Е, в момент времени а через Рь = хьР — местоположение преследователя в момент времени t, t > 0.

Движения игроков описываются следующей системой дифференциальных уравнений

¿Р = Ир, ир е иР,

_ (6)

= иБ(, иЕ, £ иЕи г = 1,тп,

с начальными условиями

гР(0)=г°р, 2,(0) = г» » = Т^Г, (7)

где гр, г1,...,гт е К2. Множества допустимых управлений 17р, UEi имеют следующий вид

иР = {иР = (и},, и%) : (и),)2 + (и2РУ = а2},

иЕ< = = , и%) : (и^)2 4- (и2,)2 = , г =

Рассматривается игра с полной информацией, т.е. каждый из участников знает местоположения всех остальных игроков в каждый текущий момент времени. Кроме того, преследователю известны направления движения убегающих игроков в текущий момент времени.

Стратегией убегающего Е, является функция иЕ^, Зр, г[,..., удовлетворяющая системе (6) с начальными условиями (7). Обозначим через Ыщ множество допустимых стратегий игрока Е{, i — 1 ,тп. Стратегию преследователя Р определим как функцию времени, местоположений всех игроков и векторов скоростей убегающих, т.е. как функцию ир(4, гР, г\,..., и^,..., и^т).

Далее поясним, как происходит игра. Игрок Р в начальный момент времени диктует убегающим ..., Ет определенный способ поведения и выбирает порядок очередности встреч с убегающими. Для этого он фиксирует некоторый

порядок и вычисляет общее время преследования, учитывая то, что убегающие используют предписанное поведение. Затем игрок Р последовательно преследует убегающих, используя П-стратегию, в соответствии с выбранным порядком. При этом Р может однократно изменить порядок преследования в случае, если какой-нибудь убегающий выбирает направление своего движения, отличное от предписанного ему преследователем. Таким образом, меняя порядок преследования, игрок Р наказывает отклонившегося игрока. Если отклоняется несколько убегающих одновременно, то наказывается произвольный игрок из группы отклонившихся, выбранный, к примеру, случайным образом.

Обозначим множество всех возможных порядков преследования через П. Введем определение стратегии наказания преследователя Р.

Определение 2 Будем говорить, что тройка и}, = (ж,иР,р) называется стратегией наказания преследователя Р, где

• 1г(г°р, 2?,..., гат, иЕ,, • • •, иЕт) — порядок преследования, выбранный преследователем в начальный момент времени Ь = О для некоторого фиксированного набора стратегий убегающих ие1 ,..., иЕга;

• иР(<, г*Р, ..., и'Е1,..., г4т), t > 0, — стратегия преследования, заключающаяся в последовательном преследовании убегающих игроком Р;

• р — р(4, и^,..., и£т) — элемент наказания, который состоит в изменении порядка преследования в случае, если вектор скорости какого-либо из убегающих в момент времени < будет отличен от соответствующей компоненты вектора (и'Е1,

Множество стратегий наказания преследователя обозначим через Ыр = {«р}хеП-

Определим момент окончания игры. Убегающий считается пойманным, если местоположения игроков Ри£;в некоторый момент времени совпадают. Под окончанием игры понимается момент поимки преследователем последнего убегающего.

Предположим, что выбранный преследователем порядок очередности встреч имеет вид 7Г = {1,... ,г,... ,т}.

Определим выигрыш Ег как

КЕ^ир,иЕ1,...,иЕ<,.. ,,иЕт) = ^ Т£, (8)

к<г, а:=1,т

где — время, потраченное преследователем на поимку убегающего Ек (к = 1 ,тп) в соответствии с порядком преследования я" е П. Индекс г обозначает очередность преследования убегающего в соответствии с выбранным порядком преследования я- = {1,..., г.....тп}, а индекс к {к < г) соответствует убегающим, преследуемым до игрока Ei включительно.

Выигрыш Р определяется как взятая с обратным знаком величина выигрыша убегающего, пойманного последним, т.е.

КР(и"Р, «в,,..., иЕт) = -Т", (9)

т

где Т" = ^ Т£ — общее время преследования в игре и 7Г — выбранный порядок к=1

преследования.

Рассматриваемую неантагонистическую игру преследования представим в нормальной форме Г(г?,, г\ ..., 2^) = (ТУ, {Щ^ц, где N = {Р,ЕХ,..Ет} — множество игроков, К{ — множество допустимых стратегий г-го игрока и К^ — функция выигрыша г-го игрока (г £ Ы), определяемая формулами (8) и (9). В § 2.2 описываются множества стратегий игроков в игре Г(2р, ..., 2 Множество стратегий игрока Р составляют функции Мр, соответствующие различным порядкам преследования т е П. Игрок Р стремится минимизировать общее время преследования, а убегающие стремятся, по возможности, оттянуть момент поимки. Другими словами, среди т\ различных порядков преследования преследователь выбирает тот порядок, который дает наименьшее общее время преследования. Обозначим его через и" и соответствующую стратегию преследователя через и*р .

Преследователь предписывает убегающим следовать определенному поведению и наказывает их за отклонение. Стоит отметить, что стратегия наказания преследователя может сделать практически любой набор стратегий убегающих равновесным по Нэшу при определенных условиях.

Пусть Е{ — убегающий, которого Р преследует в данный момент времени, е {1,... , т} (будем называть его текущим убегающим); — j-й по порядку преследования убегающий среди непойманных, ] £ {1,... , т}, j > У.

Опишем два типа поведения убегающего (г = 1,то):

• Игрок Е{ , е {1,...,т}, использует тип поведения [и^.], в соответствии с которым движется с максимальной скоростью вдоль прямой, проходящей через местоположения игроков Р и Е11 в момент начала его преследования, в направлении от Р (в предполагаемую точку его поимки Л"').

• Игрок Е{, j е {1,...ш}, использует тип поведения [и^.], в соответствии с которым движется по прямой с максимальной скоростью к точке встречи преследователя Р с текущим убегающим Е? , j > У, то есть к точке Л" , где

= РТ* и Ту — время встречи преследователя Р с убегающим Е? .

В течение всей игры в некоторый момент tвi > 0 каждый убегающий изменяет свой тип поведения с Е\ на Е\ . Следовательно, стратегия •) убегающего Е^ (г = 2, то) может быть представлена как

, ,, , /к,], о <*<**.

Следует отметить, что игрок Е1 использует только поведение [и^.] и его стратегия имеет вид •) = ["У' 4 — О-

В работе выписаны условия, при которых ситуация (и]', и'Е1,..., и*Вт) является равновесной по Нэшу.

В § 2.3 представлены неравенства, обеспечивающие существование описанного равновесия по Нэшу в стратегиях наказания.

В § 2.4 введены определения эффективной по отношению к убегающему стратегии наказания, полностью эффективной стратегии наказания и области эффективности стратегии наказания преследователя. Кроме того, приведены примеры построения областей эффективности стратегии наказания.

Определение 3 Стратегию наказания преследователя Р будем называть эффективной по отношению к убегающему Ei, если время жизни игрока Еиг е {2,..., т}, в случае следования предписанной преследователем стратегии и'Е., будет больше, чем если он от нее отклонится.

Определение 4 Стратегию наказания преследователя Р будем называть полностью эффективной в игре г?,..., г°„), если она эффективна по отношению ко всем убегающим Ei, г = 2, от.

В §2.5 строится кооперативная игра группового преследования с одним преследователем и т убегающими и доказывается, что характеристическая функция построенной кооперативной игры является супераддитивной.

Рассмотрим произвольную перестановку тг упорядоченного множества индексов М = {1,2, ...,т}. С этой перестановкой связана подстановка т.е. такая взаимно-однозначная функция к* : М —> М, что для к е М значение к„ е М представляет собой элемент из М, в который переходит к £ М в перестановке 7Г.

Определим характеристическую функцию игры следующим образом:

»({£<,}; •■•.*«) = :?!,, ч = Мп, «({Р, ДЛ; 4, г?,..., = Т4„ п =

г1,г2 = 17т, ¿1 ф г2,

где

7Г€П

Г;1=тах -Г'+ Е

ГМз = тах{ -Т-+ Е + Е гД

(10)

..., £т}; 4, г?.....= Я,.

Щ({Р, £,,...,£„,}; 4, г?.....2°) = Т*.

( <2 1т-1 гт ^

= тт ^ + Е Т1+...+ Е 11 + Е Т1 , ? = (И)

Г 12 1т-1 ]

Т*=тах^7 + Е Т1 + ...+ Е ТК .

Определение 5 Пару (Ы, г)(5; гр, г?,... С УУ), где N — множество игро-

ков и и — характеристическая функция, определенная формулами (10)-(11), будем

называть кооперативной игрой преследования или ТП игрой, соответствующей игре преследования T(z°P, z°,..., z^), и обозначать I\,(zp, z°,...,

Теорема 5 В игре Tv(zp,z°,..., характеристическая функция v, определяемая формулами (10)-(11), является супераддитивной.

В § 2.6 строится решение кооперативной игры в форме С-ядра и доказывается его непустота для любых начальных местоположений. Приводятся примеры, иллюстрирующие полученные результаты.

Теорема 6 В кооперативной игре преследования Г v{z%,z\, .■■,zam) существует непустое С-ядро для любых начальных местоположений игроков.

В заключении подытоживаются полученные результаты. В приложениях приводятся тексты программ, реализующих вычисление точек пересечения окружностей Аполлония и построение областей эффективности стратегии наказания преследователя.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в изданиях, рекомендованных ВАК

1. Панкратова Я. Б. Решение кооперативной дифференциальной игры группового преследования. Дискретный анализ и исследование операций. 2010. т. 17, № 2, с. 57-78.

2. Pankratova Ya., Tarashnina S. How many people can be controlled in a group pursuit game. Theory and Decision. Kluwer Academic Publishers. 2004. 56, p. 165181.

Публикации в других изданиях

3. Pankratova Y. A cooperative version of one group pursuit game //25 European Conference on Operational Reseach, Vilnuis, 2012, p. 221.

4. Панкратова Я.Б. Кооперация в одной игре группового преследования // Всероссийская конференция посвященная 80-летию со дня рождения В.И. Зубова "Устойчивость и процессы управления", СПб, 2010. с. 168-169.

5. Pankratova Y., Tarashnina S., Marchenko I. Cooperative solutions for a group pursuit game between a pursuer and m evaders // The 4-th International Conference Game Theory and Management, St.Petersburg, 2010. p. 123-124.

6. Pankratova Y. Cooperation in a group pursuit game //24 European Conference on Operational Reseach, Lisbon, 2010. p. 295.

7. Pankratova Ya., Tarashnina S. The importance of cooperation in a group pursuit game between a pursuer and m evaders // The Third International Conference Game Theory and Management, St.Petersburg, 2009. p. 198-199.

8. Pankratova Ya., Tarashnina S. Tinie-consistcncy of the core in group pursuit games // The Second International Conference Game Theory and Management, St.Petersburg, 2008. p. 216.

9. Pankratova Y. Some cases of cooperation in differential pursuit games. Contribu tions to Game Theory and Management. Collected papers. / Editors L.A. Petrosjan, N. A. Zenkevich. St.Petersburg. Graduated School of Management, SPbGU, 2007. p. 361-380.

10. Pankratova Y. On cooperative differential game of pursuit // SING3. Spain Italy Netherlands Meeting on Game Theory. Madrid, 2007. p. 127.

11. Pankratova Ya., Tarashnina S. How many people can be controlled in a group pursuit game. The volume "Essays on Cooperative Games - in honor of Guillermo Owen". Kluwer Academic Publishers. 2004. p. 165-181 (reprint from "Theory and Decision").

Подписано к печати 06.11.12. Формат 60 х 84 7\б . Бумага офсетная. Гарнитура Тайме. Печать цифровая. Печ. л. 1,00.

Тираж 100 экз. Заказ 5564._

Отпечатано в Отделе оперативной полиграфии химического факультета СПбГУ 198504, Санкт-Петербург, Старый Петергоф, Университетский пр., 26 Тел.: (812) 428-4043, 428-6919

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Панкратова, Ярославна Борисовна

Введение.

Глава 1. Игра преследования с одним убегающим и т преследователями.

§1.1 Неантагонистческая игра преследования с одним убегающим и т преследователями.

§ 1.2 Вывод аналитических формул для нахождения координат точек пересечения окружностей Аполлония.

§ 1.3 Множество ситуаций равновесия по Нэшу в неантагонистической игре простого преследования.

§ 1.4 Кооперативная форма игры ,.,

§ 1.5 Существование непустого С-ядра в кооперативной игре преследования ГД^,., 2°).

§ 1.6 Динамическая устойчивость С-ядра игры ад,.,^0).

§ 1.7 Примеры.

Глава 2. Игра преследования с одним преследователем и т убегающими.

§2.1 Неантагонистическая игра преследования с одним преследователем и т убегающими.

§ 2.2 Типы поведения и стратегии игроков в неантагонистической игре преследования г®,., г^)

§ 2.3 Основные неравенства, обеспечивающие существование равновесия по Нэшу.

§ 2.4 Построение областей эффективности стратегии наказания преследователя.

§ 2.5 Кооперативная форма игры ^,., г^).

§ 2.6 Существование непустого С-ядра в кооперативной игре преследования ГД^р, X®,.,

 
Введение диссертация по математике, на тему "C-ядро в кооперативных играх группового преследования"

Дифференциальные игры — это конфликтные ситуации с бесконечным множеством альтернатив, поддающиеся описанию с помощью дифференциальных уравнений. Основной причиной, побудившей возникновение теории дифференциальных игр, была необходимость решения задач военного характера, но в дальнейшем эти игры стали использоваться для формализации задач из разных областей жизнедеятельности человека. Возникшие проблемы, как правило, требовали введения новых методов. Для их решения понадобилась новая теория, получившая в дальнейшем название теории дифференциальных игр. Она выкристаллизовалась в процессе решения конкретных задач. В настоящий момент теория дифференциальных игр представляет собой своеобразный сплав теории игр, теории управления и вариационного исчисления, причем в результате такого объединения появились элементы, новые по отношению ко всем трем перечисленным наукам.

Одной из рассматриваемых задач в дифференциальных играх является задача управления непрерывно движущимися объектами в условиях конфликта, когда целью одной стороны является поимка объекта другой стороны за кратчайшее время, а целью противоположной стороны, участвующей в конфликте, является максимизация времени встречи с объектами противника. Такого рода задачи называются играми преследования на быстродействие. Когда в процессе преследования участвуют один преследователь и один преследуемый, мы имеем дело с классической антагонистической дифференциальной игрой преследования. Если же в конфликтной ситуации участвуют более двух игроков, то, вероятно, более реалистичной является постановка задачи преследования как неантагонистической дифференциальной игры.

Антагонистические дифференциальные игры преследования впервые были подробно описаны в монографии Р. Айзекса, изданной в 1965 году и переведенной на русский язык в 1967 году. Среди работ этого периода следует также отметить работы В. Флеминга и JI. Берковича.

Основополагающий вклад в развитие теории дифференциальных игр внесли H.H. Красовский и JI.C. Понтрягин. Также фундаментальные результаты в области теории дифференциальных игр преследования получены в работах Э.Г. Альбрехта, М. Барди, Т. Башара, Р. Беллма-на, А. Брайсона, H.JI. Григоренко, Р.В. Гамкрелидзе, В.И. Жуковского, М.И. Зеликина, А.Ф. Клейменова, А.Н. Красовского, A.B. Кряжим-ского, В.Н. Лагунова, O.A. Малафеева, A.A. Меликяна, Е.Ф. Мищенко, М.С. Никольского, Г. Ольсдера, Ю.С. Осипова, H.H. Петрова, JI.A. Пет-росяна, Б.Н. Пшеничного, А.Н. Субботина, Г.В. Томского, А. Фридмана, Ф.Л. Черноусько, A.A. Чикрия, C.B. Чистякова и многих других.

Неантагонистические дифференциальные игры преследования являются в настоящее время недостаточно изученными. Здесь следует отметить работу Л.А. Петросяна и В.Д. Ширяева [32], в которой впервые задача преследования формализована как неантагонистическая дифференциальная игра преследования с одним преследователем и двумя убегающими на плоскости, получившая свое развитие в работах С.И. Та-рашниной.

В последние годы значительно усилился интерес к теории дифференциальных игр со стороны экономистов, социологов, специалистов в области международных отношений [13], [44].

Обычно в играх преследования под захватом подразумевается уничтожение противника, и такие игры находят широкое применение в военном деле. Однако, решая задачи принятия решений в экономике и других областях человеческой деятельности, мы сталкиваемся с наличием многих участников, интересы которых не являются строго противоположными. Здесь под захватом понимается только встреча игроков, например, для передачи друг другу некоторой информации или товара. Это, в частности, может приводить к ситуации, выгодной не только одному игроку (в антагонистическом конфликте это невозможно). Поэтому задача исследования процесса преследования как неантагонистической игры относится к числу актуальных проблем современной теории игр преследования.

Принципиальное отличие неантагонистических игр от антагонистических заключается в возможности сообщения и сговора между игроками, то есть в возможности образования коалиций. Таким образом, проблема исследования целесообразности кооперации игроков в игре группового преследования является также актуальной задачей и позволяет "адаптировать" игры преследования для решения экономических задач.

Основа теории кооперативных дифференциальных игр была построена J1.A. Петросяном, в развитие которой в различное время свой вклад внесли H.H. Данилов, Дж. Заккур, В.В. Захаров, H.A. Зенкевич, В.И. Жуковский, С. Йоргенсен, А.Ф. Клейменов, А.Ф. Кононенко, Дж.А. Филлар, С.В Чистяков, Д.В.К. Янг и многие другие.

В работе рассматриваются два класса неантагонистических дифференциальных игр группового преследования:

• между одним убегающим и несколькими преследователями, действующими как самостоятельные игроки;

• между одним преследователем и несколькими убегающими, действующими как самостоятельные игроки.

В работе использованы как некооперативный, так и кооперативный подходы к решению задач группового преследования.

Некооперативный подход состоит в формализации процесса преследования как неантагонистической некооперативной игры и описание в ней множества равновесных по Нэшу ситуаций. Важнейшим результатом в теории неантагонистических некооперативных дифференциальных игр является доказательство существования равновесия по Нэшу для общего случая игры п лиц. Оно было получено с использованием различных подходов в работах O.A. Малафеева [14] и C.B. Чистякова [42]. В работе С.И. Тарашниной [60] доказано, что в игре преследования с одним преследователем и m убегающими существует бесконечное множество равновесных по Нэшу ситуаций: от крайне неблагоприятных для убегающих до благоприятных, а также всевозможные промежуточные равновесия (при определенных условиях накладываемые на скорости и местоположения игроков).

Кооперативный подход состоит в объединении всех игроков (преследователей и убегающих) в единую коалицию с целью получения максимального суммарного выигрыша. Такой подход к решению игр группового преследования является новым и впервые был предложен в работах автора [19, 52].

С целью исследования возможности кооперации игроков в играх группового преследования, в работе строятся классические кооперативные версии рассматриваемых неантагонистических игр преследования с транс-ферабельными выигрышами.

Наиболее распространенной концепцией решения в рамках классической кооперативной теории игр с трансферабельными полезностями является С-ядро, введенное Н.Е. Scarf [58]. В работе осуществляется построение С-ядра и исследуется его непустота в рассматриваемых классах игр.

Вместе с тем, в динамических играх существование непустого С-ядра в начальный момент времени не является достаточным для того, чтобы считать его "приемлемым" решением. В процессе движения в каждый текущий момент времени t игроки попадают в некоторую подыгру со своими начальными положениями и продолжительностью. Это означает, что с течением времени изменяются условия конфликта и возможности участвующих в нем сторон, а выбранное изначально решение перестает, возможно, отвечать их интересам.

Таким образом, динамическая устойчивость, введенная Л.А. Петро-сяном [24], является важным свойством решения и означает, что игроки в каждый текущий момент игры не имеют причин отклоняться от первоначально выбранного оптимального поведения. В работе для игры с одним убегающим и т преследователями доказывается динамическая устойчивость С-ядра.

Основной целью работы является исследование двух классов неантагонистических игр группового преследования: с одним убегающим и т преследователями и с одним преследователем и т убегающими; построение кооперативных версий этих игр; нахождение некооперативных (в форме равновесия по Нэшу) и кооперативных (в форме С-ядра) решений рассматриваемых игр.

Научная новизна работы заключается в том, что в ней:

1. предложен новый подход к решению неантагонистических игр группового преследования п-лиц, состоящий в возможности кооперации игроков;

2. определен класс кооперативных игр преследования с одним убегающим и т преследователями и дано аналитическое описание С-ядра для случая максимального числа крайних точек, доказана его непустота и динамическая устойчивость;

3. определен класс кооперативных игр преследования с одним преследователем и т убегающими и построено непустое С-ядро;

4. для неантагонистической игры преследования с одним убегающим и т преследователями построено равновесие по Нэшу и доказано его существование для любых начальных местоположений игроков;

5. для неантагонистической игры преследования с одним преследователем и т убегающими введено понятие области эффективности стратегии наказания преследователя.

Практическая ценность. Полученные в диссертации результаты представляют теоретический и практический интерес. Кооперативные дифференциальные игры преследования являются удобными математическими моделями для описания процессов, происходящих в экономике, менеджменте и прочих сферах человеческой деятельности, например, для описания "динамической версии" задачи о коммивояжере.

Основные положения, выносимые на защиту:

1. Найдено множество ситуаций равновесия по Нэшу в неантагонистической игре преследования с одним убегающим и т преследователями.

2. Для неантагонистической игры преследования с одним убегающим и т преследователями предложена формализация в виде кооперативной игры группового преследования с трансферабельными по-лезностями.

3. Доказано, что в кооперативной игре группового преследования с одним убегающим и т преследователями существует непустое С-ядро для любых начальных местоположений игроков.

4. Получено аналитическое описание С-ядра для случая максимального числа крайних точек в кооперативной игре группового преследования с одним убегающим и т преследователями.

5. Доказана динамическая устойчивость С-ядра в кооперативной игре группового преследования с одним убегающим и т преследователями.

6. Для неантагонистической игры простого преследования с одним преследователем и т убегающими предложена формализация в виде кооперативной игры группового преследования с трансферабельны-ми полезностями.

7. Доказано, что в кооперативной игре группового преследования с одним преследователем и т убегающими существует непустое С-ядро для любых начальных местоположений игроков.

Апробация работы. Основные результаты работы представлены на семинарах кафедры математической теории игр и статистических решений Санкт-Петербургского государственного университета, на семинарах Центра теории игр, на 3-й международной конференции "Spain Italy Netherlands Meeting on Game Theory" (Мадрид, 2007), на 2-й, 3-й и 4-й Международных конференциях "Game Theory and Management" (Санкт-Петербург, 2008, 2009, 2010), на Всероссийской конференции "Устойчивость и процессы управления", посвященной 80-летию со дня рождения В.И. Зубова (Санкт-Петербург, 2010), на 24-й Европейской конференции по исследованию операций (Лиссабон, 2010), на 25-й Европейской конференции по исследованию операций (Вильнюс, 2012), на семинаре института прикладных математических исследований Карельского научного центра РАН (г. Петрозаводск).

По материалам диссертации опубликованы работы [18], [19], [50]-[57].

Структура и объем работы. Диссертация состоит из введения, двух глав, разбитых на параграфы, заключения, списка используемой литературы и двух приложений.

 
Заключение диссертации по теме "Дискретная математика и математическая кибернетика"

Заключение

На основе полученных результатов диссертационной работы можно сделать следующие выводы.

В игре группового преследования с одним убегающим и т преследователями полная кооперация игроков с последующим распределением общего выигрыша между ними выгодна всем участникам конфликтной ситуации. Кооперативная версия игры может быть использована для моделирования неантагонистических процессов преследования такого вида.

В игре группового преследования с одним преследователем и т убегающими рассмотрение кооперативной версии дает возможность игрокам избежать применения жестких мер, таких как наказание, и достичь желаемого результата путем кооперации.

Полученные выводы проиллюстрированы примерами. Все примеры выполнены с использованием программ, написанных на языке программирования Delphi 7. Работа программ обеспечивает: вычисление координат точек пересечения окружностей Аполлония, графическое изображение областей эффективности стратегии наказания преследователя, вычисление значений характеристической функции кооперативных игр.

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Панкратова, Ярославна Борисовна, Санкт-Петербург

1. Айзеке Р. Дифференциальные игры. М., 1967. 480 с.

2. Беллман Р. Динамическое программирование. М., 1960.

3. Болтянский В. Г. Математические методы оптимального управления. Москва, "Наука", 1969.

4. Бондарева О.Н. Некоторые применения методов линейного программирования к теории кооперативных игр // Проблемы кибернетики. Вып. 10, М.: Физматгиз. с. 119-140.

5. Воробьев Н. Н. Основы теории игр. Бескоалиционные игры. М.: Наука, 1984, 496 с.

6. Вайсборд Э. М., Жуковский В. И. Введение в дифференциальные игры нескольких лиц и их приложения. М.: "Советское радио", 1980.

7. Данилов В. И. Лекции по теории игр. М: РЭШ, 2002.

8. Григоренко Н. Л. Дифференциальные игры преследования несколькими объектами. М.: Изд-во МГУ, 1983. 77 с.

9. Жуковский В. И., Тынянский Т. Н. Оптимальность в бескоалиционных дифференциальных играх. — Неантагонистические дифференциальные игры и их приложения: Сб. научн. тр. М., 1986. с. 3-7.

10. Зенкевич Н. А., Зятчин А. В. Построение сильного равновесия в дифференциальной игре многих лиц. МТИП, 2010. 2: 2, с. 42-65.

11. Клейменов А.Ф. Неантагонистические дифференциальные игры. Екатеринбург: Наука, 1993. 184 с.

12. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М: Наука, 1974. 455 с.

13. Мазалов В.В. Математическая теория игр и приложения: учебное пособие. СПб.: Из-во: "Лань", 2010. 448 с.

14. Малафеев О. А. Существование ситуаций равновесия в дифференциальных бескоалиционных играх со многими участниками. — Вестн. Ленигр. ун-та, 1982. № 13, с. 40-45.

15. Меликян А. А., Овакимян Н. В. Дифференциальная игра простого сближения на многообразиях. — Прикл. мат. и мех., 1993. 57, № 1, с. 41-51.

16. Мулен Э. Теория игр с примерами из математической экономики. М: Мир, 1985.

17. Нейман В. фон, Моргенштерн О. Теория игр и экономическое поведение. М: Наука, 1970.

18. Никольский М.С. Линейные дифференциальные игры преследования с интегральными ограничениями. — Дифференциальные уравнения, 1992. т. 28, № 2, с. 219-223.

19. Панкратова Я. Б. Решение кооперативной дифференциальной игры группового преследования. Дискретный анализ и исследование операций. 2010. т. 17, № 2, с. 57-78.

20. Панкратова Я. Б. Кооперация в одной игре группового преследования // Всероссийская конференция по-священная 80-летию со дня рожде-ния В.И. Зубова "Устойчивость и процессы управления", СПб, 2010. с. 168-169.

21. Петросян Л. А., Данилов Н. Н. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестник Ленинградского университета. 1979. № 1.

22. Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. М: Высш. шк., 1998.

23. Петросян Л. А. Об одном семействе дифференциальных игр на выживание в пространстве К1. ДАН СССР, 1965. Том 161, № 1, с. 52-54.

24. Петросян Л. А. Устойчивость решений в дифференциальных играх со многими участниками. Вестник Ленинградского университета, 1977. № 19, Вып. 4.

25. Петросян Л. А. Дифференциальные игры преследования. Л.: Изд-во Ленингр. ун-та. 1977. 224 с.

26. Петросян Л. Л.Неантагонистические дифференциальные игры. В кн.: Вопросы механики процессов управления, управление динамическими системами. Л., 1978.

27. Петросян Л. А. Решение неантагонистических дифференциальных игр п лиц. В кн.: Динамическое управление. Тезисы докладов Всесоюзной конференции. Свердловск, 1979.

28. Петросян Л. А., Данилов Н. Н. Кооперативные дифференциальные игры и их приложения. Томск, 1985.

29. Петросян Л. А., Мурзов Н. В. Теоретико-игровые задачи механики. Литовский математический сборник, вып.VI, 1966. 9.

30. Петросян Л. А., Томский Г. В. Геометрия простого преследования. Наука, Новосибирск. 1983.

31. Петросян Л. А., Томский Г. В. Динамические игры и их приложения. Л: Изд. ЛГУ, 1982.

32. Петросян Л. А., Ширяев В. Д. Простое преследование одним преследователем двух преследуемых. — В кн.: Некоторые вопросы дифференциальных и интегральных уравнений и их приложения. Вып. 3, Якутск, ун-т. 1978. с. 103-108.

33. Петросян Л. А., Рихсиев Б. Б. Преследование на плоскости. М: Наука. Гл. ред. физ.-мат. лит., 1991. Вып. 61.

34. Печерский С. Л., Яновская Е. Б. Кооперативные игры: решения и аксиомы. СПб.: Изд-во Европейского университета, 2004. 459 с.

35. Понтрягин Л. С. О некоторых дифференциальных играх. — Докл. АН СССР, 1964. т. 156, № 4.

36. Понтрягин Л. С. О линейных дифференциальных играх. 1. — Докл. АН СССР, 1967. т. 174, № 6, с. 1278-1280.

37. Понтрягин Л. С. О линейных дифференциальных играх. 2. — Докл. АН СССР, 1967. т. 175, № 4, с. 764-766.

38. Пшеничный В. Н. Игра с простым движением и выпуклым терминальным множеством. — Теория оптимальных решений, Киев, 1969. вып. 3, с. 3-16.

39. Пшеничный Б. Н. Простое преследование несколькими объектами. — Кибернетика, 1976. № 3, с. 145-146.

40. Тарашнина С. И. Равновесные по Нэшу ситуации в игре простого преследования. — Выпросы механики и процессов управления, Санкт-Петербург, 2001. вып. 20, с. 188-201.

41. Чикрий А. А., Калашникова С. Ф. Преследование управляемым объектом группы убегающих. — Кибернетика, 1987. К2 4, с. 1-8.

42. Чистяков С. В. О бескоалиционных дифференциальных играх. Докл. АН СССР, 1981. т. 259, № 5.

43. Чистяков С. В. О существовании решения бескоалиционных дифференциальных игр. — Управление в динамических системах, Ле-нингрд, 1979. с. 128-145.

44. Basar T., Olsder G. Dynamic Noncooperative Game Theory. N.Y. Ac, Press. 1998.

45. Bercovitz L. D., Fleming W. H. On diffirential games with integral payoff. Contributions to the theory of Games. Ann of Math Studies. 1957. № 3, p. 413-435.

46. Filar G. A., L. A. Petrosjan. Dynamic Cooperative Games. International Game Theory Review. 2000. Vol. 2, № 1, p. 47-66.

47. Owen G. Game Theory. W. B. Saunders Company. PhiladelphiaLondon-Toronto. 1986.

48. Nash J. F. Equilibrium points in n-person games // Proc. Nat. Acad. Sci. USA. 1950. Vol. 36. p. 48-49.

49. Kleimenov A. F., Kryazhimskii A. V. Normal Behavior, Altruism and Aggression in Cooperative Game Dynamics, IIASA, IR-98-076, Laxenburg, 1998. 48 p.

50. Pankratova Ya., Tarashnina S. How many people can be controlled in a group pursuit game. Theory and Decision. Kluwer Academic Publishers. 2004. 56, p. 165-181.

51. Pankratova Y. On cooperative differential game of pursuit // SING3. Spain Italy Netherlands Meeting on Game Theory. Madrid, 2007. p. 127.

52. Pankratova Ya., Tarashnina S. Time-consistency of the Core in group pursuit games // The Second International Conference Game Theory and Management, St.Petersburg, 2008. p. 216.

53. Pankratova Ya., Tarashnina S. The importance of cooperation in a group pursuit game between a pursuer and m evaders // The Third International Conference Game Theory and Management, St.Petersburg,2009. p. 198-199.

54. Pankratova Y., Tarashnina S., Marchenko I. Cooperative solutions for a group pursuit game between a pursuer and m evaders // The 4-th International Conference Game Theory and Management, St.Petersburg,2010. p. 123-124.

55. Pankratova Y. Cooperation in a group pursuit game //24 European Conference on Operational Reseach, Lisbon, 2010. p. 295.

56. Pankratova Y. A cooperative version of one group pursuit game //25 European Conference on Operational Reseach, Vilnuis, 2012. p. 221.

57. Scarf H. E. The core of an n-person game. Econometrica. 1967. 35, p. 50-69.

58. Shapley L. S. On balanced sets and cores. Naval Research Logistic Quarterly. 1967. 14, p. 453-460.

59. Tarashnina S. Nash equilibria in a differential pursuit game with one pursuer and m evaders. Game Theory and Applications. N.Y. Nova Science Publ. 1998. Vol. Ill, p. 115-123.

60. Tarashnina S. Time-consistent solution of a cooperative group pursuit game. International Game Theory Review. 2002. Vol. 4, p. 301-317.