Кооперация в дискретных линейно-квадратичных играх

Тур, Анна Викторовна

Кооперация в дискретных линейно-квадратичных играх тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Тур, Анна Викторовна АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Санкт-Петербург МЕСТО ЗАЩИТЫ

2015 ГОД ЗАЩИТЫ

01.01.09 КОД ВАК РФ

Автореферат по математике на тему «Кооперация в дискретных линейно-квадратичных играх»

Автореферат диссертации на тему "Кооперация в дискретных линейно-квадратичных играх"

Тур Анна Викторовна

КООПЕРАЦИЯ В ДИСКРЕТНЫХ ЛИНЕЙНО-КВАДРАТИЧНЫХ ИГРАХ

01.01.09 — Дискретная математика и математическая кибернетика

АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата физико-математических наук

13 МАЙ 2015

Санкт-Петербург 2015

005568956

Работа выполнена в Санкт-Петербургском государственном университете

Научный руководитель:

Официальные оппоненты:

Ведущая организация:

доктор физико-математических наук, профессор Петросян Леон Аганесович

Мазалов Владимир Викторович, доктор физико-математических наук, профессор, Институт прикладных математических исследований КарНЦ РАН, директор Сандомирский Фёдор Алексеевич, кандидат физико-математических наук, Санкт-Петербургский экономико-математический институт Российской академии наук, научный сотрудник

ФГБУН "Институт математики и механики им. Н.Н.Красовского УрО РАН"

Защита состоится «10» июня 2015 г. в 16 часов на заседании диссертационного совета Д 212.232.29 па базе Санкт-Петербургского государственного университета по адресу: 199178, Санкт-Петербург, 10 линия В.О., д. 33/35, ауд. 74.

С диссертацией можно ознакомиться в Научной библиотеке им. М. Горького Санкт-Петербургского государственного университета по адресу: 199304, СанктПетербург, Университетская наб., 7/9 и на сайте http://spbu.ru/science/disser/dissertatsii-dopushchennye-k-zashchite-i-svedeniya-о-гаяЬсЬ^е.

Автореферат разослан « ^'■» 2015 г.

Ученый секретарь диссертационного совета, доктор физ.-мат. наук, профессор

Нежинский В. М.

Общая характеристика работы

Актуальность темы. Во многих областях человеческой деятельности, таких, как экономика, экология, производство, менеджмент, в процессе принятия решения участвуют несколько сторон, цели которых зачастую оказываются разными и даже противоположными. В связи с этим возникает необходимость приятия решения в условиях конфликта. Теория игр является разделом математики, в котором рассматриваются математические модели ситуаций подобного рода. А поскольку все такие процессы развиваются на некотором временном промежутке, актуальным направлением современной теории игр является исследование динамических и дифференциальных игр.

Одним из основоположников дифференциальных игр принято считать Р. Айзекса, в работах которого и было введено понятие дифференциальной игры. Фундаментальные результаты в исследовании антагонистических дифференциальных игр получены отечественным школами академиков JI.C. Понтрягина и H.H. Красовского. В развитие неантагонистических дифференциальных игр существенный вклад внесли А.Ф. Кононенко, А.Ф. Клейменов, J1.A. Петросян, В.И. Жуковский, Т.Н. Тынянский, C.B. Чистяков и др.

В настоящее время активно исследуется такой класс дифференциальных игр, где динамика рассматриваемой системы имеет линейный вид, а выигрыши игроков квадратичны. Такие игры называют линейно-квадратичными. Актуальность исследования подобных задач обусловлена несколькими причинами. Так, многие приложения дифференциальных игр используют именно такую структуру, также важной оказывается возможность получения аналитических результатов и использования эффективных численных методов решения. В своих работах исследовали задачи подобного типа Дж. Энгверда, Т. Башар, Г. Олсдер, В.А. Жуковский, A.A. Чикрий, В. Чжан, П. Бернхард и др. Решения некооперативных линейно-квадратичных игр двух или многих лиц в различных классах стратегий подробно рассмотрены авторами. При этом исследуются модели как с конечным временем окончания игры, так и с бесконечным. В некоторых работах рассмотрены также кооперативные игры, где в качестве принципа оптимальности берётся Парето-оптимальное решение. Однако модели с возможной кооперацией игроков, где игроки объединяются с целью максимизировать

суммарный выигрыш и разделить его согласно некоторому выбранному правилу, оказываются наиболее приближенными к жизненным конфликтным ситуациям. В связи с этим исследование кооперативных линейно-квадратичных динамических игр является актуальной задачей.

Также очень важным является вопрос устойчивости кооперативного решения. Понятия динамической устойчивости впервые было введено Петрося-ном JI.A.1 Динамическая устойчивость гарантирует состоятельность выбранного принципа оптимальности на всем промежутке игры. Д.В.К. Янгом 2 было предложено ещё одно важное свойство, гарантирующее устойчивость кооперации, это "устойчивость против иррационального поведения игроков". При выполнении этого свойства, даже при возникновении иррационального поведения игроков, другие игроки не проигрывают по сравнению с некооперативным решением. В работе Марковкина М.В. 3 рассмотрены эти аспекты устойчивости кооперативных решений для линейно-квадратичных дифференциальных игр.

В реальных конфликтных ситуациях возможны случаи, когда информация о системе доступна не непрерывно во времени, а только в определенные моменты. В связи с этим актуальным оказывается исследование дискретных динамических игр. В диссертации проводится исследование описанных проблем устойчивости для кооперативных дискретных линейно-квадратичных игр.

Целью диссертационной работы является исследование кооперативных линейно-квадратичных дискретных игр. Построение кооперативных решений для игр с бесконечной продолжительностью, для игр со случайной продолжительностью, для игр с нетрансферабельными выигрышами, а также для игр на сети с управляющей коалицией, исследование динамической устойчивости полученных решений и вывод достаточных условий устойчивости против иррационального поведения игроков.

Научная новизна работы. Все основные результаты, представленные в диссертации являются новыми. В работе впервые исследуются вопросы дина-

1Петросян J1.A. Устойчивость решений в дифференциальных играх со многими участниками. Вестник Ленинградского университета, 1977, N 19, Вып. 4.

2Yeung D.W.K. An Irrational-Behavior-Proof Condition in Cooperative Differential Games // IGTR 2007, 9(1), 5-7.

3Марковкин М.В. Линейно-квадратичные кооперативные дифференциальные игры: диссертация кандидата физико-математических наук, СП6ГУ, Санкт-Петербург, 2006. 106 с.

мической устойчивости и устойчивости против иррационального поведения игроков в линейно-квадратичных дискретных кооперативных играх различного типа. А также впервые определена и исследована линейно-квадратичная дискретная игра на сети с управляющей коалицией.

Теоретическая и практическая значимость работы следует из области применения кооперативных линейно-квадратичных дискретных игр. Решения, полученные для разных вариантов рассматриваемых игр, применимы в качестве математических моделей для описания процессов, происходящих в различных сферах человеческой деятельности, таких, как менеджмент, экономика, экология и др. В работе рассмотрены экономические приложения. Результаты, полученные в диссертации, представляют теоретический и практический интерес.

Методология и методы исследования. В диссертации применяются методы теории некооперативных и кооперативных игр, теории управления, теории вероятностей. Исследование динамической устойчивости решений проводится в рамках подхода, разработанного научной школой Л.А. Петросяна.

Основные результаты, выносимые на защиту.

1. Построено кооперативное решение в дискретных линейно-квадратичных играх с бесконечным временем окончания с использованием характеристической функции. Сформулирована и доказана теорема о динамической устойчивости полученного кооперативного решения. Получены достаточные условия устойчивости против иррационального поведения игроков.

2. Построено кооперативное решение в дискретных линейно-квадратичных стохастических играх со случайной продолжительностью. Сформулирована и доказана теорема о динамической устойчивости полученного кооперативного решения. Получены достаточные условия устойчивости против иррационального поведения игроков.

3. Сформулированы и доказаны теоремы о динамической устойчивости Парето-оптимального решения линейно-квадратичных игр с нетрансфера-бельными выигрышами с предписанной продолжительностью и с бесконечной продолжительностью.

4. Сформулированы и доказаны теоремы об устойчивости Парето-оптимального решения против иррационального поведения игроков для линейно-квадратичных игр с нетрансферабельными выигрышами с предписанной продолжительностью и с бесконечной продолжительностью.

5. Определена линейно-квадратичная дискретная игра на сети с управляющей коалицией. Построено некооперативное и кооперативное решение в таких играх.

Апробация работы. Основные результаты были представлены на I, III, VII Международных конференциях Game Theory and Management GTM'07, GTM'10, GTM'14 (Санкт-Петербург, 2007, 2009, 2014 гг.); на Всероссийской конференции «Устойчивость и процессы управления» (Санкт-Петербург, 2010); на XXXVIII, XXXIX, XL, XLI международных конференциях студентов и аспирантов «Процессы управления и устойчивость» (Санкт-Петербург, 2007, 2008, 2009, 2010 гг.); на 46-й Международной молодежной школе-конференции «Современные проблемы математики и ее приложений» (Екатеринбург, 2015 г.); на семинаре отдела динамических систем Института математики и механики им. Н.Н. Красовского УрО РАН.

Публикации. По материалам диссертации опубликованы работы [1-8]. Из них статьи [4], [6] опубликованы в журналах, входящих в список ведущих российских рецензируемых научных журналов ВАК РФ, статья [7] - в издании, входящем в международную реферативную базу zbMATH.

Личный вклад автора. Все представленные в диссертации результаты получены автором лично.

Структура и объем работы. Диссертация состоит из введения, четырех глав, разбитых на параграфы, заключения и списка используемой литературы. Общий объем диссертации 105 страниц. Список литературы включает 70 наименований на 8 страницах.

Содержание работы

Первая глава посвящена линейно-квадратичным дискретным играм с бесконечной продолжительностью. Рассматривается игра п лиц, динамика си-

стемы описывается системой уравнений

х(к+1) = A{k)x{k) + J2Bi(k)ui(k)' (!)

t=i

где к > ко, ко € 7+, х 6 Rm - вектор-столбец, щ £ Rr - вектор-столбец управления игрока г; А(к), Bi(k) £ Z(T+) - (то х т) и (то х г) - матрицы соответственно, x(fco) = xq - начальное состояние, 7+ - множество неотрицательных целых чисел, Z(T+) - множество ограниченных на 7+ матриц. Выигрыш игрока i имеет вид:

Ji(ko,xo,u) = Yí(^T(k)Pi(k)x(k) + uJ(k)Ri(k)ui(k)), (2)

к=ко

где Pi(k) = Р?{к), Ri{k) = Rf(k) S Z{T+) - (то x то) и (г х г) - матрицы соответственно. Каждый игрок стремится максимизировать свой выигрыш.

Определение 1. Набор стратегий вида

{щ(к,х) = Mi(k)x, г=1,...,п} (3)

будем называть допустимым, если выполняются условия:

1) Mi(k) е Z(T+), i — 1,..., n;

2) Система (1), замкнутая набором стратегий (3), т. е. система x(k + 1) = (А(к) 4- 52Г=1 Bi(k)Mi(k))x(k) равномерно асимптотически устойчива (при к —> оо).

В работе Т. Башара и Г. Олсдера4 была сформулирована теорема о нахождении равновесия по Нэшу в линейно-квадратичных дискретных играх. В данном параграфе приводится аналог этой теоремы для рассматриваемого класса игр, в котором приведены необходимые и достаточные условия для существования равновесия по Нэшу в игре T(fco, xq). Согласно этой теореме, если набор стратегий {ufE — M¡*E(k)x, i = 1,..., п} является равновесием по Нэшу, то выигрыш игрока i в равновесии равен Ji(ko,xo,uNE) = — Xq Oi(ko)xo, г = 1,..., п, где MtNE, Qi(k) - решение соответствующих матричных уравнений.

В § 1.2 строится характеристическая функция для рассматриваемого класса игр по правилу v(S,xо) = max Js(ko, Xq, une/us). Здесь S С

uitieS

4Basar T. and Olsder G.J. Dynamic Noncooperative Game Theory, 2nd edition, Classics in Applied Mathematics, SIAM, Philadelphia, 1999. 536 p.

N, Js(kQ,x0,u) = J2Mk0,x0,u), где и = (иъ...,ип), (uNE/us) = ieS

ф S, U{,i G S}. Предполагается, что игроки из коалиции S используют стратегии, которые являются наилучшим ответом на некоторое фиксированное равновесие по Нэшу в игре Г(ко,хо). Идея построения характеристической функции в такой форме была предложена JI.A. Петросяном и Д. Заккуром5.

Формулируется теорема о существовании набора стратегий, доставляющего максимум произвольной сумме функционалов, которая используется при построении характеристической функции. Согласно этой теореме получаем значения характеристической функции v(S, Xq) = —Хддд(ко)хо, где Q*s(k) - решение соответствующей системы матричных уравнений.

Пусть набор стратегий {uf = Mj*(k)x, i = 1,..., п} доставляет максимум JN(kQ,x0,u), тогда JN(k0,x0,uN) = -хЦ<Эх{к0)х0..

Траекторию х*(к), которая реализуется при замыкании системы (1) набором стратегий uN, будем называть оптимальной.

В данном параграфе также исследуется вопрос динамической устойчивости полученных кооперативных решений.

Пусть С (ко, хо) - множество дележей в игре Г (ко, хо). М(ко,хо) С С(ко,Хо) - кооперативный принцип оптимальности в этой игре. Г(&,х*(к)) подыгра игры Г(к0,xq), которая начинается в момент времени к из состояния х"(к). В этой подыгре введем характеристическую функцию v(S,x*(k)) таким же образом, как она была введена в игре Г(А;о, хо). Пусть С(х*(к)) - множество дележей подыгры. Обозначим через М(х*(к)) С С(х*(к)) принцип оптимальности M С С, реализуемый в подыгре Г(к,х*(к)).

Определение 2. Пусть у>(ко,Хо) € М, тогда вектор-функцию /3(к) = (Pi(k),..., /Зп(к)), к > ко назовем процедурой распределения дележа (ПРД)6'7

оо

если fi(k0, х0) = Pi(k), i = 1,..., п.

к=ко

5Leon Petrosian, Georges Zaccour. Time-consistent Shapley value allocation of pollution cost réduction // Journal of Economie Dynamic and Control, 27 (2003), 381-398.

6Петросян Л.A. Построение сильно динамически устойчивых решений в кооперативных дифференциальных играх // Вестн. С.-Петерб. ун-та, 4, (1992), 33-38

7Петросян Л.Л., Н.Н. Данилов. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестн. Ленингр. ун-та, 1, (1979), 46-54.

Определение 3. Вектор-функция ß{k) = (ßi(k),... ,ßn(k)) называется состоятельной во времени ПРД6'7 , если при любом 1> ко выполняется следующее равенство

<Pi{k0, х0) = ßi(k) + 1р>{1 + 1, х*{1 + 1)), г = 1,..., п,

к=ко

где <pi(k0, х0) <= М, <pi(l + 1, x*(l + 1) е М{х*{1 + 1)).

Теорема 1. Пусть ^¡(к,х*(к) G М{х*{к)), тогда вектор-функция ß(k) = (ßx{k),...,ßn{k)),zde

ßi{k) = ipi(k,x\k))-ipi{k + l,x\k+\)), i = l,...,n (4)

является состоятельной во времени ПРД.

Далее сформулированы достаточные условия устойчивости против иррационального поведения игроков кооперативных решений.

Определение 4. Дележ ip(ko,xo) = (fi(ko,xo),..., fn(ko,xo)) удовлетворяет условию устойчивости против иррационального поведения игроков2, если выполнено неравенство I

£ß(k) + v(i,x*(l+l))>v(i,x0), г = 1,... ,п (5)

k=ko

при любом I > к0, где ß(k) = (ßг(к),... ,ßn(k)) состоятельная во времени ПРД, соответствующая дележу ф{ко,хо)-

Утверждение 1. Для того чтобы в линейно-квадратичной дискретной игре с бесконечной продолжительностью дележ был устойчив против иррационального поведения игроков достаточно, чтобы для любого i G N выполнялось:

А (к) + х*Т(к)(Э1(к) - (А(к) + + 1 )(А(к)+

i=i

+ Bj(k)M?))x*(k) >0, к > ко, ¿=i

ß(к) - состоятельная во времени процедура распределения этого дележа.

В данной главе также строится пропорциональное решение. Полученные решения проиллюстрированы на примере игры планирования производства в условиях конкуренции.

Во второй главе исследуются стохастические линейно-квадратичные дискретные игры со случайной продолжительностью. Рассматривается игра п лиц, динамика системы описывается системой уравнений

х(к + 1) = А(к)х(к) + ^Bi(k)ui{k) + w(k), i=1

где k0<k<L<oo,k0e 7+, х G Rm, щ 6 Rr, A(k), Bi(k) - матрицы размерности (m x m) и (m x г) соответственно, w(k) - m-мерный вектор возмущений, w(ko),... ,w(k) — взаимонезависимые случайные вектора с нулевым математическими ожиданиями и матрицами дисперсий W(k). Игра начинается в момент ко из состояния хо, момент ее окончания является реализацией случайной величины L, принимающей значения от ко до К с вероятностями 0 < qk < 1, к = 0,..., К, qK = 1. Выигрыш игрока г имеет вид:

Ji{k0, х0 ,и)= Е (хт(к)Р{(к)х(к) + и1(к)Щ(к)щ(к)\ +

+ хт{ЬЩ{Ь)х{Ь)^, Vi = 1,...,n,

где Pi(k), Ri(k) - симметричные матрицы размерности (m x m) и (г х г) соответственно. Каждый игрок стремится максимизировать свой выигрыш. Игроки выбирают только стратегии вида щ(к, x) = Mi(k)x, ко < к < L, i = 1,..., п.

Находится некооперативное и кооперативное решение описанной игры. Характеристическая функции строится по правилу, указанному в первой главе. В качестве дележа находится ES-вектор8 xN(ko)). В данной главе для нахождения равновесия по Нэшу и кооперативного решения по аналогии с первой главой формулируются соответствующие теоремы, исследуется вопрос динамической устойчивости ES-вектора. Выводятся достаточные условия, гарантирующие устойчивость ES-вектора против иррационального поведения игроков для этих решений.

8Driessen T. S. H. and Y. Funaki. Coïncidence of and collinearity between game theoretic solutions // OR Spektruui. 1991. N 13. P. 15-30.

Теорема 2. Вектор-функция Р(к) = (Р\(к),.. .,@п(к)), где

т = Ык,хгг(к))-Ь{к + 1,хн(к+1)), < = 1.....п (6)

является состоятельной во времени ПРД.

Утверждение 2. Если в линейно-квадратичной стохастической игре со случайной продолжительностью процедура распределения ЕБ-вектора вычисляется по правилу (6), то для выполнения условия устойчивости ЕБ-вектора против иррационального поведения игроков достаточно, чтобы для любого ко < к < К — I выполнялось неравенство

х"(к)Т{г{к) - [А(к) + В{к)м"(к))тг{к + 1)И*о + в{к)мы{к))хК{к)+

+ Е{ш1г{к)и1к} > О, (7)

где г (к) вычисляется по правилу - О^к) = Z(k), хм(к) - коопера-

¡елг

тивная траектория.

&х(к), Мм(к) - решения системы матричных уравнений, соответствующих теореме о нахождении кооперативного решения, ©¿(/с) - решение системы матричных уравнений, соответствующих теореме о нахождении равновесия по Нэшу. Приводится пример.

Третья глава посвящена линейно-квадратичным дискретным играм с нетрансферабельными выигрышами. Предполагается, что игроки не могут перераспределять выигрыши между собой.

В §3.1 исследуются игры с предписанной продолжительностью. Динамика игры описывается уравнением (1), к = 1,..., К — 1, выигрыши игроков имеют вид

К-1

Мк0,х0,и) =

к=к0

+ хТ(КЩ{К)х(К), \/г = 1,..., п, (8)

где Р^к) - симметричные отрицательно полуопределенные матрицы размерности (гп х тп). Я^к) - симметричные отрицательно определенные матрицы размерности (г х г). Каждый игрок стремится максимизировать свой выигрыш. Для таких задач находится Парето-оптимальное решение и исследуется

(хт{к)Р{(к)х(к) + и1(кЩ(к)щ(к)) +

его устойчивость, где под устойчивостью мы понимаем выполнение индивидуальной рациональности на всем промежутке игры. Здесь следует отметить, что в подавляющем большинстве случаев индивидуальная рациональность на всем промежутке игры может не выполняться, даже если игра развивается вдоль Парсто-оптималыюй траектории. Обозначим иа(к) = (и"(к),..., и"(к)) - оптимальный набор стратегий игроков, к) - кооперативную Парето-оптимальную траекторию, Vi(k,x(k)) - выигрыш игрока г в ситуации равновесия по Нэ-шу в подыгре, которая начинается в момент времени к из состояния ха(к), Щк, х(к)) = -xT(k)Qi(k)x(k). Пусть uf(jfe) = Ма(к)ха(к), i = 1,..., п.

JT.A. Петросяном и Д.В.К. Янгом9 была предложена процедура распределения выигрыша для дифференциальных игр с нетрансферабельными выигрышами, которая позволяет избежать неустойчивость Парето-оптимального решения. В данной главе выводится аналог этой процедуры для рассматриваемого класса игр.

Теорема 3. Если для некоторого Парето-оптимального решения выполняется Jf{kQ,xo,ua) > Vi{k0,Xa), i = 1,...,п, то процедура распределения выигрыша /3(к) вида

а пл _ Jj{kQ,x0,ua) - Vi(ko,xo)

PiW =-К _i_ ко-- Vi(k + !>х(к + !)) + vi(k, xn{k)), (9)

где i = 1 ,...,тг, к = l,..., К — 1, гарантирует выполнение условия индивидуальной рациональности этого Парето-оптимального решения вдоль всей кооперативной траектории, т.е. Vl,k0 < I < К, i = 1, выполняется

£ Pi{k) + (ха(К))ТЪ(К)ха(К) > ха(1)). k=l

Также исследован вопрос выполнения устойчивости против иррационального поведения игроков для Парето-отимального решения.

Теорема 4. В линейно-квадратичных дискретных играх с нетрансферабельными выигрышами с предписанной продолжительностью условие устойчивости против иррационального поведения игроков выполнено для любого Парето-отимального решения, состоятельная во времени процедура распределения

9Yeung D.W.K. and L.A. Petrosyan (2014). A Time-consistent Solution Formula for Bargaining Problem in Differential Games. Int. Game Theory Rev., 16(4), 1450016.

выигрыша ¡3(к) которого удовлетворяет неравенствам:

+ (ха{к))Т (^{А{к) + В(к)Ма(к))твг{к + 1 )(А{к) + В(к)Ма{к))-

ei(fc)jxa(fc)> 0, к0<к<К-1. (10)

Утверждение 3. Если для некоторого Парето-оптималъного решения в линейно-квадратичных дискретных играх с нетрансферабелъными выигрышами с предписанной продолжительностью выполняется ^(ко,хо,иа) > У{(ко,хо), г — 1,...,п, и процедура распределения выигрыша ¡3(к) вычисляется по формуле (9), то условие устойчивости против иррационального поведения игроков выполнено для этого Парето-отималъного решения.

В §3.2 исследуются игры с иетраисферабельными выигрышами с бесконечной продолжительностью. Динамика игры описывается уравнением (1), выигрыши игроков имеют вид (2). Находится Парето-оптимальное решение и исследуется вопрос его устойчивости. По аналогии с §3.1 здесь формулируется следующие теорема и утверждение.

Пусть щ(к) > 0 - такие функции, для которых выполняется:

оо

■/?(к0,х0,иа) -Уг(к0,х0) = т(к)-

к=к0

Теорема 5. Если для некоторого Парето-оптималъного решения выполняется ^{к0, х0, и") > Ц(к0, х0), г = 1,..., п, то процедура распределения выигрыша /3(к) вида

к) = щ(к) - Ц(к + 1, ха(к +1)) + К(к, ха(к))

г = 1,... ,п, к > к0 (11)

гарантирует выполнение условия индивидуальной рациональности этого Парето-оптималъного решения вдоль всей кооперативной траектории, т.е. выполняется

оо

^2т>У{{1,ха(1)), V/ > ко, 1=1,...,п. (12)

к=1

Теорема 6. В линейно-квадратичных дискретных играх с нетрансферабелъными выигрышами с бесконечной продолжительностью условие устойчивости

против иррационального поведения игроков выполнено для любого Парето-отимального решения, состоятельная во времени процедура распределения выигрыша/3(к) которого удовлетворяет неравенствам:

т + (а:а(*:))г^(Л(А;) + В(к)Ма{к))Тв>{к + 1)(А{к) + В{к)Ма{к))~

Qi(k)^xa(k) > 0, к>к0. (13)

Утверждение 4. Если для некоторого Парето-оптималъного решения в линейно-квадратичных дискретных играх с нетрансферабельными выигрышами с бесконечной продолжительностью выполняется J"(ho, xq, и") > Vi(ko,xo), i = 1 ,...,п, и процедура распределения выигрыша ¡3(к) вычисляется по формуле (11), то условие устойчивости против иррационального поведения игроков выполнено для этого Парето-отималъного решения.

В качестве примера в данной главе рассмотрена игра стабилизации государственного долга.

Четвёртая глава посвящена сетевым линейно-квадратичным дискретным играм с управляющей коалицией. Рассмотрим игру на сети G = (N, U), где N - конечное множество узлов сети, N — {1,2..., n}, U - множество пар (i,j), называемых дугами, i £ N, j £ N. Узлами сети считаем игроков. Предполагаем, что сеть G представляет структуру руководства или влияния некоторой организации.

Перед началом игры определятся управляющая коалиция Р. В качестве такой коалиции, например, можно взять базу, т.е. коалицию включающую наименьшее число лиц, влияющих на каждого члена организации. Если в графе существует несколько баз, то в качестве управляющей коалиции можно взять их объединение.

Для игроков, не входящих в управляющую коалицию, задается динамика, характеризующая состояние системы в каждый момент времени:

х(к + 1) = Ах(к) + BiUi{k), (14)

ieN\P

где к0 < к < К < оо, ко, К е Т+, х(к0) = х0, х £ Rm - вектор-столбец, щ е R-управление игрока г, г G N\P ; A,Bi~ матрицы размерности (от х то) и (то х 1)

соответственно, х(к0) = Xq ~ начальное состояние. Пусть N\P = {¿1,..., in-p], Si = {j S N\P : (i,j) G U} - множество игроков из N\P, для которых существует ребро (i, j). Выигрыш игрока i £ N\P обозначим через Ji(ko, xq, и), где и = (ujj,... ,uin_p). Будем предполагать, что выигрыш игрока i имеет вид:

к-1 ,

Ji(k0, xq, и, W) = J2 ( xT(k)Pix(k) + и2{[к)п + Y, u)(k)Wij-к=к0 ^ jeSi

- Y^ и]{к)гиЛ+хт(К)Р{х(К), Vi € N\P, (15) j-.ieSj '

где Pi - симметричные матрицы размерности (m х m), Г{ S R, € M <Z R - вес ребра (i,j), который задаётся управляющей коалицией на первом шаге игры, W - матрица весов, M - конечное множество значений весов, Pi, г, -фиксированные параметры заданные в начале игры. Каждый игрок стремится максимизировать свой выигрыш. Предполагается, что игроки выбирают только стратегии вида щ(к,х) = Mi(k)x, к0 < к < К, г € N\P.

Влияние управляющей коалиции на ход игры заключается только в выборе весов {wij}ie^\p,jeN\p- Целью управляющей коалиции является максимизация суммарного выигрыша игроков, не вошедших в коалицию Р.

В работе находится некооперативное и кооперативное решение игры. Приведен пример линейно-квадратичной игры на сети с управляющей коалицией. Продемонстрирована неустойчивость решения.

В Заключении приведены основные результаты, полученные в ходе исследования.

Публикации автора по теме диссертации

1. Марковкина A.B. Линейно-квадратичные неантагонистические дискретные игры // Процессы управления и устойчивость: Труды 38-й международной научной конференции аспирантов и студентов / Под ред. Н.В. Смирнова, Г.Ш. Тамасяна - СПб.: Издат. Дом С.-Петерб. гос ун-та, 2007. С. 580-585.

2. Тур A.B. Теоретико-игровая модель планирования производства в условиях конкуренции // Процессы управления и устойчивость: Труды 39-й

международной научной конференции аспирантов и студентов / Под ред. Н.В. Смирнова, Г.Ш. Тамасяна - СПб.: Издат. Дом С.-Петерб. гос ун-та, 2008. С. 517-522.

3. Тур А.В. Условие Д.В.К. Янга в линейно-квадратичных дискретных играх // Процессы управления и устойчивость: Труды 40-й международной научной конференции аспирантов и студентов / Под ред. Н.В. Смирнова, Г.Ш. Тамасяна - СПб.: Издат. Дом С.-Петерб. гос ун-та, 2009. С. 678-683.

4. Тур А.В. Линейно-квадратичные неантагонистические дискретные игры // Управление большими системами. Выпуск 26.1. М.: ИПУ РАН, 2009. С. 139-163.

5. Тур А.В. Условие Д.В.К. Янга в линейно-квадратичных дискретных играх с неполной информацией // Процессы управления и устойчивость: Труды 40-й международной научной конференции аспирантов и студентов / Под ред. Н.В. Смирнова, Г.Ш. Тамасяна - СПб.: Издат. Дом С.-Петерб. гос унта, 2010. С. 718-723.

6. Тур А.В. Линейно-квадратичные стохастические дискретные игры со случайной продолжительностью // Математическая теория игр и её приложения. Петрозаводск: КарНЦ РАН, 2014. Т. 6, В. 3. С. 76-92.

7. Tur Anna V. Dynamic Game-theoretic Model of Production Planning under Competition // Contributions to Game Theory and Management. Vol II. Collected papers/ Editors Leon A. Petrosjan, Nikolay A. Zenkevich , SPb, Graduate School of Management, SPbU, 2009. P. 474-482.

8. Tur Anna V. The Irrational Behavior Proof Condition for Linear-Quadratic Discrete-time Dynamic Games with Nontransferable Payoffs // Contributions to Game Theory and Management. Vol VII. Collected papers/ Editors Leon A. Petrosjan, Nikolay A. Zenkevich , SPb, Graduate School of Management, SPbU, 2014. P. 384-392.

Подписано в печать 26.03.2015. Формат 60 х 84 Чи. Бумага офсетная. Гарнитура Times . Печать цифровая. Усл. печ. л. 1,00. Тираж 100 экз. Заказ № 6173.

Отпечатано в отделе оперативной полиграфии Института химии СПбГУ 198504, Санкт-Петербург, Старый Петергоф, Университетский пр. 26. Тел.: (812}-428-69—19, 428-40-43