Сильные равновесия в некоторых классах динамических игр тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Зятчин, Андрей Васильевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
2010 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Диссертация по математике на тему «Сильные равновесия в некоторых классах динамических игр»
 
Автореферат диссертации на тему "Сильные равновесия в некоторых классах динамических игр"

804611729

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

СИЛЬНЫЕ РАВНОВЕСИЯ В НЕКОТОРЫХ КЛАССАХ ДИНАМИЧЕСКИХ ИГР

Специальность 01.01.09 - дискретная математика и математическая кибернетика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

На правах рукописи

Зятчин Андрей Васильевич

2 8 ОКТ 2010

Санкт-Петербург

2010 г.

004611729

Работа выполнена на кафедре математической теории игр и статистических решений факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета.

Научный руководитель:

Официальные оппоненты:

Ведущая организация:

кандидат физико-математических наук,

доцент

Зенкевич Николай Анатольевич.

доктор физико-математических наук,

профессор

Мазалов Владимир Викторович.

кандидат физико-математических наук, Грауэр Лидия Вальтеровна.

Институт математики и механики УрО РАН (г. Екатеринбург).

Защита состоится «2?» р-А 2010 г. в т1з • <9<9часов на заседании

совета Д.212.232.59 по защите докторских и кандидатских диссертаций при Санкт-Петербургском государственном университете по адресу: 199034, г. Санкт-Петербург, В. О., Средний пр., д. 41/43, ауд. 5У■{

С диссертацией можно ознакомиться в библиотеке СПбГУ им. М. Горького по адресу: Санкт-Петербург, Университетская наб., 7/9.

Автореферат разослан «2"С »2010 г.

Ученый секретарь

диссертационного совета,

доктор физ.-мат. наук, профессор .уГ В. Д. Ногин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Динамические игры многих лиц представляют собой бурно развивающийся раздел теории игр, поскольку с их помощью удается создавать адекватные модели для исследования практических задач из области международных отношений, экономики, менеджмента, экологии, биологии, охраны окружающей среды, рационального природопользования.

В теории игр, и динамических играх в частности, актуальными остаются проблемы выбора принципа оптимальности и разработки конструктивной техники нахождения оптимального решения.

Важным вопросом теории дифференциальных игр является построение позиционных сильных равновесий. Известно несколько концепций сильного равновесия в игре многих лиц, принадлежащих Р. Ауманну (1959), Э. Мулену (1985), Л.А. Петросяну (1998), Л.В. Грауэр и Л.А. Петросяну (2002). В диссертационной работе исследованы сильное равновесие в широком и узком смыслах. В каждом из этих случаев под сильным равновесием понимается ситуация, в определенном смысле устойчивая относительно коалиционных отклонений игроков. Особенность сильного равновесия состоит в том, что оно является одновременно равновесием по Нэшу и парето-оптимальным решением, т.е. удовлетворяет свойствам коллективной и индивидуальной рациональности игроков. Основным недостатком широкого применения концепции сильного равновесия в статике является то, что оно крайне редко существует даже в классе игр двух лиц.

В теории динамических игр при построении сильных равновесий часто используются народные теоремы, что позволяет в некоторых случаях найти такое решение в стратегиях наказания. Примерами таких исследований являются работы Л.В. Грауэр и Л.А. Петросяна (2002), Л.А. Петросяна и Д.В. Кузютина (2000). Недостатками такого подхода являются необходимость согласия всех игроков на использование угроз, а также наличие достаточной силы у коалиций для реализации угрозы наказания. До сих пор актуальным и открытым остается вопрос построения позиционных сильных равновесий в детерминиро-

ванных и стохастических дифференциальных играх, решению которого для динамических игр специального вида и посвящено данное диссертационное исследование.

Цель диссертационной работы состоит в исследовании динамических игр на предмет разработки новой техники построения позиционного сильного равновесия, основанной на формулировке и обосновании новых достаточных условиях его существования.

Научная новизна работы. В диссертационной работе впервые предложены достаточные условия существования сильного равновесия в детерминированных и стохастических дифференциальных играх. При формализации оценки качества стратегии коалиции для позиционного сильного равновесия в широком смысле разработана специальная техника, основанная на скаляризации векторного критерия, компонентами которого являются функции выигрышей игроков, входящих в коалицию. Это позволило применить метод динамического программирования при формулировке и обосновании достаточных условий существования позиционного сильного равновесия.

Для динамической игры защиты атмосферы от загрязнения разработана техника определения такого размера штрафа, при котором парето-оптимальное решение является равновесием по Нэшу, и при этом общее загрязнение атмосферы не превышает предельно допустимой концентрации.

Достаточные условия существования позиционного сильного равновесия получены в конструктивном виде, что позволяет говорить о новой технике построения сильного равновесия. Применение техники проиллюстрировано на примерах решения дифференциальных игр двух и трех лиц в случаях детерминированной и стохастической динамики. Разработанная в диссертационной работе техника при дальнейшем развитии может быть использована для построения сильных равновесий в более широких классах дифференциальных игр.

Практическая ценность работы следует из практических областей применения результатов в области динамических игр, например, формирования долгосрочных отношений, защиты окружающей среды, совместной разработки

недр, научно-исследовательских разработок, моделей управления в экономике и менеджменте.

Основные результаты, выносимые на защиту:

1. Теоремы о достаточных условиях существования позиционного сильного равновесия в дифференциальной игре, содержащие метод нахождения подобных ситуаций. Решение примеров задач конфликтного управления для проверки разработанной техники.

2. Теорема о достаточных условиях существования позиционного сильного равновесия в стохастической дифференциальной игре. Использование разработанной техники на примере игры трех лиц.

3. Построение парето-оптимального равновесия в модели защиты атмосферы от загрязнения

Апробация работы. Основные результаты были представлены на I-IV Международных конференциях «Теория игр и менеджмент» (Санкт-Петербург, 2007-2010); на Международном научном совещании «Workshop оп Networking Games and Management» (Петрозаводск, 2009); на Международной конференции «Дифференциальные уравнения и топология» (Москва, 2008); на Международной конференции «The Second International Conference on Game Theory and Applications» (China, 2007); на Международной конференции «7th Meeting on Game Theory and Practice dedicated to Energy, Environment and Natural Resources» (Монреаль, 2007); на Международном конгрессе по нелинейному динамическому анализу, посвященному 150-летию А.М. Ляпунова (Санкт-Петербург, 2007); на 12-м Международном симпозиуме «International Symposium on Dynamic Games and Applications» (София Антиполис, 2006); на российско-финской летней школе «Динамические игры и многокритериальная оптимизация» (Петрозаводск, 2006); на XXXV-XXXVII научных конференциях аспирантов и студентов «Процессы управления и устойчивость» (Санкт-Петербург, 2004-2006); на V Международной научно-практической конференции «Актуальные проблемы экономики и новые технологии преподавания (Смирновские чтения)» (Санкт-Петербург, 2006); на Международной конференции «Stability and control processes» (Санкт-Петербург, 2005), а также на се-

минарах кафедры математической теории игр и статистических решений, центра теории игр факультета Прикладной математики - процессов управления, научном семинаре кафедры операционного менеджмента Высшей школы менеджмента СПбГУ.

Публикации работы. По материалам диссертации опубликовано 16 работ, 2 из которых - в журналах, рекомендованных ВАК.

Структура и объем работы. Диссертация состоит из введения, трех глав, разделенных на параграфы, и списка литературы. Список литературы включает 133 наименования.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обсуждается актуальность темы диссертационного исследования и новизна полученных результатов, а также их место в теории дифференциальных игр.

Первая глава состоит из двух параграфов и посвящена нахождению позиционного сильного равновесия дифференциальной игры конечной продолжительности с детерминированной динамикой.

Обозначим через Т(х0,Т — ^) дифференциальную игру конечной продолжительности Г — ¿0 из начального состояния х0, где £0 > О, Т > <0 - моменты начала и окончания игры соответственно. Обозначим через N = {1,...,г,...,п} - множество игроков в игре Г(х0,Т — ¿0). Динамика состояния игры Г(х0,Т - ¿0) имеет вид:

х = /(<,1,^,...,^), х(га) = х0, где х(4) е В., х0 - известное начальное состояние игры, и.(Ь) - управление игрока г £ N в момент времени I. Выигрыш игрока % е N имеет вид:

Т

Предполагается, что игрок г е N стремится максимизировать значение функционала /Д.иД...,«.(•)>...,«,(•)) по «.(•)•

Пусть 5 С N - произвольная коалиция в игре Г(я0,Т - £0). Обозначим через 1р5{) = позиционную стратегию коалиции ¿>. Позиционную стратегию

дополнительной коалиции N \8 будем обозначать через или <р_5(-). Определение 1. Набор позиционных стратегий {р.&х), (4,х)е[£0,Т]хЛ, ге

образует ситуацию сильного равновесия в широком смысле в игре Г(х0,Т — 40), если ММ С N, У(/5М(-) не выполнено: Уг 6 М

Т

Л(«..^О.^О) = [«,^(0,+ г,К'П) >

т

и Эг0 £ М такой, что:

Т

«о °

Т

> /д(а [*, *(*)> 4 (*.*)] Л + ^ [*'(т)] = \ (хо-<£(■)' ¿„(О),

где

Множество всех ситуаций позиционного сильного равновесия в смысле определения 1 в игре Г(ж0,Г — ¿0) обозначается через £М£?(Г(х0,Т — <0)).

Для построения позиционного сильного равновесия в широком смысле используется специальная техника, основанная на скаляризации в виде линейной комбинации функций выигрышей игроков, входящих в коалицию. Достаточные условия существования сильного равновесия в смысле определения 1 сформулированы в виде условий на коэффициенты такой линейной комбина-

ции. С этой целью вводятся векторы вида: А1"'1' = ^Л;""'1,.--, е Еп, где

= 0 при j и Aj"1'1 = 1. Доказан следующий результат. Лемма 1 .Для того чтобы ситуация

■¿СО = (víO.ÍPjOi-.vKO) G SME{T(x0,T-t0j), т.е. была сильным равновесием в смысле определения 1, достаточно, чтобы для любой коалиции S С N существовал такой номер 6 S, при котором для любой стратегии ips(-) ^ çc'Q этой коалиции выполнялось неравенство:

¡=i ¡=i Для определения позиционного сильного равновесия в узком смысле вводятся следующие обозначения: gs |t,x, u^J = u^J, qs = y~j¡. jzj.

¡es íes

Определение 2. Набор позиционных стратегий

{v>;(t,x), (t,i)e[t0,T]xñ, ¿ejv}

образует ситуацию позиционного сильного равновесия в узком смысле в игре T(xQ,T —10), если следующие неравенства выполнены для всех коалиций S ÇN и стратегий <ps(-) :

Т

Js(xo>VwO) = f9s [*>х'(£)'VM{t,х\w(í,z)]dt + gs [z 'о

Т

>¡9s\t,¿s](t),<pM(t,x),<p:M(t,X)\dt + qs [x[s|(T)] = ^fo.^O.^O), 'о

где

¿s\t)=f\t¿%t),vM{t,x),v:u{t,x)\, x[s)(¿0)=*0, x{t) = f\t,x'{t),(p'M(t,x),ip'_M(t,x)\, x(ta) = x0.

Множество всех ситуаций позиционного сильного равновесия в смысле определения 2 в игре Г(х0,Т - f0) обозначим через SPE(t(xb,T -í0)).

Доказан следующий результат, характеризующий связь между понятиями.

Лемма 2. БРЕ (г(х0, Т - у) С БМЕ (Г(х0, Т - у).

Основным результатом первой главы является следующая теорема. ■

Теорема 1. £с/ш б игре Г(х0,Т — ¿0) для каждой коалиции Б С N, 3^=0,

существует номер г® € 5 и непрерывно-дифференцируемое на [0,Т]х Д решение системы экстремальных дифференциальных уравнений в частных производных вида

У15,(г,х) + тах

1=1

= У^Ц, х) + / [*, х, х), ¿,(4, I)] ®) + ¿>Н1,- Ь *)>£,(*.*)] =0 •

»=1

где для всех Б С N максимум в левой части достигается на единственном наборе непрерывно дифференцируемых на [<0,Т] х К функций

[у%х), (¿,х)е[уТ]хД, ¿6^}, то набор |</з*(£,ж), (¿,х) е [£0,Т]х Д, г е /V| является позиционным сильным равновесием в широком смысле в игре Г(г0, Т — ¿0).

Для решения примеров дифференциальных игр исследовано дифференциальное уравнение в частных производных вида:

дУ(Ь,х) дх

цЩ^^Ц^о, (1)

ах ох

У(Т,х) = щх,

где а, Ъ, г]1, г}2, т]3 - заданные параметры, Ь т)г, г(£) - непрерывно-

дифференцируемая функция на отрезке [40,Т].

Лемма 3. Уравнение (1) имеет на отрезке [£0, Т] единственное решение

.... , дУ{1,х)

Уи,х), причем.--—= т),е24

ах

Подробно исследован пример дифференциальной игры трех лиц конечной продолжительности с детерминированной динамикой, в которой позиционное сильное равновесие в смысле определения 1 найдено в явном виде.

Во второй главе изучен класс дифференциальных игр конечной продолжительности со стохастической управляемой динамикой типа процесса Ито. Сформулированы достаточные условия существования сильного равновесия и решен пример игры трех лиц.

Обозначим через Г(аг0,Г — ¿0) стохастическую дифференциальную игру

продолжительности Т-40, из начального состояния ж0 и множеством игроков N = {1,...,г',...,п}, где ¿0, Т - моменты начала и окончания игры соответственно. Стохастическая динамика состояния игры имеет вид:

йх{т) = /(*,*(*),1^),.»,«,ф)я + 1г(«,ат(0)«Ь(0. х((0) = . Здесь ¿(4) - состояние стандартного винеровского процесса, € Л - переменная состояния игры, и.{{) - управление игрока i в момент времени t. Выигрыш игрока г € N имеет вид:

jg.it, х(Ь),и^)ип(№ + д.(х(Т))

где через Е обозначен оператор математического ожидания.

Решение игры будем искать в смысле позиционного сильного равновесия из 5РД(Г(х0,Г-г0)).

Определение 3. Набор стратегий

Ф%х) = (<£(«,••-,<(*,*)), I е к, г],

будем называть позиционным сильным равновесием в стохастической дифференциальной игре Г(х0,Т — <0), если следующие неравенства выполнены для всех коалиций Б С N, 5 ^ 0 и стратегий ф3{Ъ х) 6 1/$ :

£

>

Т *

где

dx

*(£) = f{ty(t),4l(t,x)^s(t,x))dt + a(t,x(t))dz(t), x{%) = x„, dx's>(t) = f(t,xlsi(t),<fis(t,x)^s(t,x))dt + a(t,x^(t))dz(t), x[%) = xa.

Справедлива следующая теорема, доказательство которой основано на технике, разработанной У.Флемингом (1969) для решения задач стохастического оптимального управления.

Теорема 2. Если в игре T(x0,T — ta) для каждой коалиции S С N, 5*0

существуют дважды непрерывно-дифференцируемые функции х) и набор стратегий ф^(t,x) = [ф1(Ь,х),ф'2Ц,х),...,ф'^,х)}, </>*(i,x(i)) Е U., i<=N, <^s(£,x(i)) = fy*(t,x(t))}i(iN^s, удовлетворяющие следующей системе уравнений:

+ max |/ (i, х, us, ф'^ (i, х)) Vf1 (i, x) + gs (t, x, us, ф'^ (i, x))| =

= 0, Us(t) 6 us, V(T,x) = qs(x), тогда для заданных начальных условий [£„,£„] набор стратегий ф'ы(¿,х) принадлежит множеству SPE игры T(xa,T — t0).

Решен пример стохастической дифференциальной игры с линейной динамикой и квадратичными функционалами выигрышей. Позиционное сильное равновесие получено в явном виде на основе применения теоремы 2.

В третьей главе проводится исследование теоретико-игровой модели защиты атмосферы от загрязнения в статическом и динамическом случаях. В диссертационной работе ставилась задача построения такой функции штрафа s = s(x), х > 0, чтобы в игре существовало такое парето-оптимальное равновесие по

Нэшу, (q"E(x),...,q"E(x)), на котором усредаенное по региону значение концентрации загрязняющей примеси в атмосфере не превосходило предельно-допустимой концентрации (ПДК). Здесь х > 0 - наблюдаемый параметр. Построенное равновесие обладает свойствами индивидуальной и коллективной рациональности и в этом смысле решает задачу экологического дизайна.

Пусть уровень предельно-допустимой концентрации (ПДК) загрязняющей примеси в регионе определен и равен в > 0. Предполагается, что усредненное по региону значение концентрации загрязняющей примеси в атмосфере при

п

наличии п источников можно оценить по формуле:ш = d.U., где w. - объем

•=1

выбросов предприятия г, d. > 0 - известные параметры, характеризующие местонахождения и технические характеристики источников выбросов.

Будем называть предприятие i е N = {1, 2,..., п} игроком. Пусть выполнены следующие предположения:

1. все игроки имеют одинаковые удельные затраты с;

2. d,=d, ieN;

3. производственная технология каждого игрока такова, что объем выбросов загрязняющей примеси и. игрока i пропорционален объему производимой продукции q. е [0, об) т.е.

ТУ п

иМ) = ßii и ^(v-xij = <*Х><(<?4) = ^Гд • (2)

¡=1 i=i

п

Обозначим через Q = ^2q - региональный выпуск. Тогда (2) переписыва-

¿=1

ется в виде w(g1(...,gj = dßQ.

Предположим, что административное регулирование воздействия на окружающую среду осуществляется посредством штрафа s. > 0, который назначается каждому предприятию i в случае, когда и; превышает ПДК в.

Рыночная цена продукции р = p(Q, х), а также размер штрафа s = s(x) зависят от параметра г > 0. Пусть функция цены р(<Э,х) линейна:

р((},х) = (а-ЪО)х, где а>0 и Ь > О - заданные параметры. Тогда функция выигрыша игрока % принимает следующий вид:

Ki(x,qv...,qJ =

^(^.^.-.gj-^x), dPQ > в

где д.(х,qv...,qj = q.({a - bQ)x - с), Q = J^q..

м

В результате определен класс одношаговых игр в нормальной форме при наличии штрафов:

г(х) = (ади.^г^-.О}«,.).* >

Рассмотрим задачу определения функции штрафа s = s(i) таким образом, чтобы в игре Г(х) существовало парето-оптимальное равновесие по Нэшу, (q^E(x),...,q"E(x)), причем в этой ситуации усредненное по региону значение концентрации загрязняющей примеси в атмосфере ш не превосходило ПДК,

т.е. ы(д?Е(х),...,д™(х)) = d^E(x) < в.

•=1

В работе сначала найден явный вид симметричного равновесия по Нэшу ¡c[\x),...,q'(xfj, х > 0 в предположении, что s(x) = О, х > 0. Исследованы два случая:

1. Определены условия на параметры модели, при которых в ситуации (q'(x),...,q'(xjj, х> 0 усредненное по региону значение и < в.

2. Пусть в ситуации (^q\x),...,q"(xfj, х > 0 имеет место неравенство ш > в, т.е. ПДК превышена. Решена задача нахождения наилучшего ответа q"(x], х> 0, игрока i, u(qv...,q",...,qn)<6. В предположении о симметричности за-

(** \ ** в

q",...,q"), где q" =-. Построена функция

' nd.0

штрафа вида:

s(z) =

[а (n + 1)^ с

[2b 2nd0 ~2bx

bx> Q.

(3)

Теорема 3. Пусть функция штрафа х > 0 имеет вид (3). Тогда:

1) В игре Г(х), х > 0, существует равновесие по Нэгиу,

при котором < в;

2) Равновесие по Нэшу имеет вид:

0{п + 1)

О, О < х < ах —с

(п +1 )хЬ'

>4-

Ь(п + 1)

О, 0 < х < ах —с

(п + 1)хЬ

, \<х<А^,

мъ> Х>А»

гдеА=- А ~ СйпР

^ а' айп0-Ъ(п + 1)в'

Отдельно исследовано кооперативное поведение игроков. Показано, что

максимальный суммарный выигрыш игроков достигается на региональном

_»»», , ах —с _

выпуске С} (х) =-, х > 0.

2 Ьх

Аналогично бескоалиционному поведению исследованы два случая:

1. Определены условия на параметры модели, при которых ш < в при суммарном объеме производства на уровне (2***(ж), х > 0.

2. Пусть при С£"(х) величина ш > в.

Решена задача нахождения такого значения <2. на котором выигрыш коалиции N является максимальным при условии, что ш < в. Решение задачи по-

9

лучено в явном виде <2" = —. Построена функция штрафа вида:

т„(х) =

[о в ' с

[2Ь йР ~2Ьх

Ьх >0, х> 0.

(4)

Теорема 4. Пусть в < , х> А3 и функция штрафа т[г(х) определена в

п ^ £

виде (4). Тогда любая ситуация д = (д1,...,о'а), для которой ^д. =<Э" = —,

¡=1 ' <10

является парето-оптималънымрешением в игре Г(х), х > А^.

Следующая теорема объясняет взаимосвязь полученных результатов для случаев некооперативного и кооперативного поведения.

Теорема 5. Пусть в < х > А и функция штрафа 5(2), х > 0 опреде-26

лена в виде (3). Тогда в игре Г(х), х > А3 существует парето-оптималъное равновесие вида:

_ (_&_ в [пй/З' 'nd.pl

Проводится обсуждение результатов моделирования для статической игры, где при сравнении выигрышей игроков в случаях кооперативного и некооперативного поведения в зависимости от значений параметра в, делается вывод о целесообразности и размере снижения объемов выбросов загрязняющей примеси с помощью регулирования коэффициента пропорциональности /3. Приводится «ступенчатая» схема назначения размера штрафа в зависимости от наблюдаемых значений параметра х > 0.

Исследована также динамическая модель защиты атмосферы от загрязнения. Для этого определена динамическая игра х0), в которой в каждый момент времени Ь > 0 разыгрывается статическая игра

ад) =

при этом х(р), £ > ¿0 удовлетворяет дифференциальному уравнению

¿ = /(1), х(Ьй) = хй, х0>0, где /(х) > 0, х > 0 - заданная непрерывно дифференцируемая функция. Функция выигрыша игрока г в игре (7(40,х0) имеет вид:

ЛМЛ-),?-,(■)) = тах [е^ЪШ.фСтП^МтМЛт,

<3

где

д.((а — Ь0)х — с), < 9,

?Д(а — ЪС$)х — с) — к(х), йрС} > в,

к.{х), х > 0 - функция штрафа.

Тогда функция выигрыша максимальной коалиции N примет вид:

00

где

<2((а —&<Э)ж —с), й№<в

С((а - - с) - 3>0'

Теорема 6. Пусть, х > —= А, в < ^(г) = в(х), х> 0 и ¿(х) айр — 2вЬ 26 '

задана (3). 7огдя е динамической игре ситуация д" =

является парето-оптимальнымравновесием, при этом < в.

Рйп ' рйп

СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи в научных рецензируемых журналах из списка ВАК:

1. Модель олигополии при экологических ограничениях с позиций корпоративной социальной ответственности// Вестник СПбГУ, сер. 8, 2009, вып.1 (в соавторстве с H.A. Зенкевичем). - С. 33-62. - 1,7/0,85 п.л.

2. Сильное равновесие в дифференциальной игре со стохастической динамикой // Вестник СПбГУ, сер. 10, 2009, вып.4 (в соавторстве с H.A. Зенкевичем). - С. 84-94. - 0,6/0,3 п.л.

Статьи в научных рецензируемых журналах

3. Oligopoly Competition under Environmental Design // Game Theory and Applications, Volume 12, Nova Science Publishers, New York, 2007 (в соавторстве с H.A. Зенкевичем). - 0,9/0,45 пл.

4. Построение сильного равновесия в дифференциальной игре многих лиц // Математическая теория игр и ее приложения, 2010, т. 2, вып. 2 (в соавторстве с H.A. Зенкевичем). - С. 42-65. - 1,4/0,7 п.л.

Статьи и тезисы в сборниках

5. Динамическая модель олигополии в условиях неопределенности // Труды 35-й научной конференции аспирантов и студентов «Процессы управления и устойчивость». СПб.: Изд. СПбГУ, 2004 (в соавторстве с НА. Зенкевичем). - С. 610-616. - 0,4/0,2 пл.

6. Исследование динамической модели Мавдональда-Сайгела. // В кн.: Зенкевич H.A. (ред.) Математические методы исследования экономики. СПб.: Изд. МБИ, 2004. (в соавторстве с Н.А.Зенкевичем). - С. 47-56. - 0,6/0,3 п.л.

7. Стохастическая асимметричная модель олигополии // Труды 36-й научной конференции аспирантов и студентов «Процессы управления и устойчивость». СПб.: Изд. СПбГУ, 2005 (в соавторстве с H.A. Зенкевичем). -С. 479-484.-0,3/0,15 пл.

8. Nash equilibrium in a stochastic differential game with perfect, imperfect and ' unsymmetrical information // Proceedings of the International Conference

"Stability and control processes". SPb, Russia, 2005 (в соавторстве с H.A. Зенкевичем). - 0,5/0,25 пл.

9. Народная теорема в одной стохастической игре // Труды XXXVII научной конференции аспирантов и студентов «Процессы управления и устойчивость». СПб.: Изд. СПбГУ, 2006. - С. 546-549. - 0,2 п.л.

10. Стохастическая модель процесса конкуренции в случае полной, неполной и асимметричной информации // Математические исследования в экономике. Монография. Под ред. Н.А. Зенкевича, Д.В. Кузютина, СПб.: Изд-во МБИ, 2006. - С. 131-148. -1/0,5 пл.

11. Cooperative solutions for games with a stochastically variable parameter // in Proceedings of the 12th International Symposium on Dynamic Games and Applications, France, 2006. (в соавторстве с Н.А. Зенкевичем). - 0,1/0,05 пл.

12. Nash Equilibrium in a Stochastic Differential Game with Perfect, Imperfect and Unsymmetrical Information // Динамические игры и их приложения. Сборник трудов молодых ученых, факультет Прикладной математики -процессов управления СПбГУ, 2006, 300с. (в соавторстве с Н.А. Зенкевичем). - С. 287-296. - 0,5/0,25 пл.

13. Solution and design for an environmental protection game // in Proceedings of the Russian-Finnish Graduate School Seminar "Dynamic Games and Multicri-teria Optimization", Karelian Research Centre, RAS, 2006. - 0,3 пл.

14. Financial Instruments in a Problem of Stochastic Characteristic Function and Imputation Construction // Contributions to game theory and management. Vol. I. Collected papers presented on the International Conference Game Theory and Management / Editors Leon A. Petrosjan, Nikolay A. Zenkevich. -SPb.: Graduate School of management, SPbSU, 2007. - 0,5 пл.

15. Strong Nash Equilibrium in a Repeated Environmental Engineering Game with Stochastic Dynamics // Proceedings of the Second International Conference on Game Theory and Applications, Published by World Academic Union, 2007 (в соавторстве с H.A. Зенкевичем). - 0,22/0,11 пл.

16. Strong Equilibrium in Differential games // Contributions to game theory and management. Vol III. Collected papers presented on the International Conference "Game Theoiy and Management". - SPb.: Graduate School of management, SPbU, 2010 (в соавторстве с Н.А. Зенкевичем). - 1,1/0,55 пл.

Подписано в печать 09.09.2010 г. Формат 60 х 90 '/м-Печать ризографическая. Заказ №811. Объем 1,0 усл. п.л., 0,55 уч.-изд.л. Тираж 100

Издательство «Высшая школа менеджмента» 199155, С.-Петербург, Волховский пер., д. 3. Тел. (812) 323-84-60; факс (812) 323-84-51

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Зятчин, Андрей Васильевич

Введение.

Глава 1. Позиционное сильное равновесие в дифференциальной игре.

§1.1 Определение позиционного сильного равновесия.

§ 1.2 Позиционное сильное равновесие в дифференциальной игре с линейной динамикой.

Глава 2. Позиционное сильное равновесие в стохастической дифференциальной игре.

§2.1 Достаточные условия существования позиционного сильного равновесия в стохастической дифференциальной игре

§ 2.2 Позиционное сильное равновесие в симметричной стохастической дифференциальной игре.

Глава 3. Построение парето-оптимального равновесия в динамической модели защиты атмосферы от загрязнения

§ 3.1 Постановка задачи.

§ 3.2 Равновесие по Нэшу в статической модели.

§3.3 Парето-оптимальное решение модели.

§ 3.4 Обсуждение результатов моделирования.

§ 3.5 Динамическая модель охраны атмосферы от загрязнения . 89 Литература.

 
Введение диссертация по математике, на тему "Сильные равновесия в некоторых классах динамических игр"

Актуальность темы. Теория динамических игр представляет собой бурно развивающийся в настоящее время раздел математической теории игр, которая ведет свой отсчет как самостоятельное научное направление с момента выхода книги Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение» [38, 119]. Формирование отечественных научных школ по теории игр связано прежде всего с именами H.H. Воробьева и Ю.Б. Гермейера [5-7]. Актуальность теоретических и прикладных результатов, получаемых в области динамических игр, в первую очередь обусловлена реалистичностью исследуемых в этом разделе математических моделей, поскольку главной особенностью динамических игр является возможность построения математических моделей конфликтов, развивающихся во времени. В частности, в дифференциальных играх изучается класс конфликтно-управляемых процессов, в которых изменение состояния игры описывается системой дифференциальных уравнений на временном промежутке заданной продолжительности [25-27].

Определение класса стратегий, в котором ищется решение дифференциальной игры, зависит от предположений относительно информационной структуры конфликтного процесса. Будем различать два класса стратегий: программные и позиционные.

Программные стратегии зависят от начального состояния и являются функциями времени. Равновесие в программных стратегиях в неантагонистической игре исследовалось, например, в книге [68].

Позиционные стратегии зависят от времени и наблюдаемого в этот момент состояния игры [29]. Впервые проблема построения позиционного равновесия в дифференциальной игре исследована в работе [65]. Вопрос совпадения множеств равновесии в программных и позиционных стратегиях исследован в работах [91, 121].

В теории дифференциальных игр ее приложениях важным вопросом является построение позиционных сильных равновесий. В настоящее время известно несколько определений сильного равновесия [9, 37, 46, 62, 84, 106]. В диссертационной работе, в частности, исследовались сильное равновесие в широком [37] и узком [9, 46] смыслах. При этом в каждом случае под сильным равновесием понимается ситуация, в определенном смысле устойчивая относительно коалиционных отклонений игроков. Этот принцип оптимальности исследован для классов игр в нормальной и развернутой формах (см., например, [37, 49, 50, 57, 84]). Уникальность сильного равновесия состоит в том, что оно является одновременно равновесием по Нэшу и парето-оптимальным решением, т.е. удовлетворяет свойствам коллективной и индивидуальной рациональности игроков [10, 40, 54]. Основным недостатком применения концепции сильного равновесия в статике является то, что оно крайне редко встречается даже в классе игр двух лиц [37, 39, 88, 117].

В теории динамических игр при попытках нахождения сильных равновесий часто используются народные теоремы, что позволяет в некоторых случаях построить такое решение в стратегиях наказания [9, 50, 61, 81, 83, 84]. Недостатками этого подхода является необходимость согласия всех игроков на его применение, а также наличие достаточной силы коалиций для реализации угрозы наказания.

При исследовании дифференциальных игр часто используется принцип оптимальности Беллмана, что позволяет свести задачу построения оптимального решения к решению экстремального уравнения в частных производных. С помощью такой техники в ряде случаев удается найти равновесие по Нэшу или парето-оптимальное решение [21, 125]. При этом в исследуемой модели необходимо дополнительно учитывать условия существования и единственности решения системы дифференциальных уравнений, описывающей динамику игры, гладкость функции Беллмана, а также функций мгновенного и терминального выигрышей игроков. Эти условия служат основным препятствием для определения подклассов дифференциальных игр, в которых удается построить сильное равновесие. При этом до сих пор остается открытым вопрос построения позиционных сильных равновесий.

Диссертационная работа посвящена построению сильных равновесий в дифференциальных и стохастических дифференциальных играх специального вида. Исследована также динамическая модель защиты атмосферы от загрязнения в игровой постановке с целью построения парето-оптимального равновесия.

Теория дифференциальных, игр сформировалась в самостоятельный раздел в пятидесятых годах прошлого века. Начало систематических исследований в области дифференциальных игр обычно связывают с выходом книги Р. Айзекса [89] и Г. Лейтмана [98]. В это же время появились первые отечественные работы по дифференциальным играм [31, 43, 51, 52]. В частности, в работе [52] сформулированы необходимые уеловия существования равновесия в дифференциальной игре, основанные на использовании принципа максимума.

На протяжении многих лет исследования по дифференциальным играм были посвящены в основном антагонистическим дифференциальным играм. В этом направлении были достигнуты значительные результаты во многом благодаря отечественным научным школам по оптимальному управлению [22, 32, 52].

Первые работы в области неантагонистических дифференциальных игр появились в конце 60-х годов прошлого века [51, 70, 114, 115]. В них исследовались некооперативные игры дифференциальные игры со многими участниками, при этом в качестве принципа оптимальности рассматривалось равновесие по Нэшу в программных и позиционных стратегиях. Первая отечественная монография в этом направлении была написана в конце 70-х годов прошлого века [2].

Основополагающие результаты, посвященные исследованию существования и технике нахождения равновесия по Нэшу в неантагонистических дифференциальных играх, получены в работах [11, 28, 36, 59]. В частности, в работе [102] исследована проблема существования единственного решения уравнения Рикатти, играющего важную роль при построении равновесия в позиционных стратегиях в линейно-квадратичных дифференциальных играх. Позднее эти результаты применялись при исследовании математических моделей задач управления социально-экономическими системами (см., например, [76, 86, 91, 93, 95, 96, 113, 120, 121]).

Важным разделом теории игр являются кооперативные игры [53, 56, 109]. Начало систематического изучения теории кооперативных дифференциальных игр во многом связано с выходом книги [45], в которой, в частности, сформулировано новое направление исследований — динамическая устойчивость кооперативных решений. Впервые концепция динамической устойчивости была сформулирована в работе [44]. Успехи в этом направлении связаны прежде всего с работами JI.A. Петросяна, его школы и коллег [12, 20, 60, 103, 104, 105, 118, 124].

Необходимость учета неопределенностей в динамике конфликтного процесса привела к концепции стохастической игры. Модель стохастической игры впервые была построена JI. Шепли [111]. Им же был исследован класс стохастических игр двух лиц с нулевой суммой, в которых множества состояний и альтернатив конечны. При этом предполагалось, что в каждом состоянии с положительной вероятностью игра останавливается. Шепли доказал существование равновесия и оптимальных стратегий в таких играх. Обобщения результата Шепли для бескоалиционной игры получены в [77, 87, 112]. Кооперативная стохастическая игра была сформулирована и исследована в работах [41, 42, 63].

В работах [79, 80] на основе принципа оптимальности Беллмана [1, 21, 80, 125] и теории стохастических дифференциальных уравнений [90] был разработан математический аппарат стохастического оптимального управления. На его основе впервые были получены результаты в области стохастических дифференциальных игр [64-66]. В работе [32] исследованы условия существования максиминных стратегий и цены игры в стохастической дифференциальной игре. В работах [72, 94, 96, 122, 123, 125] представлены примеры, для которых были получены равновесия по Нэ-шу для стохастических дифференциальных игр в явном виде. Одним из актуальных и успешно развивающихся направлений стохастического оптимального управления и стохастических игр являются задачи на правило остановки [35, 99-101].

Модели административного управления и механизмов регулирования объемов выбросов загрязняющих веществ в атмосферу исследованы в [69, 116, 120]. В работе [85] приводится исследование оптимального выпуска фирмы при наличии штрафов за превышение допустимой концентрации загрязняющих веществ в условиях монополии. Во всех указанных выше работах математическая модель представляла собой задачу оптимального управления для одного предприятия.

Динамические игры использовались при моделировании конкурентных процессов при ограничениях на объем загрязняющих веществ многими авторами [34, 75, 78, 92, 97, 107]. Один из выводов указанных работ состоит в том, что при кооперативном поведении увеличивается не только совместный выигрыш участников, но и уменьшается уровень загрязнения. При этом не обсуждались проблемы производства при наличии штрафов за загрязнение.

В книгах [48, 108] и работе [126] приведены модели загрязнения атмосферы, предложены методы решения задач ограничения выбросов, оптимального размещения промышленных предприятий - источников выбросов, способы нормирования объемов расходования ресурсов и оптимизации штрафных санкций. Построена модель согласования интересов взаимодействующих сторон при использовании ограниченных природных ресурсов.

В работе [69] исследована модель двух регионов, один из которых является поставщиком комплектующих для второго. В монографии [125] приведено решение модели управления загрязнением окружающей среды, в которой уже учитывалась динамика накопления и поглощения загрязняющих веществ. Для этой модели исследована проблема динамической устойчивости выбранного кооперативного решения.

Работы, посвященные динамическим играм и их приложениям, продолжают появляться в различных разделах прикладной математики.

Цель диссертационной работы состоит в исследовании динамических игр на предмет разработки новой техники построения позиционного сильного равновесия, основанной на формулировке и обосновании новых достаточных условиях его существования.

Научная новизна работы. В диссертационной работе впервые предложены достаточные условия существования позиционного сильного равновесия в детерминированных и стохастических дифференциальных играх. При формализации оценки качества стратегии коалиции для позиционного сильного равновесия в широком смысле разработана специальная техника, основанная на скаляризации векторного критерия, компонентами которого являются функции выигрышей игроков, входящих в коалицию. Это позволило применить метод динамического программирования при формулировке и обосновании достаточных условий существования сильного равновесия.

Для динамической игры защиты атмосферы от загрязнения разработана техника определения такого размера штрафа, при котором парето-оптимальное решение является равновесием по Нэшу и при этом общее загрязнение атмосферы не превышает предельно допустимой концентрации. В статической постановке подобная модель изучалась в [47, 108, 126]. В основе данного исследования лежит динамическая модель, которая впервые была опубликована в статье [129]. В диссертационной работе завершено исследование этой модели и найдено решение задачи экологического дизайна.

Достаточные условия существования позиционного сильного равновесия получены в конструктивном виде, что позволяет говорить о новой технике построения сильного равновесия. Применение техники проиллюстрировано на примерах решения дифференциальных игр двух и трех лиц в случаях детерминированной и стохастической динамики. Разработанная в диссертационной работе техника при дальнейшем развитии может быть использована для построения сильных равновесий в более широких классах дифференциальных игр.

Практическая ценность работы следует из практических направлений применения результатов из области динамических игр, например, формирования долгосрочных соглашений, защиты окружающей среды, совместной разработки недр, научно-исследовательских разработок, моделей управления в экономике и менеджменте.

Основные результаты, выносимые на защиту.

1. Теоремы о достаточных условиях существования позиционного сильного равновесия в дифференциальной игре, содержащие метод нахождения подобных ситуаций. Решение примеров задач конфликтного управления для проверки разработанной техники.

2. Теорема о достаточных условиях существования позиционного сильного равновесия в стохастической дифференциальной игре и использование разработанной техники на примере игры трех лиц.

3. Построение парето-оптимального равновесия в модели защиты атмосферы от загрязнения.

Апробация работы. Основные результаты были представлены на I

- IV Международных конференциях «Теория игр и менеджмент» (Санкт-Петербург, 2007 - 2010), на Международном научном совещании «Workshop olí Networking Games and Management» (Петрозаводск, 2009), па Международной конференции «Дифференциальные уравнения и топология» (Москва, 2008), на Международной конференции «The Second International Conference on Game Theory and Applications» (China, 2007), на Международной конференции «7th Meeting on Game Theory and Practice dedicated to Energy, Environment and Natural Resources» (Монреаль, 2007), на Международном конгрессе по нелинейному динамическому анализу, посвященному 150-летию А.М. Ляпунова (Санкт-Петербург, 2007), на 12-м Международном симпозиуме «International Symposium on Dynamic Games and Applications» (София Антиполис, 2006), на российско-финской летней школе «Динамические игры и многокритериальная оптимизация» (Петрозаводск, 2006), на XXXV - XXXVII научной конференция аспирантов и студентов «Процессы управления и устойчивость» (Санкт-Петербург, 2004-2006), на V Международной научно-практической конференции «Актуальные проблемы экономики и новые технологии преподавания (Смирновские чтения)» (Санкт-Петербург, 2006), на Международной конференции «Stability and control processes» (Санкт-Петербург, 2005), а также на семинарах кафедры математической теории игр и статистических решений, центра теории игр факультета Прикладной математики - процессов управления, научном семинаре кафедры операционного менеджмента Высшей школы менеджмента СПбГУ.

По материалам диссертации опубликованы следующие работы: [1319, 23, 24, 127-133]. Из них статьи [17, 18] опубликованы в журналах из списка ВАК.

Структура и объем работы. Диссертация состоит из введения, трех глав, разделенных на параграфы, и списка литературы. Список литературы включает 133 наименования.

 
Заключение диссертации по теме "Дискретная математика и математическая кибернетика"

дующие выводы:

1) Для случаев некооперативного и кооперативного поведения при значениях параметра х £ (О, Л1), А\ = производство в регионе не является прибыльным.

2) При 0 > в равновесии и при в > ^ в случае кооперации при любых значениях х £ [А\, оо) производство, при котором усредненное по региону значение концентрации загрязняющей примеси в атмосфере не превосходит ПДК, прибыльно. Более того, поскольку при кооперативном поведении общий объем выбросов меньше, а суммарный выигрыш всех игроков больше, чем в равновесии, то кооперативное поведение является корпоративно социально устойчивым [110].

3) При соотношении параметров ^ < в < у корпоративная соци

1вс альная устойчивость сохраняется лишь при х £ [А\, А3], где А3 — ай1ь п.

26 —1"

При этом даже при отсутствии регулирования со стороны региональных административных органов суммарный выигрыш всех игроков при кооперативном поведении больше, а усредненное по региону значение концентрации загрязняющей примеси в атмосфере меньше, чем при некооперативном.

4) Показано (теорема 3.4), что при 0 < выполнено неравенство б(х) > т^(х). Поэтому величина штрафа в(х) сдерживает как индивидуальное, так и коллективное отклонение от ситуации в которой усредненное по региону значение концентрации загрязняющей примеси в атмосфере не превосходит ПДК. В таком случае говорят, что ситуация обладает как свойством индивидуальной, так и свойством коллективной рациональности и в этом смысле решает задачу экологического дизайна.

5) В частном случае, при п — 2 и функции штрафа й(ж) ситуация д** = (п^' • • ■' является сильным равновесием в смысле определения 1.2.

6) Практически трудно прописать в законодательных актах правило назначения штрафа в(ж), поскольку размер штрафа зависит от значений параметра х. Поэтому при практической реализации функции штрафа разумно использовать ступенчатую схему (см. рис. 3.3). Идея реализации такой схемы заключается в следующем. Разобьем область определения функции я (ж), на интервалы (0, ах], (0, 0:2],., тогда

5(0:1), ж 6 (0,0:1], Й(О2), же(0,о2], к фу

-К —у а, а2 ау а, X

Рис. 3.3: Ступенчатая система штрафов.

Другими словами, определяются промежутки значений ж, при которых размер штрафа остается постоянным. Использование такой схемы требует оптимизации по разбиению, мониторинг и прогнозирование изменения параметра ж.

7) В модели предполагается, что рыночная цена продукта является убывающей функцией по суммарному объему производства. В итоге, при решении задачи защиты атмосферы появляется новая проблема, связанная с ростом цен па продукцию. Согласно (3.1.1), альтернативным подходом к снижению объемов выбросов является регулирование коэффициента пропорциональности (3 объема производства и объема выбросов. Для случая некооперативного поведения рассмотрим неравенство О > щз^-у Из него следует, что при (3 < = В\ в ситуации равновесия усредненное по региону значение концентрации загрязняющей примеси в атмосфере не превышает ПДК при любом значении параметра х > 0. В случае кооперации (3 < 2^ = В2. Понятно, что Вл < Во при п > 2. Следовательно, в случае некооперативного поведения игроки вынуждены проводить более тщательные работы по очистке собственных выбросов, чем в случае кооперации. При этом в случае кооперации игроки имеют возможность получить большую прибыль. Поэтому часть прибыли может быть направлена на улучшение технологии очистки выбросов.

§3.5 Динамическая модель охраны атмосферы от загрязнения

Определим динамическую игру С (¿о, жо), в которой в каждый момент времени Ь > 0 разыгрывается игра

Г(жОО) = (м, {КМЬ), 91,., Яп)}г=Ы) , где ж(£) удовлетворяет уравнению = /0*0, х(г0)—х0, (з.5.1) ж), ж > 0 — заданная непрерывно дифференцируемая функция. Функция выигрыша игрока г в игре С (¿о, £о) имеет вид: оо тах / е ггА^(ж(т), д*(ж(г)), дДж(т)))с£т, (3.5.2)

Чг 3 ¿0 где

3.5.3) ф((а - &<2)ж - с) - кг(х), п где к7(х) — функция штрафа игрока г, ф = X) г=1

Тогда функция выигрыша максимальной коалиции N имеет вид: оо д(-)) = шах J е~гтКм{х{т),д(х(т)))(1т, (3.5.4) о где д((о-ьд)ж-с), <1р(з < о,

Кк(х, д) = -ч « (3.5.5)

1=1

Теорема 3.5. Пусть функция /(ж) > 0, ж > 0; жо > въ ~ в < А-;(ж) = в(ж), где й(ж) определяется по правилу (3.2.8). Тогда в игре (?(£о - ^'о) ситуация = Г— в \

Я \f3dn'"' (Здп) является парето-оптимальным равновесием, при этом о;(д**) <

Доказательство. а) Из неравенства 0 < ^ следует истинность неравенства 0 < при я > 2, и Лз = -ЛЗш, > 0айр-'ЖЪ айр-Ш б) Из неравенства жо > „¿^-т ~ слеДУет истинность неравенства

10С А ^ в) По условиям теоремы — /(ж(£)) > 0, х(€) > 0. Поэтому функция х{£) является возрастающей. Из этого следует, что х^) > А3 = а?о >

А2, г > £0.

Найдем наилучший ответ игрока г на стратегию дополнительной коалиции д1* = . ■ Для этого рассмотрим следующую задачу: хф = ¡{х(г))<И, х^о) = х0. (3.5.6) оо шах [ е~гтЩ(х(т), ф)^*\{т))с1т. (3.5.7)

Чг J ¿0

Уравнение Беллмана для задачи (3.5.6)-(3.5.7) принимает вид:

О = ~ тах [Щх®, Ф)- Сг)} + 1{Х) ^. (3.5.8) Г г ох

Заметим, что максимум в правой части уравнения (3.5.8) не зависит от значений функции Беллмана. При этом для каждого £ > ¿о максимизируется функция выигрыша игрока г в одношаговой игре Г (ж) при условии, что все остальные игроки выбрали стратегию д**. По условию теоремы кг(х) = в(х) а (п + 1)0\ с 12 26 2п(1(3 ) ~ 2Ъх

Ьх > 0.

Как было показано в теореме 3.2 при х(€) > .то = А2 и в < ¿^к) наилучшим ответом игрока на стратегию дополнительной коалиции д.

• • •' Щп) ПРИ системе штрафов, определяемой правилом з(х), является стратегия д** = -щ^. Поэтому эта же стратегия является наилучшим ответом и в игре По теореме о наилучших ответах, п**=(-А-.^ щ^) является равновесием по Нэшу в игре о,хо).

Рассмотрим задачу максимизации суммарного выигрыша: оо х(£))) = тах J е~гт Км(х(т),д(х{т)))(1т. (3.5.9) 0

Уравнение Беллмана для задачи (3.5.6), (3.5.9) принимает вид:

Ш(х)^-шах{Кк{х{г).д(х(т)))} + ^^-^. (3.5.10) г ч г ах

Вновь заметим, что максимум в правой части уравнения (3.5.10) не зависит от значений функции Беллмана. При этом для каждого £ > ¿о максимизируется функция выигрыша коалиции N в одношаговой игре Г (ж), х > А3. Следовательно, задача поиска парето-оптимального решения в игре (3.5.6)-(3.5.9) эквивалента аналогичной задаче в одношаговой игре Г(ж), х >

По условию теоремы 3.5 размер штрафа, налагаемого на каждого игрока, имеет вид: ki(x) = s(x) = следовательно, 2 o(n+l)6A с 2Ь 2ndp ) 2Ьх ~ '

S^2/kl(x) — ns(x) > 7Пдг(.т), ¿=1 где гп]\т(х) определяется правилом (3.3.2). Как было показано выше x(t) > А3, t > to, и по условию теоремы 3.5 в < Следовательно, по теореме 3.3 и следствию к ней при системе штрафов s(x) любая ситуация

П , ч

Я = (gi, • • •, §п), такая, что Е = в том числе п <f* = (-щ, ■ ■ ■, -щ), г=1 ^ ' является парето-оптимальным решением в игре Г (ж). Поэтому, ситуация ~ (щй' • • •' /з!к) является парето-оптимальным равновесием в игре G(to,xo). Теорема доказана. □

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Зятчин, Андрей Васильевич, Санкт-Петербург

1. Беллман Р. Динамическое программирование. М.: Изд-во иностр. лит-ры, 1960, 400 с.

2. Вайсборд Э.М., Жуковский В. И. Введение в дифференциальные игры нескольких лиц и их приложения. М.: Советское радио, 1980, 304 с.

3. Винер Н. Нелинейные задачи в теории случайных процессов / пер. с англ. Э.М. Хазен; под редакцией Ю. JI. Климонтовича. М.: Изд-во иностр. лит-ы, 1961, 158 с.

4. Воробьев Н. Н. Устойчивые ситуации в коалиционных играх // Доклады АН СССР, 1960, т. 131, сс. 493-495.

5. Воробьев H.H. Коалиционные игры // «Теория вероятности и её применение», 1967, т. 12, вып. 2, сс. 289 -306.

6. Воробьев Н. Н. Основы теории игр. Бескоалиционные игры. М: Наука, 1984, 496 с.

7. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976, 328 с.

8. Гихман И.И., Скороход A.B. Стохастические дифференциальные уравнения и их приложения. Киев: Изд. «Наукова думка», Главная редакция физико-математической литературы, 1982, 569 с.

9. Грауэр Л. В., Петросян Л. А. Многошаговые игры // Прикладная математика и механика, 2004, т. 68, вып. 4, сс. 667-677.

10. Губанов В. А., Захаров В. В., Коваленко А. Н. Введение в системный анализ. Л.: Изд-во ЛГУ, 1988, 232 с.

11. Жуковский В. А., Чикрий А. А. Линейно-квадратичные дифференциальные игры. Киев: Наукова думка, 1994, 320 с.

12. Захаров В. В. О регуляризации и динамической устойчивости решений иерархических дифференциальных игр // Вестник Ленингр. ун-та, Сер. 1, 1988, Вып. 2, № 5, сс. 27-31.

13. Зенкевич Н. А, Зятчин А. В. Исследование динамической модели Макдональда Сайгела. // Математические методы исследования экономики. Монография. Под ред. H.A. Зенкевича, СПб.: Изд-во МБИ. 2004, сс. 47-56.

14. Зенкевич H.A., Зятчин A.B. Стохастическая асимметричная модель олигополии // Труды 36-й научной конференции аспирантови студентов «Процессы управления и устойчивость» под ред. Н.В. Смирнова, В.Н. Старкова. СПб.: Изд. СПбГУ, 2005, сс. 479-484.

15. Зенкевич H.A., Зятчин A.B. Модель олигополии при экологических ограничениях с позиций корпоративной социальной ответственности // Вестник СПбГУ, сер. 8, 2009, вып. 1, сс. 33-62.

16. Зенкевич H.A., Зятчин A.B. Сильное равновесие в дифференциальной игре со стохастической динамикой // Вестник СПбГУ, сер. 10, 2009, вып. 4, сс. 84-94.

17. Зенкевич H.A., Зятчин A.B. Построение сильного равновесия в дифференциальной игре многих лиц // Математическая теория игр и ее приложения, 2010, т. 2, вып. 2, сс. 42-65.

18. Зенкевич Н. А., Петросян JI. А. Проблема временной состоятельности кооперативных решений в менеджменте // Вестник С-Петерб. ун-та, сер. 8, 2007, вып. 1. сс. 7-42.

19. Зенкевич Н. А., Петросян Л. А., Янг Д. В. К. Динамические игры и их приложения в менеджменте. СПб.: Высшая школа менеджмента, 2009, 415 с.

20. Зубов В. И. Лекции по теории управления. М.: Главная редакция физико-математической литературы изд-ва «Наука», 1975, 496 с.

21. Зятчин A.B. Народная теорема в одной стохастической игре // Труды XXXVII научной конференции аспирантов и студентов «Процессы управления и устойчивость» под ред. Н.В. Смирнова, A.B. Платонова. СПб.: Изд. СПбГУ, 2006, сс. 546-549.

22. Зятчин А. В. Стохастическая модель процесса конкуренции в случае полной, неполной и асимметричной информации // Математические исследования в экономике. Монография. Под ред. H.A. Зенкевича, Д.В. Кузютина, СПб.: Изд-во МБИ, 2006, сс. 131-148.

23. Клейменов А. Ф. Задачи конфликтного управления // Прикл. математика и механика, 1975, т.39, вып.2., сс. 225-234.

24. Клейменов А. Ф. К кооперативной теории бескоалиционных позиционных дифференциальных игр // Докл. АН СССР. т. 312, № 1, 1990, сс. 32-35.

25. Клейменов А. Ф. Кооперативные решения в позиционной дифференциальной игре многих лиц с непрерывными функциями платежей // Прикл. математика и механика, 1990, т. 54, вып. 3, сс. 389394.

26. Клейменов А. Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука. УРО, 1993, 185 с.

27. Клейменов А. Ф. О решениях в неантагонистической позиционной дифференциальной игре // Прикл. математика и механика, 1997, т. 61, вып. 5, сс. 739-746.

28. Клейменов А. Ф., Семеннщев A.A. Построение решений в одной многокритериальной задаче управления фирмой // Вестн. Тамбов, гос. ун-та, сер. Естеств. и техн. наук, т. 5, Xе 4, 2000, с с. 458-459.

29. Красовский Н. Н. К задаче об игровой встрече движений. // Доклады АН СССР, 1967, т. 173, № 3, сс. 535-537.

30. Красовский Н. Н. Управление динамической системой. Задача о минимуме гарантированного результата. М.: Наука. Главная редакция физико-математической литературы, 1985, 520 с.

31. Курант Р. Уравнения с частными производными // Пер. с англ.Т.Д. Вентцель, под ред. O.A. Олейник. М.: Изд-во Мир, 1964, 830 с.

32. Мазалов В. В., Реттиева А. Н. Равновесие по Нэшу в задачах охраны окружающей среды // Математическое моделирование, 2006, т. 18, № 5, сс. 73-90.

33. Мазалов В. В., Сакагучи М. Равновесие в бескоалиционной игре п лиц с выбором момента времени // Управление большими системами, 2009, вып. 26, сс. 55-78.

34. Малафеев O.A. Существование ситуаций равновесия в дифференциальных бескоалиционных играх со многими участниками // Вестн. ЛГУ, № 13, 1982, сс. 40-45.

35. Мулен Э. Теория игр. С примерами из математической экономики, М.: Мир, 1985, 200 с.

36. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение, М: Наука, 1970, 708 с.

37. Ногин В. Д. Проблема сужения множества Парето: подходы к решению // «Искусственный интеллект и принятие решений», 2008, № 1, сс. 98-112.

38. Ногин В. Д. Эффективные и собственно эффективные решения многокритериальных задач // В сб. «Методы многоцелевой оптимизации», Владивосток, 1982, сс. 59-72.

39. Петросян Л. А. Дифференциальные игры на выживание со многими участниками // Докл. АН СССР, 1965, т. 161, № 2, стр. 285-287.

40. Петросян Л.А. Устойчивость решений в дифференциальных играх со многими участниками // Вестн. ЛГУ, 1977, № 19, сс. 46-52.

41. Петросян Л. А., Данилов Н. Н. Кооперативные дифференциальные игры и их приложения. Томск: Изд. Томского ГУ, 1985, 276 с.

42. Петросян JT. А. Полукооперативные игры // Вестник СПбГУ, 1998, сер. 1, вып. 2, сс. 62-69.

43. Петросян Л. А., Захаров В. В. Введение в математическую экологию. Л.: Изд. ЛГУ, 1986, 224 с.

44. Петросян Л. А., Захаров В. В. Математические модели в экологии. СПб.: Изд. СПбГУ, 1996, 253 с.

45. Петросян Л. А., Зенкевич H.A., Семина Е. А. Теория игр. М.: Высшая школа, Книжный дом Университет, 1998, 304 с.

46. Петросян Л. А., Кузютин Д. В. Игры в развернутой форме: оптимальность и устойчивовость. СПб.: Изд. СПбГУ, 2000, 292 с.

47. Петросян Л. А., Мурзов Н. В. Теоретико-игровые проблемы в механике/ / Литовский математический сборник, 1966, №VI-3, сс. 423433.

48. Понтрягин Л. С. К теории дифференциальных игр // Успехи математических наук, 1966, 21, 4 (130), сс. 219-274.

49. Печерский С. Л., Яновская Е. Б. Кооперативные игры: решения и аксиомы. СПб.: Изд-во Европ. унив-та в С.-Петербурге, 2004, 459 с.

50. Подиновский В. В., Ногин В. Д. Парето-оптимальные решения многокритериальных задач. М.: Наука, 1982, 255 с.

51. Пугачев В. С., Синицын И. Н. Стохастические дифференциальные системы. Анализ и фильтрация. М.: Наука, 1990, 632 с.

52. Соболев А. И. Кооперативные игры // Проблемы кибернетики, М.: Наука, 1982, вып. 39, сс. 201-222.

53. Тироль Ж. Рынки и рыночная власть: теория организации промышленности, т. 2. СПб.: Экономическая школа, 2000, 455 с.

54. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. // Пер. с англ. М.Г. Бутрим, П.К. Катышева; под ред. А.Н. Ширяева. М.: Мир, 1978. 320 с.

55. Чистяков С. В. О бескоалиционных дифференциальных играх // Докл. АН СССР, 1981, т. 259, № 5, сс. 1052-1055.

56. Чистяков С. В. О построении сильно динамически устойчивых решений кооперативных дифференциальных игр // Вестник СПбГУ, сер.1, 1992, Вып. I. сс. 57-69.

57. Abren D., Dutta Р. К., Smith L. The folk theorem for repeated games: a NEU condition // Econometrica, 1985, Vol. 62, pp. 939-948.

58. Aumann R.J. Acceptable Points in General Cooperative n-Person Games // Contributions to the Theory of Games IV. Annals of Mathematics Study 40 / ed. by A.W. Tucker, Princeton NJ, Princeton University Press, 1959, pp. 287-324.

59. Baranova E. M., Petrosjan L.A. Cooperative Stochastic Games in Stationary Strategies // Game theory and Applications, Nova Science Publishers, 2006, Vol. 11, pp. 7-17.

60. Basar T. Existence of unique equilibrium solutions in nonzero-sum stochastic differential games // Differential games and control theory. II. /ed. E.O. Roxin, P.T. Liu, R. Sterbrg. New York: Marcel Dekker, Inc., 1977a. 201-228 p.

61. Basar T. Informationally nonunique equilibrium solutions in differential games // SIAM Journal of Control and Optimization, 1977b, 15, pp. 636-660.

62. Basar T., Olsder G.J. Dynamic Noncooperative Game Theory, 2nd Edn., Academic Press, London, 1995, 520 p.

63. Berkovitz L. D. A variational approach to differential games // In: Dresner, M., Shapley, L.S., Tucker, A.W. (ed) Advances in Game Theory, Princeton, Princeton University Press, NJ, 1964, pp. 127-174.

64. Cabo F., Escudero E., Martin-Herran G. A time-consistent agreement in an interregional differential game on pollution and trade // International Game Theory Review, 2006, Vol. 8, № 3, pp. 369-393.

65. Case J. H. Equilibrium points of n-person differential games, Ph.D. thesis, University of Michigan, Ann Arbor, MI, Department of Industrial Engineering, Tech. report No. 1967-1, 1967.

66. Cournot A. A. Memoire sur les applications du calcul des chances a la statistique judiciaire // Journal des mathématiques pures et appliquées 12, 1838, t. 3.

67. Clemhout S., Wan H. Y. Jr. Dynamic common-property resources and environmental problems // Journal of Optimization Theory and Applications, 1985, Vol. 46, pp. 471-481.

68. Dixit A. The Art of Smooth Pasting, New Jersey: Princeton University, 1993.

69. Dixit A.K., Pindyck R. S. Investment under Uncertainty, Princeton: Princeton University Press, 1994.

70. Dockner E. J., Van Long N. International pollution control: Cooperative versus noncooperative strategies / / Journal of Environmental Economics and Management, 1993, Vol. 25, pp. 13-29.

71. Feichtinger G., Wirl F. A Dynamic variant of the battle of the sexes // International Journal of Game Theory, 1993, Vol. 22, pp. 359-380.

72. Filar J.A., Schultz T.A., Thuijsman F., Vrieze O.J. Nonlinear programming and stationary equilibria in stochastic games // Mathematical Programming, 1991, Vol. 50, pp. 227-237.

73. Filar J. A., Gaertner P. S. A regional allocation of world C02 emission re-ductions // Mathematics and Computers in Simulation, 1997, 43, pp. 269-275.

74. Fleming W. H. Optimal continuous-parameter stochastic control // SIAM Review, 1969, 11, pp. 470-509.

75. Fleming W. H., Rishel R.W. Deterministic and Stochastic Optimal Control, New York: Springer-Verlag, 1975.

76. Fudenberg D., Maskin E. The folk theorem for repeated games with discounting or with incomplete information // Econometrica, 1986, Vol. 54, pp. 533-554.

77. Fudenberg D., Tirole J. Game theory. Cambridge: MIT press, 1991.

78. Gossner 0. The folk theorem for finitely repeated games with mixed strategies // Int. J. Game Theory, 1995, Vol. 24. pp. 95-107.

79. Grauer L. V., Petrosjan L. A. Strong Nash Equilibrium in Multistage Games // International Game Theory Review, 2002, Vol. 4(3), pp. 255264.

80. Hatcher A. Firm behaviour under pollution ratio standards with noncompliance // Environmental and resource economics, 2007, Vol. 38, pp. 89-98.

81. Haurie A., Krawczyk J.B., Roche M. Monitoring Cooperative Equilibria in a Stochastic Differential Games // Journal of optimization Theory and Applications, 1994, Vol. 81, pp. 79-95.

82. Herings P. J., Peeters R.J. Stationary Equlibria in Stochastic Games: Structure, Selection, and Computation // Journal of Economic Theory, 2004, Vol. 118, No. 1, pp. 32-60.

83. Holzman R., Law-Yone N. Strong Equilibrium in Congestion Games // Games and Economic Behavior, 1997, Vol. 21, pp. 85-101.

84. Isaacs R. Differential games. New York, London, Sydney: John Wiley and sons Inc, 1965.

85. Ito K. On stochastic differential equations. // Memoirs, American mathematical society, 1951. Vol. 4, pp. 1-51.

86. Jorgensen S. An exponential differential games which admits a simple Nash solutions // Journal of Optimization Theory and Applications, 1985, 45, pp. 383-396.

87. Jorgensen S., Martin-Herran G., Zaccour G. Agreeability and time-consistency in linear-state differential games // Journal of Optimization Theory and Applications, 2003, Vol. 119, №1. pp. 49-63.

88. Jorgensen S., Sorger G. Feedback Nash equilibria in a problem of optimal fishery management // Journal of Optimization Theory and Applications, 1990, 64, pp. 293-310.

89. Jorgensen S., Yeung D.W. K. Stochastic differential game model of a common property fishery // Journal of Optimization Theory and Applications, 1996, 90, pp. 391-403.

90. Jorgensen S., Zaccour G. The consistency In Cooperative Differential Games // Decision and Control in Management Sciences: Essays in Honor of Alain Haurie, Edited by G. Zaccour, Kluwer Academic Publishers, London, England, 2001, pp. 349-366.

91. Kaitala V. Equilibria in a stochastic resource management game under imperfect information // European Journal of Operational Research, 1993, 71, pp. 439-453.

92. Leitmann G. Cooperative and Non-Cooperative Many Players Differential Games, New York: Springer-Verlag, 1974.

93. Mazalov V. V. Dynamic games with optimal stopping // Game theory and Applicatoins, 1996, Vol. II. Nova Science Publishers, New York, pp. 37-46.

94. Mazalov V.V., Vinnichenko S.V. Games with optimal stopping of Wiener processes // Probability Theory and Applications, 1988, Vol. 33, pp. 590-591.

95. Mazalov V. V., Vinnichenko S.V. Optimal stopping of observations in optimal control of random walks problems // Probability Theory and Applications, 1990, Vol. 35, issue 4, pp. 669-676.

96. Papavassilopoulos G.P., Cruz J.B. On the Existence of Solutions to Coupled Matrix Riccati Differential Equations in Linear Quadratic Nash Games //IEEE Trans, on Automatic Control, 1979, Vol. AC-24, No. 1, Feb, pp. 127-129.

97. Parilina E. M. Subgame Consistency of Shapley Value in Cooperative Data Transmission Game in Wireless Network // Contributions to Game Theory and Management, 2008, SPb.: SPbSU, pp. 381-994.

98. Parilina E. M., Petrosyan L.A. Cooperative Stochastic Games in Stationary Strategies // «Game Theory and Applications», Nova Science Publishers, April 2006, Vol. 11, pp. 1-7

99. Petrosyan L.A. Bargaining in dynamic games // In: Petrosyan L., Yeung D. (ed) ICM Millennium Lectures on Games, 2003, Berlin: Springer-Verlag, pp. 139-143.

100. Petrosyan L. A., Grauer L.V. Strong Nash Equilibrium in Multistage Games // International Game Theory Review, 2004, Vol. 4, № 3, pp. 255-264.

101. Petrosjan L. A., Zaccour G. Time-Consistent Shapley Value Allocation of Pollution Cost Control // Journal of Economic Dynamics and Control, 2003, Vol. 27, № 3, pp. 381-398.

102. Petrosjan L. A., Zakharov V.V. Mathematical Models in Environmental Policy Analysis, New York: Nova Science Pbl., 1996.

103. Petrosyan L.A., Zenkevich N.A. Game Theory, World Scientific Publishing Co. Pte. Ltd, Republic of Singapore, 1996.

104. Porter M., Kramer M. Strategy and society. The link between Competitive Advantage and Corporate Social Responsibility // Harvard Business Review, 2006, pp. 1-14.

105. Shapley L.S. Stochastic Games // Proceedings of National Academy of Sciences of the USA, 1953, Vol. 39, pp. 1095-1100.

106. Sobel M.J. Non-cooperative stochastic games // Ann. Math. Studies, 1971, Vol. 42, pp. 1930-1935.

107. Sorger G. Competitive dynamic advertising: a modification of the case game // Journal of Economic Dynamics and Control, 1989, Vol. 13, pp. 55-80.

108. Starr A.W., Ho Y. C. Further properties of nonzero-sum differential games // Journal of Optimization Theory and Applications, 1969a, Vol. 3, pp. 207-219.

109. Starr A. W., Ho Y. C. Nonzero-sum differential games // Journal of Optimization Theory and Applications, 1969b, Vol. 3, pp. 184-206.

110. Tietenberg T. Environmental Economics and Policy. Pearson Education. 2007.

111. Tolwinski B., Haurie A., Lcitmann G. Cooperative equilibria in differential games // Journal of Mathematical Analysis and Applications, 1986, 119, pp. 82-202.

112. Van Damme E. E. C. Stability and perfection of Nash Equilibria, Berlin: Springer-Verlag, 1991.

113. Von Neumann J., Morgenstern O. The Theory of Games and Economic Behavior, Princeton University Press, Princeton,. 1944.

114. Yeung, D.W. K. A differential game of industrial pollution management // Annals of Operations Research, 1992, 37, pp. 297-311.

115. Yeung D. W. K. On differential games with a feedback Nash equilibrium // Journal of Optimization Theory and Applications, 1994, 82, No. 1, pp. 181-188.

116. Yeung D.W. K. A stochastic differential game model of institutional investor speculation / / Journal of Optimization Theory and Applications, 1999, 102, pp. 463-477.

117. Yeung D. W. K. Infinite-Horizon Stochastic Differential Games with Branching Payoffs // Journal of optimization Theory and Applications, 2001, Vol. Ill, pp. 445-460.

118. Ycung D.W. K., Petrosyan L. A. Subgame Consistent Cooperative Solutions in Stochastic Differential Games // Journal of optimization Theory and Applications, 2004, Vol. 120, pp. 651-666.

119. Ycung D.W.K., Petrosyan L.A. Cooperative stochastic differential games, New York: Springer Verlag, 2006, 242 p.

120. Zakharov V. One approach to allocating damage to environment // System Modelling and Optimization, New York.: Springer-Verl., 1994.

121. Zenkevich N. A., Zyatchin A.V. Cooperative solutions for games with a stochastically variable parameter //in Proceedings of the 12th International Symposium on Dynamic Games and Applications, France, 2006, p. 172.

122. Zenkevich N. A., Zyatchin A.V. Oligopoly Competition under Environmental Design // Game Theory and Applications, New York: Nova Science Publishers, Vol. 12, 2007, pp. 193-206.