Неантагонистические дифференциальные игры с неограниченной продолжительностью тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Адрианов, Алексей Андреевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
2006 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Диссертация по математике на тему «Неантагонистические дифференциальные игры с неограниченной продолжительностью»
 
Автореферат диссертации на тему "Неантагонистические дифференциальные игры с неограниченной продолжительностью"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ООЗОЬАи^о

На правах рукописи

АДРИАНОВ АЛЕКСЕЙ АНДРЕЕВИЧ

НЕАНТАГОНИСТИЧЕСКИЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С НЕОГРАНИЧЕННОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ

01.01.09 — дискретная математика и математическая кибернетика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

Санкт-Петербург — 2007

003054026

Работа выполнена на кафедре математической теории игр и статистических решений факультета прикладной математики - процессов управления'Санкт-Петербургского государственного университета.

Научный руководитель:

Официальные оппоненты:

Ведущая организация:

доктор физико-математических наук, профессор

Чистяков Сергей Владимирович

доктор физико-математических наук, профессор

Клейменов Анатолий Федорович (Институт математики и механики УрО РАН)

кандидат физико-математических наук, доцент

Скитович Владимир Викторович (СПбГУ)

Удмуртский Государственный Университет

Защита состоится

. 2007 г. в.

. ч..

. мин. на за-

седании диссертационного совета К-212.232.07 по защитам диссертаций на соискание ученой степени кандидата физико-математических наук при Санкт-Петербургском государственном университете по адресу: 199034. Санкт-Петербург. В.О.. Средний пр.. д. 41/43, ауд. 513.

С диссертацией можно ознакомиться в научной библиотеке им. А. М. Горького Санкт-Петербургского государственного университета по адресу: 199034. Санкт-Петербург, Университетская наб.. 7/9.

Автореферат разослан ъФ-^^ьел 2007 г.

Ученый секретарь диссертационного совета, доктор физ.-мат. наук.

профессор р ^ ^ Горьковой В.Ф.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Теория дифференциальных игр занимается исследованием динамических моделей принятия решений в условиях конфликта и неопределенности. Источником развития этой теории служат практические задачи из области экономики, экологии, управления механическими и биологическими системами. При рассмотрении таких задач, как правило, приходится учитывать динамику изменения состояния управляемой системы, а также наличие нескольких управляющих сторон, имеющих различные субъективные цели.

Становление теории дифференциальных игр связано с работами Р. Айзекса, которые были посвящены, в основном, решению задач преследования и формулировались в виде антагонистических дифференциальных игр. В нашей стране первые исследования антагонистических дифференциальных игр принадлежат академикам Л. С. Понтрягину и Н. Н. Красовскому, а также их ученикам и представителю ленинградской школы теории игр — Л. А. Петросяну. Их работы способствовали развитию теории неантагонистических дифференциальных игр. Существенный вклад в разработку этой теории внесли Э. Вайсборд, В. И. Жуковский, А. Ф, Клейменов, А. Ф. Ко-ноненко, Л. А. Петросян, Э. Р. Смольяков, Н. Т. Тынянский, С. В. Чистяков и другие.

В теории неантагонистических дифференциальных игр прежде всего возникает задача об отыскании ситуаций равновесия или е-равновесия при любом е > 0. Поскольку в об г нем случае, приходится иметь дело с целым множеством траекторий, пригодных для реализации принципа равновесия (и разным из них соответствуют, вообще говоря, разные векторы выигрышей), то возникает также задача сужения этого множества, а в идеале — выбора из него единственной траектории.

Достаточно полное решение первой задачи получено для дифференциальных игр с терминальным выигрышем на конечном промежутке времени. Используя формализм теории позиционных антагонистических дифференциальных игр, первые достаточно общие результаты, относящиеся к бескоалиционным дифференциальным играм двух лиц получил А. Ф. Кононенко. В частности, в терминах движений управляемой системы, он указал достаточные условия существования ситуации е-равновесия в этом классе игр.

В работах С. В. Чистякова близкая к подходу Кононрнко идея была положена в основу построения теории бескоалиционных дифференциальных игр т лиц (т > 2) с терминальными выигрышами игроков. В частности, установлено существование решения рассматриваемой игры (т.е. существование в игре ситуации ¿-равновесия при любом е > 0) в терминах ограничений на правую часть системы дифференциальных уравнений, описывающих управляемый процесс. Решение проблемы сужения множества равновесных траекторий оказалось возможным на основе перехода от бескоалиционной дифференциальной игры к кооперативной.

Очевидный интерес представляет собой использование аналогичного подхода к исследованию неантагонистических дифференциальных игр с интегральными выигрышами игроков на бесконечном промежутке времени, что связано с их использованием в качестве моделей социально-экономических процессов.

Целью диссертационной работы является исследование бескоалиционных и кооперативных дифференциальных игр с интегральными выигрышами игроков на бесконечном промежутке времени.

Методы исследований. При построении элементов теории неантагонистических дифференциальных игр с неограниченной продолжительностью используются методы теории функций и функционального анализа, теории оптимального управления, математического программирования, теории антагонистических и неантагонистических дифференциальных игр с конечной продолжительностью.

Научная новизна работы состоит в том, что в ней, в отличие от большинства предшествующих исследований, получены достаточно общие результаты, относящиеся как к бескоалиционным, так и к кооперативным дифференциальным играм с неограниченной продолжительностью и интегральными выигрышами. В частности, исследованы вопросы о существовании и структуре решения рассматриваемых бескоалиционных дифференциальных игр и описаны методы построения различных решений соответствующих кооперативных дифференциальных игр. Все положения, выносимые на защиту, являются новыми.

Теоретическая и практическая ценность. Работа носит теоретический характер. Бе результаты могут быть использованы для дальнейших исследований в теории неантагонистических дифференциальных игр, а также при исследовании практических задач из об-

ласти экономики и экологии.

Апробация работы. Основные результаты работы неоднократно докладывались и обсуждались на научном семинаре кафедры математической теории игр и статистических решений факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета, на научной конференции «Процессы управления и устойчивость» факультета прикладной математики -процессов управления Санкт-Петербургского государственного университета (апрель 2003, 2004 и 2006 гг.), а также докладывались на научной конференции «Теория управления и математическое моделирование» (г. Ижевск, июль 2006 г.).

Публикации. Основные результаты диссертации опубликованы в 6 печатных работах.

Структура и объем работы. Диссертация состоит из введения, двух глав, 12 параграфов, заключения и списка литературы. Объем работы составляет 104 страницы. Список литературы включает 64 наименования.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении приведена содержательная постановка исследуемой задачи, сделан обзор предшествующих исследований по близкой проблематике, а также описано краткое содержание работы по главам.

Первая глава содержит 7 параграфов и посвящена исследованию бескоалиционного варианта дифференциальной игры с неограниченной продолжительностью.

В первом параграфе приводится формальная постановка исследуемой задачи и формулируются основные предположения.

Рассматривается конфликтная задача управления, в которой процесс, управляемый тп игроками (тп > 2), описывается системой дифференциальных уравнений

с1х

— = /(¿,1,иьи2,...,«т) (1)

(£ € Я1, х € Я") с заданным начальным условием

хЦо) = х0, (2)

а каждый из его участников I е I — {1,2, ...,т} распоряжается управлением щ € Р% 6 Сотр/?*^, и оценивает качество этого процесса с помощью интегрального функционала

+оо 1о

где х(£) = а:(г, ¿0,2-0, (•),.. . ,ит(-)) — решение задачи Коши (1)-(2) на интервале [£0, соответствующее измеримому по Лебегу набору программных управлений ) -т- щ = щ^) € Рг, г = 1, т (такие управления далее будем называть допустимыми). Предполагается, что большие значения функционала Нг соответствуют более высокому качеству процесса управления с позиций интересов г-го игрока.

Относительно правой части системы (1) и подынтегральных функций в (3) делаются следующие предположения:

1°. Функция /(•) непрерывна по совокупности переменных (4, х, щ, .. ,ит) и локально липшицева по х. 2°. Существует такая постоянная А > 0, что

11/(4, X,«!,ИЗ, ..,ит)|| < А(1 + |М1)

для всех I € Я1, х 6 Д" и иг € Рг, г = 1, т. 3°. Для всех < 6 й1 и х 6 й" множество

РН(1, х) ={(/,/»!,..., /1ТО) € Дп+т|/ = /(«, X, «Ь ..., «т),

/г, = 1, .. ,ит), иг е Рг, г - 1, т}

является выпуклым.

4°. Каждая из функций /гг(-), г = 1, тп непрерывна на декартовом

произведении Д х х Рг х Р2 х ... х Рт. _

5°. Для всех / ей", 7 6 Ят, I £ Я, х € Нп и иг е Рг, г = 1 ,т выполнрно

тах пил {(1,/(Ь,х,ии ... ,ит)) + (7, гг, иь .. . ,ит))) =

и.еР, tíJ(,)6PJ(,)

= тт тах((/, /(£,х,иь .., ит)) + (7, /г(£, х, щ,. . ,ит)))

(здесь и7(г) = (и1,...,г1г_1,ыг+1,...,мт), =

= (/11 (•),..., /гт(-)), {•, •) — скалярное произведение).

6°. Для каждого г = 1,т существует интегрируемая на [¿о,+ос) функция 6\(•) такая, что выполнено неравенство:

|Ъ(1,хЦ),щ(1),и2(1), ..,ыт(0)| <<?,(*)

для любого { € (<о, +оо) и всех допустимых программных управлений щ('), г = 1,тп.

Стратегией ¿-го игрока будем называть любую конечную последовательность отображений

произвольной длины /+1 > 1. Здесь отображение 6° ставит в соответствие начальной позиции (1о,хо) пару и»[<о> )), где € (¿о, +оо), а и, [¿о, О — допустимое управление г-го игрока, реализованное на полуинтервале [¿о,О, Каждое из отображений 1 < к < I, информационному состоянию (¿о, хо, гфо, £*)) (здесь > ¿о, а «[¿о,^) — набор управлений, реализованных всеми игроками на интервале времени ставит в соответствие пару где

1 > при этом необходимо, чтобы = +оо. Обозначим множество всех таких стратегий игрока г через Р,, г = 1 ,т. Элементы этого множества будем называть рекурсивными стратегиями с информацией о предыстории по управлениям. Как обычно, набор стратегий и = (Уь ...,£/т), С/» € Р,, г = 1 ,т назовем ситуацией. Множество всех ситуаций в игре, т.е. множество Р[ х ... х Рт обозначим Р.

Непосредственно из определения множеств стратегий Р,, г € I вытекает, что любой начальной позиции (£о,2о) £ й1 х й" и любой ситуации и — (С/ь ..., С/т) 6 Р в игре однозначно сопоставляется некоторый набор

и(') = )) = и{10,х0, иии2, .,ит)

допустимых на [¿о, +оо) программных управлений всех игроков г € I, а, следовательно, и решение задачи Коши (1)-(2). Будем далее обозначать это решение через х(-^о,хо,и) и говорить, что оно порождается из позиции (Ьо,хо) ситуацией и.

Таким образом, дифференциальной игре (1)~(3) можно сопоставить следующую игру т лиц в нормальной форме

Г(*о,«о) = (/, {Р.Ье/. ТО«о,*о|-)}.€/>-

Здесь I = {1,2,..., m} — множество игроков, а

ад,sol-) ■ Pi х Р2 X . . . х Рm Д, t € /,

— функции выигрыша игроков, которые определяются по формулам:

Kt(t0, Xo\Ui, С/2, • • • , и m) = Ht(to,Xo\ui(-),U2(-), ■ ■ . ,Um(-))>

(ui(-).«2(-)>... ,«m(')) = u{to,xo,U\,Ua,.. ■ ,um), г € I.

Пусть A(to,xo) — множество всех траекторий (решений) системы (1), удовлетворяющих начальным условиям (2) при всевозможных, допустимых управлениях, а

D = {(t, х)\t 6 [io, +00), х = x(t), х(-) е A(t0> х0)}

— интегральная воронка, исходящая из начальной позиции (to,xo)-Ниже наряду с игрой будем рассматривать семейство игр Г(/}) = {Г(£*, xt)|(i»,х») е D}, также называемое бескоалиционной дифференциальной игрой (на пространстве позиций D). При этом элементы семейства Г(£)), т.е. игры T{t*,xt), {t»,xt) б D, называются играми-компонентами игры Г(D).

Далее, для вспомогательных целей рассматриваются m антагонистических игр Гi(D), г е /, каждая из которых отличается от игры F(D) тем, что в ней игроки j = 1 , m, j ф г, действующие как один игрок J(i), имеют цель противоположную цели игрока г. При сделанных предположениях в каждой из игр Гt(D), г € I, существует функция значения v,(-)-

Основные результаты первой главы перечисляются ниже.

Теорема 1. Для любой позиции (totxçj) существует mакой набор допустимых управлений и*(-) = («*(•),..., что каждая из функций

t

<Pl(t) = vl{t,x*(t)) + J ht(r, x*(t), u*(r))dr, iel,

to

(x*(-) = x(-,t0,x0,u*(-))) является неубывающей на интервале [îq, +00).

Следствие. Существует такой набор допустимых управлений и'(-) = {и\(•)>•••>и'т{'))> ЧТП0 для всех г € I иЬ е [¿о, +оо) выполнено

+оо

уг(1,х'(1))< J ЛЛт.х'М.и'М^т (

(г'(-) =

Множество всех траекторий !*(•) 6 А(£о,а:о), для которых справедливо утверждение теоремы 1 обозначим через а множество всех х'(-) 6 Л(£сь^о). для которых справедливо утверждение следствия из теоремы 1, обозначим Х'^о^о).

Теорема 2. Ягра Г^сь^о) имеет решение в классе рекурсивных стратегий с информацией о предыстории по управлениям.

Под равновесной траекторией в игре Г(£о,хо) будем понимать функцию х(-), которая на любом конечном отрезке [¿о,?1] является равномерным пределом некоторой последовательности траекторий (х^^-)}^! таких, что хк{-) - х(-,г0,хо, ие№), к € N. где е(к) > 0, е(к) —> О, ие№ — ситуация £(&)-равновесия в игре

к—«оо

Г(<о, а^о)-

Теорема 3. Множество равновесных траекторий в игре Г(£о>^о) непусто.

Теорема 4. Для того чтобы траектория

х'Ц) = х(1^0,х0,и[(-),...,и'т(-)), í 6 [¿0,+оо),

была равгювесной траекторией в игре Г(£о, необходимо и достаточно, чтобы:

+ оо

«.(*,*'(*)) < I Н1(т,х'{т),и'1(т),...Мт))(1т для всех г € I и < € [¿о, +оо)-

Из теоремы 4 следует, что множество всех равновесных траекторий в игре Г(£о, хо) совпадает со множеством Х'^о, хо) траекторий, для которых справедливо утверждение следствия из теоремы 1. Кроме того, из той же теоремы следует, что всякая траектория х*( ) € Х*{1г). хо) является равновесной траекторией. Далее такие траектории будем называть также стабильно равновесными.

Основные положения первой главы иллюстрируются на динамической модели распределения общественных благ.

Вторая глава посвящена построению определенной версии кооперативной теории рассматриваемых дифференциальных игр с целью сужения множества стабильно равновесных траекторий или выбора из него единственной траектории.

Рассмотрим многозначное отображение

I : (г*, я») (¿,,х.) е Д

Ци,х.) = {уе Ит|Эи(-) : у = Н{и, ®*|«(-))}, где «(■) = (и1(')> "."га!')) — набор допустимых управлений, а

#(•) = №(•), .,ят(.)).

Отображение Ь : (¿, х) >—* ЬЦ, х) с Е"1 будем называть кооперативным решением игры Г (И) если:

1) Ь — многозначный селектор т.е. Ь(Ь,х) С ¿(¿,ж) и Ь{Ь,х) ^ 0, € £>;

2) для любой позиции 6 й и для любого у € х») существует такой набор допустимых управлений и( ), что для всех ¿1, ¿2 € |г*,+оо) ¿2 > ¿1 справедливо

у€ ! Цт,х{г),и{т))с1т®Ь(1 а,а:(4а))С (1

С J к(т,х(т),и(т))с1т ф Щи г.

где х(-) = х{-,и,х,,и{-)), Н{-) = (МО. • • -Лт{-)), а "Ф" — операция сдвига множества на вектор.

Заметим, что свойство 2) является прямым аналогом известного свойства функции Беллмана в задаче оптимального управления.

Непосредственно из его определения следует, что многозначное отображение L* : (i»,x») t-> !,*(£*, х»), (¿*,х„) е D,

L*{tt,xt) =

{у € Дт|Э«(-) : у = Я(4Ф,i.|«(.)), ar(-,t„x„u(-)) е **(*♦,*.)}•

является кооперативным решением игры Г(£>). Рассмотрим многозначные отображения

F : (£, х) F(t,x), (t,x)eD,

F(t,x) = {/(i,x,t6b.. .,ttm)|u, eP„ г € /} • и FH : (i, x) Ftf (t, x), (i, x) e Д

FH{t,x) =

{(f, h)\f = /(i, x, uu .. ., um), ft = h(t, x,uu.. ,um), u,eP„ ¿6/},

гдеЛ(-) = (М0,---,Ы-)).

Лемма 1. Многозначные отображения F и FH являются непрерывными на множестве D и имеют на нем компактные и выпуклые значения.

Если функции г»г(-), г € I дифференцируемы в точке (£,х) € D по направлению (1, /) = (1, /i,..., /п) € то их производные в

этой точке по соответствующему направлению обозначим, соответственно, dt(t, х, /). Положим d(t, х, /) = (di(i, х, /),..., dm(t,x, /)), если соответствующие производные существуют.

Предположение 1. В каждой точке (£,х) е £) функции «,(•) дифференцируемы по любому направлению (1,/) 6 Rn+l, f € F(t,x), и множество

ФН(г, х) = {(/, h) е FH(t, x)|d(i, х, /) + ft > О}

(ft = (fti,..., ftm)) непусто.

Если выполнено это предположение, то определены многозначные отображения ФН : (t,x) ь-> ФН(*,х) С Rn+m, (t,x) € D, и Ф : (t,x) •-> Ф(*,х) С йп, (i,x) 6 D,

Ф(i, х) = {/ € F(t, х)|3ft е Дт : (/, ft) € ФН(4, х)},

являющиеся, соответственно, селекторами многозначных отображений П1 и ^ на множестве И и при х) е й можно рассматривать дифференциальное включение

¿€Ф(4,4 (4)

Теорема 5. Если выполнено предположение 1 и функции «,(•), г Е I удовлетворяют в некоторой окрестности множества И локальному условию Липшица, то каковы бы ни были начальные данные (£о,£о) € Дп+1 множество Х*^о,хо) совпадает со множеством всех абсолютно непрерывных на полуоси [¿о> решений дифференциального включения (4), удовлетворяющих начальному условгао а;(¿о) = хо.

Если функция гч(-) является непрерывно дифференцируемой в некоторой окрестности множества Д то будем писать г>,( ) е С1(П).

Лемма 2. Пусть «,(•) 6 С'] (О), г € I. Тогда предположение 1 выполнено. При этом многозначное отображение ФН полунепрерывно сверху и имеет компактные и выпуклые значения.

Рассмотрим многозначное отображение

ФН : (£,х) ^ ФН(*,х), € Д

ФН(г,х) = {(/, Н) € FЯ(£,x)|d(í,x,/) + /г > О}. Пусть БошФН = {(¿,х) е ДФН(М) ф 0}.

Лемма 3. Если г>,(-) е С1 (И), г е I и БошФН = Д то многозначное отображение ФН непрерывно на множестве О и имеет на нем компактные и выпуклые значения.

Следующая теорема доставляет подход к построению кооперативных решений игры Г(£>) на основе сужения локальных возможностей игроков влиять на процесс управления. Подразумевается, что это сужение достигается на основе кооперативного соглашения о принципах управления.

Теорема в. Пусть выполнены условия теоремы 5 и ОН — такой селектор многозначного отображения ФН, что для любой точки (U,xt) е D дифференциальное включение

z е GH(t,x) (5)

(z = (х, 2/1,..., Ут)) с начальными данными

z{U) = {x„ 0,...,0) (6)

имеет хотя бы одно абсолютно непрерывное решение на интервале [i„,+oo). Пусть также многозначное отображение

Ьан : (t,x) ~ LGH(t,x) С Rm, (t,x) е D,

каждой позиции (£*,х*) е D ставит, в соответствие множество

Lan(t*,xt) = {у = (yi,...,ym)\

уг= lim t/,(i), i6/, (i('),!/i(-)r-,ym(-))eZGH(i»,i,)},

где ZaH{t*Jx*) ~ множество всех абсолютно непрерывных решений дифференциального включения (5), удовлетворяющих начальному условию (6). Тогда отображение Lgh является кооперативным решением игры Г(О).

Далее, при выполнении условий теоремы б будем говорить, что соответствующее отображение GH индуцирует решение Ьан игры r(D). Из этой теоремы и известной теоремы о существовании решения дифференциального включения получим такое

Следствие. При выполнении условий теоремы 5 всякий полунепрерывный сверху и имеющий компактные и выпуклые значения селектор многозначного отображения ФН индуцирует решение игры Г (D).

Считая выполненным предположение 1 рассмотрим многозначное отображение х ■ (¿.я) >-* х(£,аО, (¿.я) 6 D,

X(t,x) = {d(t,xj) + h\(f,h) е ФЩ*,*)}.

Лемма 4. Если v,(-) е C1(D), i € I, то отображение х полунепрерывно сверху и имеет компактные и выпуклые значения, при этом оно непрерывно на 0ошФН, если это множество непусто.

Пусть ьг() € С1 (В), г б / и ф : Ю —> Ят — произвольное отображение, которое ниже будем называть эталонным. Поскольку отображение х по лемме 4 имеет выпуклые и компактные значения, то какова бы ни была точка, (£, х) £ Б существует единственный вектор £ ближайший в евклидовой метрике из векторов мно-

жества х) к вектору ф(Ь, х). Таким образом при сделанных предположениях эталонное отображение определяет однозначный селектор 1/-ф многозначного отображения х> который будем называть проекцией ф в х-

Теорема 7. Пусть уг(-) £ С1(Б), г £ I и ОотФН = £>. Пусть такоке ф : I) —> Нт — произвольное непрерывное эталонное отображение, а — его проекция в Х- Тогда селектор йН-ф многозначного отобраокения ФН такой, что

индуцирует решение игры Г(D).

Построение конкретных кооперативных решений на основе теорем 6 и 7 связывается далее с выбором так называемого характеристического отображения и определенного принципа оптимальности теории классических кооперативных игр.

Отображение V • (t, х) >—>■ V(t, х), ставящее в соответствие каждой позиции (í, х) S D функцию V(t, х) : 21 —> R, будем называть характеристическим. Обозначим через Vs(t,x) значение функции V(t,x) на коалиции Sel. Тогда очевидно, что определяя разными способами отображение Vs ' (t,x) >—> Vs(t,x), (t,x) £ D, мы получим разные способы определения характеристического отображения V. Так, например, можно положить

Отображение Vg можно определить также и следующим образом:

GHy(t,x) = {(/,ft) £ <S>K{t,x)\d{t,x, f) + h = v^{t,x)},

Vs(t, x) = sup inf У2 [d,(í, x, f(t, x, us, uj\S)) + K{t, x, us, u/\s)]

(7)

Vs(t,x) =

inf

(/Л)€ФН(«,х)

+ . (8)

В обоих указанных случаях считается, что Vs(t,x) = 0, если S = 0.

Очевидно, каждая пара (I,V(t,x)), (t,x) е D, представляет собой классическую кооперативную игру с множеством игроков I и характеристической функцией V(t,x). При этом функции, являющиеся значениями характеристического отображения, определенного по формулам (7) или (8), обладают свойством супераддитивности.

Лемма 5. Пусть vt(-) € С1 (В), » е I и ОотФН - D. Тогда каждое ш отображений Vg, S С I, определенных по правилу (7) или (8), является непрерывным на множестве D.

Пусть г\( ) G C1(D), г £ /, БотФН — D и задано непрерывное на множестве D супераддитивное характеристическое отображение V. Тогда, в силу непрерывной зависимости N-ядра и вектора Шеп-ли от характеристической функции, будут непрерывны и отображения ipsh, Фы '■ D —► Rm такие, что для любой позиции (i,x) € D х) и х), соответственно, — вектор Шепли и N-ядро в игре (I,V(t,x)). Как и в теореме 7 определим соответствующие эталонным отображениям i/>sh и V'/v селекторы многозначного отображения ФН, которые обозначим, соответственно, через GHsh и GHn. Тогда на основании этой теоремы заключаем, что справедливо следующее

Предложение 1. Если vt(-) € i 6 I, и Dom<3>H = D, то

каждый из селекторов GHsh « GH к многозначного отображения ФН индуцирует кооперативное решение игры Г(D).

ОСНОВНЫЕ ПОЛОЖЕНИЯ ДИССЕРТАЦИИ, ВЫНОСИМЫЕ НА ЗАЩИТУ

1. Для бескоалиционных дифференциальных игр с с интегральными выигрышами на бесконечном промежутке времени, доказана теорема о существовании решения в классе стратегий с информацией о предыстории по управлениям. Для двух частных случаев рассматриваемых игр установлено существование решения в классе стратегий с информацией о текущей позиции в игре.

2. Доказана теорема о существовании равновесной траектории, которая, в определенном смысле, является предельной для последовательности траекторий, порождаемых ситуациями ^-равновесия (е/с —> 0). Обоснован критерий равновесности.

3. В рассматриваемом классе бескоалиционных дифференциальных игр установлена теорема о существовании стабильно равновесных траекторий, вдоль которых обеспечивается рост гарантированных выигрышей всех игроков.

4. В терминах решения определенного дифференциального включения обоснован критерий стабильной равновесности траектории. Наряду с принципами оптимальности теории классических кооперативных игр, этот критерий положен в основу построения кооперативной теории в рассматриваемом классе дифференциальных игр.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Адрианов А. А., Чистяков С. В. Существование равновесных траекторий в одной бескоалиционной дифференциальной игре //В сб. Процессы управления и устойчивость: Труды 34-й научной конференции аспирантов и студентов. СПб.: Изд-во С.-Петерб. ун-та, 2003, с. 437-439.

2. Адрианов А. А., Чистяков С. В. О бескоалиционных дифференциальных играх с неограниченной продолжительностью // В сб. Процессы управления и устойчивость: Труды 35-й научной конференции аспирантов и студентов. СПб.: Изд-во С.-Петерб. ун-та, 2004, с. 539-543.

3. Адрианов А. А., Чистяков С. В. Об одном классе бескоалиционных дифференциальных игр с неограниченной продолжительностью // Вестник С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2005. Вып. 1. с. 78-93.

4. Адрианов А. А. Об одном классе кооперативных дифференциальных игр // В сб. Процессы управления и устойчивость: Труды 37-й научной конференции аспирантов и студентов. СПб.: Изд-во С.-Петерб. ун-та, 2006, с. 479-484.

5. Адрианов А. А. Идентификация равновесных траекторий в одном классе дифференциальных игр т лиц с неограниченной продолжительностью // Известия Института Математики и Информатики. Ижевск, УдГУ. 2006. Вып. 3(37). с. 3-4.

6. Адрианов А. А. О существовании ситуаций е-равновесия и равновесных траекторий в одной бескоалиционной дифференциальной игре с неограниченной продолжительностью // Вестник С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2006. Вып. 4.

Отпечатано копировальпо-мпожительпым участком отдела обслуживания учебного процесса физического факультета СПбГУ. Приказ № 571/1 от 14.05.03. Подписано в печать 31.01.07 с оригинал-макета заказчика. 4>-т 30x42/4, Усл. печ. л. 1. Тираж 100 экз., Заказ № Aille 198504, СПб, Ст. Петергоф, ул. Ульяновская, д. 3, тел. 428-43-00.

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Адрианов, Алексей Андреевич

Введение

Глава I. БЕСКОАЛИЦИОННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С ИНТЕГРАЛЬНЫМИ ВЫИГРЫШАМИ НА БЕСКОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ.

§1. Постановка задачи и основные предположения

§2 Нормальная форма дифференциальной игры т лиц.

§3. Необходимые сведения об операторах )иачения антагонистических дифференциальных игр.

§4. Траектории типа х*{-) и х'{-).

§5 Существование и структура решения игры. Равновесные траектории

§6 Характеристическое свойство равновесных траекторий

§7 Модель динамического распределения общественных благ.

Глава II. КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С

НЕОГРАНИЧЕННОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ.

§1 Стабильность кооперативных решений дифференциальной игры.

§2 Идентификация стабильно равновесных траекторий в терминах решения дифференциального включения.

§3 Локальный подход к построению кооперативных решений

§4 Конструкции кооперативных решений

§5 Кооперативные решения в модели динамического распределения общественных благ

 
Введение диссертация по математике, на тему "Неантагонистические дифференциальные игры с неограниченной продолжительностью"

Теория дифференциальных шр занимается исследованном динамических моделей принятия решений в условиях конфликта и неопределенности Источником развития -этой теории послужили практические задачи из области экономики, экологии, управления механическими и биологическими системами, военного дела При рассмотрении таких 5адач, как правило, приходится учитывать динамику изменения состояния управляемой системы, а также наличие нескольких управляющих сторон, имеющих различные субъективные цели.

Становление теории дифференциальных игр связано с работами Р. Айзекса, которые были посвящены, в основном, решению задач преследования и формулировались в виде антагонистических дифференциальных игр [7]. В нашей стране первые исследования антагонистических дифференциальных игр принадлежат академикам Л С Понтрягину [40], [39], Н Н. Красовскому [26], [27], а также их ученикам [44] и представителю ленинградской школы теории игр — Л. А. Петросяну [33]. Их результаты способствовали развитию теории неантагонистических дифференциальных игр Существенный вклад в разработку этой теории внесли Э Вайсборд, В И Жуковский, А. Ф Клейменов, А. Ф. Кононенко, Л. А. Петросян, Э Р Смольяков [41], [42], Н Т. Тынянский, С. В Чистяков и другие.

В частности, В И. Жуковский в своих оригинальных работах одним из первых указал на принципиальные проблемы, связанные с применением методов классической теории игр (таких как равновесие по Нэшу и оптимальность по Парето) и математической теории оптимального управления (принцип максимума Понтрягина и оптимальности Беллмана) к решению дифференциальных игр Им также была предпринята попытка выделить огновные направления теории неантагонистических дифференциальных игр- бескоалиционные, коалиционные, кооперативные и иерархические игры. В его работах [10], [16], [17], проводятся обширные исследования по каждому из названных направлений

Исследованиям неантагонистических дифференциальных игр посвящены многие работы А Ф Клейменова [18]-[20]. В качестве решения неанта1 онисти-ческой дифференциальной игры с терминальными выигрышами он, наряду с традиционным равновесием по Нэшу, рассматривает решения, основанные на принципах оптимальности по Парето и по Штакельбергу, а также кооперативные решения, иредуемспривающие, чго в ходе игры каждый из игроков может производить непрерывные выплаты остальным ш рокам

Своеобразный подход к исследованию кооперативных дифференциальных игр, в центре которого лежит понятие динамической устойчивости принципов оптимальности, изучен в работах Л. А Петросяна [34}

В теории неантагонистических дифференциальных игр прежде всего возникает задача об отыскании ситуаций равновесия или ¿-равновесия при любом е > 0. Поскольку в общем случае приходится иметь дело с целым множеством траекторий, пригодных для реализации принципа равновесия (и разным из них соответствуют, вообще говоря, разные векторы выигрышей), то возникает также задача сужения этого множества, а в идеале — выбора из него единственной траектории.

Достаточно полное исследование первой задачи проведено для дифференциальных игр с терминальным выигрышем на конечном промежутке времени. Эти исследования начались с работ А. Ф. Кононенко [22]-[24], который, используя формализм теории позиционных антагонистических дифференциальных игр, получил первые наиболее общие результаты, относящиеся к бескоалиционным дифференциальным играм двух лиц. В частности, в терминах движений управляемой системы, он указал достаточные условия существования ситуации е-равновесия в этом классе игр

В работах С В Чистякова [51]-[53], [57) близкая к подходу Кононенко идея была положена в основу построения теории бескоалиционных дифференциальных игр тп лиц (ш > 2) с терминальными выигрышами игроков. В частности, установлено существование решения рассматриваемой игры (те. существование в игре ситуации е-равновесия при любом £ > 0) в терминах ограничений на правую часть системы дифференциальных уравнений, описывающих управляемый процесс В основу построения ситуаций е-равновесия в исходной неантагонистической дифференциальной игре были положены программные конструкции решения антагонистических дифференциальных игр описанные, в частности, в [55] Решение проблемы сужения множества равновесных траекторий оказалось возможным на основе перехода от бескоалиционной дифференциальной ш ры к кооперативной

В данной работе описывается аналогичный подход к построению элеменюв теории дифференциальных ш р с интегральными выигрышами игроков на бесконечном промежутке времени

В первой главе исследуется определенный страте1 ический аспект решения данной конфликтной задачи В частности, установлено существование решения рассматриваемой шры, а также существование равновесных траекторий, соответствующих оптимальному в смысле равновесия по Н^шу поведению игроков в игре Кроме того, доказана теорема о существовании в рассматриваемом классе игр таких траекторий, вдоль которых гарантированные выигрыши игроков к моменту времени £ являются неубывающими функциями этого момента времени Эта теорема и ее следствие составляют основу для построения в главе II определенной версии теории кооперативных дифференциальных игр Последний параграф первой главы посвящен применению полученных результатов к исследованию модели динамического распределения общественных благ. В частности, в этом параграфе, данная модель представлена в виде бескоалиционной дифференциальной игры с нео1 раниченной продолжительностью и описано множество стабильно равновесных траекторий в этой игре.

Вторая глава посвящена построению определенной версии кооперативной теории рассматриваемых дифференциальных игр. Вводится понятие кооперативного решения дифференциальной игры, являющееся, по сути, сильно динамически устойчивым [53] При этом оказывается, что такое решение может быть построено на основе введенного ранее множества стабильно равновесных траекторий в исходной бескоалиционной дифференциальной игре. В основе подхода к построению кооперативных решений рассматриваемой игры лежит доказанная в § 2 2 теорема об идентификации стабильно равновесных траекторий в терминах решений определенного дифференциального включения. Описаны некоторые из таких кооперативных решений, отвечающие известным решениям проблемы дележа — ¡М-ядру, вектору Шепли и др. Последний параграф второй главы посвящен построению некоторых кооперативных решений в модели динамического распределения общественных благ

В заключении формулируются основные положения диссертации, выносимые на защиту

Параграфы каждой из двух глав имеюг (ною нумерацию Утверждения замечания и формулы внутри каждою параграфа также имекп свою нумерацию, причем при иылках на них из дру1их параграфов той же главы кпереди, через точку добавляется номер соответствующего параграфа. При подобных ссылках на параграфы другой главы впереди добавляется еще и номер соответствующей главы

 
Заключение диссертации по теме "Дискретная математика и математическая кибернетика"

Заключение

Основные положения диссертации, выносимые на. защиту, соиояг в следующем

1 Для бескоалиционных дифференциальных игр с с интегральными выигрышами И1 роков на бесконечном промежутке времени, доказана теорема о существовании решения в классе стратегий с информацией о предыстории по управлениям Для двух частных случаев рассматриваемых игр установлено существование решения в классе стратегий с информацией о текущей позиции в шре.

2. Доказана теорема о существовании равновесной траектории, которая, в определенном смысле, является предельной для последовательности траекторий, порождаемых ситуациями е^-равновесия (е*. —> 0) Обоснован критерий равновесности.

3 В рассматриваемом классе бескоалиционных дифференциальных игр установлена теорема о существовании стабильно равновесных траекторий, вдоль которых обеспечивается рост гарантированных выигрышей всех игроков

4 В терминах решения определенного дифференциального включения обоснован критерий стабильной равновесности траектории, который наряду с принципами оптимальности теории классических кооперативных игр, положен в основу построения кооперативной теории рассматриваемых дифференциальных игр, имеющей своей целью решение проблемы сужения множества стабильно равновесных траекторий Построены различные кооперативные решения рассматриваемой неантагонистической дифференциальной игры

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Адрианов, Алексей Андреевич, Санкт-Петербург

1. Адрианов А. А , Чистяков С В Об одном классе бескоалиционных дифференциальных игр с неограниченной продолжительностью // Вестн. С -Петерб ун-та. Сер 10. Прикладная математика, информатика, процессы управления 2005. Вып 1. С 78-93

2. Адрианов А А. Об одном классе кооперативных дифференциальных игр // Процессы управления и устойчивость- Труды 37-й научной конференции аспирантов и студентов / Под ред. Н.В Смирнова, В.Н Старкова СПб : Изд-во СПбГУ, 2006. С 479-484

3. Адрианов А А. Идентификация равновесных траекторий в одном классе дифференциальных игр т лиц с неограниченной продолжительностью // Известия Института Математики и Информатики Ижевск, УдГУ 2006. Вып 3(37) С 3-4

4. Айзеке Р Дифференциальные игры М * Мир, 1967. 480 с

5. Бсрж К Общая теория игр нескольких лиц M Изд-во фи i -мат лит-ры, 1961 128 с

6. Брамс С. Д Делим по справедливости или гарантия выигрыша каждому. Под ред Ф Т. Алескерова. M . СИНТЕГ, 2002 188 с.

7. Вайсборд Э M, Жуковский В И. Введение в дифференцальные шры нескольких лиц и их приложения M • Советское радио, 1980. 304 с.

8. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями М.- Наука, 1984 624 с

9. Васецов M. Е, Чистяков С. В. О некоторых квазисовершенных принципах оптимальности в кооперативных дифференциальных играх // Вестн. С.-Петерб. ун-та Сер. 1. 1998. Вып. 4 № 22. С 3-9.

10. Воробьев H. H Теория игр для экономистов-кибернетиков М.1 Наука, 1985. 272 с.

11. Демьянов В Ф, Васильев Л. В Недифференцируемая оптимизация. М.: Наука, Главная редакция физ -мат лит-ры, 1981. 384 с.

12. Демьянов В Ф , Малоземов В Н. Введение в минимакс. M : Наука, 1972

13. Жуковский В И, Салуквадзе M. Е. Некоторые игровые задачи управления и их приложения Тбилиси- Мецниереба, 1998. 462 с

14. Жуковский В И Кооперативные игры при неопределенности и их приложения M Эдиториал, 1999 334 с

15. Клейменов А Ф Решения по Нэшу, Парею и Штакельбергу в неантагонистических дифференциальных играх // ПММ. 1987. Т. 51. № 2. с. 209-215.

16. Клейменов А Ф Кооперативные решения в позиционной дифференциальной игре многих лиц с непрерывными функциями платежей. // ПММ 1990. Т 54 № 3 с 389-394

17. Клейменов А Ф Неантагонистические позиционные дифференциальные игры Екатеринбург Наука, Урал отд , 1993 185 с.

18. Колмогоров Л Н, Фомин С. В Элементы теории функции и функционального анализа М Наука, 1972 496 с

19. Кононенко А Ф О равновесных позиционных стратегиях в неантагонистических дифференциальных играх Доклады АН СССР, 1976. т 231 № 2 с 285-288

20. Кононенко А Ф Структура оптимальных стратегий в динамических управляемых системах //Журнал вычисл магем и матем. физики, 1980. т 20. №5 с 1105-1116

21. Кононенко А Ф , Конурбаев Е М. Существование равновесных ситуаций в классе позиционных стратегий оптимальных по Парето для некоторых дифференциальных игр. // Теория игр и ее приложения. — Сб. трудов — Кемерово, 1983 с. 105-115

22. Косачев Ю В Экономико-математические модели эффективности финансово-промышленных структур. М.: Логос, 2004. 284 с.

23. Красовский Н Н Игровые задачи о встрече движений. М . Наука, 1970. 420 с

24. Красовский Н Н Управление динамической системой: Задача о минимизации гарантированного результата. М. Наука, 1985. 518 с.

25. Лутманов С В Об одной альтернативе в дифференциальной игре нескольких лиц // ПММ 1977 т. 41. № 5 с. 813-818.

26. Лутманов С В Достаточные условия существования равновесного набора стратегий в дифференциальных играх нескольких лиц // Дифференциальные уравнения, 1980 Т 16 № 10 с. 1760-1765

27. Матвеев Н М Методы интегрирования обыкновенных дифференциальных уравнений Минск, "Вышэйш школа", 1974. 768 с

28. Никитин Ф Ф , Чистяков С В Об антагонистических дифференциальных играх с неограниченной продолжительностью Вестник СпбГУ, (ер 1, 2004, выи 3, с 38-44

29. Обен Ж., Экланд И Прикладной нелинейный анализ М Мир, 1988 510 с

30. Петросян Л А Дифференциальные шры преследования Л Изд-во Ле-нингр ун-та, 1977 222(

31. Петросян Л А , Данилов Н Н Кооперативные диференциальные игры и их приложения. Томск Иад-во Томскою ун-га, 1985 276 с

32. Петросян Л. А Сильно-динамически устойчивые принципы оптимальности в многокритериальных задачах оптимального управления. Техническая кибернетика, № 1, 1993, с 169-174.

33. Петросян Л А Сильно-динамически устойчивые дифференциальные принципы оптимальности. Вестник СПбГУ, сер 1, 1993, вып. 4 (№ 22), с. 35-40.

34. Петросян Л. А , Зенкевич Н А , Семина Е А Теория игр. Высш. шк Кн. дом "Университет", 1998 252 с

35. Печерский С Л, Яновская Е. Б. Кооперативные игры, решения и аксиомы. СПб Издательство Европейского университета в Санкт-Петербурге, 2004. 459 с

36. Понтрягин Л С Избранные научные труды. Т 2 Дифференциальные уравнения Теория операторов. Оп гималыюе управление Дифференциальные игры. М . Наука, 1988 575 с

37. Понтрягин Л С, Болтянский В Г, Гамкрелидзе Р. В. Математическая теория оптимальных процессов М. Наука, 1983. 392 с

38. Смолъяков Э Р Равновесные модели при несовпадающих интересах участников М Наука, 1986 221 с

39. Смолъяков Э Р Теория антагонизмов и дифференциальные игры. М Эди-ториал, 2000 159 с

40. Субботин А И Обобщенные решения уравнений в частных производных первого порядка Перспективы динамической оптимизации Ижевск, 2003 335 с

41. Субботин А И, Чепцов А Г Оптимизация гарантии в задачах управления. М Наука, 1981. 287 с

42. Филиппов А Ф Дифференциальные уравнения с разрывной правой частью М Наука, 1985. 224 с

43. Фихтенгольц Г М Дифференциальоное и интегральное исчисление Уч пособие СПб., 1997 800 с.

44. Флеминг У, Ришел Р Оптимальное управление детерминированными и стохастическими системами М : Мир, 1978 318 с.

45. Фридман А. Об определении дифференциальных игр и существовании значения игры и седловых точек // Кибернетический сб , новая серия, вып 9. М. Мир, 1972.

46. Ченцов А Р. Об игровой задаче сближеггия в заданный момент времени. // Мат сб , 1976, т. 99, № 3. с 394-420.

47. Чистяков С В К решению игровых задач преследования // ПММ, 1977, т 41, № 5 с. 825-832

48. Чистяков С В О существовании решения бескоалиционных дифференциальных игр // Управление в динамических системах. JL, 1979. С 71-99 Деп ВИНИТИ от 24 июля 1979 г., N° 2794-79. (РЖМат, 1979, 10В733 деп )

49. Чистяков С В О бескоалиционных дифференциальных играх // Доклады АН СССР, 1981, Т259, X» 5, с 1052-1055.

50. Чистяков С В О построении сильно динамически устойчивых решений кооперативных дифференциальных игр // Вестник СпбГУ, сер. 1, 1992, вып 1(JV° 1), с 50-54

51. Чистяков С В Динамический аспект решения классических кооперативных игр // Доклады АН России, 1993, том 330, N° 6

52. Чистяков С В Операторы значения антагонистических дифференциальных игр Уч пособие СПб, 1999 62 с

53. Чистяков С В Элементы динамической теории классических кооперативных шр // Численные и качественные методы прикладной математики СПб. Иад-во С -Петерб ун-та 2004 С 14-40 (Вопросы механики и процессов управления Вып 23)

54. Чистяков С В Об одной лемме теории бескоалиционных дифференциальных игр // Вестник СпбГУ, сер 10. 2004 вып 2 с 110-118

55. Basar Т, G J Olsder Dynamic Noncooperative Game Theory. San Diego, 1995, Academic Presb

56. Cellini R., Lambertim L A differential oligopoly game with differentiated goods and sticky prices Department of Economics, University of Catania, Italy, 2002.

57. J Chamberhn Provision of collective goods as a function of group size // The American Political Science Review, 1974, 68, pp 707-716

58. Dockner E J, S Jorgensen, N. Van Long, G. Sorgen. Differential Games in Economics and Management Science. Cambridge Cambridge University Press 2000 382 p

59. С Fershtman, S Nitzan Dynamic voluntary provision of public goods // European Economic Review, 1991, 35, pp. 1057-1067

60. Schmeidler D The nucleolus of a characteristic function game SIAM J. Appl Math , 17(1969), pp 1163-1170