Динамическая устойчивость решений для некоторых классов игр с неполной информацией тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Кузютин, Денис Вячеславович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
1993 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Динамическая устойчивость решений для некоторых классов игр с неполной информацией»
 
Автореферат диссертации на тему "Динамическая устойчивость решений для некоторых классов игр с неполной информацией"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

т- ■-> р1 1 Г 1 и

■ г

и ^ I

КУЗЮТНН Деннс Вячеславович

удк 518.9

ДИНАМИЧЕСКАЯ УСТОЙЧИВОСТЬ РЕ13Е1ШЙ ДЛЯ НЕКОТОРЫХ КЛАССОВ ИГР С НЕПОЛНОЙ ИН®ОРИАЦИЕП.

01.01.09 - Математическая кибернетика

автореферат

диссертации на сиисканио ученой стэпепи кандидата физико-математических наук

Санкт-Петербург, 1993

Работа выполнена на кафедре математической статистики, теории надежности и массового обслуживания факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета.

Научный руководитель : - доктор физико-математических наук, профессор Л.А.Патросян.

Официальные оппоненты: - доктор физико-математических наук, профессор А.ф •Клейменов,

- кандидат физико-математических Наук, ДОЦЭНТ В.А.Уланов.

Ведущая организация : - Московский государственный

университет им.М.В.Ломоносова.

Защита диссертации состоится 1993г. в

.часов на заседании специализированного совета К 063. 57.16 по присуждению ученой степени кандидата физико-математических наук в Санкт-Петербургском государственном университете (188904, С-Пэтербург, Ст.Петергоф, Библиотечная пл., 2, факультет ПМ-ПУ С-ШГУ). За'дата будет проходить по адресу : С-Петербург, В.О., 10 линия, д.33, ауд.88.

С диссертацией можно ознакомиться в бибияшлеке им. A.M. Горького Санкт-Петербургского государственного университета (199034, С-Петербург, Университетская наб., д. 7/9).

Автореферат разослан хэазг.

Ученый секретарь специализированною совета,

ДОЦеНТ 0-/{-'(< В. Ф. Горь ковоп

ОБЯАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Одам из важных свойств принципов оптимальности, используемых в различных классах динамических игр со многими участниками, является их динамическая устойчивость. Это свойство, впервые введенное Л.А.Пэтрося-ном в из, обеспечивает реализуемость и устойчивое оптимальное развитие конфликтного динамического процесса, что особенно важно для многочисленных практических приложений. В связи с этим возникают два круга актуальных задач : исследование динамической устойчивости известных принципов оптимальности для различных классов динамических игр и конструирование новых динамически устойчивых {сильно динамически устойчивых) решений. Диссертационная работа посвящена исследованию указанных актуальных проблем применительно к различным классам динамических игр с неполной информацией .

Цель работы. Исследование устойчивости известных принципов оптимальности в конечных многошаговых играх со многими участниками в классе смешанных стратегий. Математическое обоснование применимости динамически устойчивых и сильно динамически устойчивых решений в указанном классе игр, а тагске в конечных повторяющихся играх с дисконтированием выигрыша.

Конструирование и исследование новых динамически устойчивых принципов оптимальности в дифференциальных играх п лиц с терминальными и интегралъяьми выигрышами.

Научная новизна. Теория динамических игр, возникшая на стыке классической статической теории игр из и математической Теории оптимального управления, является в настоящее время однйл из перспективных и быстро развивающихся направлений современной математики. Наибольшее развитие получила теория антагонистических дифференциальных игр, основополагающе результаты которой были получены научными школами Л.С.Понтрягина и Н.Н.Крзсовского. Большой вклад в теорию антагонистических дифференциальных игр внесли Р.Айзеке. В.Д.Бзтухтин, Н.Л.Григорешю, В.И.Зубов, А.Ф.Кононенко,

А.В.Крпягамский, А.Б.Куржанския, Е.Ф.Мищенко, М.С.Никольский, Ю.С.Осипов, Н.Н.Петров, Л.А.Петросян, Б.Н.Пшеничный, Н.Ю.Сатимов, А.И.Субботин, Г.В.Томский, У.Флеминг, А.Г.Чен-цоз, Ф.Л.Черноусько, А.А.Чикрий и многие другие советские и зарубежные математики.

Однако многие задачи принятия решения в организационных, социально-экономических и других конфликтно-управляемых системах характеризуются, в числе прочих факторов, наличием многих участников и не являются антагонистическими. Различные вопросы, связанные с оптимальным поведением игроков в некоторых классах нэантагонистических игр и динамических игр со многими участниками, рассматривались в работах Э.М. Вайсборда, В.И.Жуковского, В.В.Захарова, А.Ф.Клейменова, А.Ф.Кононенко, 0.А.Малафеева, Л.А.Петросяца, Н.ТЛынянско-го, Ю.Е.Чистякова и других авторов.

Одной из основных задач теории игр, как это отмечает Н.Н.Воробьев в I3J, является конструирование и анализ принципов оптимального поведения игроков. D статической теории игр изучаются разнообразные принципы оптимальности, имеющие определенные границы приложимости, в рамках которых они могут считаться в достаточной мере адекватным описанием содержательно оптимального поведения. При исследовании динамических игр со многими участниками возникает вопрос о применимости того или иного "статического" принципа оптимальности в более широких классах игр. На зтом пута можно ожидать нахождения обоснованных критериев выбора принципов оптимальности в различных классах игр, а там® формального конструирования новых принципов, которые могут оказаться весьма плодотворными. Предмет данной работы относится к атому кругу актуальных задач.

В работе из впервые было обращено внимание на одно важное свойство решения динамических игр, названное свойством динамической устойчивости (состоятельности во времени). Попытки переноса известных в статической теории принципов оптимальности на различные классы динамических игр без соовотствукяцего исследования их динамической устойчивости, вообще говоря, но обоснованы и в ряде случаев мо-тут приводить к выбору заведомо нереализуемых решения. Bon-

росы динамической устойчивости решений в различных классах динамических игр изучались в работах Л.А.Петросяна, Н.Н.Данилова, В.В.Захарова, К.А.Зенкевича, С.В.Чистякова а других авторов.

Основные результаты диссертации : 1) Доказана динамическая и сильная динамическая устойчивость известных принципов оптимальпости в классе смешанных стратегий для конечных многошаговых игр п лиц с неполной информацией и различными определениями выигрыша в подаграх. г) Математически обоснована применимость отдельных принципов оптимальности для одного класса повторяющихся игр с дисконтированием выигрыша.

з) Предложены методы обеспечения динамической устойчивости арбитражных Пзрето-оптимальных решений в дифференциальных играх со многими участниками, основанные на определенном характере изменения значения "статус кво" з текущих подаграх вдоль оптимальной траектории. В случае дифференциальных игр с терминальными выигрышами получены в явпом виде законы движения точки "статус кво", обеспечивающие динамическую устойчивость конкретных арбитражных решений. Для игр с интегральными выигрышами предложена одна модель динамики выплат игрокам при движении вдоль оптимальной траектории, обеспечивающая динамическую устойчивость арбитражного решения Кэлаи-Смородинского.

Общая методика исследования основана на классических результатах теории игр и современных методах теории управления динамическими системами. Существенно используется теория разложения позициоиых игр и стратегий в них, предложенная Г.У.Куном в [-45, методы конструирования динамически устойчивых принципов оптимальности в дифференциальных играх, описанные в работах Л.А.Петросяна, а также современные результаты теории арбитражных схем.

Практическая ценность. Полученные в диссертации результаты и предложенные метода могут быть использованы в теории динамических игр со многими участниками, при обосновании применимости отдельных принципов оптимальности в конфликтно-управляемых системах с различной информационной структурой,

!

при решении динамических задач распределения и выоора, а также при конструировании устойчивых принципов опгимзльно-стн в дифференциальных играх п лиц.

Апробация работы. Основные результаты диссертационной работы докладыва.шсь на Всесоюзных Герценовских чтениях (ЛЬнинград,1»91), на Международной конференции "Конструктивная теория функций" (С-Петербург,1£>92), на 2 Международном семинаре ИФАК "Негладкие и разрывные задачи управления и оптимизации" (Челябинск,««), на Международной конференции "Теория приближения и задачи вычислительной математики" (Днепропетровск,1993), на Международном конгрессе "Компьютерные системы и прикладная математика" (С-Петербург,1в»з), а также обсуждались на семинарах по теории игр кафедры математической статистики, теории надежности и массового обслуживания факультета прикладной математики - процессов управления С-ПбГУ.

Публикации. По теме диссертации опубликованы ^ печатных работ.

Структура и объем работы. Диссертация состоит из введения, трех .глав (19 параграфов) и списка литературы, включа-кмдего 72 наименования. Общий обюм дассэргадаи составляет 121 страницу.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Ео введении содержится обоснование актуальности темы работы, формулируются дели исследования, приводится краткий обзор содержания и основные результата диссертации.

Глава I "Устойчивость принципов оптимальности в многошаговых играх с неполной информацией" содержит 9 пара1рафов. Б ней рассматриваются конечные игры п лиц, представленные в позиционной форме как игры на древовидном ориентированном графе к. Основным инструментом исследования здесь яьляется теория разложения таких игр и стратегий в них, предложенная Г.У.Куном в нз.

В 5 1.1. определяется рассматриваемый класс позиционных игр. При этом па множестве всех позиций к за исключением начальной позиции о полагается заданной векторная функция ь с Бе;чествешгкми компонентами ь., < = 1,___,п. Если в игре Г реализуется партия (ТрЭЭКТОрИЛ) ф - <о, у..... у>п,... >, то

вдпгрнш игрока < равен

ЬЛф) I ь((Уга).

т

Исследование устойчивости решетш проводится в классе скошап-пых стратегий. Каждая ситуация ц = (р^, .... ¡хп) з смешанных стратегиях порождает целое семейство траекторий и к Ф(р.) « <фй>. реализующихся с пологатолъной вероятностью р(<рм,|а).

Предполагается, что целью кээдэго участника игры Г является максимизация своого ожидаемого выигрыша п^р) » 2 Р!'^.!') '\(<Рк> > 1 = 1.....пк

В 5 1.2 содержатся основные результаты теории разложения позиционных игр, используемые в дальнейших рассуждениях, и предлагаются различные подходы к определении выигрызз в подаграх, отражающие практический свойства конфликтных динамических систем, моделируемых игрой.

Пусть игра Г разложепа в позиции х на подагру Г.; и фактор-игру Гп> называемую также усечением игры Г в позиции х. Векторная функция ьх для каждой позиции подагры Гх определяется как ограничение ь па множестве позиций из где кх - поддерево к с корнем х. Пусть <р - партия в игра Г, проходящая

через позицию х •, ф = < о..... х >. фх= < х, ф ч <р > - часть

траектории ф в подагре Г . Тогда выигрыш игрока ; в подагре на траектории <рн полосам равным

Ь«|4«Рк> - I > С1-2'15*>

Уя,^»4«

При этом :

- 2 |Мут> + - N«4») + ь*|<!Фх>- С1-2-23

»Vя?40

нумерация формул и утверкдений соответствует их нумерации в диссертации.

&

Определение <1.2.1) отражает стремление участников конфликтного процесса максимизировать свой текущий и будущий виигрцш, вне зависимости от уже накопленних платежей. Определение выигрыша в подаграх, принятое в 143, является частным случаем определения С1.2.1). все доказательства в главе I проводятся для модели позиционной игры Г с условием «.2.1).

Разложению игры Г на подагру Гх и фактор-игру Г0 отвечает естественное разложение смешанных стратегий в Г на пару смешанных стратегий в Гх и в Гс : - <Иьц. 1 ~ 1.....

В 5 1.3 приводится определение и обсуждение свойств динамической и сильной динамической устойчивости. Под принципом оптимальности 6 будем понимать всякое отображение, ставящее в соответствие игре Г непустое подмножество 0(Г) множества ожидаемых виигришей. Ситуации ц такую, что н(ц) е в(Г), назовем оптимальной в смысле принципа оптимальности 8, а траектории ф е Ф(ц) - условно-оптималышмц траекториями. Множество всех О-оптимальшх ситуаций в игре Г обозначим иб(Г). В дальнейшем рассматриваются только подагры Гх с начальными позициями на некоторых условно-оптимальных траекториях игры Г.

Пусть в Г выбран принцип оптимальности 0, и *ГХ> - множество возможных подагр вдоль условио-оптимальних траекторий. Определение 1.3.1. Будем говорить, что множество иц(Г) является динамически устойчивым (принцип оптимальности 6 обладает свойством динамической устойчивости), если для любой ситуации ц в и0!Г) в каждой подагре Гх выполнено условие

где обозначает элемент разложения ситуации ц в подагре. Определение 1.3.2. Множество 1>е(Г) является сильно динамически устойчивим, если джя каэдой подагры Гх и для любой ситуации vx е и0(Гх) существует ситуация ц е и0(Г) такая, что цх совпадает с ух на информационных мноюствах где через х4 обозначено семейство информационных множеств игрока » в подагре Гх.

Если в динамической игре определено оптимальное поведение игроков в соответствии с некоторым принципом оптимальности, то динамическая устойчивость этого принципа оптимальности га-

рантир.ует, что во всех подаграх, образованных вдоль оптимального пути развития игры, ни у одного из игроков не появится оснований отклоняться от первоначально выбранной схемы поведения. «

Определенный в 55 I.I. 1.2 класс позиционных игр содержит, в частности, следующие интересные с точки зрения экономических и других приложений классы игр: конечные позиционные игры п лиц, формализованные Куном в работе ш, конечные игры на выживание (или игры на разорение), одновременные игры, удовлетворяющие условиям 5 I.I.

В $5 1.4 - 1.8 проводится исследование свойств динамической и сильной динамической устойчивости различных принципов оптимальности в позиционных играх Г, основанное на анализе разложения таких игр и смешанных стратегия в mix и его влияния на ожидаемый выигрыш игроков. Доказаны, в частности, следующие теоромы.

Теорема I.4.I. Множество всех ситуаций равновесия по Нашу isi •'„(Г) в игра Г является сильно динамически устойчивым. Теорема 1.5.2. Если в фактор-играх Гй существуют ситуации сильного равновесия tsi, то множество всех сильно-равновесшх ситуаций и (Г) является сильно динамически устойчивым. Теорема 1.6.I. Если множество ситуаций К-равновесия сз] и (Г) в игре Г непусто, то оно является динамически устойчивым. Теорема 1.7.2. Множество оптимальных по Парето ситуаций чр(Г) в игре Г является динамически устойчивым. Теорема I.8.I. Множество собственно эффективных ситуаций и (Г) является динамически устойчивым решением.

Таким образом, математически обоснована целесообразность применения указанных принципов оптимальности на практике.

В 5 1.9 предложен один подход к сужению множества ситуаций равновесия по Нашу, основанный на введенном понятии <-устойчивости. Рассмотрен модельный пример.

Глава я "Динамическая устойчивость решений в повторяющихся играх с дисконтированием выигрыша", содержащая 4 параграфа, посвящена распространению основных результатов, полученных в главе I, на класс конечных повторяющихся игр с наблюдаемыми действиями и дисконтированием платежей tsi.

jo

В § 2.1 описывается указанный масс игр Г(0), .причем предполагается, что каждый участник i-.спользует собственный коэффициент дисконтирования (discount factor) 0. е (0,1), ТО вСТЬ О - (S,.....вп).

В 5 2.2 предложена удобная позиционная форма для таких игр, пооволягаш представить их как игры на конечном древовидном оризнтированпом графе и проводить исследование динамической устойчивости методами главы I. Пусть у - множество всех позиций в Г (б), соответствущих окончанию некоторого шага игры. Определим на кношестю Y целочисленную функцию rang (у), показывающую количество шагов игры Г(0), совершенных с момента начала игры до появления позиции у е у. Пусть у' = с у с y ( rang (у) «• t> - множество всех позиций ранга <, t - 1,2,...,т; т - число различных позиций в у1, 3 -0 "

"О (¡.s^.. . ,sn) - функция» ставящая в соответствие каждому выбору в позиции случая и определенному набору выборов игроков на шаге номер окончательной позиции первого шага :

О (i,si.....sn) - h , h e < 1, 2,..., m >. Тогда для

определония выигрыша участников в Г(0) достаточно задать векторную функцию ь на шшкаствз позиций у* « с у*,..., у*, >.

Действительно, множество у' для всех t = 2,...,т может быть разбито с помощью функции О на т классов эквивалентности, у* каждый из которых содержит позиций из у* :

т

у' - U ■ у' .

л« i

Позиции из Уд .-эквивалентны в смысле величины выигрыша, полученного игроками на шаге t. Для каждой позиции у£ е у*

- О;"* Ь.(У^> , i » 1.....П. С2.2.9)

Если в игре Г (О) реализуется траектория

_ f rt I г t т 1

{ °..........у/......ч.....у* ) *

^ i г Ь т J

то выигрьва игрока t полагается равный

т т

Разложений игры г(6) возможно только в позициях к с у. Пусть Г (О) разложена в позиции хеу', ф - траектория, проходящая

ЧЭрЗЗ ПОЗИЦИЮ я, ф - < о, . . . , х > ,

ф » [ ф Ч ф ) - ( х.......... yj.....уI } -

часть траектории <р в подыгре Гч(б). Тогда выигрыш игрока * на траектории ф подагры Гх(б) равен

ПХ|<<ТХ)- 0i I 5Г h£<X > • С2-212У

t»t+l ^

Формула <2.2.«) отличается от определения выигрыша в подаграх, принятого в главе I, присутствием в правой часта инти--t.

теля ä( , который коию интерпретировать, как коэффициент

изменения одашици полезности игрока i при переходе от (»+»)-

го изгз ]с первому шагу игры Г(в). При этом сиеста <1.2.2)

будет справвддиьо следующее равенство t.

П.(ф) - 1,.(ф) + О. «»N1, (фх) • С2.2Л-И

Несмотря на указанные отличия, вызванные дисконтированием выигрышей, все основные результаты, полученные в главе t, останутся справедливыми для повторяющихся игр с иаблюдаэмнми действиями Г(б).

В частности, б 2.3, 2.4 доказана сильная динамическая устойчивость множества ситуаций равновесия по Нэшу и (Г(б)) и множества ситуаций сильного равновесия и {Г(0>) (теоремы 2.3.1 и 2.3.2), а также динамическая устойчивость множества ситуаций К-равновесип и множества ситуация, оптимальных но Пзрято, Слейтеру и Джо.'Мриону (теоремы 2.3.3, 2.4.1 - 2.4.3).

Глава 3 "Устойчивость Парето-оптимальных решений в дифференциальных играх со многими участниками" содержит б параграфов. Она посвяцонз проблеме конструирования динамически устойчивых принципов оптимальности в дифференциальных играх п лиц с терминальными и интегральными выигрышами.

В 5 3.1 определяется дифференциальная игра п лиц Г(т-*0,х°), описываемая уравнениями

;<о - wo, ....."n(f)), <3.1.2>

t e lt , t). о * *

где x e r'" . u{(t) e и. с comp r1"' - допустимое управление игрока 1, при начальных .условиях

x(to) Ш X°, <3.1.3)

Рассматриваются игры с фиксированной продолжительностью т-<о и функциями выигрыша

J4( t-t0. » (•).....un<">> " 'lt"<•>> "

Т

- J /•1<x(D)d-i + II*(x(T>> , <3.1.4>

i

о

где h. и - непрерывные функции на Rm. Предполагается, что выполнены известные условия, гарантирующие существование и единственность решения задачи <з.1.2>, <з.1.з> на i«0, tj.

Все рассматриваемые в глав© 3 решения представляют собой попытку компромисса на множестве Парето-оптимальных или слабо Парето-огггимальных векторов выигрыша, что позволяет ограничиться классом допустимых программных стратегий игроков

i в 1, . . . ,П.

Пусть х{т-»о,х°) - множество всех траекторий системы сэ.1.2) с начальными условиями <з.«.з>, порожденных всевозможны;»! допустимыми программными стратегиями u. е Dj, i « i,... ,n ,

y<t-t0.H°) » [ II(T-to,x(-)> t *('»*°> } - <3.5.2>

множество возможных векторов выигрыша участников игры.

Известно, что множества оптимальных по Парето и Слейтеру векторов выигрыша в Г(т-<0,х°> являются динамически устойчивыми. Однако для принятия коллективного решения необходимо иметь некоторый "справедливый" способ выбора единственного

вектора,, к - н(т-<0 ,**{•)> из этих множеств, поскольку в действительности может быть реализован лишь один исход развития. Одним из обоснованных методов такого выбора является использование различных арбитражных схем £б], описанию которых по-свяшэн 5 3.2.

Пусть игрокам доступно множество у возможных выигрышей, и задан некоторый вакгор л « v, интерпретируемый как вектор гарантированных выигрышей, либо иным образом, называемый точкой разногласия или "статус кво". Везде будам предполагать, что множество S - < х е y | х > d > с Comp Rn явлпотся выпуклым

и исчерпывающим. Под арбитражной схемой будем понимать правило ф, ставящее в соответствие каждой паре (s,d) некоторую точку множества s, интерпретируемую как арбитражное (компро-

миссноэ) решение, пли оптимальный вектор выигрышей участников:

ср : (S,d) — il е S, {3.2.2)

В работе рассматриваются арбиграиоыв схемы Iîama w(£,d), эгалитарная E(s,d), Калаи-Смородияского K(s,d), 1 утилитарное арбитражное решение <u(s,d) и решение, монотонное вдоль пути

WIPS(S,d) Г63.

Пусть d(T-to,x°) - точка "статус-кво" в игре r(T-fo,x°),

S (d (T-i0 ,x° > ) -{y* Y(T-to,x°> I y > d(T-fo,*°) ] - C3.S.4)

допустимое множество, удовлетворяющее указанным ограничениям. Под арбитражной схемой в дифференциальной игре r(T-fo,x°) будем понимать следующее отображение *

ф : <S<d(T-to,x°)), d(T-io,x°)) - H й S(d(T-to,x°)),

где

lî » iT<d(T-to,x°)) = II(T-to> x*(.)) - <3.8 S)

арбитражное (компромиссное) решение дифференциальной игры. Здесь х'(-) е x(T-to, - оптимальная траектория системы со.1.2) - <3.1.31, порожденная соответствующими оптимальными стратегиями u*(t) и доставляющая игрокам выигрыши н..

Для исследования вопросов, связанных с динамической устойчивостью арбитражных решета, рассмотрим семейство текущих подагр T(T-t, x*(i)) с начальными условиями x*(t) и продолжительностью т-t, ( е tto ,тз. Условий динамической устойчивости арбитражного решения можно записать в виде

H(d(T-i, х*(0) » î>(d(T-i0, х°)) <3.S.1S>

для всех t e (tc,T), где ¡ï(a(T-t,x*(t)> - арбитражное решение текущей игры. При выполнении этого условия игроки во всех текущих подаграх вдоль оптимальной траектории х*(<) в качестве арбитражного решения будут выбирать один и тот же вектор возможных выигрышей ¡¡(diT-t^.x0)), что соответствует использованию ими своих оптимальных программных стратегий u*(t) на всем отрезке времени "0,тз и практической реализации траектория х*(() в игре Г(т-ta, х°).

Выполнение условия <з.5.13> существенным образом зависит от характера изменения значения "статус кво" d(T-t,x*(t)) в текущих подаграх вдоль оптимальной траектории. В } 3.3 пока-

и

зано, что единственным арбитражным решением, априори удовлетворяющим требованию динамической устойчивости, является утилитарное решение и (б, а).

Обеспечить динамическую устойчивость других арбитражное решений представляется возможным за счет управления движением точки "статус кво" и(т-*,х*(0) в подаграх вдоль оптимальной траектории ■-<*(•). .

В 5 3,4 для дифференциальных игр с терминальными выигрышами получены в явном виде законы изменения точки "статус кво", обеспечивающие динамическую .устойчивость арбитражных решений

И №5(2,1!).

В з 3.5 рассматриваются дифференциальные игры п лиц с интегральными выигрышами. Показано, что если выигрыш, полученный игроком г при движении вдоль х*(•) на промежутке времени

и ,«, определяется по известной формуле » •

111(«-*о,х*(.)) - | , 1 • !,..,,п, <3.3.6)

о

И

(3(Т-4, х*(0) - Ч(1-«0, х*(0>, (3.5.11>

то все рассматриваемые арбитражные решения (за исключением в общем случае динамически неустойчивы.

В $ 3.6 предложен закон осуществления текущих платежей участникам дифференциальной игры Г(т-*о, х°), отличный от <з.5.б>, позволяющий обеспечить динамическую устойчивость конкретных арбитражных решений. Иными словами, предложена одна неклассическэя модель динамики выплат игрокам при движении вдоль оптимальной траектории, обладающая рядом существенных преимуществ по сравнению с моделью <з.5.й>.

В частности, для арбитражного решения Калаи-Смородинского получены необходимые условия динамической устойчивости, которым должно удовлетворять значение "статус кво" а(т-<,х*«)) в процессе оптимального развития игры, и рассмотрены некоторые возможности для их проверки.

Цитируемая литература ш Петросян Л.А. Устойчивость решений в дифференциальных играх со многими участниками Вестник ЛГУ, 1«Г7, N 19, с.

4&~Bt.

C2i Фон Нейман Дк., Моргештерн 0. Теория игр и экономическое поведение. М.: Мир, «7о.

t3i Воробьев H.H. Современное состояние теорий игр УШ,

1970, т.25, N 2, C.M-HO.

t-n Кун Г.У. Позиционные игры и проблема информации ^ в сб. "Позиционные игры", М.: Наука, 1Я&?.

[5] Fudenberg D., Tirols J. Оате Theory. MIT Press, 1991. 16J Thomson W., Lensbers T. Axiomatic Theory of Bargaining with a Variable Number of Agents. Cambridge Univ .Press, 1989.

Основные результата диссертации опубликованы в работах:

1 Кузютин Д.В. О динамической устойчивости решений в многошаговых играх с неполной информацией ss 2 межд. семинар ИФАК "Негладкие и разрывные задачи управления и оптимизации". Челябинск, 1993, Тез.докл., с.яз-в-».

2 Кузютин Д.В. Сильная динамическая устойчивость принципов оптимальности для одного масса игр // Сборник научных трудов "Модели, алгоритмы, программы", Тверь, Изд-во ТГУ,

1993, с.во-ез.

3 Кузютин Д.В..Сейсов Ю.Б. Один метод раскрытия неопределенностей на массе разрывных функции /V Известия АН Туркменистана, 1992, N2, С.79-01.

4 Кузютин Д.В. Аппроксимация дифференциальных игр многошаговыми и проблема динамической устойчивости решений Межд.конференция "Теория приближения и задачи вычислительной математики". Днепропетровск. 1993, Тез.докл. с.ш.

5 Кузютин Д.В. Динамически устойчивые принципы управления в природных системах Сб. науч.'трудов "Моделирование природных систем и задачи оптимального управления", Новосибирск, Наука, 19$>з, с.78-во.

6 Кузютин Д.В. К вопросу об устойчивости решений в многошаговых играх /у Сб. науч. трудов _ "Динамические системы и управление", Саранск, Изд-во МордГУ, 1993, с.57-59,

7 Kuzutin D,V. Time consistency of the solutions for one class of multistaged games with incomplete information // Intel-national Congress on Computer Systems fi Applied Mathematics. St. . Petersburg , 1993, Abstracts, pp. 30-31.

Подписано к печати 3.11.93

Заказ 308 Тираж 100 Объев I п.л. ПМЛ СПГУ

19903<(, Санкт-Петербург, наб. Макарова,6.