Динамическая устойчивость решений для некоторых классов игр с неполной информацией тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Кузютин, Денис Вячеславович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1993
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
т- ■-> р1 1 Г 1 и
■ г
и ^ I
КУЗЮТНН Деннс Вячеславович
удк 518.9
ДИНАМИЧЕСКАЯ УСТОЙЧИВОСТЬ РЕ13Е1ШЙ ДЛЯ НЕКОТОРЫХ КЛАССОВ ИГР С НЕПОЛНОЙ ИН®ОРИАЦИЕП.
01.01.09 - Математическая кибернетика
автореферат
диссертации на сиисканио ученой стэпепи кандидата физико-математических наук
Санкт-Петербург, 1993
Работа выполнена на кафедре математической статистики, теории надежности и массового обслуживания факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета.
Научный руководитель : - доктор физико-математических наук, профессор Л.А.Патросян.
Официальные оппоненты: - доктор физико-математических наук, профессор А.ф •Клейменов,
- кандидат физико-математических Наук, ДОЦЭНТ В.А.Уланов.
Ведущая организация : - Московский государственный
университет им.М.В.Ломоносова.
Защита диссертации состоится 1993г. в
.часов на заседании специализированного совета К 063. 57.16 по присуждению ученой степени кандидата физико-математических наук в Санкт-Петербургском государственном университете (188904, С-Пэтербург, Ст.Петергоф, Библиотечная пл., 2, факультет ПМ-ПУ С-ШГУ). За'дата будет проходить по адресу : С-Петербург, В.О., 10 линия, д.33, ауд.88.
С диссертацией можно ознакомиться в бибияшлеке им. A.M. Горького Санкт-Петербургского государственного университета (199034, С-Петербург, Университетская наб., д. 7/9).
Автореферат разослан хэазг.
Ученый секретарь специализированною совета,
ДОЦеНТ 0-/{-'(< В. Ф. Горь ковоп
ОБЯАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Одам из важных свойств принципов оптимальности, используемых в различных классах динамических игр со многими участниками, является их динамическая устойчивость. Это свойство, впервые введенное Л.А.Пэтрося-ном в из, обеспечивает реализуемость и устойчивое оптимальное развитие конфликтного динамического процесса, что особенно важно для многочисленных практических приложений. В связи с этим возникают два круга актуальных задач : исследование динамической устойчивости известных принципов оптимальности для различных классов динамических игр и конструирование новых динамически устойчивых {сильно динамически устойчивых) решений. Диссертационная работа посвящена исследованию указанных актуальных проблем применительно к различным классам динамических игр с неполной информацией .
Цель работы. Исследование устойчивости известных принципов оптимальности в конечных многошаговых играх со многими участниками в классе смешанных стратегий. Математическое обоснование применимости динамически устойчивых и сильно динамически устойчивых решений в указанном классе игр, а тагске в конечных повторяющихся играх с дисконтированием выигрыша.
Конструирование и исследование новых динамически устойчивых принципов оптимальности в дифференциальных играх п лиц с терминальными и интегралъяьми выигрышами.
Научная новизна. Теория динамических игр, возникшая на стыке классической статической теории игр из и математической Теории оптимального управления, является в настоящее время однйл из перспективных и быстро развивающихся направлений современной математики. Наибольшее развитие получила теория антагонистических дифференциальных игр, основополагающе результаты которой были получены научными школами Л.С.Понтрягина и Н.Н.Крзсовского. Большой вклад в теорию антагонистических дифференциальных игр внесли Р.Айзеке. В.Д.Бзтухтин, Н.Л.Григорешю, В.И.Зубов, А.Ф.Кононенко,
А.В.Крпягамский, А.Б.Куржанския, Е.Ф.Мищенко, М.С.Никольский, Ю.С.Осипов, Н.Н.Петров, Л.А.Петросян, Б.Н.Пшеничный, Н.Ю.Сатимов, А.И.Субботин, Г.В.Томский, У.Флеминг, А.Г.Чен-цоз, Ф.Л.Черноусько, А.А.Чикрий и многие другие советские и зарубежные математики.
Однако многие задачи принятия решения в организационных, социально-экономических и других конфликтно-управляемых системах характеризуются, в числе прочих факторов, наличием многих участников и не являются антагонистическими. Различные вопросы, связанные с оптимальным поведением игроков в некоторых классах нэантагонистических игр и динамических игр со многими участниками, рассматривались в работах Э.М. Вайсборда, В.И.Жуковского, В.В.Захарова, А.Ф.Клейменова, А.Ф.Кононенко, 0.А.Малафеева, Л.А.Петросяца, Н.ТЛынянско-го, Ю.Е.Чистякова и других авторов.
Одной из основных задач теории игр, как это отмечает Н.Н.Воробьев в I3J, является конструирование и анализ принципов оптимального поведения игроков. D статической теории игр изучаются разнообразные принципы оптимальности, имеющие определенные границы приложимости, в рамках которых они могут считаться в достаточной мере адекватным описанием содержательно оптимального поведения. При исследовании динамических игр со многими участниками возникает вопрос о применимости того или иного "статического" принципа оптимальности в более широких классах игр. На зтом пута можно ожидать нахождения обоснованных критериев выбора принципов оптимальности в различных классах игр, а там® формального конструирования новых принципов, которые могут оказаться весьма плодотворными. Предмет данной работы относится к атому кругу актуальных задач.
В работе из впервые было обращено внимание на одно важное свойство решения динамических игр, названное свойством динамической устойчивости (состоятельности во времени). Попытки переноса известных в статической теории принципов оптимальности на различные классы динамических игр без соовотствукяцего исследования их динамической устойчивости, вообще говоря, но обоснованы и в ряде случаев мо-тут приводить к выбору заведомо нереализуемых решения. Bon-
росы динамической устойчивости решений в различных классах динамических игр изучались в работах Л.А.Петросяна, Н.Н.Данилова, В.В.Захарова, К.А.Зенкевича, С.В.Чистякова а других авторов.
Основные результаты диссертации : 1) Доказана динамическая и сильная динамическая устойчивость известных принципов оптимальпости в классе смешанных стратегий для конечных многошаговых игр п лиц с неполной информацией и различными определениями выигрыша в подаграх. г) Математически обоснована применимость отдельных принципов оптимальности для одного класса повторяющихся игр с дисконтированием выигрыша.
з) Предложены методы обеспечения динамической устойчивости арбитражных Пзрето-оптимальных решений в дифференциальных играх со многими участниками, основанные на определенном характере изменения значения "статус кво" з текущих подаграх вдоль оптимальной траектории. В случае дифференциальных игр с терминальными выигрышами получены в явпом виде законы движения точки "статус кво", обеспечивающие динамическую устойчивость конкретных арбитражных решений. Для игр с интегральными выигрышами предложена одна модель динамики выплат игрокам при движении вдоль оптимальной траектории, обеспечивающая динамическую устойчивость арбитражного решения Кэлаи-Смородинского.
Общая методика исследования основана на классических результатах теории игр и современных методах теории управления динамическими системами. Существенно используется теория разложения позициоиых игр и стратегий в них, предложенная Г.У.Куном в [-45, методы конструирования динамически устойчивых принципов оптимальности в дифференциальных играх, описанные в работах Л.А.Петросяна, а также современные результаты теории арбитражных схем.
Практическая ценность. Полученные в диссертации результаты и предложенные метода могут быть использованы в теории динамических игр со многими участниками, при обосновании применимости отдельных принципов оптимальности в конфликтно-управляемых системах с различной информационной структурой,
!
при решении динамических задач распределения и выоора, а также при конструировании устойчивых принципов опгимзльно-стн в дифференциальных играх п лиц.
Апробация работы. Основные результаты диссертационной работы докладыва.шсь на Всесоюзных Герценовских чтениях (ЛЬнинград,1»91), на Международной конференции "Конструктивная теория функций" (С-Петербург,1£>92), на 2 Международном семинаре ИФАК "Негладкие и разрывные задачи управления и оптимизации" (Челябинск,««), на Международной конференции "Теория приближения и задачи вычислительной математики" (Днепропетровск,1993), на Международном конгрессе "Компьютерные системы и прикладная математика" (С-Петербург,1в»з), а также обсуждались на семинарах по теории игр кафедры математической статистики, теории надежности и массового обслуживания факультета прикладной математики - процессов управления С-ПбГУ.
Публикации. По теме диссертации опубликованы ^ печатных работ.
Структура и объем работы. Диссертация состоит из введения, трех .глав (19 параграфов) и списка литературы, включа-кмдего 72 наименования. Общий обюм дассэргадаи составляет 121 страницу.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Ео введении содержится обоснование актуальности темы работы, формулируются дели исследования, приводится краткий обзор содержания и основные результата диссертации.
Глава I "Устойчивость принципов оптимальности в многошаговых играх с неполной информацией" содержит 9 пара1рафов. Б ней рассматриваются конечные игры п лиц, представленные в позиционной форме как игры на древовидном ориентированном графе к. Основным инструментом исследования здесь яьляется теория разложения таких игр и стратегий в них, предложенная Г.У.Куном в нз.
В 5 1.1. определяется рассматриваемый класс позиционных игр. При этом па множестве всех позиций к за исключением начальной позиции о полагается заданной векторная функция ь с Бе;чествешгкми компонентами ь., < = 1,___,п. Если в игре Г реализуется партия (ТрЭЭКТОрИЛ) ф - <о, у..... у>п,... >, то
вдпгрнш игрока < равен
ЬЛф) I ь((Уга).
т
Исследование устойчивости решетш проводится в классе скошап-пых стратегий. Каждая ситуация ц = (р^, .... ¡хп) з смешанных стратегиях порождает целое семейство траекторий и к Ф(р.) « <фй>. реализующихся с пологатолъной вероятностью р(<рм,|а).
Предполагается, что целью кээдэго участника игры Г является максимизация своого ожидаемого выигрыша п^р) » 2 Р!'^.!') '\(<Рк> > 1 = 1.....пк
В 5 1.2 содержатся основные результаты теории разложения позиционных игр, используемые в дальнейших рассуждениях, и предлагаются различные подходы к определении выигрызз в подаграх, отражающие практический свойства конфликтных динамических систем, моделируемых игрой.
Пусть игра Г разложепа в позиции х на подагру Г.; и фактор-игру Гп> называемую также усечением игры Г в позиции х. Векторная функция ьх для каждой позиции подагры Гх определяется как ограничение ь па множестве позиций из где кх - поддерево к с корнем х. Пусть <р - партия в игра Г, проходящая
через позицию х •, ф = < о..... х >. фх= < х, ф ч <р > - часть
траектории ф в подагре Г . Тогда выигрыш игрока ; в подагре на траектории <рн полосам равным
Ь«|4«Рк> - I > С1-2'15*>
Уя,^»4«
При этом :
- 2 |Мут> + - N«4») + ь*|<!Фх>- С1-2-23
»Vя?40
нумерация формул и утверкдений соответствует их нумерации в диссертации.
&
Определение <1.2.1) отражает стремление участников конфликтного процесса максимизировать свой текущий и будущий виигрцш, вне зависимости от уже накопленних платежей. Определение выигрыша в подаграх, принятое в 143, является частным случаем определения С1.2.1). все доказательства в главе I проводятся для модели позиционной игры Г с условием «.2.1).
Разложению игры Г на подагру Гх и фактор-игру Г0 отвечает естественное разложение смешанных стратегий в Г на пару смешанных стратегий в Гх и в Гс : - <Иьц. 1 ~ 1.....
В 5 1.3 приводится определение и обсуждение свойств динамической и сильной динамической устойчивости. Под принципом оптимальности 6 будем понимать всякое отображение, ставящее в соответствие игре Г непустое подмножество 0(Г) множества ожидаемых виигришей. Ситуации ц такую, что н(ц) е в(Г), назовем оптимальной в смысле принципа оптимальности 8, а траектории ф е Ф(ц) - условно-оптималышмц траекториями. Множество всех О-оптимальшх ситуаций в игре Г обозначим иб(Г). В дальнейшем рассматриваются только подагры Гх с начальными позициями на некоторых условно-оптимальных траекториях игры Г.
Пусть в Г выбран принцип оптимальности 0, и *ГХ> - множество возможных подагр вдоль условио-оптимальних траекторий. Определение 1.3.1. Будем говорить, что множество иц(Г) является динамически устойчивым (принцип оптимальности 6 обладает свойством динамической устойчивости), если для любой ситуации ц в и0!Г) в каждой подагре Гх выполнено условие
где обозначает элемент разложения ситуации ц в подагре. Определение 1.3.2. Множество 1>е(Г) является сильно динамически устойчивим, если джя каэдой подагры Гх и для любой ситуации vx е и0(Гх) существует ситуация ц е и0(Г) такая, что цх совпадает с ух на информационных мноюствах где через х4 обозначено семейство информационных множеств игрока » в подагре Гх.
Если в динамической игре определено оптимальное поведение игроков в соответствии с некоторым принципом оптимальности, то динамическая устойчивость этого принципа оптимальности га-
рантир.ует, что во всех подаграх, образованных вдоль оптимального пути развития игры, ни у одного из игроков не появится оснований отклоняться от первоначально выбранной схемы поведения. «
Определенный в 55 I.I. 1.2 класс позиционных игр содержит, в частности, следующие интересные с точки зрения экономических и других приложений классы игр: конечные позиционные игры п лиц, формализованные Куном в работе ш, конечные игры на выживание (или игры на разорение), одновременные игры, удовлетворяющие условиям 5 I.I.
В $5 1.4 - 1.8 проводится исследование свойств динамической и сильной динамической устойчивости различных принципов оптимальности в позиционных играх Г, основанное на анализе разложения таких игр и смешанных стратегия в mix и его влияния на ожидаемый выигрыш игроков. Доказаны, в частности, следующие теоромы.
Теорема I.4.I. Множество всех ситуаций равновесия по Нашу isi •'„(Г) в игра Г является сильно динамически устойчивым. Теорема 1.5.2. Если в фактор-играх Гй существуют ситуации сильного равновесия tsi, то множество всех сильно-равновесшх ситуаций и (Г) является сильно динамически устойчивым. Теорема 1.6.I. Если множество ситуаций К-равновесия сз] и (Г) в игре Г непусто, то оно является динамически устойчивым. Теорема 1.7.2. Множество оптимальных по Парето ситуаций чр(Г) в игре Г является динамически устойчивым. Теорема I.8.I. Множество собственно эффективных ситуаций и (Г) является динамически устойчивым решением.
Таким образом, математически обоснована целесообразность применения указанных принципов оптимальности на практике.
В 5 1.9 предложен один подход к сужению множества ситуаций равновесия по Нашу, основанный на введенном понятии <-устойчивости. Рассмотрен модельный пример.
Глава я "Динамическая устойчивость решений в повторяющихся играх с дисконтированием выигрыша", содержащая 4 параграфа, посвящена распространению основных результатов, полученных в главе I, на класс конечных повторяющихся игр с наблюдаемыми действиями и дисконтированием платежей tsi.
jo
В § 2.1 описывается указанный масс игр Г(0), .причем предполагается, что каждый участник i-.спользует собственный коэффициент дисконтирования (discount factor) 0. е (0,1), ТО вСТЬ О - (S,.....вп).
В 5 2.2 предложена удобная позиционная форма для таких игр, пооволягаш представить их как игры на конечном древовидном оризнтированпом графе и проводить исследование динамической устойчивости методами главы I. Пусть у - множество всех позиций в Г (б), соответствущих окончанию некоторого шага игры. Определим на кношестю Y целочисленную функцию rang (у), показывающую количество шагов игры Г(0), совершенных с момента начала игры до появления позиции у е у. Пусть у' = с у с y ( rang (у) «• t> - множество всех позиций ранга <, t - 1,2,...,т; т - число различных позиций в у1, 3 -0 "
"О (¡.s^.. . ,sn) - функция» ставящая в соответствие каждому выбору в позиции случая и определенному набору выборов игроков на шаге номер окончательной позиции первого шага :
О (i,si.....sn) - h , h e < 1, 2,..., m >. Тогда для
определония выигрыша участников в Г(0) достаточно задать векторную функцию ь на шшкаствз позиций у* « с у*,..., у*, >.
Действительно, множество у' для всех t = 2,...,т может быть разбито с помощью функции О на т классов эквивалентности, у* каждый из которых содержит позиций из у* :
т
у' - U ■ у' .
л« i
Позиции из Уд .-эквивалентны в смысле величины выигрыша, полученного игроками на шаге t. Для каждой позиции у£ е у*
- О;"* Ь.(У^> , i » 1.....П. С2.2.9)
Если в игре Г (О) реализуется траектория
_ f rt I г t т 1
{ °..........у/......ч.....у* ) *
^ i г Ь т J
то выигрьва игрока t полагается равный
т т
Разложений игры г(6) возможно только в позициях к с у. Пусть Г (О) разложена в позиции хеу', ф - траектория, проходящая
ЧЭрЗЗ ПОЗИЦИЮ я, ф - < о, . . . , х > ,
ф » [ ф Ч ф ) - ( х.......... yj.....уI } -
часть траектории <р в подыгре Гч(б). Тогда выигрыш игрока * на траектории ф подагры Гх(б) равен
ПХ|<<ТХ)- 0i I 5Г h£<X > • С2-212У
t»t+l ^
Формула <2.2.«) отличается от определения выигрыша в подаграх, принятого в главе I, присутствием в правой часта инти--t.
теля ä( , который коию интерпретировать, как коэффициент
изменения одашици полезности игрока i при переходе от (»+»)-
го изгз ]с первому шагу игры Г(в). При этом сиеста <1.2.2)
будет справвддиьо следующее равенство t.
П.(ф) - 1,.(ф) + О. «»N1, (фх) • С2.2Л-И
Несмотря на указанные отличия, вызванные дисконтированием выигрышей, все основные результаты, полученные в главе t, останутся справедливыми для повторяющихся игр с иаблюдаэмнми действиями Г(б).
В частности, б 2.3, 2.4 доказана сильная динамическая устойчивость множества ситуаций равновесия по Нэшу и (Г(б)) и множества ситуаций сильного равновесия и {Г(0>) (теоремы 2.3.1 и 2.3.2), а также динамическая устойчивость множества ситуаций К-равновесип и множества ситуация, оптимальных но Пзрято, Слейтеру и Джо.'Мриону (теоремы 2.3.3, 2.4.1 - 2.4.3).
Глава 3 "Устойчивость Парето-оптимальных решений в дифференциальных играх со многими участниками" содержит б параграфов. Она посвяцонз проблеме конструирования динамически устойчивых принципов оптимальности в дифференциальных играх п лиц с терминальными и интегральными выигрышами.
В 5 3.1 определяется дифференциальная игра п лиц Г(т-*0,х°), описываемая уравнениями
;<о - wo, ....."n(f)), <3.1.2>
t e lt , t). о * *
где x e r'" . u{(t) e и. с comp r1"' - допустимое управление игрока 1, при начальных .условиях
x(to) Ш X°, <3.1.3)
Рассматриваются игры с фиксированной продолжительностью т-<о и функциями выигрыша
J4( t-t0. » (•).....un<">> " 'lt"<•>> "
Т
- J /•1<x(D)d-i + II*(x(T>> , <3.1.4>
i
о
где h. и - непрерывные функции на Rm. Предполагается, что выполнены известные условия, гарантирующие существование и единственность решения задачи <з.1.2>, <з.1.з> на i«0, tj.
Все рассматриваемые в глав© 3 решения представляют собой попытку компромисса на множестве Парето-оптимальных или слабо Парето-огггимальных векторов выигрыша, что позволяет ограничиться классом допустимых программных стратегий игроков
i в 1, . . . ,П.
Пусть х{т-»о,х°) - множество всех траекторий системы сэ.1.2) с начальными условиями <з.«.з>, порожденных всевозможны;»! допустимыми программными стратегиями u. е Dj, i « i,... ,n ,
y<t-t0.H°) » [ II(T-to,x(-)> t *('»*°> } - <3.5.2>
множество возможных векторов выигрыша участников игры.
Известно, что множества оптимальных по Парето и Слейтеру векторов выигрыша в Г(т-<0,х°> являются динамически устойчивыми. Однако для принятия коллективного решения необходимо иметь некоторый "справедливый" способ выбора единственного
вектора,, к - н(т-<0 ,**{•)> из этих множеств, поскольку в действительности может быть реализован лишь один исход развития. Одним из обоснованных методов такого выбора является использование различных арбитражных схем £б], описанию которых по-свяшэн 5 3.2.
Пусть игрокам доступно множество у возможных выигрышей, и задан некоторый вакгор л « v, интерпретируемый как вектор гарантированных выигрышей, либо иным образом, называемый точкой разногласия или "статус кво". Везде будам предполагать, что множество S - < х е y | х > d > с Comp Rn явлпотся выпуклым
и исчерпывающим. Под арбитражной схемой будем понимать правило ф, ставящее в соответствие каждой паре (s,d) некоторую точку множества s, интерпретируемую как арбитражное (компро-
миссноэ) решение, пли оптимальный вектор выигрышей участников:
ср : (S,d) — il е S, {3.2.2)
В работе рассматриваются арбиграиоыв схемы Iîama w(£,d), эгалитарная E(s,d), Калаи-Смородияского K(s,d), 1 утилитарное арбитражное решение <u(s,d) и решение, монотонное вдоль пути
WIPS(S,d) Г63.
Пусть d(T-to,x°) - точка "статус-кво" в игре r(T-fo,x°),
S (d (T-i0 ,x° > ) -{y* Y(T-to,x°> I y > d(T-fo,*°) ] - C3.S.4)
допустимое множество, удовлетворяющее указанным ограничениям. Под арбитражной схемой в дифференциальной игре r(T-fo,x°) будем понимать следующее отображение *
ф : <S<d(T-to,x°)), d(T-io,x°)) - H й S(d(T-to,x°)),
где
lî » iT<d(T-to,x°)) = II(T-to> x*(.)) - <3.8 S)
арбитражное (компромиссное) решение дифференциальной игры. Здесь х'(-) е x(T-to, - оптимальная траектория системы со.1.2) - <3.1.31, порожденная соответствующими оптимальными стратегиями u*(t) и доставляющая игрокам выигрыши н..
Для исследования вопросов, связанных с динамической устойчивостью арбитражных решета, рассмотрим семейство текущих подагр T(T-t, x*(i)) с начальными условиями x*(t) и продолжительностью т-t, ( е tto ,тз. Условий динамической устойчивости арбитражного решения можно записать в виде
H(d(T-i, х*(0) » î>(d(T-i0, х°)) <3.S.1S>
для всех t e (tc,T), где ¡ï(a(T-t,x*(t)> - арбитражное решение текущей игры. При выполнении этого условия игроки во всех текущих подаграх вдоль оптимальной траектории х*(<) в качестве арбитражного решения будут выбирать один и тот же вектор возможных выигрышей ¡¡(diT-t^.x0)), что соответствует использованию ими своих оптимальных программных стратегий u*(t) на всем отрезке времени "0,тз и практической реализации траектория х*(() в игре Г(т-ta, х°).
Выполнение условия <з.5.13> существенным образом зависит от характера изменения значения "статус кво" d(T-t,x*(t)) в текущих подаграх вдоль оптимальной траектории. В } 3.3 пока-
и
зано, что единственным арбитражным решением, априори удовлетворяющим требованию динамической устойчивости, является утилитарное решение и (б, а).
Обеспечить динамическую устойчивость других арбитражное решений представляется возможным за счет управления движением точки "статус кво" и(т-*,х*(0) в подаграх вдоль оптимальной траектории ■-<*(•). .
В 5 3,4 для дифференциальных игр с терминальными выигрышами получены в явном виде законы изменения точки "статус кво", обеспечивающие динамическую .устойчивость арбитражных решений
И №5(2,1!).
В з 3.5 рассматриваются дифференциальные игры п лиц с интегральными выигрышами. Показано, что если выигрыш, полученный игроком г при движении вдоль х*(•) на промежутке времени
и ,«, определяется по известной формуле » •
111(«-*о,х*(.)) - | , 1 • !,..,,п, <3.3.6)
о
И
(3(Т-4, х*(0) - Ч(1-«0, х*(0>, (3.5.11>
то все рассматриваемые арбитражные решения (за исключением в общем случае динамически неустойчивы.
В $ 3.6 предложен закон осуществления текущих платежей участникам дифференциальной игры Г(т-*о, х°), отличный от <з.5.б>, позволяющий обеспечить динамическую устойчивость конкретных арбитражных решений. Иными словами, предложена одна неклассическэя модель динамики выплат игрокам при движении вдоль оптимальной траектории, обладающая рядом существенных преимуществ по сравнению с моделью <з.5.й>.
В частности, для арбитражного решения Калаи-Смородинского получены необходимые условия динамической устойчивости, которым должно удовлетворять значение "статус кво" а(т-<,х*«)) в процессе оптимального развития игры, и рассмотрены некоторые возможности для их проверки.
Цитируемая литература ш Петросян Л.А. Устойчивость решений в дифференциальных играх со многими участниками Вестник ЛГУ, 1«Г7, N 19, с.
4&~Bt.
C2i Фон Нейман Дк., Моргештерн 0. Теория игр и экономическое поведение. М.: Мир, «7о.
t3i Воробьев H.H. Современное состояние теорий игр УШ,
1970, т.25, N 2, C.M-HO.
t-n Кун Г.У. Позиционные игры и проблема информации ^ в сб. "Позиционные игры", М.: Наука, 1Я&?.
[5] Fudenberg D., Tirols J. Оате Theory. MIT Press, 1991. 16J Thomson W., Lensbers T. Axiomatic Theory of Bargaining with a Variable Number of Agents. Cambridge Univ .Press, 1989.
Основные результата диссертации опубликованы в работах:
1 Кузютин Д.В. О динамической устойчивости решений в многошаговых играх с неполной информацией ss 2 межд. семинар ИФАК "Негладкие и разрывные задачи управления и оптимизации". Челябинск, 1993, Тез.докл., с.яз-в-».
2 Кузютин Д.В. Сильная динамическая устойчивость принципов оптимальности для одного масса игр // Сборник научных трудов "Модели, алгоритмы, программы", Тверь, Изд-во ТГУ,
1993, с.во-ез.
3 Кузютин Д.В..Сейсов Ю.Б. Один метод раскрытия неопределенностей на массе разрывных функции /V Известия АН Туркменистана, 1992, N2, С.79-01.
4 Кузютин Д.В. Аппроксимация дифференциальных игр многошаговыми и проблема динамической устойчивости решений Межд.конференция "Теория приближения и задачи вычислительной математики". Днепропетровск. 1993, Тез.докл. с.ш.
5 Кузютин Д.В. Динамически устойчивые принципы управления в природных системах Сб. науч.'трудов "Моделирование природных систем и задачи оптимального управления", Новосибирск, Наука, 19$>з, с.78-во.
6 Кузютин Д.В. К вопросу об устойчивости решений в многошаговых играх /у Сб. науч. трудов _ "Динамические системы и управление", Саранск, Изд-во МордГУ, 1993, с.57-59,
7 Kuzutin D,V. Time consistency of the solutions for one class of multistaged games with incomplete information // Intel-national Congress on Computer Systems fi Applied Mathematics. St. . Petersburg , 1993, Abstracts, pp. 30-31.
Подписано к печати 3.11.93
Заказ 308 Тираж 100 Объев I п.л. ПМЛ СПГУ
19903<(, Санкт-Петербург, наб. Макарова,6.