Равновесия в позиционных динамических системах тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Жуковский, Владислав Иосифович
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Свердловск
МЕСТО ЗАЩИТЫ
|
||||
1988
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
АКАДЕМИЯ НАУК СССР
/ I УРАЛЬСКОЕ ОТДЕЛЕНИЕ ' ^
/ / ИНСТИТУТ МАТЕМАТИКИ И МЕХАНИКИ
АЗ
п
На правах рукописи
■1
ВУКОВСКИЙ Владислав Иосифович
УДК 519.9
РАВНОВЕСИЯ В ПОЗИЦИОННЫХ ДИНАМИЧЕСКИХ СИСТЕМАХ
(01.01.02 - дифференциальные уравнения и математическая физика)
Автореферат диссертации на соискание ученой степени доктора физико-математических наук
Свердловск
1988
Работа выполнена во Всесоюзном заочном институте текстильной и легкой промышленности.
Официальные оппоненты:
Ведущее учреждение -
Защита состоится "_
доктор физико-математических наук, профессор
ЛАГУНОВ В.Н.,
доктор физико-математических наук, профессор
чднцов А.Г.,
доктор физико-математических наук, профессор
ЧИКРИЙ А. А.
Математический институт им. В.А.Стеклова АН СССР
198 г. в
час.
на заседании специализированного совета Д 002.07.01' гто защите диссертаций на соискание ученой степени доктора наук при Институте математики и механики УрО АН СССР (620066, г.Свердловск, ул.С.Ковалевской, 16). .
С диссертацией можно ознакомиться в библиотеке Института математики и механики УрО АН СССР
Автореферат разослан
198
Ученый секретарь специализированного совета кандидат физ.-мат.наук
ßy М.И.Гусев
/СКПЗГ
г»
* ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Д.
ТДСЛ _ 1иссертаи,ин
--КктУальность проблемы. При создании новой прогрессивной тех-
ншси, как правило, возникает необходимость исследование взаимодействия нескольких управляемых динамических систем, цели которых не совпадают. Кроме того, любая техническая система, особенно система сложная, характеризуется многими свойствами, определяющими ее ценность. Среди этих свойств есть такие, величину которых долательно всемерно увеличить, есть к такие, которые жела -тельно минимизировать. Математические модели подобных задач для систем, описываемых дифференциальными уравнениями, исследувтся в рамках теории дифференциальных неантагонистическнх игр.
Дифференциальная неантагонистическая игра является математическим образом реальных конфликтов и процессов принятия решений в управляемых динамических системах с учетом их взаимосвязи'и несовпадения интересов.
Этот раздел математической теории управления возник в начало 70-х годов на стыке математической теории оптимального управления, общей теории игр и теории антагонистических дифференцн -альных игр. Источником, стимулирующим зарождение, становление и интенсивное развитие неантагонистических дифференциальных игр, явились, в частности, следующие задачи механики:
1. задача о встрече нескольких управляемых объектов;
2. игра на перетягивание, в которой каждый из игроков стремится "перетянуть" одну и ту га точку возможно блияе к "своему" целевому множеству;
3. ряд постановок задач преследования с несколькими догоняющими и убегающими;
4. задача А.М.Летова об аналитическом конструировании регулятора при векторном критерии.
Большую роль в развитии теории дифференциальных неантагонистических игр сыграли также исследования конкретных динамичес -ких моделей экономики и стратегических игр, перечисленных в
обзорах [б, с.253-255; 7, с.91-93 J и в комментарии к библиографии . Большинство из приведенных там задач характеризует -ся следующими пятью факторами. Во-первых, это игры степени (в терминологии Р.Айзекса); во.-вторых, время продолжительности игры фиксировано; в-третьих, отсутствуют ограничения на фазовые координаты; в-четвертых, в качестве решений использовались или равновесие по Нэшу, или оптимум по Парето, и, наконец, в-пятых, такие решения находились с помощью принципа максимума Л.С.Понтрягина и представляли собой, в основном, функции времени. ^ „,
Сдедует отметить, что в 70-е годы для теории дифференциальных неантагонистических игр характерно интенсивное накоп -ленне фактов, при решении задач применялись либо эвристичес -кие методы, либо методы теории оптимального управления, при -чем (порой без должного обоснования) использовались концепции оптимальности из общей теории игр. Особое развитие в эти годы получили исследования дифференциальных игр качества, связанные с задачами преследования и уклонения от встречи, в случае трех и более игроков. Основные результаты этого направления получены в работах М.С.Габриеляна, Н.Л.Григоренко, П.Б. Гусятников», Е.Ф.Мищенко, М.С.Никольского, Л.А.Потросяна,-В.А.Плотникова,. Б.Н.Пшеничного, Н.Сатшова, Ф.Л.Черноусько, А.А.Чшсркя. ' .
Для начала 80-х годов характерен переход к этапу математической формализации неантагонистических дифференциальных игр степени (в которых, учитывался бы позиционный характер таких задач), к разработке специфических методов качественного исследования и практического построения решений. Здесь вагнув роль
^Дифференциальные игры со многими участниками. Указатель литературы за 1968-1983 г.г. (Под ред. В.И.Шуковского и Д.Т.Дочо-ва) - НРБ, Русо: ВТУ "А.Кынчев", 1985.- 114 с. ^Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.$. Математическая теория оптимальных процессов.- М.: Наука, 1969.- 384 с.
играет использование результатов теории антагонистических (игр двух лиц с противоположными интересами) дифференциальных игр ' . Исследования, помещенные в диссертационной работе, основываются на математической формализации дифференциальной позиционной игры и методах ее решения, разработанных н/й.Кра-совским и его сотрудниками ^'
Суцестьенное отличие неантагонистической диффе -ренциальной игры от антагонистической - наличие у каждого игрока "своей" функции выигрыша - показателя качества футглио -нирования динамической системы "с точки зрения"( данного игрока. В большинстве случаев эти функции выигрыша явно не связаны меяду собой и задаются функционалами, определенными на движениях динамической системы и, возможно, на реализациях управляющих воздействий игроков. Другая особенность - постулируемая априори возможность (или отсутствие таковой) объединения игроков в коалиции, которые, в свою очередь являются множествами игроков, имепцих возмоп -ность сойместного выбора "своих" стратегий. В остальном, как и в антагонистическом случае, неантагснистическая дифференциальная игра складывается из уравнения эволю -ц и н рассматриваемой динамической системы (дифференциального уравнения, связывающего фазовые состояния системы с
^Понтрягин Л.С. К теории дифференциальных игр // Успехи математических наук.- 1966,- г.21, вып.4(130).- С.210-274. ^Красовский H.H., Субботин А.И. Позиционные дифференциальные игры,- М.: Наука, 1974.- 456 с.
■"Мищенко E.S. Задачи преследования и уклонения от встречи в теории дифференциальных игр // Изв. АН СССР. Техническая кибернетика.- 1971.- № 5. - С.3-9. ^'Осипов D.C. Дифференциальные игры систем с последействием//
Докл. АН СССР.- 1971.- т.196, }} 4.- С.779-782. ''Пшеничный Б.Н. Структура дифференциальных игр // Докл. АН СССР.- 1969.- Т. 184, № 2.- С.285-287.
управляющими воздействиями игроков) и ограничений на множество управляющих воздействий каждого игрока.
Исследование многих содержательных задач игрового управления, возникающих в различных областях техники и в динамических моделях экономики, приводит к рассмотрению следующего уравнения эволюции
Здесь ОС - П. -мерный фазовый вектор; время Z€Li0ivJ]> где моменты начала ~Ь0 ь О и окончания V>> г0 игры фиксированы; V? - вектор управляющих воздействий i -го игрока, стесненных ограничением , где (2^ - компакт в ев-
клидовом пространстве
Типичный вид функции выигрыша i -го игрока З^-Р^С^С ,
где X I- J - ], ~fca i i: 4 $ } - движение системы (I),
xcLl - CC„
, порожденное ' фиксированным набором стратегий V"- [ V^ , ге/Ь/} игроков. Стратегии"^ для ¿-го игрока отождествляются с функциями V^ ос) , удойлетворя-
пцими в каждой допустимой позиции , Jcj включению er Q. i » - множество таких стратегий.
В последние годы активно развиваются три направления теории неантагонистических дифференциальных игр: бескоалиционные, кооперативные-и иерархические дифференциальные игры. В диссертационной работе рассматривается бескоалиционна позиционная .дифференциальная игра вида:
^Красовский H.H. Управление динамическими системами.- М.': Наука, 1985.- 520 с.
^Красовский H.H. Дифференциальные игры. Аппроксимация и форма л ныв модели // Математический сборник.- I978.-T.I07, К 4(12).-С.541-571.
'Субботу,к А.И., Ченцов А.Г. Оптимизация гарантий в задачах управления.- М.: Наука, 1981.- 288 с.
ней исключается возможность образования коалиций из двух и злее игроков.
Содержательно задача кавдого Z -го игрока в игре (2) со-гоит в поиске такой стратегии (is А/) ,П<ото -
ая обеспечила бы возможно большее значение функции ыигрыша J^ (выигрыш 2 -го игрока). При этом игроки ыбирают "свои" стратегии независимо друг от друга. Для /У= [1,2] и = - J^ игра (2) становится антагонисти-еской. Однако наличие в ней только двух и причем противобор-твующих сторон существенно сужает круг задач, решение кото -ых, хотя бы в принципе, было бы возможным с помощью теории нтагонистических дифференциальных игр. Например, эта теория е охватывает задачу управления двумя предприятиями (и тем олее больше двух), функционирующих в рамках единого экономи-еского объединения, где цель - максимальное увеличение прибыли каждого предприятия. Подобные практические примеры подчер-:ивают необходимость и актуальность исследования дифференциальна игр, в которых явный антагонизм между игроками отсутствует, I число игроков может быть и больше двух. В частности, боль -1ИНСТВО таких задач исследуются в рамках теории беехоалицион-[ых позиционных дифференциальных игр.
К настоящему времени библиография работ по теории и при-южениям бескоалиционных дифференциальных игр весьма обширна: ^считывает свыше 500 названий. При работе над библиографией^ I обзором работ по бескоалиционным дифференциальным играм [б 1 'бросились в глаза" следующие два обстоятельства.
Во-первых, авторы работ ограничились, в основном, классом программных стратегий (зависящих только от времени), в случае ге позиционных стратегий предполагалось, что функции Щ (т-,х) достаточно гладкие. Как отмечается в , в первом случае "обед-1Я9ТСЯ игровой характер задачи", во втором - класс стратегий "беден" и не позволяет решать практические задачи в достаточно простых случаях даже для антагонистических дифференциальных игр. Избежать этот недостаток позволяет, например, использование математической формализации стратегий и порожденных ими
^ Hash J.J1. Ucm-cooperative games // Ann. Math.1951V.54, N2.- P.286-295.
движений системы (I), предложенная для антагонистических дифференциальных игр Н.Н.Красовским. В диссертационной работе как раз и следуем такому подходу.
Во-вторых, в подавляющем большинстве работ по бескоали -ционным дифференциальным играм использовалась в качестве единственно возможного решения игры ситуация равновесия по Наш у"), т.е. такой набор стратегий всех игроков, отклонение от которого одним игроком (когда остальные этой ситуации придерживаются) не может привести к выигрышу отклонившегося. Данное понятие решения бескоалиционной дифференциальной игры заимствовано из общей теории игр. Однако уде исследование существования равновесной по Нэшу ситуа -ции в позиционных дифференциальных играх вызывает принципиальные трудности. Наиболее общий результат в этом направлении для игры двух лиц (при используемой в диссертации формализации стратегий и движений) получен А.Ф.Кононенко* . Его подход, связанный со "стратегиями наказания", применен в работах А.5. Клейменова, А.Э.Бунакова, Е.М.Конурбаева, М.Б.Мамедова, Ю.С. Чистякова и С.В.Чистякова. Одновременно с тем, имеются простые модельные примеры дифференциальных игр, в которых равновесная по Нэшу ситуация вообще не существует. Более того, негативные стороны такого понятия решения бескоалиционной иг -ры наиболее "проявляются" именно в дифференциальных играх. Заметим, что цель, которую преследовал диссертант при работе над книгой [в} - ."остановить глобальное увлечение" равновесием по Нэшу и "критически взглянуть" на возможность использования его в качестве решения- бескоалиционных позиционных дифференциальных игр. Наряду с вопросаг.те существования (возникающими даже в линейно -квадратичных дифференциальных играх), ситуации равнове -сия по Нэшу, как понятию решения игры, присущ и ряд других негативных сторон. В первую очередь здесь отметим: если такое решение в дифференциальной игре существует, то равновесных ситуаций, как правило, целый континуум. В связи с этим возникает
*^Кононенко А,5>. Структура оптимальной стратегии в динамических управляемых системах // Курн. вычислительной математи -ки и математической физики.- 1980. - Т.20, К' 5.- С.П05-Ш6.
вопрос: какую конкретно из ситуаций равновесия игрокам следует использовать? Ведь при различных равновесиях по Нэшу игроки "получают" различные выигрыши (нет эквивалентности ситуаций). Кроме того, если нет предварительной договоренности до начала игры, то игроки могут использовать "свои" стратегии из несовпадающих равновесных по Нэшу набо -ров стратегий. Эти стратегии в едином наборе ситуацию равновесия по Нэшу, вообще говоря, не образуют (нет взаимозаменяемости ситуаций). Поэтому необходима предварительная договоренность меязду игроками: какой конк -ретно ситуации равновесия по Нэпу они будут придерживаться. Однако такие переговоры могут одновременно привести к обра -зованию коалиции (из двух и более игроков), которая за счет совместного выбора "своей" стратегии увеличит выигрыши чле -нов коалиции по сравнению с равновесным ("у л у ч-ш а е -мост ь" равновесной по Нэшу ситуации). Далее, отклонение одного игрока от ситуации равновесия по Нэшу может привести к уменьшению выи г р ышей всех ост а л ьн ы х игроков. Зачем же тогда им придерживаться "своих" стратегий из такой ситуации равновесия? Кроме того, от -сутствует внутренняя устойчивость ситуации равновесия, ибо построен (п.20.8 диссертации) пример • дифференциальной игры, в которой выигрыши всех игроков в одной ситуации равновесия по Нэшу строго больше, чем в другой. Наконец, в дифференциальных бескоалиционных играх, как правило, появляется парадокс типа "дилемма заключенного"*"^. Здесь игрокам невыгодно следовать равновесной по Нэшу ситуации,т.к. существует другая ситуация (не равновесная по Нэшу), где их выигрыш больше (нет внешней устойчивое-т и). Такое явление имеет место во всех без исключения публикациях, указанных в § 10 обзора С 61 и посвященных решению практических задач экономической динамики и механики управляемых систем. , математическая модель которых представлена бескоалиционной дифференциальной игрой. Поэтому актуальным как с практической, так и с теоретической точек зрения является форма -•
го)
'Льюс Р.Д., Райфа X. Игры и решения,- М.: Иностранная литература, 1961.- 642 с.
лизация новых понятий решения бескоалиционной'дифференциальной игры, которые, обладая достоинствами ситуации равновесия по Нзшу, позволяли бы снять хотя бы некоторые из указанных недостатков.
К настоящему времени понятиям решений бескоалиционной ■ дифференциальной игры, отличным от ситуации равновесия по Нэ-шу, посвящено сравнительно небольшое число работ . Решение, основанное на концепции возражений и контрвозражений (угроз и контругроз) предложено в задаче 10 из § II обзора [ 6 ] и в § 4.4.3 из[ 5 7. Оно базируется на соответствующем понятии решения коалиционной дифференциальной игры^'1^ . Отметим также цикл работ Э.Р.Смольякова; объединенных в^, в которых предлагается ряд новых понятий решения в случае программных стратегий.-В основе этих понятий лежит "слабая экстремальность" ситуации, представляющая собой "часть" контрвозражения_(контругрозы). В последние годы в теории дифференциальных игр наблюдается интерес к понятию сильного равновесия - естественному обобщению понятия ситуации равновесия по Нэшу на случай "отклонения" любой коалиции игроков.
В диссертационной работе вводится новое понятие решения для позицион.ной бескоалиционной дифференциальной игры (А-равновесие). Также, как и ситуация равновесия по Нэшу, А-равновесие совпадает с седловой точкой в случае антагонистической дифференциальной игры, обеспечивает каждому игроку вы -игрыш не меньший гарантированного (максиминного) и устойчиво по отношению к отклонению от него отдельного игрока. Одновременно с тем ■
- А - равновесие существует при обычных ограничениях для позиционных дифференциальных игр; .
- при наличии ситуации равновесия по Нэшу существует
^Вайсборд Э.М. 0 коалиционных дифференциальных играх // Дифференциальные уравнения.- 1974.- ТЛО, № 4,- С.613-623.
. ^Жуковский В.И. Коалиционные дифференциальные игры//№Б,
Годишник на ВУЗ, приложна математика,- 1975.- Т.П, кн. I,-С.43-51.
Смольяков Э.Р. Равновесные модел'; при несовпадающих интересах участников.- М.: Наука, 1986.- 223 с.
А-равновесие, доставляющее игрокам выигрыш не меньший, чем при равновесной по Нэшу ситуации;
- А-равновесие обладает свойствами как внутренней, так и внешней устойчивости (тем самым исключает возникновение'парадокса типа "дилемма заключенного").
Использование А-равновесия потребовало специального, ис -следования многокритериальной позиционной динамической задачи, математи -ческая формализация которой основывается на соответствующих понятиях, предложенных Н.Н.Красовским для антагонистических дифференциальных игр. Эти многокритериальные задачи представляют самостоятельный теоретический и практический интерес, т.к. качество функционирования большинства динамических сис -тем оценить значением только одного критерия представляется весьма проблематичным. Многокритериальные динамические задачи - развитый раздел математической теории оптимальных процессов (обзор работ вЕ 7 ]). В нашей стране основные результаты этого направления получены А.Я.Азимовым, В.В.Величенко, Р.Ф.Габасо -вш, В.М.Гавриловым, Ю.А.Гореликом, В.В.Гороховиком, М.И.Гусевым, В.И.Заботиным, Ф.М.Кирилловой, А.Б.Куржанским, Д.М.Метре-вели, М.Е.Салуквадзе, Л.А.Петросяном, В.В.Подиновским, Р.И. Трухаевьш, В.В.Федоровым, В.Б.Хоменюком. Исследования прово -дятся, как правило, для случая программных стратегий. Особенностью применяемого в диссертационной работе математического аппарата позиционных стратегий является ' и н о г о з н а ч -н о с .т ь каждого из целевых функционалов (критериев). Эту многозначность следует учитывать уже на стадии формализации "хороших" решений рассматриваемой многокритериальной задачи, не говоря уже о способах практического построения таких реше -ний. Впервые указанная многозначность была учтена в § 10 обзо- ' ра [ 7 ], развитие предложенных там подходов - в
^Molostvov V.S., Zhukovskii V.l. On Л - Optimality in a Class
of Cooperative Many Flauer Differential Games // Lect. Notes
Control and Inform. Sei.- Springer-Verlag, 1980.- V.22, P.1.-P.489-498.
^Жуковский В.И., Дочев Д.Т. Векторная оптимизация динамических систем.- НРБ, Русе: ВТУ "А.Кынчев", I98T.- 187' с.
В диссертационной работе дается ответ на ряд принципиальных вопросов теории многокритериальных задач при позиционном способе управления: определены понятия решений, установлено их существование и способы практического построения. Последние основываются на модификации метода динамического программирования*^ .
Таким образом, проблемы, обсузвдаемые в диссертационной работе, представляются актуальными.
Целью работы является математическая формализация новых понятий решения позиционной бескоалиционной диф -ференц'/.альной игры и многокритериальной динамической задачи при позиционном способе управления; доказательство существования и исследование свойств таких решений; выяснение структуры оптимальных решений указанных многокритериальных задач; разработка на основе модификации метода динамического программирования способов практического построения введенных решений.
Методика исследования поставленных проблем основывается на математическом аппарате решения антагонистических позици -онных дифференциальных игр, созданном Н.Н.Красовским и его научной школой4'_ Основными рабочими средствами • при этом являются понятия стратегий, порожденных ими движений системы (I), оптимального гарантированного результата, цены диф -ференциальной антагонистической игры, седловой точки, модифи -кация метода'динамического, программирования. Кроме того, ис пользуются понятия и факты из общей теории игр (коалиция, функция выигрыша игрока, его выигрыш, равновесие по Нэшу), определения и методы решения математической теории многокритериаль -ных задач (оптимумы по Слейтеру и по Парето, свойства таких решений, способы "свертки" критериев^). Важную роль в доказательствах играют следствия из альтернативы* ' и непрерывноси однозначных выигрышей игроков по начальным позициям {статья В.И.Жуковского из20)).
^Подиновский В.В., Ногин В.Д; Парето-оптимальные решения
многокритериальных задач.- М.: Наука, 1982.- 254 с. ^Дифференциальные игры со многими участниками: сб.науч.тр./В1 "А.Кырчев". - Т.26, Ив, математика и механика. - НРБ, Русе, 1984. -,222с. ..
Построение контрпримеров, в большей части,основывается на мажорирующем свойстве стратегий в линейно-квадратичном случае (§ 4 из [ 9 ]). В ряде доказательств используются общие понятия и факты из качественной теории дифференциальных уравне -ний, математической теории оптимальных процессов и функци -онального анализа.
Научная новизна полученных в диссертационной работе результатов определяется как новыми понятиями решений для позиционных дифференциальных игр и соответствующих многокритери -альных задач, так и новыми подходами к решению поставленных в работе задач. Все основные результаты диссертационной работы являются новыми.
Теоретическая и практическая ценность. Теоретическая ценность работы, помимо полученных в ней фактических результатов, состоит, как представляется, в тех математических схемах доказательств, которые позволили решить ряд актуальных вопросов теории многокритериальных задач при позиционном способе управления и бескоалиционных дифференциальных игр. Это, в первую очередь, относится к схеме доказательства структуры оптимальных (по Парето и по Слейтеру) решений многокритериальных за -дач. Здесь не только устанавливается факт существования, но и дается конструктивное описание множества значений целевых функционалов (терминального вида) при оптимальных стратегиях. Это множество, как выясняется, совпадает с множеством оптимальных (соответственно по Парето или по Слейтеру) значений этих целевых функций на области достижимости системы (I) в соответствующей многокритериальной "статической" задаче.
Дальнейшие исследования показали, что принятая в диссертационной работе формализация оптимальных решений сохраняет свою силу в "статических" многокритериальных задачах при наличии неопределенных факторов' , в аналогичных динамических
задачах для случая запаздывания в управляемой системе*^
__
1 'Zhukovskii V.l., Molostvov V.S., Korhonen P. A Maximin Approach to Solving MGDM Problems under Uncertainty // Abstracts of 7th European Congress on Operation Research.—Bologna, Italy, Juno 16-19, 1985.- P.43.
и исследовании антагонистических дифференциальных позиционных игр с векторной платой (раздел II иэ*^) и ¿¿), Сказанное относится и к схеме доказательства одного из основных утверждений работы о существовании А-равновесия при обычных ограничениях для дифференциальных позицйонных игр. Это утверждение является вторым важным теоретическим аспектом диссертационной работы.
Ценность применяемой при этом схемы доказательства состоит еще и в том, что она эффективно использована и в других игровых ситуациях, в частности, для систем с распределенными параметрами , систем с последействием^ , в случае, когда игроки применяют смешанные позиционные стратегии' ' или ограничены программными стратегиями*^.
Применение этой схемы доказательства позволило установить третий центральный результат диссертационной работы, согласно которому существование ситуации равновесия по Нэшу в позиционной дифференциальной игре влечет наличие А-равновесия, выигрыши всех игроков.при котором не меньше, чем при равновесии по Нэшу; теоретическая и практическая ценность этого результата в том, что даже при существовании в игре (2) ситуации равновесия по Нэшу игрокам (в подавляющем большинстве случаев) "выгоднее" использовать А-равновесие.
Практическая ценность работы заключается и в тех возможностях, которые содержит предложенный в ней способ аналитическо -го конструирования А-равновесий. Этот способ, состоящий в построении для кавдого игрока функции Беллмана-Красовского по известной оптимальной по Парето ситуации, позволяет в ряде случев
^Дифференциальные неантагоиястяческве игры:. сб.вауч.тр./ВТУ "А.Кынчев". - Т.23, ]£9, математика и механика. - НРБ, Русе, 1981. - 180с.
2^Дочев Д.Т., Шуковски; В.И. Седлова точка по Парето в диф-фереициал-но-антагонистични игры със закъснение с векторна платежна функция // НРБ, Годишник на ВУЗ, прилежна математика,- 1982,- Т. 18, кн.4,- С.9-24. 2^Дочев Д.Т. Достаточни условия за съществуване на седлова точка по Парето в дифференциално-ннтагонистични игри със закъс-неиис с векторна платежна функция П НРБ, Годишник на ВУЗ, приложна математика.- 1932.- Т.18, кн.4.- С.49-58.
яайти явный вид А-равновесия. Данный подход реализован в диссертационной работе для математической модели совместной разработки радом фирм одной научной проблемы. Эти результаты использованы В.С.Молоствовым^ ) при исследовании взаимодействия НИИ в странах СЭВ. Ценность применяемого способа конструирования А-равновесий еще и в том, что он оказался эффективным для дифференциальных игр в банаховом пространстве2^, для многошаговых игр*^ и проведенного в диссертации исследования существования абсолютного А-равновесия {аналога А-равновесия)
в одной кооперативной дифференциальной позиционной игре.
1)
Апробация работы. Диссертационная работа обсуждалась на заседаниях научных семинаров Института математики и механики УНЦ АН СССР (1984 г.) и Института кибернетики АН УССР (1985 г.) Отдельные результаты докладывались в Вычислительной центре АН СССР (1987 г.), на заседаниях научных семинаров сектора исследования операций Института математики БАН (София, 1981 г.), Московского (1981 г.), Иркутского (1984 г.), Одесского (1986г.) и Ленинградского (1987 г.) университетов, на Национальном научном коллеквиуме Союза Математиков НРБ (1984 г.). По теме диссертационной работы были сделаны доклады на 1-Ш Всесоюзных конференциях по теории игр, на Всесоюзном симпозиуме по оптимальному управлению и дифференциальным играм (г.Тбилиси,1976 г.), на Всесоюзной конференции по динамическому управлению (г.Свердловск, 1979 г.), на IX конференции по методам оптимизации (г.Варшава, 1979 г.), Ш Всесоюзной конференции по оптимальному управлению в механических системах (г.Киев, 1979 г.), на П конференции по дифференциальным уравнениям и их применениям (НРБ, г.Русе, 1981 г.), на IX Всесоюзном совещании по про -блемам управления (г.Ереван, 1983 г.), на 1У и У Всесоюзных семинарах по исследованию операций и системному анализу (г.Батуми, 1983 г. и г.Кутаиси, 1985 г.), на Летней школе по исследованию операций (НРБ, Приморск, 1984 г.), на УП Всесоюзной конференции по проблемам теоретической кибернетики (г.Иркутск, 1985 г.).
25)
'Неантагонистические дифференциальные игры и их приложения:
Межвузовский сборник научных работ (Под ред. В.И.Жуковского).
- М.: ВЗМИ, 1986.- 160 с.
Публикации. Основные результаты диссертационной работы отражены в публикациях С 1-9 ] .
Научные результаты, представленный в диссертации, получены автором самостоятельно.
СОДЕРЖАНИЕ РАБОТЫ
Диссертационная работа состоит из введения и 31 параграфа, разбитых на семь глав.
Первая глава "Формализации неантагонистической дифференциальной и г -р ы" содержит пять параграфов. В ней приводятся основные понятия и собраны вспомогательные утверждения, используемые в дальнейших теоретических построениях.
Предполагается, что в игре участвует// игроков, подмножество игроков } »/V , объединенных возможностью совместного выбора стратегий, образует коалицию, а игроки из /V4 К - контркоалицию. -Текущее состояние игры характеризуется парой {1,ас} - позицией," где осе Б?"1 - п. -мерному евклидову пространству с нормой // • // . Стратегии Л^ для I -го игрока отождествляются с функциями
г* (£ ос) с О. г с » указанное соответствие обознача -
ется Т^" -г (т£, СО) ; множество таких стратегий. Ис-
пользуются также стратегии .коалиции К :
К] ±УК ^ ,геК}€. П ;
* 2> с К,
причем (в связи с-общепринятой терминологией) далее при рассмотрении многокритериальных задач
V называем "просто" стратегией, а при исследовании дифференциальных позиционных игр V* будем назьшать ситуацией игры (2). Одновременно с тем применяются программные стратегии а -го игрока, которые отождествляются с измеримыми по Борелю функциями г^(-): [0, ;
множество таких программных стратегий обозначается , ана-
логично предыдущему, Vv. (i) = { W.(¿). i e К }
С)Гй ¡-j с\УВ 1 P
и Чилд-" ¿ • Предполагается, что дня Z из (I)
выполняются D '
Условия I. Функция I (Ú .. ) непреркСка
по совокупности аргументов; для любой ограниченной области Gr пространства позиций {i, ос } существует Я (G-) = сап
такая, что для любых jé j сс (JJJ Gr (j * Lf 2) имеет место .....
при всех
( г е AV ); неравенство
справедливо для всех возможных значений ЪС, ... t ; (2. ¿ замкнуто и ограничено (компакт), i е. А/ .
Пусть фиксированы некоторая стратегия коалиции К и начальная позиция {¿0,осд} е £<?,$) х ^ а Движением системы (I), порожденным стратегией
коалиции К из начальной позиции у сса | называется 10) всякая функция {aci ¿ ía , 1 , éa < ¿ ~ta¡cc0 , 3 . которая определяется пределом
Л>.,Т£ J - , & Л (3)
хотя бы одной последовательности пошаговых движений ^(i)^.
ющихся, в свою очередь, решениями пошагового интегрального уравнения
<Р4)+ \ f(vt , г^^,
где ^ ^ , .
д = Д - разбиение интервала г^ 3 точками "27.^
), именно ... < VÇ4 ^
и
^ = Cc-lf- T.^j *"0 при ^ —(4)
Известно*®^, что ОС-i- ^о&оУк 1 ~ п у ч е к всех
движений эс-С-^о^о^к J - образует в ] компакт-
ное в себе множество и область доетижимос-т и , сс0, J системы (I) стра-
тегией VK из позиции {"tо, ЪС-о j :
является компактом в
. Аналогичным свойством обладает и область достижимости си с т е м ы (I) -множество é0, cc^V-r Q. 3 . me Q-- {¡^ Q¿. .
Пусть M - некоторое замкнутое множество в Ñ п и такое, что ' M ñ J^- 0 • Из альтернати-
вы^ следует существование ситуации
V
€ <2|/^такой, что
X ¿о,0СоУГМ] c-I^Í . В частности, для каждой точки
СV-f: <5 3 существует "своя" ситуация У*е ¿У" » Ч» которой .¿С/-Д V*J. - .et
для всех . Наконец, пусть задана векторная
функция Pcx.) - { f^eccj,.., , F^-Cx) } . , скалярные функции , isAV , непрерывны на .ХгД¿ú3cca, V"-r ¿2 J
и точка
a J) . Тогда
существует V^é Этакая, что гД ^ oc„j~Vr*jJ ~
при всех ají*.
Если при построении движений и0>ос0з V ] использу-
ются (продолженные влево до i о) пошаговые движения
с началь-
ньаш условиями СГ ( -¿W х. с?'> ~V г/- с. )
' > 3 лг ' SV-K ^ ' '
, А(<Ру)) - ОС , и в (4) дополнительно
J Цос'?)~ оса Н~~ О при . (5)
то имеет место
Утверждение 3.4. Если скалярная функция /^(ос) непрерывна
и ситуация Vх& <ГУ~ игры (2) такова, что при любых еСО.^хРг"-
р}сс$£0 аг Р(ссЗ,-£оХ0У*1) , (6)
то функция ^(¿о, ЭС0) - Р"¿о J
-у*-])
непрерывна на
Утвервдение 3.4 имеет принципиальное значение в теории позиционных неантагонистических дифференциальных игр и многокри -териальных задач при позиционном способе управления, особенно при построении необходимы х условий существования оптимальных решений
. Такие условия имеют вцд обобщенных уравнений динамического программирования и при этом используются функции вида Щ^^сс^м-п¡\(:Ы&~к0рс<1~Уг*1),
определенные в каждой возможной позиции {оса } > где
, ¿е А/ , либо функции выигрыша игроков (в дифференциальных играх), либо целевые функционалы (в многокритериальных задачах). Так как условие однозначности (6) имеет место для большинства ситуаций
У*
, формализуемых в качестве оптимальных решений, то утверждение 3.4 позволяет включать.в формулировку необходимых условий существования V* свойство непрерывности.
В § 5 первой главы на основе приведенных понятий определяется, позиционная дифференциальная бескоалиционная игра (2) и многокритериальная позиционная динамическая задача
< (п , У, (7)
где система (I) уже записана в виде
£ - V*) , . (8)
Условие II. Скалярные функции , г £ ЛУД непрерывны
на .
Принятая в диссертационной работе формализация стратегий и порожденных ими движений системы (I) приводит к следующей • особенности: всякой ситуации Т^е 2^ отвечает, вообще говоря, множество значений каждого из функционалов = ^ 1 которые получаем при "пере-
боре" всех осо] еЭС1£<,,гс0У~1 • Так как заранее не известно,
какое конкретно движение ос 1-1 € ^Сс^о^о^! реализуется, то при исследовании игры (2) или задачи .^7) следует учитывать равновероятную возможность реализации любого такого движения. Таким образом, (2) является бескоалиционной дифференциальной игрой с многозначными функциями выигрыша, а (7) - многокритериальной позиционной динамической задачей с многозначными целевыми функционалами. Указанная многозначность учтена в диссертации уже при определении оптимальных решений У^* для игры (2) и для задачи (7). Задача (7) представляет самостоятельный интерес и используется при исследовании А-равновесий игры (2). Следующие две главы диссертации посвящены задаче (7).
Во второй главе, названной "Опт и. мальность по Слейт.еру" (§§ 6-10), определяется одно из воз -можных понятий решения задачи (7) - аналог оптимума по Слейте-ру в многокритериальных "статических" задачах:
стратегия называется 5- оптималь
ной в задаче ( 7.) с начальной по з и ц и е й оса}& ^ , если не существует-
такого, чтобы имела место система строгих неравенств г^г. ^(^ЗЛсЭСсУз) > гьсгь Ъес&.с^У*^ ¿е Л/. Множество таких £-оптимальных стратегий обозначается
У*.
Приведенное определение представляет собой объединение двух понятий: гарантированного результата (по Ю.Б.Гермейеру) и оптимума по Слейтеру-. Оно достаточно полно: как частные случаи из него получаются понятия максиминной стратегии (при 1 ) и оптимума по Слейтеру для многокритериальных динамических задач с однозначными целевыми функционалами.
о
При выполнении условий I и П имеют место следующие свойства ¿»-оптимальной стратегии в' задаче (7) с начальной позицией е[0,Э)х Rrt
1. Каждая из максиминных стратегий
уе ¿г °сс-1 ^
V* " * ]
является. ¡э-оптимальной, и поэтому ,
2. Множество
внешне устойчиво, т.е. для всякой Vсуществует £ -оптимальная стратегия
у-*
такая, что
ггиъ Рг%Гх/г?4 1 ¿еЛ'. (Ю)
се Г-7 ССГ-З
3. Множество
^вну.тренне устойчиво, т.е. для любых {, 3) не могут выполняться неравен-
ства
ОС Г* 7 £С 7 -
4. Если Р?(0С)>О,г£/У, пдл эс.е'Х¡З^х^У^в-]
то стратегия "V является ¿-оптимальной тогда и только тогда, когда существует набор положительных чисел о^ , г е /V, для которого
Угъасс. гъьп, а:,,, V.
•у'е?/ г. г?XV
а
Это свойство позволяет свести задачу отыскания всего множества £> -оптимальных стратегий к решению задачи .оптимального управления с одним критерием t^rx.
"перебрав" все ^corné>0 жг множества - i •
Перейдем к структуре решения задачи (7) с начальной позицией {£0,эс0} в случае $ -оптимальности (§ 9). Для этого множество оптимальных по Слейтеру решений ос а "статической" многокритериальной задачи
<х^сс0уга1> {/7> сп)
обозначим через (для любого <2. Л
несовместна система неравенств Р} (х) г е/Ч^ при
каждом ос. £-л Структура решений залачи (7) состоит в том, что б -оптимальные стратегии "V порождают такие движения Х/'^ ^о^^ системы (8), что ) V & причем ], Г'е У2}.
В заключительном § 10 второй главы устанавливается следующее вспомогательное утверждение, которое составляет основу ряда дальнейших контрпримеров. Именно, рассматривается линейно-квадратичная позиционная задача с целевым функционалом
СссаЪ + 5 { ЛЬ
+ + (т(£)ссил
0
при ограничении
К ~Аи)г>с+ <зс.(£0)*ос0 (12)
множество стратегий
Здесь <= гге£<? ^ элементы всех используемых (кроме ) матриц непрерывны на ] , а у С! - постоянны; матрицы
симметричны; сс<1) = ас(6, ¿О1осал обычное решение (12) при
и штрих сверху означает операцию транспонирования; если существует <Р~сспа^> С> такая, что <РЦг>-Цй
(или V
<9«)
гг Ну И ), то этот факт обозначается
, о (или @а) < о).
Утверждение 10.2. Если
о (£Эа)< о), то
каковы бы ни были начальная позиция } е х£? ^
О '
Псс0ЦФ О , и стратегия V"e С2ХЛ , существует ßH'(V) = *сст£>о такая, что для стратегии ß сс. при любых
уЗ f$H0/~) выполняется строгое неравенство
7CV*J> 3<~V) ( 7СVм) + JCV)) .
С помощью этого-утвервдения в диссертационной работе построен пример линейно-квадратичной многокритериальной задачи, в которой не существует S-оптимальной стратегии.
Исследование другого возможного понятия оптимальности -аналога оптимума, по Парето - отнесено в третью главу "Оптимальность по Парето "(§§ II—15).
В § II приводится соответствующее понятие оптимальности: стратегия называется Р-оптимальной
в задаче (7)с начальной позицией {~Ьа, 0Со } , если для любых V"e CV несобместна система неравенств
пъСп, Pl&AK^yi)* at-uVv R(xL&J^y^l i e /К .
CCL-1
из которых, по крайней мере, одно строгое.
^.'ножество таких Р-оптимальных стратегий обозначается , согласно определениям
. Кроме того- при Р-оптимальная стратегия совпадает с максиминной, а в случае однозначных целевых функционалов - с оптимальной по Парето стратегией для многокритериальной динамически задачи.
При выполнении условий 1.и П имеют место-следующие свойства Р-оптимальной стратегии в задаче (7) с начальной позицией {i0,oc0} . ур
1. Множество -Р -оптимальных стратегий v в н у т ренне устойчиво, т. е. для любых
несовместна система неравенств
JCC-I OOl'J с
из которых, по крайней мере, одно строгое.
2. Множество Р -оптимальных стратегий внешне устойчиво, т.е. для любой
Ve 2Х*,
существует
такое, что выполняются неравенства (10).
Однако в отличие от $-олтимально-
с т и
3. не каждая максиминная стратегия из (9) является Р-оптимальной, но для каждого ¡е лУ существует "своя" Р-оптимальная стратегия Уре у/'** такая, что
czi-i d ' ссс-3 d
■ г*г
Ve
Чяс HrxUsx.
zV-Vccc-j 6 ' V cteXl^UУ+&1
-, yp
4. каждой P -оптимальной стратегии V соответствует единственное значение целевого функционала
Pi(ccSJ0iacoyP])> ie/V , т.е. гггсгзс
Fl(cc$J0jocoyPl)- ^(¿орсс)
set-] г ' acc-j
и функции if? (t0j сс0) непрерывны на
5. в § 12 установлено: если область достижимости
v+ai
ьыпукла в , а каждая из функ -
ций F\fcrjj г^/V » строго квазшюгнута на X ¿^x^/Vr- Q]>
6. пусть У ^ - множество оптимальных по Парето решений СС задачи (И) (для любых ас еXИ^Ло«> V4- J несовместна система неравенств Р^ (oz) ^ Pi<sc-n)i г g/у
из которых, по крайней мере, одно строгое), структура
Р-оптимальных решений задачи (7) с начальной позицией состоит (§13) в том, что для любых Vpe c&~f> имеет
место
■ В § 14 установлены достаточные условия существования Р-оптимальных стратегий следующего вида: . ° пусть существуют непрерывная функция £0
строго возрастающая по каждому аргументу функция J 'V )
и стратегия такие, что
- 24 -
а) при всех ос с ^ ' '
б) для любой позиции * и каждого дви^-жения осР1- имеют место равенства
& I г и, ЛЬ) -£СК, а* л & - 4 У-г яс^и
в) в каждой позиции * выполняется неравенство
для движений сс[- 3.
, порожденных любыми
Тогда стратегия "V является Р -оптимальной в задаче (7) при любом выборе начальной позиции
. Конкретный вид ^ ) приводит, в частности, к
"среднеквадратичной стратегии" и "арбитражному решению Нэша" задачи (7), -
Заключительный § 15 третьей главы посвящен линейно-квадратичной многокритериальной.задаче. Для класса таких задач указан явный вид Р-оптимальной (а значит, и б'-оптималь -ной) стратегии. На основе утверждения Ю.2 построен пример многокритериальной динамической позиционной линейно-квадратичной задачи, в которой не существует _Р-оптимальной стратегии. В § 15 обсуяща'зтся позитивные и негативные стороны понятий и Р-оптимальчосги, в частнос.ти, приведен (в § 13) пример дифференциальной игры на перетягивание, в которой выигрыш одного из игроков на Р -оптимальной стратегии строго меньше-, чем его гарантированный (максиминный) выигрыш.
В следующей четвертой главе "Равновесие по Кэшу" {§§ 16-20) выясняются позитивнее и негативные стороны общепринятого понятия решения бескоалиционной дифференциальной
игры - равновесной по Нэшу ситуации, и затем обосновывается желательность формализации новых понятий решения такой игры. Прежде всего, в § 16 приводится рад вспомогательных фактов из теории антагонистических позиционных дифференциальных игр
< <1'2), «Ц*. ЯШ.
где (1)ЛУ, (^г} е^ть система аг = от, , ) ;
непрерывная функция Ропределяет плату игры р1 (зс 1.$]) » которую первый игрок максимизирует, второй -
минимизирует подходящим выбором "своих" стратегий. При выполнении условий I (где ЛУ= и условия седловой точки в маленькой игре^ для игры (13) с дабой начальной позицией
, существует седловая точка
}, обладающая следующими свойствами:
1) пара стратегий является седловой
Л ^ К ' ^ К
точкой тогда и только тогда, когда неравенства
. * Рссь&Л.ъХЪ
имеют место для любых движений ^Ь { х Уз !
2) все седловые точки игры (13) взаимозаменяемы и эквива-' дентны;
3) седловая точка является Р-оптимальной стратегией
многокритериальной динамической задачи
\
с начальной позицией •
Далее в § 17 определяется равновесная по Нэшу ситуация
& ^дифференциальной игры (2) с начальной позицией {'¿г>> зес} : для любых 1/" е
о
При выполнении условий I и П равновесная ситуация V"7 с начальной позицией {¿а > сг0 } обладает следующими свойствами (на наш взгляд, "популярность" ситуации ргвновесия по Нэшу можно объяснить именно наличием этих свойств).
1. Ситуация равновесия по Нэшу устойчива по отношению к отклонению от нее отдельного игрока, ибо в этом случае его вы- . игрыш не может увеличиться по сравнению с выигрышем в равновесной по Нэшу ситуации.
2. Выигрыш каждого игрока в равновесной по Нэшу ситуации единственный , т.е. ¡¿(^С00/74ё,
хотя сами функции выигрыша'игроков многозначны.
3. Выигрыш сса)каждого ¿-го игрока не меньше его максиминного (свойство индивидуальной рациональности):
4. Ситуация равновесия по Нэшу игры (2), где
%= Р(32.) , с начальной позицией {¿о,0Со}
совпадает с седловой точкой игры (13) с той же начальной позицией.
В § 18 приводятся достаточные условия существования равновесной по Нэшу ситуации V в игре (2) с любой начальной позицией {ас0
• . пусть существуют набор стратегий
и /V непрерывных скалярнчх функций £^ такие, что
а) при всех X е ■Р"'
С!
б) в каждой позиции {-¿м ссл }е /<* п'
' «А >7 # " ^ Г-
XI'I т.—'г+О
л
в) во всякой позиции }е[0,§>)х-
эсг-1 г
■' л
- Л 6* С7 , г е /V,
для любой стратегии £ .
Тогда ситуация V" являетея равновесной по Нэшу в игре (2) при любой начальной позиции {¿0!,эс<Р}е 1.0,$) х /5 ^
Кроме того, выигрыш г-го игрока в такой равновесной по Нэшу ситуации £] сое.ф¿с,сг0 , Vы]) ■= ^ г £ Ж
Достаточные условия позволяют установить и с т р у к - . туру игры (2) двух лиц (' АУ= {1, 3.}).
В § 19 построена ситуация равновесия по Нэшу в линейно-квадратичной игре двух лиц, где один из участников "достаточ- • но мало влияет" на скорость изменения фазового вектора. Заметим, что для бескоалиционной позиционной линейно-квадратичной игры двух лиц сложность построения равновесной по Нэшу ситуации состоит в доказательстве продолжимого на весь временной интервал игры решения системы из двух "связанных" матричных обыкновенных дифференциальных уравнений типа Риккати. Условий продолжимости (такого типа, как в соответствующей линейно-квадратичной задаче оптимального.управления) до сих пор получить не удалось. Поэтому обычно предполагается, что продолжитель -ность игры мала. Такое ограничение вызывает справедливое нарекание при практической реализации задачи. В § 19 удалось выделись класс дифференциальных линейно-квадратичных игр двух лиц, где (с помощью теорем А.Пуанкаре о малом параметре) установлена продолжимость решения соответствующей матричной системы уравнений типа Риккати на весь заданный временной интервал игры. 0 Негативные стороны понятия ситуации равнове -
>'г
сия по Нэшу заключаются в том, что (§ 20):'!
1) построен (в п.20.1) пример "достаточно общей" дифференциальной позиционной игры, в которой не существует ситуации равновесия по Нэшу и поэтому вопрос об ее использовании в качестве решения такой игры снимается вообще. Отметим, что этот пример не отвергает существование равновесной по Нэшу ситуации
V" в дифференциальной игре (2), а лишь демонстрирует возможность данного факта при отсутствии ограничений гг^е С^.есо та/?, г ¿еЛ/; 1
2) равновесных по Нэшу ситуаций "V может быть континуум: например, в дифференциальной неантагонистической игре двух однотипных объектов
.ос[.£0]*эс0 , сс е с множествами стратегий'
и функциями, выигрыша
где для Ф выполнены условия I, скалярные функции
9? с<с)
непрерывны и £ } **
В связи с неединственностью ситуаций равновесия по Нэшу "остро встает вопрос" об их эквивалентности и взаимозаменяемости. Как правилз, ситуации равновесия по Нэшу не в з а и м о-заменяемы (стратегии игроков из различных ситуаций равновесия по Нэшу в "едином" наборе ситуацию равновесия не обра-, зугат) и не эквивалентны (выигрыши игрокоз в различных ситуациях равновесия по Нэшу не совпадают);
3) множество ситуаций равновесия 66 Нэшу может не б ы т .ь, внутренне устойчивым: в п.20.3 диссертации
построен' пример дифференциальной позиционной игры двух лиц, в которой выигрыши игроков в одной ситуации равновесия по Нэ-шу больше, чем в другой;
4) аналог "дилеммы заключенного" в дифференциальных пози- , ционных играх, именно, существование в игре (2) с начальной позицией {¿с,^о} ситуации такой, что
причем, по крайней мере, одно ..из неравенств строгое. Наличие .''аналога дилеммы заключенного" означает отсутствие внешней устойчивости множества ситуаций равновесия по Нэшу, и этот аналог присутзтвует во всех, без исключе -ния, публикациях по приложениям дифференциальных игр (перечисленных в § 10 обзора [ 6 ]), где в качестве решения игры взята ситуация равновесия по Нэшу. Исключить аналог "дилеммы заключенного" можно ; либо, следуя ситуации равновесия по Нэшу од -новременно Р-оптимальной (что в дифференциальных играх встречается крайне редко), либо используя другое понятие решения игры (2), обладающее свойством Р-оптимальности. Одно из таких решений и рассматривается в пятой главе "А-равнове'-сие и его св о^й с т в а " (§§ 21-24).
, В §5 21-22 определяется понятие А-равновесия и приводятся
некоторые его свойства. г т/-* О У
Ситуация V <=. с/ названа А-равновесиеы игры (2) с' начальной позицией { , ссе } <г £0, &) X ^ , если
а) для всякой стратегии У^ ^любого I -го игрока, существует набор стратегий остальных ("свой"
для каждого ) такой, что
б) V
является Р-оптимальной в многокритериальной задаче (7), , г^, } с начальной позицией {¿е^Л-
- 30 - '
Множество таких А-равновесий обозначено У . При вы -полнении условий I и П А-равновесие игры (2) с начальной позицией {£0,а:0} обладает (как и ситуация равновесия по Нэшу) следующими свойствами.
1. А-равновесие устойчиво по. отноше нию к отклонению от него отдель-и о р о ( г - г о ) и г р о к а , ибо в этом случае А/^ г могут применить такие стратегии, что максимальный выигрышл"от-клонившегося" в сложившейся при этом новой ситуации
не превосходит его выигрыш в А-равновесии.
2. Выигрыш каждого игрока в А-равновесии единственный,т.е.
Р} (ос[Ц4, СС0 , V *]) ^ - сопЛ, ге /У.
3. Выигрыш каждого игрока в А-равноЕесии не меньше его максиминного (свойство индивидуальной ра циональности):
Р. (х.У*}) жах.
4. А-равновесие игры (2), где
=/^(се),с начальной позицией {¿о,0са) совпадает с седловой
точкой игры (13) стой же начальной позицией.
Однако в отличие от ситуации равновесия по Нэшу.
5. множество А-равновесий . внутренне устойчиво , т.е. для любых У^'б = 1,2) несовместна система неравенств
из которых, по крайней мере, одно строгое;
6. множество А-равновесий внешне..'устойчив о
по отношению'к ситуациям из множества £ &
т.е. для каждой ситуации найдется "свое" А-равнове-
сие V* такое, что
ССС-З сс с-л
Заметим, что с "игровой точки зрения" именно ситуации из "представляют интерес" для игроков, ибо максиминный выигрыш крдый может себе гарантировать, применяя максиминную стратегию; наконец, благодаря внешней устойчивости, при использовании А-равновесля в дифференциальной позиционной игре не может возникнуть аналог "дилеммы заключенного";
7. А-равновесие существует при обычных ограничениях для позиционных дифференциальных игр. Именно, имеет место
Теорема 22.1. Предположим, что выполнены условия I, П и для любых -3 <г и
справедливы соотношения '
та^ << [Р//■ гу ?г оУ I -
г^ьг^гг^ тех ос
Тогда, какова бы ни была начальная позиция {¿с,^}
в игре (2) существует А-равновесие.
Схема доказательства теоремы 22.1 позволяет находить А-равновесие, используя результаты теории антагонистических дифференциальных игр Спостроение седловой точки ') и многокритери -альных "статических" задач (построение оптимального по Парето решения^).
Перейдем к динамической устойчивости введенных решений.Это понятие для решений дифференциальных неантагонистических игр ввел Л.А.Петросян^. На содержательном уровне динамическая
'Петросян Л.А. Устойчивость решений в дифференциальных играх со многими участниками // Вестник ЛГУ.-1977.19.- С.46-52.
устойчивость решения ( ситуации) означает, что решение'инвариантно относительно начальной позиции, -"скользящей" вдоль движения, порожденного этим решением. Если следовать формализации движений по (3)-(4), то для отдельных и ситуаций V*
может нарушаться включение
Поэтому при таком определении движений системы
(I) и Р-
оптимальные стратегии, а также ситуация равновесия по Нэпу могут не быть динамически устойчивыми. Если же для пошаговых движений допустить возможность скачков в точках Ту ^разбиения Л(^) , причем сумма скачков не больше числа с/-г . а в определение движений ССС-1 добавить требование с1г" О при г-»со , то включение (15) имеет место. Тогда и Р-оптимальные стратегии задачи (7), а также ситуации равновесия по Нэшу игры (2) с начальной позицией ССа } будут динамически устой-чивкми, но А -равновесие таким свойством, вообще говоря, не обладает. Однако, следуя схеме доказательства теоремы 22.1, установлена справедливость следующего утверждения:
- пусть шповнены условия теоремы 22.1. Для того чтобы А-равновесие \г * игры (2) с начальной позицией ЭГ0]было динамически устойчивым, т.е. ситуация Т/"'^осталась А-рзвно-весиен в игре (2) с начальной позицией сс0^/"]]
при любых ось, £0> тх е. £, ■&>) необходимо и
достаточно, чтобы ' Т ± -т /•*•,
а) при жюбых-6е[Га>г?) н х'^ЗеХ!^,^, V }
^¿П, > г е/У-
Здесь'
- цена антагонистической игры
с начальной позицией | / jJ , где г -ый игрок макси-
мизирует, а контркоалиция ЛУ4 Z - минимизирует плату F¡ cacl&l) .
Два класса дифференциальных позиционных игр, у^овлетво -ряющих условиям а) и б), найдены В.А.Прокопьевым в*" .
Отметим, что все A-равновесия, построенные в примерах диссертационной работы, являются динечически устойчивыми,ибо они найдены на основе уравнений динамического программирования.
С помощью схемы доказательства теоремы 22.I устанавливается (§ 23) связь мезду ситуацией равновесия по Нэшу и А-рав-новесием:
Теорема 23.1. Если в дифференциальной игре (2) с начальной позицией {i0,X0}имеется ситуация равновесия по Нэшу V\ то существует и A-равновесие 'V* такое, что
P¡ 'l^ié/V. (16)
Причем равенства в (16) возможны лишь в том случае, когда ситуация равновесия по Нэшу "V^ является одновременно Р-оп-тимальной в задаче (?) с начальной позицией {¿oi&oj- Тогда сама ситуация ~VH становится A-равновесием. В остальных случаях, по крайней мере-, одно из неравенств в (16) строгое.
Далее,в § 23 приводится линейно-квадратичная дифференциальная игра, в которой ситуации равновесия не существуют, но имеется А-равновесие.
Завершается пятая глава (§ 24) сравнением ситуации равновесия по Нэгау с А-равновесием. A-равновесие, как и ситуация равновесия по Нэшу, устойчива по отношению к отклонению от нее отдельного игрока, удовлетворяет свойству индивидуальной рациональности, совпадает с седловой точкой в случае антагонисти -ческой игры. Преимущество A-равновесия в том, что
1. A-равновесие существует при обычных ограничениях для позиционных дифференциальных игр (теорема 22.1);
2. при наличии в игре ситуации равновесия по Нэшу игрокам "выгоднее" применить A-равновесие, т.к. при этом выигрыши всех игроков не уменьшатся, а в подавляющем большинстве случаев -
оувеличатся. Одновременно с тем имеются дифференциальные игры,в которых, несмотря на отсутствие ситуации равновесия по Нэшу,
существует А-равновесие (контрпример 23.1);'
3. множество А-равновесий, в отлитие от равновесия по Нэпу, обладает свойствами внутренней и внешней устойчивости. Благодаря последней заведомо исключается аналог "дилеммы заключенного".
Поэтому в диссертационной работе сделан вывод: в бескоалиционной позиционной дифференциальной игре игрокам при выборе своих стратегий следует А-равновесие учитывать, по крайней мере, наряду с ситуациями равновесия по Нэшу.
Расширение класса стратегий позволяет освободиться от ограничения (14). Этим вопросам посвящена шестая глава "С м е ванные -стратегии и контрстратеги и " (§§ 25-27).
В § 25 рассматривается дифференциальная позиционная игра типа (2) в том случае, когда игроки используют только смешанные стратегии^'^ . Аналогично вводится понятие А-равновесия уже в смешанных стратегиях и устанавливается его существование лишь при выполнении условий I и П. В практических задачах возникают трудности с реализацией смешанных стратегий. Поэтому в § 26 определяется А-равновесие в чистых стратегиях для игры, рассмотренной в предыдущем параграфе. Здесь "наказание за отступление" осуществляется смешанными стратегиями конттжоали -ций'Д^4 2 . Заметим, что это "наказание" носит, как правило, "потенциальный характер" и вводится для того, чтобы "заста -вить" игроков следовать А-равновееию. Существование такого А-раЕНОвесия установлено лишь при .требовании непустоты специального подмножества области достижимости.
В § 27 рассматривается возможность "наказания отступившегося" с помощью контрстратегий. Отметим, что использование в дифференциальной игре (2) пары стратегия - контрстрате^ия возникает в том глучае, когда кроме реализующейся к данному моменту времени ^ позиции коалиции из I игроков известна и реализация (в данный момент времени) управляющего воздействия ¿' -го игрока, не сходящего в данную коалицию.. Такая постановка вполне естественна, если "действия отклонивше- ' Гося" игрока находятся под контролем остальных. С аналогичном подходом встречаемся, например, при заявлении договоров, где имеется возможность контролировать дзйствня каждого игрока. В этом случае (теорема 27.1) существует А-равновесие, если даже условия (14) не ваполленц. В § 27 ксччрстратзгиа г
коалиции /Vх 2 отождествляются с функциями такими, что
являются борелевскими (по Щ ). Множество стратегий
обозначается через ^г) . Движения 4;
"V" . I И систему (I) определяются согласно*^.
4 г-1 ,
Набор чистых стратегий V & с/ назван А-равно весием в контрстратегиях для игры (2) с начальной позицией если: 0
а) каковы бы ни были индекс ¿е /V и стратегия Т-^ существует ("своя" для каждого ) контрстратегия
• ^ ^^ ^ конидии /V4 2 такая, что
т-асе сг V" "И" . ) <
^^ г1 » г> /V»г. г
лгг^:^ /¿¿г ссс-2
б) ситуация "V является .Р-оптимальной в задаче (7) с начальной позицией Ха } .
Теорема 27.1. Если выполнены условия I и П, и при любой начальной позиции уоса * в игре (2) не пу-
сто множество А-равновесий в контрстратегиях.
В гдаве семь "Приложения" (§§ 28-31) найдены яв -.ный вид А-равновесия и ситуации равновесия по Нэшу в дифференциальной игре сближения двух однотипных инерциальных объектов (§ 28). Показано, что выигрыши обоих игроков в А-равновесии больше, чем при равновесии йо Нэшу, т.е. в этой задаче имеется аналог "дилеммы заключенного". В § 29 рассматривается возможный вид математической модели, описывающей процесс соревнования между двумя экономиками, где оценка функционирования каждой систе-ф.1 проводится по одному и тому же набору показателей.-Найдено А-равновесие, которое в этой задаче совпадает с ситуацией
равновесия по Нэиу одновременно Р -оптимальной^ § 30 посвящен следующему обобщению понятия А-равновесия:
ситуация названа абсолютным А -
равновесием игры (2) с начальной позицией J } , если •
а) для ка-сдой стратегии € любой коалиции К с А/ (К^Л/) существует стратегия <£ контркоалиции /Vх такая, что
сер У о О
б) ситуация V является .Р-оптимальной в задаче (7) с начальной позицией {'с0 5 }.
Выделен класс линейно-квадратичных позиционных дифференциальных игр, в которых найден явный вид абсолютного А-равновесия. Такое равновесие построено и в математической модели взаимодействия четырех фирм, занятых совместной разработкой научной проблемы (§ 31), Здесь ,так ле как и в задаче сближения, имеет место аналог "дилеммы заключенного": выигрыши игроков в абсолютном А-равновесии больше, чем в ситуации равновесия по Нэгау.
ЗАКЛЮЧЕНИЕ . '
Таким образом, в диссертационной работе получены следующие результаты. •.'
I. Дана новая математическая постановка многокритериальной позиционной динамической задачи. Выявлены структура и свойства оптимальных стратегий, способы- их вычисления.
■2. Введено новое понятие решения позиционной бескоалиционной дифференциальной игры - А-равновесие. Установлено существование при обычных ограничения« для позиционных дифференциальных игр для случая чистых, смешанных стратегий и контрстратегий. По" сравнению с общепринятым решением (ситуацией равновесия по Нашу) А-равновесие улучшает выигрыши игроков, обладает свойствами внутренней и внешней устойчивости«, тем самым исключая пара- ' • доке "дилемма :.аключе'шого" и существует также.в тех случаях,
о
когда ситуация равновесия по Нашу отсутствует.
3. Предложен способ аналитического конструирования А-рав-новесий, сводящийся к построению функций Беллмана-Красовского по известной Р-оптимальной ситуации. Для некоторых классов позиционных дифференциальных игр построен явный вид А-равнове-сия.
Публикации основных результатов диссертационной работы у
I. Жуковский В.И. Об аналитическом конструировании оптимальных стратегий в некоторых дифференциальных играх.I. // Автоматика и• телемеханика.- 1970.- )f 4,- С.26-30.
2.. Жуковский В.И. 0.6 аналитическом конструировании оптимальных стратегий в некоторых дифференциальных играх.П. // Автоматика и телемеханика.- 1970.- if 5.- С.25-50.
3. Жуковский В.И. О дифференциальных играх нескольких лиц с ненулевой суммой // Изв.АН СССР. Сер.техн.кибернетика.- 1971,-п 3.- С.3-13.
4. йуковский В.И. Оптимальность в одной дифференциальной игре нескольких лиц // Проблемы аналитической механики, теории устойчивости и управления: Сб.научн.тр.- М.: Наука, 1975.-С.143-147.
5. Вайсборд Э.М., Жуковский В.И. Введение в дифференциальные игры нескольких лиц и их приложения.- М.: Советское Радио, I960.- 304 с.
6. Тынянский Н .Т., Жуковский В.И. Дифференциальные игры с ненулевой суммой (бескоалиционный вариант)// Итоги науки и техники: Математический анализ.- М.: ВИНИТИ АН СССР, 1977.- Т.15.-СЛ99-266.' \ -
7. Тынянский Н.Т., Куковский В.И. Дифференциальные игры с ненулевой суммой (кооперативный вариант) // Итоги науки и техники: Математический анализ,- М.: ВИНИТИ АН СССР, 1979.- T.I7.-C.3-II2.
8. Шуковский В.И., Тынянский Н.Т. Равновесные управления многокритериальных динамических систем.- М.: Моск.ун-т, 1984.224 с.
9Р Zhukovskii V.I. Some Problems of Hon-Antagonistio Differential Garaeg // Math. Metods in Operation Research.- Bulgar. Acad. Soi., Sofia, 1985.- P.103-195.