Оптимальное поведение в иерархических системах тема автореферата и диссертации по математике, 01.01.11 ВАК РФ
Захаров, Виктор Васильевич
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Ленинград
МЕСТО ЗАЩИТЫ
|
||||
1990
ГОД ЗАЩИТЫ
|
|
01.01.11
КОД ВАК РФ
|
||
|
¿1)23 УЗ
ДНЕ5НГРАДСЮЙ ОРДЕНА ЛЕНИНА И ОРДЕНА ТРУДОВОГО КРАСНОГО ШАШНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
ЗАХАРОВ Виктор Васильевич
УДК 513.9
*
ОПТИМАЛЬНОЕ ПОВЕДЕНИЕ В
иерархических системах
01.01.II - Системный анализ и автоматическое управление.
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора физико-математических наук
Ленинград - 1990
Работа выполнена на факультете прикладной математики-про-цессов управления Ленинградского государствешого университета
Официальные оппоненты: доктор физико-математических наук КШОНЕНКО А.ё. доктор технических наук ВОРОБЬЕВ A.M.
доктор физико-матеыатичоских наук ТОМСКИЙ Г.В.
Ведущая организация - Иркутский Вычислительный центр СО АН СССР
Защита состоится "_"_1990 г. в_час. на
заседании специализированного совота Д.063.57.33 при Ленинградском ордена Ленина и ордена Трудового Красного Знамени государственном университете по адресу: I9S004 г.Ленинград, В.О., 10 линия, Д.33.
С диссертацией можно ознакомиться в фундаментальной библиотеке имени А.М.Горького Ленинградского государственного университета (Университетская наб., 7/9).
Автореферат разослан "_"_1990 г.
Ученый секретарь специализированного совета, доцент
Харитонов B.JI.
- 3 -
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Одной из характерных тенденций современного этапа развития науки является формирование новых направлений, объединяющих различные области научного знания. Именно к таким направлениям принадлежат исследования в области системного анализа, относящиеся к проблемам принятия решений. Как отмечает академик Н.Н.Моисеев, системный анализ -это дисциплина, занимающаяся проблемами принятия решений в условиях, когда выбор альтернативы требует анализа разнообразной сложной информации. Поэтому методические концепции, аппаратные методы реализации системного анализа основываются на общей теории систем и на дисциплинах, занимающихся проблемами принятия решений - теории исследования операций, общей теории управления и теории игр.
При построении математически моделей функционирования или развития даже сравнительно небольших реальных систем исследователи сталкиваются с необходимостью учета сложных взаимосвязей компонент модели, оказывающих действелчое влияние на реализацию альтернатив развития и достижение поставленных целей. Значительное число сложных систем управления характеризуется конфликтностью процесса принятия решений, что является следствием наличия у ряда субъектов управления, системой различных представлений как о глобальной цели развития системы, так и локальных целях и критериях развития ее элементов.
Еще одним характерным признаком сложных систем является их иерархическая структура, которая выражается как-в наличии в системо вертикально соподчиненных подсистем, та:с и в иерархии процесса управления.
Иерархическая структура управления в сложной системе представляет собой последовательность уровней управления, следующих друг за другом в порядке определенного приоритета. Одной из причин появления иерархической структуры в системах управления и принятия решений является большой объем информации об управляемых процессах в системе, невозможность обработки этой информации об управляемых процессах одним управляющим центром. Другой причиной является существующая в реальных системах децентрализация процесса принятия решений, когда олемен-
ты, подчиненные центру, вырабатывают управляющее воздействия исходя из решений центра и с учетом собственных интересов.
К настоящему времени лучше всего изучены двухуровневые статические и динамические системы, а также некоторые классы систем с иерархической структурой частного вида.
Задачи управления в конфликтных двухуровневых системах, впервые сформулированные в 30-х годах в связи с исследованиями в области экономики, получили затем свое развитие и изучались многими советскими и зарубежными исследователями.
Основы информационной теории иерархических систем были разработаны Н.Н.Моисеевым, й.Б.Гермейером, А.О.Кононенко и их учениками. Одной из основных задач моделирования конфликтных систем, как отмечает Н.Н,Воробьев, является конструирование и анализ принципов оптимальности. Вопрос о принципах оптимальности, различных модификациях равновесия продолжает привле -кать внимание специалистов и широко обсуждается в литературе, например, в работах Э.И.Вилкаса, Н.Н.Воробьева, В.С.Бубялиса, Э.Дамме, Д.М.Крепса и др.
Разработка проблематики конфликтных динамических систем с иерархической структурой базируется на основополагающих результатах в теории дифференциальных игр, полученных в конце 60-х - начале 70-х годов Л.С.Понтрягиным и Н.Н.Краеовским и развитых в работах А.Ф.Кононенко, В.Н.Лагунова, М.С.Никольского, Ю.С.Осипова, Н.Н.Петрова, Л.А.Петросяна, Б.Н.Пшеничного, Н.Ю.Сатиыова, А.И.Субботина, Г.В.Томского и многих других советских и зарубежных математиков.
Необходимость исследования иерархических дифференциальных игр подчеркивалась в работах А.Ф.Кононенко, А.Ф.Клейменова, Н.С.Кукушкина, А.Бапчк, Т.Базара, внесших значительный вклад в разработку возникающих здесь проблем.
Фундаментальной проблемой, которая в последние годы привлекла к себе внимание многих специалистов по теории конфликтных динамических систем, является проблема динамической устойчивости решений. Это обусловлено тем, что динамическая устойчивость является важнейшим фактором реализуемости во времени Быбранных принципов оптимальности. Постановка этой проблемы была впервые осуществлена Л.А.Петросяном в конце 70-х годов и разрабатывалась в дальнейаем в работах Н.Н.Данилова, С.В.Чистякова, В.В.Захарова и других исследователей. Следует отме-
тить также более поздние работы зарубежных ученых Д.Краса, С.Холли, В.Хиллера, в которых исследуется проблема "временной состоятельности" оптимальных решений, аналогичная проблеме динамической устойчивости. Анализ этой проблемы для различных классов дифференциальных игр показывает настоятельную необходимость получения условий, при которых динамическая устойии-востьимеет место. Упитывая, что практически все принципы оптимальности, применяемые в конфликтных иерархических системах управления данным свойством не обладают, актуальной является проблема разработки методов регуляризации решений иерархических дифференциальных игр, обеспечивающих динамическую устойчивость решений.
В предлагаемой работе указанным проблемам уделено значительное место. С прикладной точки зрения ценность любого подхода определяется практической ценностью разработанных методов. Доотому в работе теоретические результаты применяются при исследовании конкретных иерархических моделей принятия решений.
Цель работы состоит в развитии теории управления и прикатил решений в конфликтных иерархических системах общего вида;
- применении традиционных и построении и исследовании новых принципов оптимальности в статических и динамических конфликтных системах управления с иерархической структурой;
- исследовании свойств решений иерархических игр общего вида, сравнении принципов оптимальности, выявлении закономерностей в реализации решений для произвольного принципа оптимальности;
- исследовании проблемы динамической устойчивости принципов оптимальности и решений в иерархических дифференциальных играх и разработке методов регуляризации решений на различных классах стратегий;
- построении конкретных: моделей иерархических систем и применении полученных результатов для анализа и нахождения оптимальных решений.
Научная новизна. Впервые сформулирована задача управления в конфликтных иерархических системах общего вида. На основании предложенных подходов разработаны новые принципы оптимальности и процедуры выбора оптимальных решений в статических и динамических системах. Введено новое понятие и получены нэ-
обходимые и достаточные условия иерархической устойчивости решений игр общего вида для произвольного принципа оптимальности.
Сформулирована проблема динамической устойчивости решений иерархических дифференциальных игр и доказаны теоремы о необходимых и достаточных условиях динамической устойчивости решений для различных классов игр. Впервые для иерархических дифференциальных игр разработены методы регуляризации решений, обеспечивающие их динамическую, а такзке монотонно динамическую устойчивость.
Рассмотрен класс иерархических, игр с разрывными функциями выигрышей, для которых сформулированы необходимые и достаточные условия существования и единственности решений, предложены конструктивные методы нахождения решений в этих играх.
Практическая ценность. Разработанные в диссертации методы и подходы, полученные условия существования и единственности решений иерархических игр, методы регуляризации решений использованы при исследовании ряда теоретико-игровых моделей принятия решений в конфликтных эколого-зкономических системах. Полученные теоретические результаты могут найти применение для дальнейшего развития теории иерархических систем, исследования проблемы динамической устойчивости решений и принципов оптимальности в иерархических дифференциальных играх.
Методы исследований. Ь работе используются методология и аппаратные метода реализации системного анализа, основанные на понятиях и утверждениях общей теории динамических систем, теории управления и теории игр. Построение и анализ ряда моделей иерархических систем управления базировались на методах теории обыкновенных дифференциальных уравнений и уравнений в частных производных, линейного программирования.
Апробация работы. Основные положения и результаты работы докладывались и обсуждались на 1-ом Ленинградском симпозиуме по теории игр (1978 г.) , на Ш Всесоюзной конференции по исследованию операций (Горький, 1978 г.), на Всесоюзном семинаре "Прикладные.аспекты управления сложными системами" (Кемерово, 19ЭЗ г.), на Всесоюзной конференции "Проблемы теоретической кибернетики" (Иркутск, 1985 г.), на Всесоюзной школе "Оптимальное управление. Геометрия и анализ" (Кемерово, 1986 г.), на Всесоюзной школе "Математические ыетоды в экологии"
(Чита, 1986 г.), на Всесоюзной школе "Математические проблемы биологии" (Чита, Î988 г.), на научных семинарах БЦ /Л СССР, Института кибернетики /Л УССР, Института социально-экономических проблем АН СССР, факультета Вычислительной математики и кибернетики }.ГУ им.М.В.Ломоносова, Иркутского Вычислительного центра СО АН СССР, Института природных ресурсов СО АН СССР, Научно-исследовательского центра экологической безопасности ЛИЦ АН СССР, Вычислительного центра АН Армянской CCI5, кафедры теории управления и кафедры математической статистики, теории надежности и массового обслуживания факультета приклад -ной математики-процессов управления ЛГУ.
Публикации. Результаты диссертации опубликованы в 23 научные работах, в том числе 2-х монографиях, общим объемом более 50 печатных листов.
Структура работы. Диссертация состоит из введения, трех глав, девятнадцати параграфов, заключения и списка литературы Общий объем диссертации 317 страниц. Список литературы включает 133 наименования.
СОДЕРЖАНИЕ РАБОТЫ
Ео введении обоснована актуальность решаемой проблемы, сформулированы цель, методы и направления исследований, описаны краткое содержание ¡1 основные результаты работы.
Г да га I. Кногокритег.'Иальные и иерархические системы
В первой главе дается общая постановка задачи выбора оптимальных ретений в многокритериальных и иерархических системах, описываются принципы оптимальности, исследуются ромбовидные, древовидные, двухуровневые и многоуровневые системы, предлагается метод построения характеристической функции кооперативной игры с непустым С-ядром, вводится понятие иерархической устойчивости решения игры Г общего вида и исследуются свойства устойчивых оптимальных ситуаций.
В параграфе Î.1 задача управления сложной системой формализуется в виде конечного графа G , множество Еершин которого разбито на два подмножества - основных и сопутствующих компонент. При этом определяется зависимость количественного
состояния лвбой основной компоненты системы от состояний компонент множества & \г) , а также от ¿отравляющего параметра п; выбираемого из множества М>у1' (г>), где
(О _ вокторы, описывающие состояние основных и сопутствующих компонент. Для каждой основной компоненты вводится функция полезности, которая с учетом взаимосвязи системы определяется как функция параметров управления. Если в процессе управления участвуют т. различных сторон, выбирающих'соответственно управляющие воздействия м-, то мы получаем математическую модель принятия решений в условиях несовпадающих интересов участников. Особенность модели заключается в том,( что множества стратегий (управлений) игроков и{(х° ^зависят от количественных состояний компонент,
влияющих на компоненту £ . Поэтому здесь нельзя говорить, что игроки выбирают свои стратегии одновременно и независимо как это принято в бескоалиционных играх.
Обозначим множество элементов иерархической системы 10 = {А0,Аи..., Аъ] ■ Будем считать, что на верхнем уровне иерархии расположен элемент А0, который называется центром. Множество Г = 10\ {/40 } разобьем на 1> непересекающихся подмножеств ¿>2 , таких, что.и £¿=7. Обозначим
через 1Г, ..,^(0 множества допустимых действий (управле-
ний, стратегий) элементов А0> Ал Мы будем предпо-
лагать, что в общем случае множества допустимых действий зависят от управлений, выбранных элементами более верхних уровней системы и не пусты при любых допустимых значениях этих управлений. Критерий любого элемента £е I будем задавать некоторым функционалом определенным на множестве 1/х х. ..л гсе ^е^О), . Каждый из элементов заинтересован в максимизации своего функционала.
Процесс принятия решения в такой системе мы будем моделировать иерархической многоуровневой игрой Г, которую будем называть иерархической игрой общего вида.
В § 1.2 обсуждаются проблемы оптимизации в системах управления и принятия решений с иерархической структурой, формулируется понятие иерархической структуры управления. Характерным элементом, использованным для выбора решения в иерархической системе является множество оптимальных реакций отдель-
ноР компоненты системы или группы компонент /?(•) на
выбор управлений подсистемами более еысоких уровней. В этом параграфе рассмотрен ряд конкретных: моделей принятия решений в двухуровневых системах управления.
Параграф 1.3 посвящен принципам оптимальности, используемым в теоретико-игровых моделях. Здесь рассматриваются двухуровневая, древовидная игры и иерархическая игра общего вида. В качестве принципов оптимальности в отих играх используются равновесия по Нэшу и по Штакельбергу. Показано, что в древовидной игре при предположении о единственности точек максимума функционалов выигрышей для всех значений параметров, решение по Штакельбергу совпадает с множеством ситуаций равновесия по Нээу.
Для игры Г введем .понятие равновесных иерархических стратегий игроков.
Определим множество оптимальных реакций игроков шютего уровня следующим образом:
/Г(>У,...У~1Ь{гЛг/£_ ^ Н; (и, у,1 .и1~\
где ик<?. - вектор управлений игроков /с-го уровня;
vl¡\!^'. - Еектор управлений, в котором £-ая компонента заменена на г>/ .
Определение. Отображение V п., и]..и^''1) » ставящее в соответствие каядому допустимому набору и> у1, .. единственное управление к -го уровня, принадлежащее
.»пюгкеству оптимальных реакций , будем
называть равновесной иерархической стратегией Л-го уровня
Здесь множество оптимальных реакций ?< -го уровня определяется так:
, -I
где V (•),...(.) - соответственно равновесные иерархи-
- 10 -
ческие стратегии &-И,... , Ъ -го уровней.
Равновесным иерархическим решением центра будем называть множество R0 всех управлений its ¿7, таких, что
В лемме 1 доказывается, что любой набор равновесных иерархических стратегий образует ситуацию равновесия по Нэшу. Дчя частного случая игры Г , когда на каждом уровне иерархии расположен только один игрок формулируется Теорема -I о существовании ситуации е-равновесия.
В § 1.4 подробно обсуждается процесс нахождения решения по Дтакельбергу в ромбовидных играх, рассматриваются также многокритериальные ромбовидные системы управления, в которых используется смешанный принцип оптимальности. Для соответст-вую:дей этой системе ромбовидной игры вводится понятие SP-решения, которое обладает свойствами решения по Штакельбергу и требованиям оптимальности по Парето. Для иллюстрации процессов принятия решений в системах с ромбовидной структурой рассматривается задача построения оптимального плана производственного подразделения С, подчиненного двум административным центрам В1 и &г , которые ь свою очередь также подчинены центру А0, а такая задача распределения ресурсов в иерархической системе производства. '
Основной особенностью кооперативных игр с иерархической структурой является то, что характеристические функции в этих играх строятся с учетом информационной структуры. В работах Л.А.Петросяна характеристические функции ромбовидных игр строятся с использованием ситуаций равновесия по Нашу. В параграфе 1.5 предлагается способ построения характеристической функции кооперативной иерархической игры общего вида с использованием равновесных иерархических стратегий игроков в бескоалиционной игре Г. Доказывается супераддитивность построенной характеристической функции. В теореме 4 устанавливается, что вектор выигрышей в ситуации равновесия игры Г является дележом,в кооперативной игре и принадлежит ее С-ядру. В конце параграфа рассмотрены примеры построения характеристических функций в ромбовидных играх.
3 ряде научных публикаций Р.Д.Аумана, Н.Н.Воробьева, P.P. Льюса, Э.Ддмме, Д.М.Крепса, Н.Куна и других исследователей
- и -
рассматриваются различные модификации понятия устойчивости ситуаций равновесия в играх в развернутой форме. В параграфе 1,6 вводится новое понятие устойчивости решения в иерархической игре Г общего вида. Обозначим через
М = {О, V,,...,г>п); и.е/г°, vke ..к = \,г,...,ь}
- решение иерархической игры Г, где - множество оптимальных иерархических решений центра, /?*(•] - множество оптимальных реакций игроков к-го уровня, непустое при всех допустимых значениях управлений игроков более верхних уровней.
Обозначим иерархические стратегии игрока г через Ц>-(') , а коалиции - через
Рассмотрим ситуацию (и, у 1(-), ■ ■., , такую, что
любого -ие/?0 , = и, Л = 1,2,...,1-
Пусть М^ есть подмножество М, включающее в себя все альтернативы с фиксированной стратегией центра Для каждого "к =1,2,...,1 введем множество
м1м.... V1'') = {(г>?..., V1): . 1>1.у-'), 1-К..Л
Определение. Альтернатива (и, V1,... называется
иерархически устойчивой относительно ситуации если при любом к = ■(, 2,..., I
Подмножество А/,' множества Ми будем называть иерархически устойчивым относительно ситуации (.и.гуЧ'),...,Ч10)) , если любая альтернатива из множества М^ является иерархически устойчивой относительно этой ситуации. Ситуацию (и,<рV-;,... ...»ф^С-)) будем называть абсолютно иерархически устойчивой, если относительно нее устойчиво множество М1о.
Сформулируем следующие теоремы о необходимых и достаточных условиях иерархической устойчивости, доказанные в первой главе.
Теорема 6. Для того, чтобы альтернатива
и,
была иерархически устойчивой относительно ситуации (_ и,$4-),...
-Ь - IX -
—»С-)) , необходимо и достаточно, чтобы для любого
£ =1,2,',..,£ выполнялось условие
П к-<1()у*'*;,
где У^ср1^,»1,..., V , £=
Теорема 7. Для того, чтобы оптимальная ситуация Си, ^'О,--'/?^')) была абсолютно иерархически устойчивой, необходимо и достаточно, чтобы для любой альтернативы (и, г>1...>у1)&М1 выполнялось условие
для всех А = {,2., ... ,1 .
Глава 2. Динамические конфликтные системы управления
с иерархической структурой
В этой главе формулируется задача конфликтного управления общей динамической системой с иерархической структурой. Для иерархических систем управления, динамика которых описывается векторными дифференциальными уравнениями, а функционалы выигрышей содержат интегральные и терминальные слагаемые, формулируется проблема динамической устойчивости решений для различных принципов оптимальности, исследуются условия, при которых решения оказываются динамически устойчивыми, для неустойчивых принципов оптимальности предлагаются методы регуляризации, обеспечивающие динамическую устойчивость решений иерархических игр.
В параграфе 2.1 формулируется задача конфликтного управления в динамических моледях с иерархической структурой, обсуждаются условия, обеспечивающие существование и единственность решений систем дифференциальных уравнений для различных классов стратегий и управлений, приводятся условия, при которых множества всевозможных траекторий при использовании программных и синтезирующих управлений совпадает. В конце параграфа рассматриваются два примера нахождения ситуаций равновесия в двухуровневых дифференциальных играх с терминальными
выигрышами. Рассмотренные примеры характерны тем, что оптимальные врогра»!»!Ные стратегии в одном из них оказываются динамически неустойчивыми, а в другом обладают противоположным свойством.
Динамика всех конфликтных иерархических систем рассматриваемых в первом параграфе и во всей главе описывается векторным дифференциальным уравнением
при начальных условиях
ха о) = х0
I й Т > управления гс. е , р. е й в каждый момент времени выбираются из компактных множеств , ,..., Рп , £ = ■1,2, ...,п • Функционалы выигрышей игроков рассматриваются в виде
Г
= ¿-0,1.....п.
10
Существенным моментом в построении теоретико-игровой модели принятия решения в конфликтной системе управления является выбор принципа оптимальности, а также типа стратегий, используемых игроками. Об этом идет речь в параграфе 2.2. В соответствии с принятой терминологией мы определяем стратегию игрока как отображение информационного множества этого игрока на множество его управляющих параметров. В общем случае предполагается, что пространство стратегий 1-го игрока есть множество отображений ^¿(¿,хО>) , где для фиксированного I, (р.(-) зависит от для %&1а\ Ь~\. Интересным представляет-
ся случай, когда в иерархической дифференциальной игре двух лиц используются стратегии, включающие предложение игроку нижнего уровня отслеживать совместно с игроком верхнего уровня некоторую траекторию, выгодную обоим игрокам. Такие стратегии использовались, например, в работах А.Ф.Клейменова.
В параграфе 2.2 аналогичные стратегии рассматриваются для двухуровневой игры п-Н лица с одним центром - игроком верхнего уровня, когда центр не оказывает влияния на динамику системы, а лишь только на значение функционалов выигрышей иг-
роков нижнего уровня. Характерной особенностью предлагаемых конструкций решения является наличие у центра стратегии угр; эы, предполагающей в случае отклонения от реализации предложенной страектории переход центра на универсальную стратеги которую можно трактовать еще как стратегию наказания. Далее в атом параграфе обсуждается применение принципа оптимально! ти штакольберга для двух и трехуровневых дифференциальных игр. Б конце параграфа рассматриваются примеры нахождения о: тикальных по Лтакельбсргу решений, а также БР-решений в дв, уровневкх дифференциальных играх.
Б параграфе 2.3 обсуждается проблема динамической устой чпвости решений иерархических дифференциальных игр. Решение М(10>х0) иерархической дифференциальной игры ГС^0,агр^ м называем динамически устойчивым, если для любого набора стр тегий еМ(10,х0) и любого ¿еЦ0>
спра ведай во условие
где • _ сужение оптимальных стратегий На
интервал Г] . А/({,х(£)) - решение текущей игры в которой в качестве начальной позиции используется точка оптимальной траектории в момент времени Ь . Из такого опре деления динамической устойчивости решения следует, что дине мицески устойчивью оптимальные стратегии обладают свойство?, сохранять сбою оптимальность на протяжении всего периода рг вития игры вдоль оптимальной траектории.
Далее в отом параграфе доказывается динамическая устой* вость равновесия по Нолу и Парето-оптимального решения в ю ссе програмшых стратегий. Подробно обсуждаются здесь таш;:< динамические свойства решения по Стапельбергу перархическо! даффереициальной игры двух лиц. Показано, что даже в том с. чае, когда множество оптимальных реакций игрока нижнего ур> ня состоит из единственной стратегии, решение по Штакельбе; в общем случае оказывается динамически неустойчивым как в ссе программных, так и позиционных стратегий. Вместе с тем существуют иерархические игры, в которых решение по Штакел бергу является динамически устойчивым. Это подтверждается конкретным примером, помещенным в конце параграфа.
Параграф 2.4 посвящен методу регуляризации двухуровнев
дифференциальных игр. Цель метода состоит в том, чтобы обеспечить динамическую устойчивость решения игры. Для этого предлагается каждому игроку к моменту времени выплачивать такую часть интегрального гыигрива, чтобы на любом оставшемся до конца игры интервале времени этол?у игроку было не выгодно отклоняться от выбранной в начале игры стратегии. Характерное свойство решения по Штакельо'ергу двухуровневой игры в классе программных стратегий сюормулировано в следующей леммо.
Лемма 2Л. Пусть М(i0,x0)-решение по Штакельбергу двухуровневой игры Г на классе программных стратегий. Для любой ситуации (ü,v^,...,vn)<s M(t0,xQ) и любого éeLt0fr] выполнено условие
vil, П eRsCü.Li,T}),
где Rs{ñ ТУ) - множество оптимальных реакций игроков нижнего уровня в текущей игре I. й-lГ]~ = (ß^iyT]}.,., vn lít Г] ) - сужения оптимальных управлений игроков на отрезке времени [4,7*].
Аналогичная лемма в этом параграфе сформулирована для S Р -решения двухуровневой дифференциальной игры.
Рассмотрим теперь пучок траекторий X?.(í) ¿0¡x0) оптимальных по Штакельбергу, дая которых фиксировано управление центра il.(i). Тогда, как показано в теорема 2, условие
Н' °(йа,'П, vltj]) = max min
u-'eVCtSJ vt£R^ut) 0 *
где vb) - функционал центра в текущей игре,
xÍb xí( ¿ í„, x\ - произвольная позиция сечения пучка в моме-
О > > О' О'
нт времени í, является достаточным для динамической устойчивости решения. Аналогичное условие устанавливается для SP-решения в теореме 3. В этих теоремах условие типа (I) предполагает, что оптимальная реакция нижнего уровня в случае динамически устойчивой ситуации равновесия (,ü,v) одновременно является и стратегией наказания. Однако, как показано в теореме 2, это условие можно ослабить, введя понятие некоторой универсальной стратегии наказания
и сформулировав уже условие (í) для этой стратегии нижнего уровня. Далее для реализации метода регуляризации предполагается, что интегральный выигрыш a.At) игрока i , который
ему выплачивается к моменту времени íe[í0,T} , определяется следующим образом:
и{ (t) = ¡i¿ (Ь) I h; С^С-с;, ü(T), ü(T)) dr, i=0,i,...,п,
¿o
где p¿(í)- кусочно непрерывные функции, принимающие значения в интервале от нуля до единицы. Причем значения функций ji-(i), вообще говоря, завися'.' от выбранной траектории, поэтому
Это позволяет вычислить значения функционалов выигрышей игроков на сужония оптимальных управлений ¿¿[i,7T], vLi,T3 с учетом функции Ji(-) , а для набора стратегий, не совладоэт-щих с выбранным оптимальным, обычным образом. Этот процесс перераспределения выигрша вдоль оптимальной траектории мы будем называть регуляризациой иерархической дифференциальной игры, а иерархическую дифференциальную игру, допускающую регуляризации, iti'poii с трапсферао'ельнк;>:и во времени шигршадш или ¿-трансферабелькыми выигрышами.
Пусть ü(_í) v(i),äi[ij - оптимальнее- rio Етакольбсргу управления и траектория в двухуровневой игрэ Г( f0, xß). Обозначим через iÍх(•)) первый момент времени, когда управление ÜW центра порестаот быть штгагальшм в текущзй игре. Предположим, чю iß< ¿ (£(•)) < Т
Обозначим
G(t,ic(t)) - sup Inf н1'Ш{и\ vb).
u*g vla Rs(ub)
Теорема 2.5. Если дня кбой ситуации равновесия по lilra-кельбергу (iL, v)g M[tQ,x0) и соответствующей оптимальной траектории ¿(¿J двухуровневой дифференциальной игры V(tß,x с i -трш1с$орабелы1ыли suarpuEtuoi существует i(xc-))e(í0, T)í • а функции выбраны в виде
Н0 *(üZi0,r2,vlb0,T2)-G( „ (í; ss--------,
и lhJ¿S(x),acv)fBiv))civ
íeLi'(.£C')), Г'J;
- 17 -
= и г =1,2,..„п.
то решение» по Штакельбергу х0) будет динамически ус-
тойчивым.
Вследствие того, что функция рдС?) может иметь разрыв в точке I (■) , разрыв в этой точке может претерпеть и функция «„(*; . Для того, чтобы избежать этого и обеспечить монотонность функции ос0(-£) и динамическую устойчивость решения в теореме 6 второй главы сформулированы соответствующие условия. Решение в этом случае называется монотонно динамически устойчивым.
В параграфе 2.5 метод регуляризации развивается для двухуровневых дифференциальных игр в классе позиционных стратегий. Необходимые и достаточные условия динамической устойчивости оптимальной ситуации и решения двухуровневой дифференциальной игры формулируется в теоремах 7 и 9. В теореме 9 приводятся условия, которым должна удовлетворять вектор-функция ^С1) , чтобы решение по Штакельбергу было динамически устойчивым. В параграфе 2.5 рассмотрена также двухуровневая игра двух лиц с доброжелательным игроком нижнего уровня, для которой в лемме 3 сформулированы достаточные условия динамической устойчивости решения. Для оптимальных ситуаций и соответствующих траекторий, не удовлетворяющих этим условиям, предлагается использовать метод регуляризации. Соответствующие условия для вектор-функции [$(■) сформулированы в теореме 10.
В параграфе 2.6 исследуются проблемы динамической устой-чивостирешений иерархических дифференциальных игр общего вида и квазидревовидных игр. Для игры общего вида устанавливается динамическая устойчивость равновесия по Нэ'лу в классе программных стратегий (теорема II). Проблема динамической устойчивости по Штакельбергу рассматривается сначала для квазидревовидных игр, в которых любой игрок подчинен только центру и одному из игроков более верхнего уровня. Используя такой же подход к определению контрстратегий, как в двухуровневых играх, в теореме 13 формулируются необходимые и достаточные условия .динамической устойчивости решения по Штакельбергу, а в теореме 14 указываются условия, которым должны удовлетворять функции {(*;(•)}, г = 0,1,..., п . В теорема 15 содержатся ус-
- 18 -
ловия монотонной динамической устойчивости решения.
Применение метода регуляризации для иерархической дифференциальной игры общего вида в следствие сложности иерархической структуры требует введения дополнительных условий регуляризации игры, при которых возможно применение указанного метода. Они получены в зтом параграфе. Необходимые и достаточные условия динамической устойчивости решения по Штакальбер-гу в игре общего вида, а также условия, для функций {^¿(0} сформулированы в теоремах 17, 48 и '19.
В параграфе 2.7 проблема динамической устойчивости рассматривается в классе позиционных стратегий особого вида, пре-дполагаю'вдх использование центром стратегий, содержащих функции регуляризации • Такие стратегии здесь называется р -позиционными стратегиями. В теоремах 20 и 21 формулируются достаточные условия динамической устойчивое::; решения по Штакельбергу в игре общего вида с ¿-трансферабельными выигрышами. В заключении параграфа метод регуляризации применяется .для обеспечения динамической устойчивости решений в иерархических дифференциальных играх ебщего вида в классе позиционных стратегий. Условия, которые должны удовлетворять функции {[^С')}. получены в теореме 22.
В заключительной главе рассматриваются некоторые теоретико-игровые модели принятия рэаений в конфликтных системах с иерархической структурой управления.
В параграфе ЗЛ исследуются теоретико-игровые модели принятия решений о нормировании выбросов промышленных предприятий, в которых выигрыши участников имеют разрыв па гиперплоскости. Процесс принятия решоний моделируется двухуровневыми играми, в которых центр (игрок верхнего уровня) регулирует величину штрафов, накладываемы;: на игроков нижнего уровня в случае превышения предельно-допустимого уровня загрязнения. Реакция игроков нижнего уровня состоит в выборе значений интенсивности выбросов вредной примеси. Серьезной задачей, которая появляется при рассмотрении модели принятия решений в такой игре, является задача нахождения множества оптимальных реакций, а также определения условий непустоты этого множества. В данном параграфе описаны множества оптимальных реакций в рассматриваемых иерархических играх, получены необходимые и достаточные условия существования решения по Штакельбергу,
предлагаются конструктивные алгоритмы определения равновесных по Мтанельбергу ситуаций. Полученные результаты сформулированы в теоремах 1-9.
Параграф 3.2 посвящен исследованию сильно равновесного решения по Штакельбергу в модели нормирования выбросов. Мы называем решение по штакельбергу двухуровневой игры Г0 сильно равновесным, если для любой стратегии центра <?еХ0 множество оптимальных реакций игроков нижнего уровня представляет собой множество допустимых сильно равновесных ситуаций в бескоалиционной игре Г^Э) игроков нижнего уровня при фиксированной стратегии центра. В теоремах 10, И формулируются необходимые и достаточные условия существования непустого множества оптимальных реакций и решения по Штакельбергу в иерархической игре Г0 . В параграфе 3.3 предлагаются методы нахождения оптимальных стратегий центра в моделях, рассмотренных в предыдущих двух параграфах. Приводятся численные примеры решения задач о нормировании выбросов и выборе оптимальных размеров штрафн-озс санкций.
В параграфе 3.4 исследуется динамическая теоретико-игровая модель охраны атмосферы от загрязнения, процесс принятия решений в которой моделируется иерархической дифференциальной игрой. Динамика игры задается уравнением турбулентной диффузии, решением которого является функция ,
описывающая распределение уровня концентрации вредной примеси в заданной области трехмерного пространства. Как и в предыдущих параграфах центр использует в качестве своих стратегий назначения штрафов (^5,, , .. ., $п) , а игроки нижнего уровня управляют интенсивностью выбросов источников иг<И),... ...^и^). Оптимальной реакцией игроков нижнего уровня является выбор управлений, максимизирующих суммарный выигрыш всех игроков. Оптимальным иерархическим решением центра является множество ситуаций ("•?,,...,таких, что при оптимальной реакции нижнего уровня выполнено некоторое условие качества воздушной среды в заданной экологически значимой зоне. После выбора некоторой ситуации равновесия
процесс распределения суммарного выигрыша между игроками нижнего уровня моделируется кооперативной дифференциальной игрой, для которой формулируются необходимые и достаточные условия динамической устойчивости С-ядра и предлагается способ регу-
ляризации игры. Полученные результаты отражены в теоремах <12 и 13 зтой главы.
Параграф 3.5 посвящен исследованию модели оптимального поведения игры при осуществлении экономического сотрудничества на основе кооперации. Процесс принятия решений здесь также моделируется иерархической динамической игрой, в которой кооперация игроков осуществляется на нижнем уровне. На основании применения метода регуляризации строится план развития региона, учитывающий задания по приросту основных показателей развития и возможности экономии ресурсов в условиях кооперации.
Последний параграф третьей главы посвящен исследованию Двухуровневой дифференциальной игры с векторными пигрышами игрока нижнего уровня. Здесь рассматривается метод нахождения динамически устойчивых 5Р-решений в построенной игре. Дгш нахождения множества оптимальных реакций игрока нижнего уровня используется известная задача о сближении с несколькими половыми точками.
Основное содержание диссертации опубликовано в следующих работах:
1. Захаров Ь.Ь. Одна теоретике-игровая модель охраны окружающей среда. В кн: Некоторые вопросы дифференциальных и интегральных уравнений. Якутск, 1978 г.
2. Захаров В.В. Об одном примоненин теории игр в моделировании экологических процессов. В кк: .Математические методы оптимизации и структурирования систем. Калинин, -1980.
3. Захаров В.В., Патросян Л.А. Теоретико-игровой подход к проблеме охраны окружающей среды,- Востн.Ленингр.ун-та, '1981, серия мате.м.,мех.,астрономия, г.ыл.1.
4. Захаров В.Б. К вопросу о применении теории игр к проблеме охраны окружающей среды.- Востн.Ленингр.ун-та, серия матом.,мех. ,астрономия, был л.
5. Захаров В.В. Рациональное природопользование и его то-оретико-игровое кодолирование. В кн: Математические оптимизации и структурирования систем. Калинин, 1981.
6. Захаров В.В. Динамическая теоретико-игровая модель охраны окружающей среды. В кн: Многошаговые, дифференциальные, бескоалиционные и кооперативные игры. Калинин, 1С32.
7. Захаров В.В. Игры с разрывом на гиперплоскости и некоторые проблемы охраны окружающей среды. В кн: Прикладные ас-
- ¿1 -
пекты управления сложными системами. Кемерово, 1983.
8. Захаров В.В. О значении функций штрафов в играх с разрывом на плоскости. В кн: Динамические управляемые системы. Якутск, 1983.
9. Захаров В.В. Игры с разрывом на гиперплоскости. В кн: Теория игр и ее приложения. Кемерово, 1983.
10. Потроскн Л.А., Захаров В.В, Динамическая игровая модель планирования развития региона. В кн: Многошаговые, дифференциальные, бескоалиционные и кооперативные игры. Калинин, 1983.
11. Захаров В.В. Принцип справедливого распределения в задаче возмещения ущерба от загрязнения окружающей среды. В кн: Математические методы оптимизации и управления в сложных системах. Калинин, 1984.
12. Захаров В.В. Иерархические игры с. разрывными функциями выигрыша. В кн: Многошаговые, дифференциальные, бескоалиционные и кооперативные игры и их приложения. Калинин, 1935.
13. Захаров В.В. 0 структуре оптимальных решений в играх с разрывом на гиперплоскости. Тезисы доклада на Всесоюзной конференции "Проблемы теоретической кибернетики." Иркутск, 1986.
14. Захаров В.В. 0 динамической устойчивости решений иерархических дифференциальных игр. В кн: Многошаговые, иерархические, дифференциальные и кооперативные игры. Калинин, 1986.
15. Захаров В.В. 0 ситуациях равновесия по Нэшу и по Штакельбергу. Тезисы доклада на Всесоюзной школе "Оптимальное управление. Геометрия и анализ". Кемерово, 1986.
16. Захаров В.В. Иерархические игры и их приложения к проблеме охраны окружающей среды. В кн: Математические методы экологии. Чита, 1986.
17. Петросян Л.А., Захаров В.В. Введение в математическую экологию. Л.,. 1986.
18. Захаров В.В., Ускова С.А. Двухуровневые иерархические игры с векторными функциями выигрыша. В кн: Математическое и программное обеспечение задач конфликтного управления. Ереван, 1987.
19. Захаров В.В. 0 регуляризации и динамической устойчивости решений иерархических дифференциальных игр,- Вестн.Ле-
- 22 -
нингр, ун-та, cep.I, 1988, выл Л.
20. Захаров В.Б. Оптимизация в иерархических системах управления и принятия решений. Вестн.Ленингр.ун-та, сер.5, 1988, вып Л.
21. Захаров В.В. Оптимальное управление в моделях биологических сообществ. В iw: Стоматические проблемы -биологии. Чита, 1988.
22. Захаров В.В. Устойчивость решений в иерархических играх общего вида. В кн: Проблемы теории игр в общих системах. Якутск, 1938.
23. Губанои В.А., Захаров В.В., Коваленко Л.Н. Введение в системный анализ. Л., 1988.
24. Захаров В.В. Решение по Штакельбергу в иерархических играх с разрывными функциями выигрьиа. В ich: Дифференциальные уравнения и их приложения. Якутск: ШЦ СО АН CCGP, 1989.