Исследование эволюционных игр в рамках теории обобщенных решений уравнений Гамильтона-Якоби тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Мельникова, Наталья Венедиктовна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Екатеринбург МЕСТО ЗАЩИТЫ
1999 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Исследование эволюционных игр в рамках теории обобщенных решений уравнений Гамильтона-Якоби»
 
Автореферат диссертации на тему "Исследование эволюционных игр в рамках теории обобщенных решений уравнений Гамильтона-Якоби"

РГБ ОД

¿о ОПТ 1999

Уральское Отделение Российской Академии Наук Институт Математики и Механики

На правах рукописи

МЕЛЬНИКОВА Наталья Венедиктовна

ИССЛЕДОВАНИЕ ЭВОЛЮЦИОННЫХ ИГР В РАМКАХ ТЕОРИИ ОБОБЩЕННЫХ РЕШЕНИЙ УРАВНЕНИЙ ГАМИЛЬТОНА-ЯКОБИ

Специальность 01.01.02 - дифференциальные уравнения

Автореферат на соискание ученой степени кандидата физико-математических наух

Екатеринбург - 1999

Работа выполнена в Институте Математики и Механики Уральского отделения Российской Академии наук

Научные руководители: академик РАН, {А.И. Субботин; | доктор физико-математических наук, A.M. Тарасъев;

Официальные оппоненты: доктор физико-математических наук,

доцент А.Н. Сесекин; кандидат физико-математических наук, доцент A.M. Соломатин;

Ведущая организация - Институт проблем механики РАН

Защита состоится " " СШУБРЯ 1999 г. в " 7/ "

час. на заседании специализированного совета Д 002.07.01 по защите диссертации на соискание ученой степени доктора наук при Институте Математики и Механики Уральского Отделения РАН по адресу: 620219, г. Екатеринбург, ул. С. Ковалевской, 16.

С диссертацией можно ознакомиться в библиотеке Института Математики и Механики Уральского Отделения РАН.

Автореферат разослан " 199

Ученый секретарь диссертационного совета кандидат физ. - мат. наук, с.н.с.

У, Ш-SfO

М.Н.Гусев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы

Диссертационная работа посвящена разработке вычислительных методов построения равновесных стратегий управления в эволюционных играх. Теория эволюционных игр является активно исследуемым направлением прикладной -математики. Создание этой теории было вызвано актуальностью выявления закономерностей развития экономических, социологических, биологических систем. Представляет интерес изучение и разработка законов управления в таких системах.

Развитие теории эволюционных игр тесно связано с такими направлениями как дифференциальные игры, оптимальное управление, математическое програмирование, негладкий и выпуклый анализ.

Становление теории дифференциальных игр относится к началу 60-х годов и связано с именами российских и зарубежных математиков H.H. Красовского, JI.C. Поитрягына, Р. Айоекса, У. Флеминга. Крупный вклад в развитие теории оптимального гарантированного управления внесли Э.Г. Альбрехт, М. Барди, В.Д. Батухтин, Т. Башар, E.H. Баррон, Р. Беллман, А. Брайсон, Р.В. Гамкрелидзе, В.И. Жуковский, М.И. Оеликин, Н. Калтон, А.Ф. Клейменов, А.Н. Красовский, М. Дж. Крэндалл, A.B. Кряжпмский, А.Б. Кружанский, Дж. Лей-тман, П.-Л. Лионе, A.A. Меликян, Е.Ф. Мищенко, М.С. Никольский, Ж.-П. Обен, Г. Ольсдер, Ю.С. Осипов, А.Г. Пашков, B.C. Падко, H.H. Петров, Л.А. Петросян, Г.К. Пожарпцжий, Б.Н. Пшеничный, А.И. Субботин, H.H. Субботина, В.Е. Третьяков, В.Н. Ушаков, А. Фридман, Хо Ю-ши, А.Г. Ченцов, Ф.Л. Черноусько, A.A. Чикрий, Р. Эллиот и многие другие.

В качестве решения эволюционной игры в диссертации рассматривается совокупность позиционных управлений, основанных на гарантированной постановке задач оптимального управления, что является характерной чертой теории дифференциальных игр. Построение равновесных стратегий управления базируется на решениях вспомогательных задач гарантнрованого управления. В этих задачах вычисление функции оптимального гарантированного управления — функции цены, и синтез оптимальных позиционных стратегий осуществляется в рамках апнрохеимационных сеточных схем для обобщенных решений уравнений Гамильтона-Якоби. В этом смысле диссертация тесно

связана с результатами теории уравнений Гамильтона-Якоби, разработанными в работах А.И. Субботина 1,2 для обобщенных минимаксных решений. Используются также конструкции вязкостных решений, предложенных в работах М.Дж. Крэндалла, П.-Л. Лионса. 3,4

В частности, особое внимание уделяется конечно-разностным операторам для локальной аппроксимации минимаксных (вязкостных) решений, в которых значения гамильтониана вычисляются на обобщенных градиентам различных типов. Аппроксимационные решения сеточных схем (аппроксимационные функции цены) и информация об их обобщенных градиентах позволяют строить гарантированные управления методом экстремального сдвига, предложенным в работах H.H. Красовского. 5>6

Равновесные решения (динамические равновесия по Нэшу) синтезируются на базе построенных гарантированных управлений в рамках конструкции, разработанной А.Ф. Клейменовым. 7

Цель работы. Целью работы является разработка и обоснование конструкций для эффективного вычисления позиционных стратегии управления, реализующих динамическое равновесие по Нэшу (равновесные траектории) в эволюционных играх, исследование свойств равновесных траекторий в конкретных игровых моделях математической экономики.

Методы исследования. Разработанные методы опираются на теорию оптимального управления и дифференциальных игр, конструкции функционального, выпуклого и негладкого анализа. Исследуемые динамические модели обобщают классические постановки биматричных игр. Диссертация выполнена в рамках исследований по теории пози-

'Субботин А.й. Обобщение основного уравнения теории дифференциальных игр // Докл. АН СССР 1980. Т. 254. No. 2. С. 293-297.

2Субботии А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М.:Наука, 1991. 215

с.

3Crandall M.G., Lions P.-L. Viscosity solutions of Hamilton-Jacobi equations // Trans. Amer. Math. Soc. 1983. Voi. 277. No. 1. P. 1-42.

4Crandall M.G., Lions P.-L. Two approximations of solutions of Hamilton-Jacobi equations // Math. Comput. 1984. Vol. 43. No. 167. P. 1-19.

5Красовский H.H. Управление динамической системой. M.: Наука, 1985. 518 с.

6Красовский H.H., Субботин А.И. Пооиционные дифференциальные игры. М: Наука, 1974. 456

с.

7Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Е«атерин-бург:Наука, 1993. 185 с.

ционных дифференциальных игр, которая разрабатывается в научной школе H.H. Красовского по оптимальному управлению. Используются идеи локальных аппроксимаций (выпуклых, вогнутых, линейных) в конечно-разностных операторах для сеточных схем вычисления функций цены. Метод экстремального сдвига на сопутствующие движения, связанные с узлами сетка, применяется для построения оптимальных стратегий.

Научная новизна

Разработаны конечно-разностные операторы со среднеквадратичными градиентами, повышающие эффективность процесса вычисления фунцпи цены и оптимальных управлений. Конструкции оптимального синтеза терминальных задач адаптированы дм эволюционных игровых задач с бесконечным горизонтом. Проведено моделирование и исследование асимптотических свойств равновесных траекторий.

Теоретическая и практическая ценность. Изложенные в диссертации методы построения оптимальных стратегий носят конструктивный характер и применимы к достаточно широкому кругу задач теории эволюционных игр. Предлагаемые конструкции и процедуры могут быть положены в основу разработки эффективных алгоритмов и программ, реализуемых на ЭВМ и позволяющих не только прогнозировать эволюционный процесс но и вносить управляющие коррективы для достижения определенных параметров.

Апробация работы. Материал по теме дисертации докладывался в 1995 году на семинарах в Институте прикладного и системного анализа (IIASA, Лаксенбург, Австрия); на международной научной конференции "Дифференциальные и интегральные уравнения" (Челябинск, 1999) Результаты представлялись на научных семинарах отдела динамических систем Института математики и механики УрО РАН, кафедры информатики и процессов управления Уральского Государственного Университета.

Публикации. По теме диссертации опубликовано три статьи в журнале "Прикладная математика и механика" и тезисы доклада на научной конференции.

Состав и объем диссертации. Диссертация состоит из введения и пяти глав. Нумерация параграфов сквозная. Список литературы включает 86 наименований. Объем работы составляет 116 страниц ма-

шинописного текста.

СОДЕРЖАНИЕ РАБОТЫ

Первая глава состоит из двух параграфов. В ней описывается постановка эволюционной игры, дается определение динамического равновесия в смысле Нэша, указывается подход к решению сведением поставленной задачи к серии дифференциальных игр, в которых функция цены и оптимальные позиционные стратегии конструируются в сеточных адпроксимационных схемах для соответствующих уравнений Гамипьтона-Якоби. В первом параграфе рассматривается динамическая биматрпчная игра, в которой I = {1,2} - множество игроков, 5,- = {1,2}-множество стратегий. Выигрыш участника определяется матрицей выигрыша А для первой коалиции и матрицей В для второй коалиции

«11 «12 I в _ II 6ц £>12 | а21 «22 II ' II ¿21 ¿22 |

Эволюционная динамика поведения игроков описывается системой дифференциальных уравнений

¿0о = /(х(0,»(«),«(<)) (1)

х € В", и б Р с Вр, V б <5 с И4, где параметры гг, V играют роль управляющих сигналов. Правая часть системы предполагется линейной по и II V.

Локальные (краткосрочные) выигрыши коалиций задаются функциями да, дь как соответствующие математические ожидания (средние выигрыши).

Глобальные (долгосрочные) интересы коалиций представляются как несобственные интегралы с дисконтированием от локальных выигрышей

М*0)) = /0+°°е-^а(ф),и(т),у(т))с1т (2)

■¡ьШ) = [0+ООе-х'дь(х(г),и(тЫт))с1т (3)

где £(-) = {х(1): t € [0,+оо)} - траектория системы (1), порожденная парой управлений (и(^,и(^) из начальной позиции х(0) = хо. Пара-

метр А > 0 называется коэффициентом дисконтирования и описывает обесценивание краткосрочного выигрыша с ростом времени 8,э.

Цель коалиции максимизировать значение своего функционала.

Рассматривается задача поиска динамического равновесия по Нэшу в классе позиционных стратегий и = u(t,x,e), v = v(t,x,e).

Динамическое равновесие склеивается 7 из решении двух вспомогательных задач гарантированного управления (антагонистических игр с интегральными функционалами платы). Таким образом, равновесное решение эволюционной игры тесно связано с исследованием гарантированных задач управления с терминальным и интегральным функционалами платы. Задачи являются однотипными и исследуются в рамках формализации позиционных дифференциальных игр 3'4. Задачи с интегральными фукционалами качества сводятся к задачам с терминальными функционалами путем добавления к системе (1) (п + 1)-го уравнения, задающего в дифференциальной форме функционал качества.

Во втором параграфе даются математические постановки терминальных и интегральных задач, и рассматриваются связанные' с ними уравнения Гамильтона-Якобн.

В качестве терминальной задачи рассматривается задача Кошп для уравнения Гамильтона-Якобн

2g+JT(t,x,^) = 0, (М)€(<о,б)хЛ» (4)

w(6,x) = o(x), xeR" (5)

Этой краевой задаче отвечает задача гарантированного управления для динамической системы

х = f(t,x,u,v) = A(t,x) + B(t,x)u + C(t,x)v _ (6)

teT=[t0,9], я ei?n, tiePcF, veQcR4 с терминальным функционалом платы

_7Ш = <т(х(9)) ' (7)

®Dolcheta I.С. On a discrete approximation of Hamilton-Jacobi equation of dynamic programming // Appl. Matb. Optimiz. 1983. V. 10. No. 4. P. 367-377.

9Адиатулина P.A., Тарасьеэ A.M. Дифференциальная игра неограниченной продолжительности // Прикл. математика и механика. 1987. Т. 51, Вып. 4. С. 531-537.

Здесь х - n-мерный вектор системы, и - управляющее воздействие, v - вектор помехи. Множества P,Q - выпуклые компакты.

Функция H(t,x,s) : Т х R" х Rn R из уравнения (4) является гамильтонианом для системы (6), т.е. связана с динамикой f(t,x,u,v) соотношением

H(t, x,s) =<s,A(t,x) > +

+ mm < s,B(t,x)u > -fmax < s,C(t,x)v > (8)

ueP VZQ '

Исследуется стационарная постановка задачи.

На бесконечном временном промежутке [0, +оо) рассматривается управляемая система, не зависящая от времени в явном виде

x(t) = /(®(t),u(i),w(t)) = A{x) + B{x)u(t) +C{x)v{t) (9)

x(t) 6 Rn, u(i) ePcRp, v(t) eQcR"

Пусть x( ) = {x(t): t 6 [0,+oo)} - траектория системы (9). Будем оценивать качество траектории интегральным функционалом с коэффициентом дисконтирования

J(xi)M-), «(•)) = f0+OOe-^ä(x(r),u(r)Ar))dr,X>0 (10)

Определим функцию цены w° в задаче (9), (10) соотношением

w°(xn) = mia max lim z(6) (11)

Здесь символом Y(ya,U) обозначено множество траекторий y(t) = (x{t).z(t)), t e [0.6] расширенной системы

i=f(x,u,v) (12)

z = e~Mg(x,u,v)

порожденных позиционной стратегией и = U(t,x) и произвольными реализациями v = v(t) из начальной позиции у а

УО — (•*■()> ~о)> l(0) = Io, z(0)=20=0

Известно 8'9, что функция цены х -* и/а(х) обладает следующими свойствами. Она непрерывна по Гельдеру с константой Гельдера 7,

зависящей только от константы Липшица Ь и коэффициента дисконтирования А. Выполнено условие ограниченности с константой К/А. Эти условия и свойства стабильности формируют блок необходимых и достаточных условий, которым должна удовлетворять функция цены иА Свойства стабильности могут выражены дифференциальными неравенствами 2'3, которые в точках дифференцируемости функции цены ту0 обращаются в стационарное уравнение Гамильтона-Якоби

- Аш° + Н{х, = 0, г 6 Я" (13)

Функция Н(х,в) : Л." х Д" -» Д из уравнения (13) является гамильтонианом для задачи (9), (10) и связана с динамикой /(х,и,у) и интегральной функцией д(х, и, ь) соотношением

Н(х,з) = тттж{< я, > +д(х,и,у)} =

=< в, А(х) > +ииптая{< з,Б(х)и + С(х)у > +д(х,и,у)} (14)

Функции /(•), д(-) непрерывны по совокупности переменных, удовлетворяют условию Липшица по переменной х с константой Ь и ограничены константой К - скоростью системы (9).

Во второй главе предлагается конечно-разностный оператор для уравнения Гамильтона-Яко би, в котором несуществующие градиенты решений заменяются градиентами линейных аппроксимаций. Доказывается, что соответствующие этому конечно-разностному оператору аппроксимационная схема минорируется и мажорируется агпгрокси-мапионными схемами с конечно-разностными операторами, основанными на конструкциях суб- и супердифференциалов локальных выпуклых и вогнутых оболочек. Это позволяет обосновать сходимость аппроксимацнонных схем с линейными конструкциями. Конечно-разностные операторы, основанные на локальных аппроксимациях: выпуклых, вогнутых оболочках и линейных конструкциях, модифицируются для стационарной задачи с дисконтирующим функционалом на бесконечном промежутке времени. Доказывается сходимость аппроксимацнонных сеточных схем с этими операторами.

Рассматриваются модификации конечно-разностных операторов, которые учитывают расположение локальных областей достижимости.

В параграфе три, решается вспомогательная задача об отношениях, связывающих локальные выпуклые, вогнутые оболочки fh(y),gh(y) и среднеквадратичные плоскости L(y).

Оболочки для функции вычисляются локально на окрестности ÓPl(x,ri) базовой точки г.

Среднеквадратичной названа аппроксимационная плоскость, построенная по методу наименьших квадратов, на основе информации о значении функции в узлах окрестности ¿^(х,^) (IV-количество узлов по координатной оси).

Окрестности радиуса rj, r<¿ рассматривается в метрике р\. Основным результатом является утверждение.

Теорема 1 Пусть радиусы гьг2 окрестностей 0Pl(x,ri),ÓPi(x,r2) выбраны таким образом, что

11 = 341-^) (1б)

Тогда

jh{y)<L{y)<gh{y), у б ÓPl(х,r¡) (17)

Последнее соотношение качественно означает, что существует невырожденная окрестность, в которой линейная аппроксимация расположена между выпуклой и вогнутой оболочками.

В четвертом параграфе предлагается конечно-разностный оператор LA, локально аппроксимирующий обобщенное решение уравнения Гамильтона-Якобя для терминальной задачи

v(x) = LA(t, A, u)(x) = L(x) + LH(t,x, А) (18)

Здесь у L(y) = Ау+В- локальная линейная аппроксимация решения ■у -> u(t + А,у), проходящая между выпуклой и вогнутой оболочками в момент времени t + Дв окрестности Ó(x,r Д), г > К, А - ее градиент (нормальный вектор), Н - гамильтониан динамической системы, v{x)

- аппроксимация решения у -»u{t,y) в момент времени t в точке х, К

- максимальная скорость динамической системы.

Доказывается сходимость аппроксимационной схемы, построенной на основе этого оператора.

Теорема 2 Апрокспмациониая схема с конечно-разностным оператором u-+LA(t,A,u) (18) сходится с оценкой сходимости Д1/2.

Доказательство опирается на основной результат третьего параграфа об отношении локальных аппроксимаций (выпуклых, вогнутых, линейных) и монотоность соответствующих конечно-разностных операторов.

В пятом параграфе исследуется возможность использования линейного оператора в аппроксимационных схемах для стационарной задачи. В качестве первого шага конструируются конечно-разностные операторы на базе локальных выпуклых (вогнутых) оболочек, определяются оценки сходимости соответствующих аппроксимационных схем.

Определим значения функции и$(х), аппроксимирующей решение u.i°(x) - функцию цены в стационарной задаче, следующей итерационной процедурой:

ug(i) = 0, х е Л" (19)

и'0(х) = CUSliiif1)^), i - 0,..., m, m = в/А (20)

CUS2 = min min {AH(x,e~x^s) (21)

yeÖ(z,I<A) seD-(gh(,j))

дЫ- < e_AAs,y - X >}

Здесь gh&(y) = e~x&-gh(y) - нормированное значение вогнутой оболочки gh(y), D*gh(y) - супер дифференциал локальной вогнутой оболочки gh(y) для аппроксимации u'0~l(y), у е Ö(x,KA).

Доказывается сходимость итерационной процедуры в следующем утверждении.

Теорема 3 Существует функция в = 0(A) такая, что аппроксимация uff(-) (19),(20) равномерно сходится к функции w° : Rn -* R -обобщенному решению уравнения (13), когда А -> 0. При эТом для некоторого т е [¿о-. справедлива оценка

sup !|u;0(x) - u"(i)n < CAт/2 (22)

Числа С и 7 е (0,1) определяется из условия непрерывности по Гельдеру 9

Доказательство проводится построением вспомогательной расширенной системы, позволяющей при увеличении размерности задачи на единицу применить к ней конструкции, разработанные для задач с терминальным функционалом.

Аналогичный результат обосновывается для апрохошационных схем, базирующихся на конечно-разностных операторах с конструкциями локальных выпуклых оболочек.

Приведем конструкцию линейного конечно-разностного оператора LAS для стационарной задачи. Пусть задан шаг дискретизации Д интервала Г и моменты времени f,i+Д е Т. Предположим, что в момент времени i-f Д определена непрерывная по Липшицу (с постоянной Липшица L) функция х u(t+Д, х) = и{х), аппроксимирующая обобщенное решение х -* w(t+A,x). Значения функции х -* u(t,x) = v(x), аппроксимирующей решение х -+ w{t,x) в момент времени t, определяются как значения конечно-разностного оператора LAS следующим образом:

v{x) = LAS{t, Д, «)(i) = e~XAL(y) + Д H(t,x,e~**A), (23)

Здесь А - градиент линейной аппроксимации у -» L(y) итерационной функции у —► и(у) в окрестности 0(х, г А) точки х, v(x) - новое значение итерационной функции.

Вышеизложенные утверждения дают возмолсность обосновать применение конечно-разностного оператора с линейными конструкциями для аппроксимации функции цены в стационарной задаче с бесконечным горизонтом и доказать сходимость соответствующих итерационных процедур.

Теорема 4 Апрокашационная схема с конечно-разностным оператором и -> LAS(t, Д. и) сходится с оценкой сходимости Д7/2.

Доказательство проводится аналогично обоснованию теоремы (2)

В шестом параграфе оптимизируются конечно-разностные операторы с выпуклыми, вогнутыми оболочками и среднеквадратичными линейными аппроксимациями, учитывая расположение в заданной симметричной окрестности реальной области достижимости D(t,x,A) = {yeRn: y=x + Af(t,x,u,v), u е Р, veQ}.

В третьей главе предлагаются процедуры синтеза оптимальных управлений на основе метода экстремального прицеливания в направлении

обобщенных градиентов алпроксимационных функций цены для задач с терминальным условием и интегральным дисконтирующим функционалом. Функция цены аппроксимируется посредством конечно-разностных операторов для уравнения Гамильтона-Якоби, использующих конструкции суб- и супердифференциалов локальных выпуклых и вогнутых оболочек. Исследуется зависимость алпроксимационных шагов по фазовому пространству и временному интервалу для корректного применения метода экстремального сдвига. Обосновывается оптимальность синтезируемых управлении

В седьмом параграфе аппроксимационые решения, полученные для функции цены, используются для построения оптимальных управлений. Предлагается модификация метода экстремального сдвига в направлении обобщенных градиентов аппроксииационных функций цены.

Пусть

r = {t0 <ft < ...< tK = 0},

A = ti+l-ti, i = 0,1,...,/V-1

есть произвольное разбиение временного отрезка Т. Проведем анализ аппроксимационноп схемы с конечно-разностным оператором CU2 для разбиения Г отрезка Т. Напомним, что С^2-конечно-разност-ный оператор на локальных вогнутых оболочках для терминальной задачи

и(в,х) = а(х) (24)

u(thx) = CU2(ti, A,«(ii+i,-))(r) (25)

(U,x)i{ti+\:x) € Gr, ¿=0,...,iV-l

Определим значения позиционной стратегии U* = U*(t,x) по принципу экстремального прицеливания в направлении обобщенных градиентов - суперградиентов s* локальной вогнутой оболочки gh функции и

U* = U*(t,x)=argmm{<s*,B(t,x)u> (26)

s* =s*(t,x,y') =arg min (27)

seD'gh(y')

+gh(y*)-<s,y* -x>}

= arg min min { y€Ö{x,KA)s£D*gh(y)

+gh(y)-<s,y~x>}

y* =y*(t,x) =arg min min {&H(t,x,s)+ (28)

y€Ö(x,KA) sBD'gh(y)

Неухудшение оптимального гарантированного результата вдоль ап-проксимационных траекторий, порожденных позиционной стратегией U* (26), позволяет доказать следующий результат.

Теорема 5 Для любых разбиений Г, начальных позиций (io,£o) 11 произвольных возмущений t -> v(t) траектория х(-) , порожденная стратегией U* (26), удовлетворяет оценке

a(x(e))<u{t0,x0) (29)

Так как аппроксимационная схема (24), (25), порождающая функцию и, сходится к функции цены ю и оценка сходимости 10 составляет величину CA1/2,

то соотношение (29) влечет неравенство

о(х(в)) < u/fr,,х0) + CA!/2 (30)

Из последнего неравенства следует, что зафиксировав произвольное число е > 0, можно указать шаг А разбиения Г, обеспечивающий оценку

o(x(e))<w(t0,x0)+e (31)

Процедура построения оптимального позиционного управления U* = U*(x), х е Rn для задачи со стационарным уравнением Гамильтона-Яко би приведена в восьмом параграфе

U* = U*(x) — ar^rmnm^c{< s*,f(x,u,v) > + +g(x,u,v)} =argпшг{< s*,B(x)u > +

+ m|<s',C(i)D>+i(i,ii,i)))} (32)

s* = s*(x, у*) = arg min {AH(x, e~XAs)+ s€£>-(sM y))

+ е-ХАдкт(у*)-<е-Хйз,у*-х>} (33)

y* = y*(x) — arg min min {Д H(x,e~XAs)+

+ e-*Aghm{y)-<e-XAs,y-x>} (34)

Основным результатом этого параграфа является теорема, устанавливающая оптимальность позиционной стратегии U* = U*(x) (32).

10Тарасьев /V.M. Аппроксимационные схемы построения минимаксных решений уравнений Гамильтона-Якоби // Прикл. математика и механика. 1994. T.58, Вып.2. С. 22-36.

Теорема 6 Для любых разбиений Г, начальных позиций я произвольных возмущений т -» ь(г) траектория х(-), порожденная стратегией 1/* (32), удовлетворяет оценке

/(*(•), 1Г,»(•)) <^о) + САт/2 (35)

Зафиксировав произвольное число е > О, можно указать шаг А разбиения Г, обеспечивающий оценку

Цх№М-))<У>0Ы + е (36)

Реально аппроксимационные процедуры могут быть реализованы не в каждой точке рассматриваемой области, а только в узлах сетки пространственных переменных. Поэтому в девятом параграфе уделено внимание согласованию шагов аппроксимации фазового пространства /г и времени Д для корректной интерполяции узловых значений позиционных управлений, построенных экстремальным сдвигом в направлении обобщенных градиентов.

Рассмотрим равномерную прямоугольную-сетку £?#(£), £ е Г.

вЩг) = {х € В? :. (¿,:с)б£г, х = Е(т1е1 +--- + тпеп)рА} (37)

те,-=0,±1,±2,..., г' = 1,...,п е, =(е',...,е?), е\ = 1, е\ =0, г' = 1,...,гг, •Значения функции цены, будем определять только в узлах сеткп С/2(2) в аппроксимационной схеме с конечно-разностным оператором С?72, и линейно интерполировать для остальных точек пространства. С интерполяцией значений {/*(£, я) оптимальной стратегии дело обстоит сложнее. Это объясняется тем, что в общем случае линейная интерполяция не годится для аппроксимации разрывных стратегий. Для этой цели следует использовать кусочно-постоянные (копирующие) интерполяции

ис^,х)=и*(^у),у=у(х)=:агд ш \\х-г\\ (38)

Пусть параметр р сетки С#(г), < е Г является бесконечно малой величиной по сравнению с шагом разбиения Д

р = е(А), Нте(Д)=0 (39)

например,

р = ¿Л", а > 0, <1 > О (40)

т.е. шаг /г сетки <?Л(<) по фазовым переменным х, (г = 1,...,га) является бесконечно малой величиной

к = ¿Д1+а (41)

более высокого порядка малости, чем шаг Д разбиения Г временного интервата Т.

При таком отношении шагов для терминальной задачи справедливо утверждение, гарантирующее оптимальность стратегией IIе с кусочно-постоянной интерполяцией.

Теорема 7 Для любых разбиений Г, сеток С-Й(г), < е Г с параметрами р (40) высокого порядка малости, начальных позиций (Ц,хо)) и произвольных возмущении т -> ь(т) траектория х(-) , порожденная стратегией 1~с (38) с кусочно-постоянной интерполяцией, удовлетворяет оценке

ф(0))<и(*о,*о) + ?(Д) (42)

п1/2

9(Д) = (в - + ЬА)(1Аа, Нт = 0

Д—+о

и, следовательно,

с(х(9))<ш{10,х0) + САУЧ<р(^) (43)

Зафиксировав произвольное число е > 0, можно указать шаг Д разбиения Г, обеспечивающий оценку

а{х(в))<и>Ц о,х0) + £ (44)

Отметим, что эти результаты модифицируются также для построения узловых значений позиционных стратегий, их корректной интерполяции и доказательства оптимальности траектории в стационарной задачи с дисконтированием (9), (10).

Теорема 8 Для любых разбиений Г, сеток £?/?(*), ¿еГс параметрами (40) высокого порядка малости, начальных позиций х0 и произвольных возмущений т -* г/(г) траектория х('), порожденная стратегией 17е (38) с кусочно-постоянной интерполяцией, удовлетворяет оценке

Дх(-),ис, и(-)) < ш°(х0) + С(Д1/»+ д(д)д»)А/(£+1) (45)

ЩА) = ^-ё(2 + ЪЬА)

Зафиксировал произвольное число е > О, можно указать шаг Д разбиения Г, обеспечивающий оценку

^х(-),и^т(-))<юа(х0)+£ (46)

В четвертой главе исследуется сеточные схемы и конечно-разностные операторы при условии кваоивыпуклости аппроксимационных решений уравнения Гамильтона-Якоби. В общем случае аппроксимацп-онная схема требует сложных конечно-разностных конструкций, связанных с локальными вогнутыми (выпуклыми) оболочками и их дифференциалами. Решение проблемы корректной интерполяции узловых значений оптимального управления обеспечивается более высоким порядком малости шага аппроксимации пространственных переменных по сравнению с шагом по времени. В этой глазе исследуется случай квазивыпуклых аппроксимационных функций, при котором возможна линейная зависимость пространственно-временных шагов. Линейная зависимость существенно сокращает объем вычислений, упрощает конечно-разностные формулы и позволяет использовать простые операторы, основанные на конструкциях метода наименьших квадратов.

В десятом параграфе вводится свойство локальной квазивыпукло-стп аппроксимируемых функций.

Функции цены и ее аппроксимации в сеточных схемах предполагаются выпуклыми с точностью до бесконечно малой величины /¿Д1+ь, Ь > 0, ц > 0 в областях размера ¡/А,

£х-) +1*А1+ь > и(*, £а}х}) (47)

У=о 1=0

п

Ч > О, ] = 0,1,...,77, £<^=1

- Х)\\ < г/Д, гь^еЛ", к,1 = 0,1,...,п V = п1/2р+2К

При выполнении условия квазивыпуклости существенно упрощаются конечно-разностные формулы и, что особенно важно, становится возможным использовать линейную зависимость пространственно-временных шагов аппроксимации

Н - рА (48)

Здесь /т-фижсир о ванная константа.

Теорема 9 Пусть для разбиений Г я "нормальных" линейных сеток С7?, (48) аппроксимацяонная функция и^,у) является квазивыпуклой (47). Тоща для всех начальных позиций я произвольных воз-

мущений г -* и(т) траектория х(-) порожденная стратегией 17* (26) с линейной интерполяцией узловых значений, удовлетворяет оценкам

о(х(в))<и(^,х0) + ф(А) (49)

ф(А) <(в- ^)(цАь + Ьюп1/2ЬрА), 1|т<£(Д) = О

\и>^0,х0)~и(10,х0)\<СА^2 (50)

Зафиксировав произвольное число е > 0, можно указать шаг А разбиения Г и "нормальную" линейную сетку ОН (48), обеспечивающие оценку (30)).

В одиннадцатом параграфе используются результаты, полученные при условии выполнения свойства квазивыпуклости в терминальной задаче, для обосновании свойств оптимальности траекторий в задаче с интегральным фунционалом и бесконечным временным горизонтом.

Теорема 10 Пусть для "нормальных" линейных сеток О! итерационные функции и'£(у) обладают свойствами квазивыпуклости (47). Тогда для всех начальных позиций х0 и произвольных возмущений т —»и(т) траектория х(-) , порожденная стратегией и* (32) с линейной интерполяцией узловых значений, удовлетворяет оценкам

3(х(в), 1Т\ «/(•)) < г^(^о) + д(^Аь + е^"^Д) + ^е~хв <

<и£(г0) + ВД7*, 9 = тА (51)

\ю°(х0) - «дЫ1 < С А^ (52)

Зафиксировав произвольное число е > 0, можно указать шаг А, "нормальную" линейную сетку йВ. (48) и итерацию тп, обеспечивающие оценку (36).

В пятой главе представлен ряд моделей эволюционных игр и проведены вычислительные эксперименты. Приведем краткое описание рассматриваемых управляемых динамических систем. В двенадцатом параграфе рассматривается модель, динамика которой описывается управляемыми уравнениями Колмогорова. Задача представляет собой эволюционную 2 х 2-игру двух коалиций с ненулевой суммой. Предполагается, что в качестве коалиций выступают "Продавцы" и "Покупатели", взаимодействующие на товарном рынке.

Полагаем, что "Продавцы" в каждый момент времени могут придерживаться одной из двух стратегий: либо продавать товары по низкой цене, либо по высокой. Пусть х (0 < х > 1) - величина, отражающая вероятность того, что "Продавец" придерживается первой стратегии ("Продавать по высокой цене"), соответственно 1 - х - вероятность выбора второй стратегии ("Продавать по нпзкой цене").

Для второй коалиции "Покупателей" определим также множество из двух стратегий: "Покупать товар" и "Не покупать товар". Тогда величина у (0 < у > 1) выражает вероятность покупки товара, (1-у) - вероятность того, что товар не будет куплен.

Динамика выбора стратегий описывается дифференциальными уравнениями

х = -х + и, 0 < и < 1 У = 0 < г; < 1

Здесь параметры «и« - управляющие сигналы, предлагающие участникам игры сменить стратегии.

Условная модель борьбы за рынки сбыта представлена в тринадцатом параграфе. В этой модели параметр х задает относительную часть капиталовложений первой коалиции, вкладываемую в первый рынок, 0 < х < 1, (1 - х) - относительная часть капиталовложений первой коалиции во втором рынке, у - относительная часть капиталовложений второй коалиции в первом рынке, 0 < у < 1, (!• - у) -относительная часть капиталовложений второй коалиции во втором рынке.

Система, описывающая динамику капиталовложений, моделируется

уравнениями

х = рх( 1 - х)(Сау - ai) + (1 -р)(-х + "), О < u < 1, 0<Î><1 У = ЯУО- ~ У)(Сьх ~ fa) + (1 - q){-y + О < t; < 1, О < g < 1

Скорость изменения капиталовложений первой коалиции х формируется по двум принципам. Предположим, что имеется группа фирм в коалиции (их относительный вес р, 0 <р < 1), действующих исходя из критерия получения наибольшей текущей прибыли да(х,у). Поведение этой группы условно описывается значением частной производной dga/dx — Cay-cti. Скорость вложения капитала этой группы задается первым слагаемым в первом уравнении п.

Второе слагаемое (1 -p)(-a;-f и) описывает скорость вложения той части фирм 1 -р, которые придерживаются управляющего сигнала и(-) от координирующего центра.

Во втором уравнении правая часть описывает скорость капиталовложений второй коалиции и интерпретируется аналогично при параметре q, 0 < q < 1.

Заключает серию экспериментов управляемая репликаторнная модель в четырнадцатом параграфе.

В биологических процессах эволюция взаимодействия двух популяций развивается в соответствии с процессом накопления опыта в повторяющихся ситуациях, где каждый участник действует по одному из двух возможных для его популяции вариантов поведения. Пусть х -относительная часть первой популяции, придерживающаяся в данный момент времени первого варианта поведения (стратегии), 0 < х < 1, (1-х) - второго варианта. Параметр у, (1 - у) имеет аналогичную интерпретацию для второй популяции.

В классической теории эволюционных игр процесс моделируется ре-пликаторной динамикой 11

х = х(1-х)(Сау-а1), (53)

y = y(l-y)(Cbx-P2)

"Hofbauer J. and Sigmund К., The Theory of Evolution and Dynamic Systems, Cambrige: Cambrige University Press, 1988.

в которой скорости изменения групп, разыгрывающих разные стратегии в одной популяции, линейно связаны с выигрышами популяций

= (54)

Отметим, что анализ произвольной эволюционной системы с гладкой динамикой, в том числе и репликаторной (53), проведен в 12.

В диссертации предлагается исследовать динамическую игровую постановку, в которой управляющие стратегии могут быть разрывными функциями от позиции.

Предположим, что скорости и, v изменения структуры популяций являются управляющими параметрами

х = л:(1 - х)и, . (55)

У = у(1 - у)«

и ограничения на и, v связаны с-репликаторной динамикой (53) и € Р, Р — [min{Q,Ca} - ai,max{0,Ca} - <*i]

V € Q, Q = [min{0,Cj} - ßi,mzx{0,Cb} -ßi]

В вышерассмогренных играх ставится задача построения оптимальных гарантирующих стратегий и равновесных по Ношу траекторий, порожденных этими стратегиями.

Выигрышы коалиций определяются интегральными функционалами (2), (3).

Для решения эволюционных игр применены методы, изложенные в диссертации. Результаты вычислительных экспериментов показывают, конструктивность и эффективность, предложенных алгоритмов, уточняют теоритические оценки и позволяют исследовать результаты взаимодействия коалиций во времени.

Отметим важный результат моделирования. В случае неантагонистичности интересов коалиций оптимальные траектории сходятся к

1гКряжимский A.B., Осипов Ю.С. О эволюционно-дифференциальных играх // Т^уды МИРАН им. В.А. Стек.това. 1995. Т. 211. С. 257-287

точкам Нэшевского равновесия:. При выраженном антагонизме равновесные траектории не сходятся к точкам Нэшевского равновесия, и не циркулируют в их окрестностях, а устремляются к точкам динамического равновесия.

Значения функционалов Ja, Jb, выражающих глобальные интересы коалиций, на приемлемой траектории (хс(-), Уе(-)), лучше, чем значения функционалов •/„• вычисленных на траектории [х(-),у(•)), стартовавшей из той же начальной позиции, но сходящейся к точке статического равновесия по Нэшу.

Кроме того, проиллюстрировала слабая зависимость линий переключения от вариации коэффициента дисконтирования Л.

ЗАКЛЮЧЕНИЕ

В диссертации

1 .Разработан конечно- разностный оператор для аппроксимации уравнения Гамильтона - Якоби на базе градиентов локальных п-мерных плоскостей.

2.Предложены алгоритмы численного построения оптимальных по Нэшу решений эволюционных игр.

3.Построены модели эволюционных игр с различными динамикой. Выполнено моделирование равновесных траекторий и исследован характер их поведения.

ПУБЛИКАЦИИ ОСНОВНЫХ РЕЗУЛЬТАТОВ

Мельникова Н.В., Тарасьев A.M. Градиенты локальных линейных оболочек в конечно-разностных операторах для уравнений Гамильтона-Якоои // Прикл. математика и механика. 1997. Т.61, Вып. 3. С. 422431.

Мельникова Н.В., Тарасьев A.M. Синтез оптимального гарантированного управления в сеточных аппроксимационных схемах // Прикл. математика и механика. 1997. Т.61, Вып. 4. С. 570-583.

Мельникова Н.В., Тарасьев A.M. Оптимальный синтез в сеточных схемах для квазивыпуклых апроксимационных функций// Прикл. математика и механика. 1998. Т.62, Вып. 4. С. 576-585.

Мельникова Н.В. Синтез равновесных стратегий в теории игр на основе обобщенных решений уранений Гамильтона-Якоби// Международная научная конференция "Дифференциальные и интегральные уравнения". Челябинск 1999г.: Тез. докл.-Челябинск, 1999.-С.80.

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Мельникова, Наталья Венедиктовна

Уравнения Гамильтона-Якоби в задачах эволюционных дифференциальных игр

1 Постановки задач теории эволюционных и дифференциальных игр

2 Терминальная и стационарная задачи для уравнений типа Гамильтона-Якоби

Конечно-разностные операторы для уравнения Гамильтона-Якоби

3 Выпуклые, вогнутые оболочки и п-мерные плоскости кусочно-линейных функций

4 Среднеквадратичные конструкции в конечных разностях

5 Модификация линейного оператора для стационарной задачи.

6 Операторы на несимметричных областях достижимости.

Синтез оптимального управления при пространственно-временной дискретизации задачи

7 Оптимальные процедуры управления

8 Синтез стационарных стратегий

9 Соотношения между шагами аппроксимаци-онной сеточной схемы.

4 Квазивыпуклые аппроксимационные схемы

10 Оптимальный синтез для квазивыпуклых аппроксимационных функций.

11 Дифференциальная игра с дисконтированием

5 Динамические модели и вычислительные эксперименты

12 Управляемые уравнения Колмогорова

13 Динамика неоднородных коалиций

14 Управляемая репликаторная модель.

 
Введение диссертация по математике, на тему "Исследование эволюционных игр в рамках теории обобщенных решений уравнений Гамильтона-Якоби"

Диссертационная работа посвящена разработке вычислительных методов построения равновесных стратегий управления в эволюционных играх. Теория эволюционных игр является активно исследуемым направлением прикладной математики. Создание этой теории было вызвано актуальностью выявления закономерностей развития и возможностей управления в экономических, социологических, биологических системах.

Развитие теории эволюционных игр тесно связано с такими направлениями как дифференциальные игры, оптимальное управление, математическое програмирование, негладкий и выпуклый анализ.

Становление теории дифференциальных игр относится к началу 60-х годов и связано с именами российских и зарубежных математиков H.H. Красовского, JI.C. Понтря-гина, Р. Айзекса, У. Флеминга. В качестве решения эволюционной игры в диссертации рассматривается совокупность позиционных управлений, ориентированных на гарантированную оптимизацию выигрышей -«- один из классических подходов теории дифференциальных игр. Равновесные управления конструируются на основе решений вспомогательных задач гарантированого управления. Базисным элементом решения этих задач является функция цены, для построения которой применяются сеточные схемы аппроксимации обобщенных решений уравнений Гамильто-на-Якоби. В этом аспекте материал диссертации опирается на результаты теории уравнений Гамильтона-Якоби, разработанных в работах А.И. Субботина для обобщенных минимаксных решений. Используются также конструкции вязкостных решений, предложенных в работах М.Дж. Крэндалла, П.-JI. Лионса. В частности, особое внимание уделяется конечно-разностным операторам. Аппро-ксимационные решения сеточных схем (аппроксимацион-ные функции цены) и информация об их обобщенных градиентах позволяют строить гарантированные управления методом экстремального сдвига, предложенным в работах H.H. Красовского. Равновесные решения (динамические равновесия по Нэшу) синтезируются на базе построенных гарантированных управлений в рамках конструкции, разработанной А.Ф. Клейменовым.

Основные целями работы являются.

1. Разработка и обоснование конструкций для эффективного вычисления позиционных управлений, реализующих динамическое рановесие по Нэшу в эволюционных играх.

2. Построение конечно-разностных операторов со среднеквадратичными градиентами, повышающих эффективность процесса вычисления фунции цены и оптимальных гарантированных управлений.

3. Синтезирование равновесных траекторий и исследование их свойств.

Теоретическая и практическая ценность.

Изложенные в диссертации методы носят конструктивный характер и применимы к достаточно широкому кругу задач. Предлагаемые конструкции и процедуры могут быть положены в основу разработки эффективных алгоритмов и программ, реализуемых на ЭВМ и позволяющих не только прогнозировать эволюционный процесс, но и вносить управляющие коррективы для достижения определенных параметров.

Диссертация состоит из введения и пяти глав. Нумерация параграфов сквозная. Список литературы включает 84 наименования. Объем работы составляет 116 страниц машинописного текста.

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Мельникова, Наталья Венедиктовна, Екатеринбург

1. Адиатулина P.A., Тарасьев A.M. Дифференциальная игра неограниченной продолжительности // Прикл. математика и механика. 1987. Т. 51, Вып. 4. С. 531537.

2. Адиатулина P.A., Тарасьев A.M. Функция цены в дифференциальной игре неограниченной продолжительности //В сб.¡Позиционное управление с гарантированным результатом. УрО АН СССР. 1988. С. 4-13.

3. Айзеке Р. Дифференциальные игры. М.: Мир, 1967. 479 с.

4. Акуленко Л.Д. Асимптотические методы оптимального управления. М.: Наука, 1987. 366 с.

5. Альбрехт Э.Г., Мухтаров М. О формировании программных оптимальных управлений в одной иерха-рической игре// Синтез оптимальных управлений в игровых системах. Свердловск. УНЦ АН СССР. 1985. С. 3-15.

6. Арнольд В.И. Математические методы классической механики. М.: Наука, 1979. 432 с.

7. Байдосов В.А. Отображения, сопряженные к многозначным отображениям, и их применение к обобщенным динамическим играм // Докл. АН СССР. 1987. Т. 297. No. 5 С. 1033-1036.

8. Батухтин В.Д. Об одном подходе к решению разрывных экстремальных задач // Изв. АН. Техн. кибернетика. 1994. No. 3. С. 37-46.

9. Батухтин В.Д., Майборода JI.A. Оптимизация разрывных Функций. М.: Наука, 1984. 208 с.

10. Беллман Р. Динамическое программирование. М.: ИЛ, 1960. 400 с.

11. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. М.: Мир, 1972. 544 с.

12. Воробьев H.H. Теория игр для экономистов-кибернетиков. М.гНаука, 1985. 272 с.

13. Сборник переводов под ред. Воробьева H.H. Матричные игры. М.: Государственное издательство физико-математической литературы, 1961. 280 с.

14. Григоренко Н.Л. К задаче группового иследования// Тр. МИАН СССР. 1988. Т 185. С. 66-73.

15. Жуковский В.И., Чикрий A.A. Линейно-квадратичньй; дифференциальные игры. Киев: Нау-кова думка, 1994. 320 с.

16. Зеликин М.И. Об одной дифференциальной игре с неполной информацией // Докл. АН СССР. 1972. Т. 202. No. 5 С. 998-1000.

17. ГарнышеваГ.Г., Субботин А.И. Стратегии минимаксного прицеливания в направлении квазиградиента // Прикл. матем. и мех. 1994. Т. 58, Вып. 4. С. 5-11.

18. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988. 280 с.

19. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. ЕкатеринбурггНаука, 1993. 185 с.

20. Красовский А.Н. Дифференциальная игра для позиционного функционала // Докл. АН СССР. 1980. Т. 253. No. 6. С. 1303-1307.

21. Красовский А.Н. Построение смешанных стратегий на основе стохастических программ // Прикл. матем. и мех. 1981. Т. 45, Вып 4. С. 579-586.

22. Красовский H.H. Теория управления движением. М.: Наука, 1968. 475 с.

23. Красовский H.H. Игровые задачи о встрече движений. М.: Наука, 1970. 420 с.

24. Красовский H.H. Управление динамической системой. М.: Наука, 1985. 518 с.

25. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М: Наука, 1974. 456 с.

26. Красовский H.H. Об одной задаче преследования // Прикл. матем. и мех. 1963. Т. 27, Вып. 2. С. 244-254.

27. Красовский H.H. К задаче о преследовании в случае линейных однотипных объектов // Прикл. матем. и мех. 1966. Т. 30, Вып. 2. С. 209-225.

28. Красовский H.H. Минимаксное поглощение в игре сближения // Прикл. матем. и мех. 1971. Т. 3 , Вып. 6. С. 945-951.

29. Красовский H.H. Дифференциальные игры. Аппрок-симационные и формальные модели // Мат. сб. 1978. Т. 107. No. 4. С. 795-822.

30. Красовский H.H., Решетова Т.Н. О программном синтезе гарантирующего управления // Проблемы управления и теории информации. 1988. Т. 17. No. 6. С.1-11.

31. Красовский H.H., Третьяков В.Е. Стохастический программный синтез для позиционной дифференциальной игры // Докл. АН СССР. 1981. т. 259 N. 1. С. 24-27.

32. Кряжимский A.B., Осипов Ю.С. О эволюционно-дифференциальных играх // Труды МИР АН им. В. А. Стеклова. 1995. Т. 211. С. 257-287

33. Кряжимский A.B., Осипов Ю.С. О моделировании управления в линейной динамической системе // Изв. АН СССР. Техн. кибернетика. 1983. No. 2. С. 51-60.

34. Куржанский A.B., Никонов О.И. К задаче синтеза стратегий управления. Эволюционные уравнения и многозначное интегрирование // Докл. АН СССР. 1990. Т. 311 No. 4. С. 788-793.

35. Куржанский A.B., Филиппова Т.Ф. Об описании множества выживающих траекторий дифференциального включения // Докл. АН СССР. 1986. Т. 289 No. 1. С. 38-41.

36. Лейтман Дж. Введение в теорию оптимального управления. М: Наука, 1968. 190 с.

37. Логинов М.И. Об одном способе экстремального управления// Прикл. матем. и мех. 1982. Т. 46, Вып. 6. С. 893-899.

38. Меликян A.A. Необходимые условия оптимальности на поверхности разрыва одного типа в дифференциальной игре // Изв. АН СССР. Техн. кибернетика. 1981. No. 4. С. 10-18.

39. Мищенко Е.Ф. Задачи преследования и уклонения от встречи в теории дифференциальных игр // Изв. АН СССР. Техн. кибернетика. 1971. No. 5. С. 3-9.

40. Мельникова Н.В., Тарасьев А.М. Градиенты локальных линейных оболочек в конечно-разностных операторах для уравнений Гамильтона-Лкоби // Прикл. математика и механика. 1997. Т.61, Вып. 3. С. 422431.

41. Мельникова Н.В., Тарасьев А.М. Синтез оптимального гарантированного управления в сеточных аппроксимационных схемах // Прикл. математика и механика. 1997. Т.61, Вып. 4. С. 570-583.

42. Никольский М.С. О гарантированных оценках в дифференциальных играх с векторным критерием качества и фиксированным временем// Изв. АН СССР. Техн. кибернетика. 1980. N0. 2. С. 37-43.

43. Понтрягин Л.С. О линейных дифференциальных играх // Докл. АН СССР. 1967. Т. 174. N0.6. С. 12781280. // Докл. АН СССР. 1967. Т. 175. N. 4. С. 764766.

44. Понтрягин Л.С. Математическая теория оптимальных процессов и дифференциальные игры // Тр. МИАН СССР. 1985. Т. 169. С. 119-157.

45. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М: Наука, 1976. 392 с.

46. Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. М: Наука, 1980. 319 с.

47. Пшеничный Б.Н. Структура дифференциальных игр // Докл. АН СССР. 1969. Т. 184. N0. 2. С. 285-287.

48. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. 469 с.

49. Субботин А.И. Обобщение оснозного уравнения теории дифференциальных игр // Докл. АН СССР. 1980. Т. 254. No. 2. С. 293-297.

50. Субботин А.И. Об одном свойстве субдифференциала // Мат. сб. 1991. Т. 182. No. 9. С. 1315-1330.

51. Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Лкоби. М.:Наука, 1991. 215 с.

52. Субботин А.И. Ченцов А.Г. Оптимизации гарантии в задачах управления. М.:Наука, 1981. 288 с.

53. Субботин А.И. Обобщение основного уравнения теории дифференциальных игр // Докл. АН СССР. 1980. Т. 254. No. 2. С. 293-297.

54. Субботин А.И. Об одном свойстве субдифференциала // Мат. сб. 1991. Т. 182. No. 9. С. 1315-1330.

55. Субботин А.И., Субботина H.H. Необходимые и достаточные условия для кусочно-гладкой цены дифференциальной игры // Докл. АН СССР. 1978. Т. 243. No. 4. С. 829-865.

56. Субботин А.И., Субботина H.H. Свойства потенциала дифференциальной игры // Прикл. матем. и мех. 1982. Т. 46, Вып. 2. С. 204-211.

57. Субботин А.И., Субботина H.H. Кусочно-гладкие решения уравнений с частными производными первого порядка // Докл. АН. 1993. Т. 333. No. 6. С. 705-707.

58. Субботин А.И., Тарасьев A.M. Сопряженные производные функции цены дифференциальной игры // Докл. АН СССР. 1985. Т. 283. No. 3. С. 559-564.

59. Субботин А.И., Тарасьев A.M., Ушаков В.Н. Обобщенные характеристики уравнений Гамильтона-Яко-би // Изв. АН. Техн. кибернетика. 1993. No. 1. С. 190-197.

60. Субботин А.И., Шагалова Л.Г. Кусочно-линейное решение задачи Коши для уравнений Гамильтона-Яко-би // Докл. АН. 1992. Т. 325. No. 5. С. 932-936.

61. Субботин H.H. Метод характеристик Коши и обобщенные решения уравнений Гамильтон а-Якоби-Беллмана // Докл. АН. СССР. 1991. Т. 320. No. 3. С. 556-561.

62. Тарасьев A.M. Аппроксимационные схемы построения минимаксных решений уравнений Гамильтона-Якоби // Прикл. математика и механика. 1994. Т.58, Вып.2. С. 22-36.

63. Тарасьев A.M. Неравенства для сопряженных производных кусочно-гладкой функции цены //В сб.: Управление с гарантированным результатом. Свердловск. УНЦ АН СССР. 1987. С. 86-91.

64. Тарасьев A.M. Решение эволюционных игр в рамках теории уравнений Гамильтона-Якоби // Прикл. математика и механика. 1995. Т.59, Вып. 6. С. 965-978.

65. Тарасьев А.М., Ушаков В.Н. Об одном вычислительном алгоритме решения игровых задач управления // Прикл. математика и механика. 1987. Т.51, Вып. 2. С. 219-222.

66. Тарасьев А.М., Успенский A.A., Ушаков В.Н. Конечно-разностный метод построения функции оптимального гарантированного результата // Сборник избранных докладов. Гагаринские научные чтения. Москва. 1991. С. 166-172.

67. Тарасьев А.М., Успенский A.A., Ушаков В.Н. Аппро-ксимационные схемы и конечно-разностные операторы для построения обобщенных решений уравнений Гамильтона-Якоби // Изв. РАН. Техн. Кибернетика. 1994. No. 3. С. 173-185.

68. Третьяков В.Е. К теории стохастических дифференциальных игр// Докл. АН. СССР. 1983. Т. 269. No. 3. С. 1049-1053.

69. Ченцов А.Г. Об условиях стабильности дифференциальной игры// Докл. АН. СССР. 1974. Т. 215. No. 4. С. 800-803.

70. Ченцов А.Г. Цена дифференциальной игры с обобщенной платой// Докл. АН. СССР. 1977. Т. 237. No. 1. С. 41-43.

71. Ченоусько Ф.Л. Меликян A.A. Игровые задачи управления и поиска. М.:Наука, 1978. 270 с.

72. Ушаков В.Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения // Изв. АН СССР. Техн. Кибернетика. 1980, No 4. С. 29-36.

73. Шориков А.Ф. Минимаксные фильтры для оценивания состояний нелинейных дискретных систем / / Автоматика и телемеханика. 1991, No 4. С. 112-122.

74. Bardi М., Falcone М. An Approximation Scheme for the Minimax Time Function // SIAM J. Control Optimiz. 1990. Vol. 28. No. 4. P. 950-965.

75. Bardi M., Osher S. The nonconvex multi-dimensional Riemann problem for Hamilton-Jacobi equations // SIAM J. Math. Anal. 1991. V. 22. No. 2. P. 344-351.

76. Crandall M.G., Lions P.-L. Viscosity solutions of Hamilton-Jacobi equations // Trans. Amer. Math. Soc.1983. Vol. 277. No. 1. P. 1-42.

77. Crandall M.G., Lions P.-L. Two approximations of solutions of Hamilton-Jacobi equations // Math. Com put.1984. Vol. 43. No. 167. P. 1-19.

78. Dolcheta I.C. On a discrete approximation of Hamilton-Jacobi equation of dynamic programming // Appl. Math. Optimiz. 1983. V. 10. No. 4. P. 367-377.

79. Fleming W.H. The convergence problem for differential games // Math. Anal. Appl. 1961. Vol. 3. No. 1. P. 102116.

80. Hofbauer J. and Sigmund K., The Theory of Evolution and Dynamic Systems, Cambrige: Cambrige University Press, 1988.

81. Krasovskii A.N., Krasovskii N.N. Control under Lack of "Information, Birkhauser, Boston, 1995.

82. Kryazhimskii A.V. Behavioral equilibria for a 2x2-" Seller-Buyer" game evolutionary model // Working paper. WP-94-131. IIASA. Laxenburg. 1994. 25 p.

83. Lax P.D. Weak solutions of nonlinear hyperbolic equations and their numerical computation // Comm. Pure Appl. Math. 1954. V. 7. No. 1. P. 159-193.

84. Souganidis P.E. Approximation schemes for viscosity solutions of Hamilton-Jacobi equations // J. Different. Equat. 1985. Vol. 59. No. 1. P. 1-43.

85. Tarasyev A.M. A differential model for a 2 X 2-evolutionary games dynamics // Working paper. WP-94-63. IIASA. Laxenburg. 1994. 32 p.

86. III111IIIIIIIIIIII111. 11IIIIIIII0 О.ЙО 1.00 1.20фиг. 19Траектория ТЯ. сгенерированная позитивным управлением v [Э]-линии переключения и2° 1 т Матрицы А=С1, В=СЗ. 1Р=(0.2Д1)1,00 -Е0,80 -Е

87. ГГТГГТ ГГ1ТГГ^Г'ГГ>"| | ГГГГГТГТ177 Г|^ГГ)"?У7 ГГ1)Г1ТГГ |1| 111111111о.бо 0.20 0.4-0 оАо О.ЙО 1.00 1.20Хд хвфиг. 20ЛвПозитивное управлениефиг. 21Траектория Т(*. сгенерированная позитивным управлениемфиг. 22