Асимптотические методы решения дифференциальных игр N лиц с непротивоположными интересами тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Аль-Хйассат, Халед
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Одесса
МЕСТО ЗАЩИТЫ
|
||||
1994
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
МИНИСТЕРСТВО ОБРАЗОВАНИЯ УКРАИНЫ ОДЕССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. И.И. МЕЧНИКОВА
Гг: од
на правах рукописи
5 0 ^
АЛЬ - ХЙАССАТ ХАЛЕД
Асимптотические методы решения дифференциальных игр N лиц с непротивоположными интересами
01.01.02 Дифференциальные уравнения
АВТОРЕФЕРАТ
ДИССЕРТАЦИИ НА СОИСКАНИЕ УЧЕНОЙ СТЕПЕНИ КАНДИДАТА ФИЗИКО-МАТЕМАТИЧЕСКИХ НАУК
Одесса 1994
Диссертация является рукописью. /
Работа выполнена в Одесском государственном университете им. И.И.Мечникова •
доктор физико-математических наук,профессор ПЛОТНИКОВ В.А.
доктор физико-математических наук,дрофессор ЖУКОВСКИЙ В.Й.
кандидат физико-математических наук,доцент КЖМЧУК С.С. Киевский государственный университет им. Т.Г.Шевченко
Защита состоится "\~Y " июня 1994 года на заседании специализированного ученого совета К 05-01.02 по физико-математическим наукам в Одесском государственном университете /270100,Одесса, ул.Петра Великого 2 / & \ 5Г00
С диссертацией можно ознакомится в библиотеке Одесского государственного университета / 270100, Одесса, ул. Советской армии 24 /
I Ч"
Автореферат разослан »»—* » мая 1994г.
Научный руководитель:
Официальные оппоненты:
Ведущая организация
Ученый секретарь
специализированного ученого совета
Третьяк А.И.
Актуальность темы. Исследование многих задач экономики, механики и исследования операций требует учета наличия нескольких управляемых систем, изменяющихся во времени и взаимосвязанных мекду собой, цели которых различны. При этом указанные задачи составляют предает исследования теории дифференциальных игр нескольких лиц.
Первые работы по теории дифференциальных игр появились практически одновременно с исследованиями по теории оптимального управления и затем круг рассматриваемых задач все время расширялся. В работах Л.С.Понтрягина, Н.Н.Красовского, В.И.Жуковского, А.Б.Куржаяского, Ю.С.Осипова, Л.А.ГГетросяна, Б.Н.Пшенич-ного, R.Isaacs, R.Bellman были получены принципиальные результаты теории дифференциальных игр. Существенное влияние на развитие данных исследований оказали работы по общей теории игр Н.Н.Воробьева, Ю.Б.Гермейера, Н.Н.Моисеева, J.E.Nash, V.Pareto.
В последние годы широкое распространение в нелинейных системах получил метод усреднения. Большую роль в разработке метода усреднения для все более широкого класса уравнений сыграли работы Н.М.Крылова, Н.Н.Боголюбова, Ю.А.Митропольского, А.М.Самойленко, В.М.Волосова, Н.А.Перестюка, В.А.Плотникова, А.Н.Филатова, М.М.Хапаева.
I
Впервые метод усреднения в задаче оптимального управления . применен в работах Н.И.Моисеева. Первоначально для асимптотического исследования задач оптимального управления применялся подход, основанный на построении асимтотического решения краевых задач, полученных с помощью необходимых условий оптимальности.
В работах В.А.Плотникова впервые бил предложен подход, ос-
- * -
нованный на непосредственном применении асимптотических методов
к уравнениям управляемого движения.
■ В диссертационной работе данный подход распространяется на
задачи оптимального управления с импульсными воздействиями и дифференциальные игры N лиц.
Дифференциальные уравнения с импульсным воздействием возникают как математические модели процессов, подверженных: кратковременному внешнему воздействию. Такие явления с "мгновенным" изменением состояния системы можно наблюдать в механике, электронной технике, в теории автоматического регулирования.
Существенные результаты в развитии теории дифференциальных уравнений с импульсными воздействиями получены в работах А.Д.Мышкиса, А.М.Самойленко , Н.А.ПерестюкЬ, Д.Байнова.
Цель работы. Построение и обоснование схем непосредственного усреднения уравнений управляемого движения в задаче оптимального управления и дифференциальных игр N лиц с непротиво-положныш интересами для непрерывных и импульсных систем.
Метода исследования. В диссертации используются методы усреднения дифференциальных уравнений: и включений, теория дифференциальных уравнений с импульсным воздействием, теория оптимального управления и теория дифференциальных игр N лиц.
Научная новизна работы. Основные результаты диссертационной работы являются новыми и состоят в следующем:
- построены и обоснованы схемы метода усреднения уравнений управляемого движения с импульсным воздействием;
- построены и обоснованы схемы метода усреднения для неантагонистических игр У лиц, динамика движений в которых описывается
линейными непрерывными и импульсными системами с квадратичными функциями выигрыша;
- построены-и обоснованы схемы метода усреднения для нелинейных терминальных неантагонистических; игр № лиц с непрерывными и импульсными управлениями движения.
Теоретическая и практическая ценность. Полученные в работе результаты могут быть использованы для дальнейшего развития метода усреднения в системах с импульсными воздействиями, теории оптимального управления и дифференциальных бескоалиционных игр N лиц.
Результаты работы могут найти применение при решении ряда прикладных задач, возникающих при изучении колебательных управляемых систем, подверженных кратковременным возмущениям импульсного типа.
АштроСяция работы. Основные результаты диссертации докладывались на семинаре по теории оптиального управления в Одесском государственном университете им.М.И.Мечникова (руководитель проф.Плотников В.А.); на Весенней Воронежской математической школе "Понтрягинские чтения - 17". Воронеж, 1993; на межгосударственной научной конференции "Динамические системы: устойчивость, управление, оптимизация". Минск, 1993; на II международном коллоквиуме по численному анализу. Пловдив: НРБ, 1993; на IV международном коллоквиуме по дифференциальным уравнениям. Пловдив: НРБ, 1993.).
Структура и объем работы. Диссертация состоит из введения, трех глав, списка литературы из 78 наименований и содержит 88 страниц машинописного текста.
СОДЕРЖАНИЕ РАБОТЫ Во введении обсуждается актуальность исследуемой в работе проблематики, формулируются задачи исследования, дается краткий обзор литературы по теме диссертации, приводится аннотация полученных результатов.
В первой главе предлагаются и обосновываются различные схемы полного и частичного усреднения линейных уравнений управляемого движения с импульсными воздействиями.
В § 1 дается постановка задачи оптимального управления
системой дифференциальных уравнений с импульсным воздействием в фиксированные моменты времени и приводятся основные обозначения.
В § 2 рассматривается линейная задача управления с импульсными воздействиями
х = с{А(г)т + ви)и(г)], Гк <г< г(0) = хо, к = 577? (1)
Дг
= e[Ckx(tk-0) + DuwJ, fe = 1 ,N, (2)
tMtk
а функционал имеет вид
J = <b(x(T)). (3)
Предположим, что выполнены следующие Условия А:
1) матрицы A(t), B(t) - ограниченные постоянной М, измеримые
2л-периодические по t функции, С, = С,, £>, = D,,
j »р j i+p j
t = tj + 2Я, p - некоторое целое число, u(t)« Ue сстр(й"),
!i/k€ We ccmp(Rk),complR*) - пространство непустых компактных
подмножеств пространства fik.
Системе уравнений (1),(2) ставится в соответствие следу-
ющая усредненная Система 1.
- А + 2,' 5(0) = *„,
(4)
>2* < Л
где Г = а, А = 1Г Л(г)сн, ге I = V + (7, V = В{т&, о о
5 = 2Г Е V' С°=ЯГ * С, А° = А + Сс с о*». <ак с
Система 2.
-Ц- = е + и), t * 2Пк, к = 0,1,..-, 5(0) = хп.
¿5
ЬаЯК I
= С
где ие V, б(€ б. Система 3.
= £ / С * 2ПЙ, й = 0,1,..., 5(0) = х0.
А?
Система 4.
е е г,
= о, г * 2*й, й = о,1..... 5(0) = Х„,
Л5
Ъ «2!Г1< к
= с 5(£к-о) + 2 €
(5)
(6)
(7) (3)
(9) (10)
Система(9), (10) является дискретной системой управления, т.е.
= ^ + £ «и =х0, Й = 0,1,
(11)
Минимизируемый функционал для усредненных систем имеет вид
? = (12) Каждому управлению гШ системы 1 будем ставить в соответствие управление u(t) и используя следующий
Алгоритм 1: 1. Вычисляем точки
. 2К<1*1>
2=5=-/ гЩйХ, I = 0,1,... (13)
* 2*1
2. Находим векторы и^ такие, что г^ = vi+
3- Строим управление и(Г) = { 2Ш зг <2я(£+1) >, где
и( (Г) определяются из условия
1 2ХС1+1)
I В(С)и( = и( (14)
2Я1
4. Находим векторы li^J из условия
2Г I О гу = а . (15)
акии 1*1) 1 1
В системах 2-4 используется аналогичный алгоритм.
Теорема 1. Пусть выполнены условия А и управление и(г)
и векторы шк в системе (1), (2) соответствуют управлению £)
системы (4) согласно алгоритму 1, а х(0 и - траектории
систем (1), (2) и (4), пороаденные управлениями ( и(1), и>к >
и соответственно.
Тогда для любого Ъ >0 можно указать такие С(I, го) > 0 и
е0(1,г0) >0, что для всех ее (0,ео1 и te [0,1"] выполняется неравенство
и х(г) - II 5 Се, . (16)
если х(0) = ?(0) = ха.
Обозначим через Г, с) множество досишшости для системы (1), (2), а через Я - множество достижимости системы С. Из теоремы следует, что Мй(1,е), Я (еО) « Се. Из оценки (1б) следует применимость алгоритма 1 для решения терминальной задачи оптимального управления (1), (2), (3). Так как для множеств достижимости справедлива оценка (1б),то в случае лишпицевости функции Ф(г) аналогичная оценка справедлива
для оптимальных значений критериев Л* и
В § 3 рассматривается линейная непериодическая система с с импульсными воздействиями.
Предположим, что ТГш -4- Цг,г+Т) = с1 < <», где (ид+Г) -
количество точек ^ на промежутке
Исходной системе поставим в соответствие следующую усредненную систему
dt
где г = et, Z - V + G,
= + z, z<= Z, Ç(o') = x .
= Л + C°, A - Un -4- yTA(t)dt, C° = lîm -4- £ C,
T+<B t T-»» tSt. <l*T J
1 t<-T 1
7 - llm -ж- S S(t)Udt, G = lim -ж- Conv Z D W ,
T+to t T-+00 tStj<t*T -1
Сопи Л - выпуклая оболочка множества Л. Здесь интеграл от многозначного отображения понимается в смысле Аумана.а сходимость в смысле метрики Хэусдорфа. Рассмотрен алгоритм построения соответствующих управлений исходной и усредненной систем вида систем 2-4 и доказана теорема, в которой дано обоснование предложенных схем усреднения.
В § 4 рассматривается усреднение линейно-квадэртсгшых задач управления с импульсными воздействиями
х = е[ ¿(t)r + B(i)u ], t * t , (1)
to = e[ С r(f-O) + D » ],
t-t t
с квадартичным функционалом т
J = £ S I x'{зШз)х{з) + и'(з)Я(з)и(з) ]ds + о
f г Z t r'(t,-0)Ii(f-0) + w/<7 » ]. (2)
OSt rST k
Предположим, что выполнено следуетеe Условие С:
1) матрицы Л(£). B{t), Q(t), R(î)- кусочно-непрерывные, 2Я-пе-
риодические со t функции;
2) ограничивающие шо*ества-и = fi* s К = flrj
3) матрицы Q{t), R{t) - непрерывны и симметричны на отрезке [0,2й1,-Q(t), Ik - неотрицательно определенные, R(t), Gk - положительно определенные иатрицы;
4) существует такое целое р, что
t. - t. = 2Л, С, = С., D. =0,,Х1 = G. .
t*p 1 i + p 1 i+p 1 i»-p i i»j» i
Поставим задаче (1), (2) в соответствие следующую частично усредненную задачу
-gf- * е[ + Fz ]. t * t,. (3)
AÇ I = et + DjUj,
с квадратичным функционалом т
^ = X С5'(з)Ч5(з) + г'(з)й:(з) ]йз + о
к
где
? = " жод-'тв'и)«,
о
_ 1 а* _ 1 а*
4 = 5Г" ■г Л(з)Да, <3 = * 0(з)йз. о о
Теорема _1- Пусть выполнено условие С и для любого единичного вектора I справедливо условие В'(1)1 * О, Ге [0.2Я].
Тогда для любого п>0 существует такое с°[ц,хо) >0, что к хл(г\ - и ^ п. к* - « и,
где (х'Ш, и*{I). ш*, «Г*) - оптимальная траектория, управление и значение функционала в задаче (1), (2), а z*(t).
* "И \
ик, J ) - оптимально« траектория, управление и значение функционала в задаче (3), (4).
Рассмотрена также схема полного усреднения для задачи (Т), (2) и доказана теорема по ее обоснованию.
Во второй главе рассматривается обоснование метода усреднения для ииследования линейных неантагониетических дифференциальных игр N лиц.
В §1 рассматривается линейно-квадратичная непрерывная игра Пусть изменение позиции игроков описывается липейпой системой
м
i = i[A{t)x f I В (t)u 1, r(0) = x°, (1)
j-j ' J
t T
-f- Г (ti (t).u (t))dt = l , J- 1.ЛГ. (2)
o ^
а функция вшлгршиа J~ro игрока задается квадратичным функционалом
J.íul = -f- J [(? (t)®(t).i(t)) + (8 Át).x(t))]dt, (3) J o
Задача каждого /-го игрока состоит в внборе такого своего управления t¿, чтобы достичь возможно большего значения своей функции выигрыша .Г £и].
Задаче (1) - (3) поставим в соответствие следующую усредненную задачу:
N
= + I ».г.. = х°• «>
ut j.i J J
= "2" ' í(Pjí(tM(t)) + <erí(T))]dt (5)
X (ff^jír).^jít))dx = lj, (6)
где
.2* . as 4 ait
Л = X Л( t )cit, f = 5T" -Г í'Atjdt, g = та- J e.(t)dt, O J o J J o J
. 21Г
/ в1'(г)ВАь)са, « = Т777.
Г 5тГ £
Определение . Набор допустимых управлений
и'(гг) = (и*(0, и*{».....и'т)
называется г)-равновоснш управлением дифференциальной игры (1) - (3), если
JJ^v%(t)) + п * JJ(^l'<t) « С>> (7)
для любых допустимых управлений и (1), где
и II и = (и,, из ,...,и , и}, и ), Г} >0.
т I
Теорема Пусть в области £} и гО, хе к", не Я 3) выполнены следующие условия:
1) элементы матриц АН), SJ(t)I У (£) и векторов -кусочно - непрерывные, гя-периодические функции; -симметричные отрицательно-определенные матрицы при £с 10,Т};
2) любому допустимому управлению г (I:) поставлено в соответствие управление и (£,с) с помощью соотношения
ягк) ♦ I) аг < .|м)
!Г / г {ПШ = X В (э)и (з,е)(3э; (8)
21Г) -1 Я») 3 3
3) для любого J и любого единичного вектора I1 спрэвделиво условие В 'П)1! * О, íe [О.гя].
Тогда для любого ц >0 существует с°(п) >0, что при 0< с £ 5£°(г)) управление и(1,с), определяемое соотношением (8), является п-равновесным управлением задачи (1) - (3)-
Анзлогичным образом проводится обоснование асимптотического построения равновесных стртегий игроков.
Приведены результаты вычислений на ПЭВМ иллюстрирующие еффектквность данного численно-асимптотического метода.
В § 2 рассматриваются коалиционные дифференциальные игры
без побочных платежей.
Подмножество Кс N игроков, объединенных: возможностью координированного выс'^ра стратегий, называется коалицией.
Определение . Равновесная ситуация ¡7° "улучшаема" по
коалиции Я, если существует стратегия коалиции У* такая, что 1
Доказана теорема устанавливающая услошя, при выполнении которых из "улучшаемоста" ситуации равновесия усредненной игры следует улучшаемость ситуации равновесия в исходной задаче.
В § 3 рассматриваются линейно-квадратичные игры с импульсным воздействием:
м
х = е[ АЦ)х + £ В^П^ ], 1:*^, 1(0) = го (1)
n
4х I = El C^it^O) + £ û{ и>! ], i = 1,2..... (2)
|t=t[ j-i
т n
J. (и,tu) = Е J- [ T'(3)Q (3)1(3) + l и <(3)R\(3)U (з) ]da + J « J « - < 1 1
£ £ т'(Г -О) + е Е Г (гу')^1; V. (Э)
051 " О*«., ЯТ 1-1 J•
к к
Рассмотрена также система (1) с импульсными воздействиями
кх I = C i|t -0) 4- X D J ш J. (4)
lt=t( ]-i
и функциями выигрыша J-го игрока
т н
J (u,w) = с S [r'(a)Q (з)i(a) + £ u '(з)Д,(з)и (з) )ds +
0 (5)
+ I Ï'(t -0)1 '¿U -0) + i E
4-1 k* 1 l-l
+
- 14 -
Доказаны теоремы устанавливающие условия, при выполнении
которых для любого г)- >0 существует такое е°>0, что при е е (О,
е°] управление соответствующее равновесному управлению
усредненной задачи (г",и") , задает п-равновесную ситуацию в исходной задаче (1)- (2).
В третьей главе обосновывается применимость метода усреднения при исследовании нелинейных дифференциальных игр N лиц.
В § 1 рассмотрены нелинейные непрерывные задачи с терминальным критерием:
х = е[/и,г) + Е А (г)?а,и..)], х(0) - х°, (1)
¡'I J 3 '
^[и] = Ф^х(Г)), (2)
где /(^х) и <р ) - 2тг-периодические по { функции.
Поставим в соответствие задаче (1), (2) следующую усредненную задачу
= 7(5) + Е Л (ç)u.. 5(0) = х°, j-i J J
(3)
7j(u) = Ф^5(Ь)). (4)
где
_ 1 2R .2*
fix) " -Jif S f(t,x)dt, I = ct, v б 7 = X f) (Î.U )dt. о о
Пусть D(t) некоторое допустимое управление в задаче (3),
(4). Построим управление u(t,c) исходной задачи (1), (2) с помощью следующих соотношений:
t t ( ь k + 1
u.(t,£) = { uVt.c) I J" vAct)dt = J plt,u\it,c))at, J к J t J t J J
tks t <tUM, tk = 2Мг, fe = 0,1, / = TTf j (5)
m
Теорема 1. Пусть в области Q{ t гО, le De Я", t^e UjC R J) выполнены следующие условия:
- 15 -
1) функции /(£,r), Aj(x), f(t,u) равномерно ограничены, непрерывны rio и, удовлетворяют условию Липшица по х с постоянной X, измеримы и 2it-периодичны по t;
2) функции Ф (т) удовлетворяют условию Липшица с постоянной ¡i;
3) решение £(т) системы (3) вместе с некоторой р-окрест-ностью при всех допустимых управлениях у (г) принадлежит области D при Os X
4) существует единственное равновесное управление и*(г) = = (i»*(t),u*(r4 ...,и"(г)) задачи (3), (4).
12 п
Тогда для любого г) >0 существует такое £°(rj,i) >0, что при 0< е se° управление ti(i,e), построенное с помощью соотношения
(5) по управлению v'(z), является rj-равновесным решением задачи
(1), (2).
Рассмотрен также случай управлений, осуществляемых по принципу обратной связи.
В § 2 рассмотрены сначала нелинейные задачи оптимального управления с импульсными воздействиями:
i = £[/(t.x) + 4(x)j>(r,u)], tftlP i(0) = г° (1)
Ku.Wj) = ФЫТ)). (2)
Исследованы два случая приложения импульсных воздействий:
1) Дат I = ela (x) + КЛч>{)1. « = 1.2,... (3)
lt=S
существует такое целое р, что С, «£,+2П, а, -а.,К, - Я.;
г 1+Р t l+p i 1+р 1
2) существует конечное число точек импульсного воздействия
t = I /е, 1-17р7 и величина импульса определяется следующим образом
U I = a,(i) + K^Wj). (4)
Доказаны теорема по обосновании метода усреднения уравнений управляемо:^ движения для задач (1)-(3) и (1).(2),(4).
Рассмотрена также дифференциальная игра ff-лиц с импульсными воздействиями
м
X = t[/(t,X) + Z А ЛхЦ (t.U ;], х{0) = Х°, t*t , (5) j«l J J J
К
Ax I = e[a (r) + I К J(u> J)]f i = 1,2..... (6)
U-t, ¡mi
ZjCu.tüj) = Ф^т(Г)). (7)
Рассмотрена также дифференциальная игра N лиц для системы (5) с импульсным воздйствием вида
Ах I = a (х) 4 £ К ](и>.'), 1 = 1,2,.... (8) |t»i, J-i
Пусть Zj - множество допустимых управлений (u^U),®^} /-го игрока.
Поставим в соответствие задаче (5) - (7) следующую усредненную задачу:
м
5 = £[/(5) + Е Л + zА, 5(0) = х° (9)
1 ' 1
1(0,2) = Ф(5(Г)), (10)
где
fix) = 7¿¡¡- S f(t,x)dt + ji- £ a,(x).
ze Z = -4 E K.J(tü.), t».e VJ = 4= Г Mt.IMdt.
ostias J 1 o J 3
1
Теорема Пусть в области <3(^0, ге Ее Я", иГ/}с Я (и^б ^е я ;) выполнены следующие условия:
1) функции f{t,x), А^х), а^х), pJ(t,u), Я.^ш) равномерно ограничены, удовлетворяют условию Липшица по х и и с постоянной X, измеримы и 2Я-периодичны по Ц
2) для и « 7} определены функции у (^и^е = ТТ^.
измеримые по t и удовлетворяющие условию Липшица по и с постоянной {i такие, что
1 2К
-5jf -Г Mt,2/,(t,u))dt = к;
о J J
3) решения системы (9) £(t) вместе с некоторой р-окрест-ностью при всех допустимых управлениях v{t) и z(t) принадлежат области D при te tO.Le"1];
4) существует единственное равновесное решение v*(t), z*(t) задачи (9), (10).
Тогда для любого г)>0 существует такое е°(п)>0, что при ее
е (0,е°] существует г)-равновесное управление задачи (5)- (7).
ПУБЛИКАЦИИ ПО ТШЕ ДИССЕРТАЦИИ
1.Аль-Хйассат Халод Численно-асимптотический метод исследова-Ш1Я терминальных бескоалиционных дифференциальных нгр//Весенняя Воронежская математическая школа "Понтрягинокие чтения IY": Тез. докл..Воронеж,1993.-С.б.
2.Аль-Хйассат Халед Усреднение уравнений движения в неантагонистических игра! М лиц// Межгосударственная научная конференция "Динамические системы:устойчивость, управление, оптимизация" :Тез. докл.-Гш1Нок,1993.-С.29.
3.Аль-Хйассат Халед Об "улучшаемое™" равновесных ситуаций в линейно-квадратичных задачах управления N лиц.//Всеукра1нсбка науксва конференц1я "Нов1 п1дходи до розв'язання диференц1аль-них р1внянь":Тез. доп.-Ки1в,1994.-С.&.
4.Plotnikov У.A., Alhyassat К.А. The averaging method In non-coalitive differential games/Abstracts of invited lectures and
short oommunioations delivered at the fourth International colloquium on differential equations'.Bulgaria, Plovdiv, 1993. -P. 211.
5-Plotnllcov V.A., Alhyassat K.A., lozovatslcy V.V. Numerical-acymptotio method in linear- quadratic non-ooalitive differential games/ZAbstraots of invited leotures and ehort communications delivered at the fourth international colloquium on differential equations .-Bulgaria, Plovdiv, 1993.-P.212.
6.Аль-Хйассат Халед Метод усреднения в задачах управления с импульсными воздействиями/Одес.ун-т,Одесса,1994,22с..Деп в ГНГБ Украины 20.04.94, N 823 - Ук94.
7.Plotnlkov t.A., Alhyasgat К.A., lozovatsky v.V. Numerical-asymptotio method In linear- quadratio rm-ooalitive differential games//Seleoted invited leotures and short oommunioations
delivered at the fourth international colloquium on differential equations:Bulgaria,Plovdiv,1993 --P.187-198.