Синтез оптимальных управлений в линейно-квадратичных задачах для нестационарной системы с внешней помехой тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Чэнь Янчжоу
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1994
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
РГ6 од
;> и* САЛКТгДЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ~ ' ! УНИВЕРСИТЕТ
На. правах рукописи
чэньянчдаэу
С^ГПтар1ТШМАЛЬЬ1Ь1Х УПРАВЛЕНИИ В ЛИНЕИНО-КВАЛРАТИЧЦЫХ ЗАДАЧАХ ДЛЯ НЕСТА11ИОЩРНОИ СИСТЕМЫ С ВНЕШНЕ^! ПОМЕХОЙ (ИГРОВОМ ПОДХОД)
Специальность 01.01.09 - математическая кибернетика
АВТОРЕФЕРАТ
Диссертации на соискание ученой степени кандидата фгоико-математических наук
САНКТ-ПЕТЕРБУРГ —1994 г.
Работа выполнена на кафедре теоретической кибернетики Саяет^Петербургского государственного университета.
НАУЧНЫЙ РУКОВОДИТЕЛЬ -чл. кор, РАН, доктор фюико-матсматачсских наук профессор В. А. ЯКУБОВИЧ
ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ -доктор технических наук, проф. А. Л. ФРАДКОВ кандидат физ.-мат на^рр^Л. ЛИХТАРНИКОВ
ВЕДУЩАЯ ОРГАНИЗАЦИЯ -Санк]> Петербурге кий государственный технический университет
Защита состоится . 1994 г. в_часов
на заседании специализированного совета к 063.57.49 по присуждению ученой степени кандидата физико-математических наук в Санкт-Петербургском государственном университете по адресу: 108904, Санкт-Петербург, От. Петергоф, Библиотечная пл., 2, математико- механический факультет СПбГУ.
С диссертацией можно ознакомиться В библиотеке им. М.Горького СПбГУ, Университетская наб. 7/9.
Автореферат разослал "-2-?" 1Я04 г.
Ученый секретарь специализированного совета,
кандидат фиэ.-мат. наук А.И. Шепелявый
2
ОБЩАЯ ХЛРЛКГЕРИСГИКЛ РАБОТЫ
Актуальность. При построении систем управления реальными объектами приходится принимать во внимание наличие в реальных условиях тех или иных неполных априорных сведений, которые будем называть неопределенностями (параметрическими (ПН) или динамическими (ДН)) системы. Для классов проблем, спязанных с типом ДН, традиционно эта неопределенности считаются имеющими вероятностный характер (они задаются, например, либо белым шумом, либо цветным шумом с известной спектральной плотностью) и в связи с этим предлагается отыскивать оптимальное управление из условия минимшап?ш математического ожидания некоторого функционала качества. Соответствующая теория, берущая начало от Винера и Калмана, как известно, хорошо развита. Однако, давно замечено наличие ряда "нехороших" свойств у некоторых оптимальных регуляторов, построенных на основании этой теории: иногда оказывается, что оптимальный регулятор — негрубый или строго не реализуемый и др. Кроме того, либо лежащее в основе понятия случайного стационарного процесса предположение об ансамбле траекторий и его усреднении перестает соответствовать задаче, либо предположение о некоррелированности процессов, которое обычно в той или иной форме ьрисутствует в теории, является трудно проверяемым. В связи с этим, в последние годы создан и быстро развивается новый (игровой) подход (Красовский H.H., Куржаяский А.Б., Кунцевич D.M. и др.). В рамках этого подхода оптимальное управление устанавливается соответственно "наихудшему" входному воздействию для того, чтобы гарантировать желаемый результат даже при самом "неблагоприятном" влиянии внешней среды. Для учета чувствительности выхода системы относительно внешнего возмущения, созданы теория {-инвариантности (Лузин H.H., Кузнецов П.И., Петров Б.Н., Кухтенко А.И. и др.) и Нос -теория (Zaxnes G., Francis В.А. и др.), которые тесно свя-
заны с теорией дифференциальных игр. Диссертация примыкает к этому последнему ("игровому") направлению.
Рассмотрены задачи синтеза оптимальных управлений в лшейш>-квадратичной дифференциальной игре (ЛШШ) для нестационарной системы. Для нестационарной системы изучены задача, аналогичная задаче Н«, -теории (ос будем называть задачей оптимизации по Н^-критерию). Рассмот1>ена задача оптимизации в некотором смысле аналогичная линейно-квадратичной гауссовой задаче (задача Ь(21,2).
Цель работы состоит в том, чтобы найти условия (необходимые, и достаточные) разрешимости всех трех указанных задач и тгиакс их решения. Решения задачи ЬС^ и задачи оптимиза--ции но Н^-критерию использунхг ¡моления задач ЛКДИ.
Общаи мет/дока выполнении исследования. В диео-рта-цш1 применяются методы линейно-квадратичной теории, принцип максимума Понтряшна. методы функциональной) анализа, теория линейных диф<{к>рснциальных уравнений с периодическими коэффициентами, тео[*:ма о 5-процедуре и др.
Нау*тап новизна. В диссертации получены следующие новые результаты: -
Доказана равносильность разрешимости трех основных задач ЛКДИ (минимаксной, м<1ксиминной задач и задачи существования еедловой точки) в несингулярном случае как для нестационарной линейной системы на конечном временном интс1>-вал«, так и для периодической системы на бесконечном временном интервале;
— Дли каждой из ¡утк трех задач найден ряд условий ^необходимых и достаточных) разрешимости задачи;
......Для этих задач дано описание оптимальных управлений
(регуляторов) и седлойой точки;
— Получены условия (необходимые и достаточные) разрешимости некоторых вырожденных (включающих сингулярный случай) максиминных задач программного управления и дано описание оптимальных (программных) управлений;
— Рассмотрена задача оптимизации по Нс-критерию для нестационарной линейной системы на конечном временном интерпале.
— Рассмотрена задача LQLj для нестационарной линейной системы на конечном временном интервале.
Теоретическая и практическая ценность. Ряд теоретических результатов (задач ЛКДИ) носит окончательный характер. Полученные результата и методы могут быть примены в дальнейшем при рассмотрении линейно-квадратичных задач для систем с внешней помехой.
Апробация. Результаты работы докладывались па студенческих семинарах и на семинарах кафедры теоретической кибернетики СПбГУ.
Публикации. Часть результатов диссертации опубликована в работе [1].
Объем и структура работы. Диссертация состоит из введ-ния, трех глав и заключения и занимает 105 страниц. Список литературы содержит 45 наименования.
Содержанка работы
Для удобства изложения введем следующие обозначения:
R1 — ¿-мерное вещественное евклидово пространство.
СМ[0,Г] — множество матриц-функций конечной размерности, имеющих элементы, являющееся вещественными непрерывными функциями на интервале [0,Т].
СМ'о*^0,Т] —подмножество множества СМ[0,Т], состоящее из симметричных квадратных матриц размерности к.
1(2к) — пространство Ьз{[0,Г1 Л*}, либо ^{[О^+ао) К*} квадратично суммируемых векторов-функций со склярным произведением (•, •) и с нормой || • ||г.
* — символ операции эрмитова сопряжения в случае комплексных векторов и матриц и транспонирования в случае вещественных векторов и матриц.
¡п£и{Ф[и]|(/)} (|п£[/{Ф[и]|(/)}) — нижняя грань функционала Ф[и] по и 6 (и е и) при условиях, определяющихся формулой (¿).
Гп/и{Ф[и] | (/)} = ? — задача определения нижней грани функционала Ф[и] по и 6 при условиях, заданных формулой (/) и определения функции и0 € на которой, достигается нижняя грань функционала Ф[и] (если и0 существует).
1„ — единичная п х г» матрица.
41 п
ЬМ[0,Т) — множество матриц-функций конечной размерности, имеющих элементы, являющиеся вещественными, локально суммируемыми, ограниченными, Г-периодическими функциями на интервале ТО, Т], где Т — период.
• — подмножество множества ЬМ[0, Г], состоящее из симметричных квадратных матриц размерности к.
Ат„1 (М) (Am¿n(M)) —наибольшее (наименьшее) собственное значение симметричной матрицы М.
В гсерзой главе рассмотрена нестационарная линейно-квадратичная дифференциальная игра (ЛКДИ) на конечном временном интервале. В §1.1 поставлены достаточно общие задачи Л*\ДИ. Зга задачи не только имеют большое самосостоятельное значение, но и нужны для рассмотрения задач синтеза оптимальных управлений для линейно-квадратичной системы с внешней поме-
хой.
Пусть динамический объект описывается дифференциальным уравнением
J = A(i)* + b(i)« + C(i)v + /(i), te[0,21, (1)
с начальным условием
®(0) = а, а€ R", (2)
Множество допустимых управлений W —множество пар функций (u(t, x),v(t, ж)), которые удовлетворяют следующим условиям: для любого а е Rn на [О, Т] уравнение (1) имеет единственное абсолютно непрерывное решение x(i) такое, что1 х(0) = о, u(t, x(t)) €
Определим следующие множества
U={u ( 3»: («,«)€ ЛЬ К={«|Ь:МбП \ Uv = {« | (и,о) € W], Уи = {о | (и, v) <= W). / W
Пусть дет квадратичный функционал качества:
] Гг/*у/щ 9® № \(*\ 2 Jo \ v) \p{iy q(ty -mj\»)
+ J (fc(t)-x + <f(i)'u + е(<)'»)Й + ^(T)'Qx(T) + г(Т)*5а- (4)
Предполагается, что все матрицы в (1) - ($) — непрерывные иГ(1)>0, r,(i)>0 (Vi 6 (0,31).
'В данной главе вскму через L^' будем обознанать пространство
Рассмотрим следующие три основные задачи ЛКДИ:
(¿) Макскмшшая задача:
ВцрДОМ|(1),(2)} =?.
V Щ
(») Минимаксная задача:
и Уц
(»«') Задача сущрстисвашш седаовой точки: из всех допустимых пар управлений (и(1,я), v{t,x)) найти пару управлений (и0 = и(*,х),и° = v(t,x)) такую, что для любых и € V € верны нерапешпа
/[и0,«] < ¿[«V] < ¿[«У]-
В § 1.2 приведены предварительные сведения. Через <1от(ШсЮ)) обозначим множество матричных функций #(•) 6 СМ^2п^[0,Г], для каждой из которых матрица-решение
Z{t)~{nt) и*))
уравнения Гамильтона
Jnjt=H{t)z, (H(t) € CM<2n)[0,T], z 6 L(22n))
при краевом условии
(где Q — Q* - заданная яхп матрица) имеет свойство: det X(¿) ^ О при t е |0,Т]. Определим оператор ític^ из dom(ffic^) в множество СМ^п)[0,Г] следующим образом:
Ric{Я)(Щ) =
Используя симметричную матрицу Я € СМ^О.Г], определим оператор Ц(">: См£п)[0, Т\ — СМ(0п)[0,т] формулой
В §1.3 сформулировано решение выше поставленных трех задач в частом случае, когда /(<) = 0, з(4) ~ 0, р(<) = 0, а О, Щ) = 0, ¿(0 = 0, е(*) = 0, до = 0. Получены следующие результаты (теоремы 1.2 и 1.3 в диссертации):
ТЕОРЕМЫ 1.2 И 1.3. Определим следующие матрицы:
Я = ( А ЬТ~Ч*)> Я = В = А - ЬГ_1Ь*Л. (5)
Я,
-(
ЯСТ^С'Л (В + стеску \ =Шс(0)(н )
В + СГ^С'П ст;
(б)
5 = ( А СГГ'С* )' ИсИЙ(5)» 5 = А-СТГ'СГЛ.
(7)
д / тт-Ч'к (в+ьг-Ч'яу \ 5 п-«>)т\ л*
= + ¡№-^(7* Л'=Шс (Я1)- (8)
Й={ А ЪТ'Ч* -СТ^С* ) ' (9) Тогда следующие утверядения равносильны:
(I) Максиминная задача (i) разрешима для любого начального состояния х(0) = а € Rn;
(II) Выполнены условия:
Н £ dom(RicW), Я, 6 dom(Ric(0)); (10)
(III) При 0 < t < Т существуют абсолютно непрерывные матрицы-функции R(t) = R{t)',Ri(t) = Ri(t)', которые соответ-сшешо являются решениями матричных дифференциальных уравнений Риккати (УР) с указанными краевыми условиями
§ = Я<Н>(Д), ЩТ) = Q, (И)
= Ri(T) = 0. (12)
Здесь матрицы И, Н\ определены в (5), (6). При атом в матрица Н\ матрица Л является решением уравнения (11);
(IV) При 0 < í < Т существует абсолютно непрерывная матрицал-функция R(t) = Я(*)* — решение следующего матричного УР с указанным краевым условием
f = RW(R), R(T) = Q\ (13)
(V) Минимаксная задача (>*) разрешима для любого начального состояния х(0) = а € R";
(VI) Выполнены условия:
Н 6 dom(íüc(-9)), Hi 6 dom(Ric(0)); (14)
(VII) При 0 < t < Т существуют абсолютно непрерывные матрицы-функции R(t) - R(t)\Ri(i) = jRi(¿)*, которые соответственно являются решениями матричных УР с указанными краг евыми условиями
m=-Q, (16)
■ ^ = Л,(Т) = о, (16)
где матрицы Я, Я1 определены в (7) и (8). При этом в матрице Н\ матрица Я является решением уравнения (15);
{VIII) при любом начальном состоянии г(0) = а 6 Еп у функционала 7[и,«] (с.м. (4)) при условиях (1),(2) существует сед-ловая точка (и0, и0), которая имеет вид и0 = М(1)х, о0 = Ы{1)х с некоторыми матрицами М{Ь), М(*) 6 СМ[0,Г].
Пусть выполнено одно из условий (/) — (УIII). Тогда в (1//), (IV), {VII) соответственно имеет место
Я = Шс((3>(Я), Л] = Ис(0)(Я,), (17)
Д = Шс<"9)(Я), Й1 =Шс<°)(Я1), (18)
Д = -В.у-К. (19)
Решение и^,х),и(<,г) задачи (»), решение и;(<,х),и(<,а) за^ дачи (и) и седловая точка (и°(4,зе), »"(<,2)) функщюпала 7[и,ю] соападгиог и имеют следутапщй вид
«(<,!) =ид(*,а) = и0(<>а;) = г1(Ох, (20)
(21)
п(<)=-г-(<ж<т<), ыо=ггчо^охо- (22)
При этом
■ВнрЬГ{Ли,0Ц(1),(2)} = ЛАА = |«*Л(0)а.
(23)
Доказательства для этих результатов приведены в §1.4. Решение общих задач («) — (иг) изложено без доказательства в §1.5, поскольку оно аналогично доказательству указанного частного случая, различие состоит лишь в сложности вычислений.
Во второй главе рассмотрены аналогичные задачи ЛКДИ для периодической системы на бесконечном временном интервале.
В §2.1 поставлены общие задачи ЛКДИ для периодической линейной системы. Однако для простоты мы ограничимся рассмотрением следующего частного случая. Пусть динамический объект описывается дифференциальным уравнением
^ = + + £(*)"> ¿е[0,оо) (24)
с начальным условием
ае(0)=а, аб!Г. (25)
Функционал качества имеет вид
Л«. »1=5+2 *(«)•» (<М0 + и(<)Т(<М1) -- 2а:(0*К0"(0 - и(/)*Г1(«)о(4))Л. (26)
Множество допустимых управлений Ш определяется множеством пар (и(<, а), «(¿, х)), которые удовлетворяют условиям: для Уа € Е" уравнение (24) при и = и(<,г), и = и(<,х) имеет единственное абсолютно непрерывное решение? х(*) б такое, что х(0) = а, € 14т), »(<,*(*)) €
4В данной главе векшу через обозначим лебегово пространство Ьа{[0,оо)-»Е(*)}
Аналогично определим множества [/, У, Uv, Vu(cm. (3)). Здесь все матрицы в (24), (26) предалагаются вещественными, локально суммируемыми, ограниченными, Т-периодмческими функциями, причем r(f) > 7iIm, Ti(i) > т2Jj (Vi G [0,T)) для некоторых чисел 7i > 0, 72 > О-
Аналогично рассмотрим три основные задачи ЛКДИ (») — (т) (см. с. 7) для периодической системы.
В §2.2 изложены необходимые предварительные сведения. Пусть Z(t) — матрициалг Г-периодического канонического уравнения Jndz/dt = Я(<)г (где Я(4) 6 ЬМ^п)(0,Г]). Пусть выполнено следующее частотное условие для матрицы монодромии Z(T):
det(Z(T) - eiuI2n) Ф 0, (Vw 6 [0,2тг». (27)
Тогда можно найти несингулярную матрицу М такую, что маг трица Z(t)M имеет следующий вид:
z(t)M-( p"ii)etNl )
где Pi, — Г-периодическая матричная функция, No, -N\ — гур-вицевы n x п-матрицы. Если матрица Рц(<) несингулярная
detPn(i) ф 0, (Vi€[0,T)), (28)
то определим оператор Ric:
Шс(Я(0) = -PzdWiit)-1.
Можно доказать, что Ric(H(i)) G LM<n)[0,T].
Если матрица Я удовлетворяет условиям (27) и (28), то она называется сильно неосцилляторной (Якубович В.А., 1962), обозначим это условие через Я € dom(Ric).
Аналогично, для любой матрицы Я 6 LMo2n)[0,T] через обозначим следующее отображение из
Решение зад ам (г) — (wi) для период ической системы сформулировано в §2.3 в теореме 2.2:
ТЕОРЕМА 2.2. Предположим, что пары {Л(-), Ь(-)} и {Л(-),С(-)} является Ьг-схабилизируемыми и T(t) = r(t)* > 71 Гт > 0,ra(t) = Г1О)* > 7Ж > 0 (Vi е (0,Т|). Тогда следующие утверадения равносильны:
(I) Максиминная задача разрешима для любого начального состояния х(0) = а £ R";
(II) Выполнены условия
ч так» к«
(30)
где Я = Ric(ff), В = А- ЬГ~\т + д)*\ {III) При t 6 (О.оо) матричные УР
§=*<">№), (31)
(32)
имеют соответственно решения Д(4) = il(i)* = Л(< + T),Ri(i) = АО)' = + Л такие, что В(-) = А(.) - ЧТО-1 W)K'j + <?('))*
и ад = л(-) - ¿(Wr'PO) - ДК0Ж-) + + от») -
Я,(•))(?(•) - р(-)1* — гурвицеаы матричные функции, где матричные функции Я и П\ определены в (29) и (30). При игом маг тричная функция R о (30) является решением уравнения (31) с указанным выше свойством;
(IV) Выполнено условие
й_ ( -С+^Г-у-рГ.-у (Л-ЬГ-У-СГГУГ \Gdom(mcy н - { а - ¿г~у - СГ;У ЬГ-Ч< - сг;гс* ) 6 dom(Rjc)-
(33)
(V) При i € [0, оо) матричные УР
§ = К(Й)(Я)> ■ (34)
имеет решение fí(i) = R(t)* = R(t + T) такое; что В-А-ЬГ-У -СГ^У - (ЬГ~1Ь* - СТ^С*)Й — гурпицева матричная функция. Здесь Я — матричная функция в (33);
(VI) Для любого вектора а € R" у функционала/[и, и] (с.м.(26)) при условиях (24) и (25) существует седловая точка (и0,«0), которая имеет вид u° = M(i)x, v° — N(t)x с некоторь-ми матрицами M(t), N(t) £ ЬМ[0,Г];
(VII) Минимаксная задача разрешима для любого начального состояния г(0) = а € R";
(VIII) Выполнены условия
fi / (? + рГ,"У (А-ЗГ^У)* \ . .
\ А-Ст\1р' CT¡ С* ) (35>
щ \ в + ьг-цШ-ду ьт~Ч*-сг^с- )6 dom^c)'
„ . (36> где R = Шс(Я), В = А~ CTïl(RC + р)*;
(IX) При i € [о, оо) матричные УР
f = (37)
^ = (33)
имеют соответственно решения R(t) — R(t)* = R(t + Т),Д](<) = Ri{t)' = Ri(t + Г) такие, что В = А - CT^(RC+p)' и Я, = А -СТГ1 [(Л-Л|)С+р1* + ЬГ~1 р- Я, )Иffl* — гурпицевы матричные функции, где Я, Я] — матричные функции определенные в (35) и (36). При атом матричная функция R в (36) является решением уравнения (37) с указанным выше свойством.
Пусть выполнено одно из условий (I) — (7Х). Тогда в (111)^1 X) и (V) соответственно имеем R = Шс(Я),R\ = Ric(#i), Л = Ric(Я), Я, = Ric(Äi), Л = Л - Я, = Ri - Л.
Решение u~(t,x\v(t,x) минимаксной задачи, решение v~(t,x), S(t,x) максиминной задачи и седловая точка (и°(<,х), ч0(/)г)) функционала J[u,ü](cm.(26)) er.впадают и имеют следующий вид
u{t,x) = uü(t;x) = u0(t>x) = r](t)x, (39)
v(i,x) = vS(i,x) = v°(i,x) = r,(i)x, (40)
где
г,(.) = -Г-'(Rb + g)', г2(.)-ГГЧйС-рГ- (41) При этом
8upm£{/[«,W]|(24),(25)} = infSup{J[«,„]|(24),(25)} = V vV и vu
= J[uV]=^*ß(0)a.
В §2.5 d теореме 2.3 изложение результаты решений задач (») — (Ш) в случае, когда есе матрицы в (3), (5) — постоянны. Эта теорема сразу следует из теоремы 2.2. Здесь пропустим ее изложение.
В треггьей главе рассмотрены две важные задачи синтеза оптимальных управлений для нестационарной линейной системы с внешней помехой (задача оптимизации по Н,*,-критерию и задача LQL2). Первая задача является распространением Ноо-теории .(Zames G, Francia В.A., Doyle J.C. и др., 1983,1989) на нестационарные системы. Ноо-критерий выражает чувствительность выхода относительно внешнего возмущения. Вторая задача в некотором смысле аналогична линейно-квадратичной гауссовой (LQG) задаче.
Рассмотрена следующая максишпшая задача, динамический объект которой описывается уравнениями (1), (2) (при /(¿) = 0).
(«') задача программного управления:
supiuf{J[u,ü,7]l(l),(2))=?.
Здесь
(43)
ТЬгда. можно определить матрицы
Л » Шс(<})(Я), В = А- ЬТ'Ч'Я (44)
Определим оператор В на следующим образспс
М»Х0 = МОТ1 £ Х(ГУЩг)С(ТНГ)Ь, В =: ^¿Г-'бМ - (Л*С + СМ).
где X - ,ЯГ(<) — решение матричного уравнения ¿Х/<Й = В(<)Х с краевым условием Х(Т) = /„. Пусть
Ао = - и* {(Л,»)}, (45)
М1»=1
^»СГДХ-^О)-1«. (46)
Получены следующее теоремы.
ТЕОРЕМА 3.1 (решевне задачи (»') в ияныроац^нном случае). Предположим, что в (42) 7 > 0. Тогда следующие утверждения равносильны:
(I) Максиминная задача (»') разрешима для любого начального состояния х(0) = а € К"; (/I) Выполнены условия
Я(*)€<к>т(Шс(<ю) и 7>*о, (47)
где матрица Я(!) указана в (43), число Ло указано в (45);
Пусть выполнены условия (47). Для любого 7 > Ло положим .
Д=ШсЮ>(Я), В = А-ЬТ'Ч*Н, '
Д,(<,7) = Шс<в>(Я1(<,7)),
(48)
ВгМО) = г1(<,7)»(<), Ч**<*)) = Ы*,7М*). (49)
где
ВД?) = ( 7-1(70!«Л) - ; • (б0>
Тогда решение задачи (»') (для любого начального состояния а;(0) = а £ К") имеет вид
= = '»(«лМО, <(0 = г»(*Л>(<)-
При этом
ву I (1),(2)} = /К, о?] = |«*%7)а.
В §3.4 рассмотрели основные свойства мягрици Д1(<,7) из (48), которые играют большую роль в дальнейшем.
ЛЕММА 3.6. Маярица ¿£1(0,7) (7 > До) является неположгь телыю определенной.
ЛЕММА 3.7. Л) (<,7) является непрерывно дифференцируемой функцей от параметра 7 > До, в удовлетворяет тсюэдестау
^~1 = Х(г,7)*г1(г,7)^(г,7)г,(г,7Мг^«,7)-1.
Поэтому для любого вектора о 6 К", а*Л(<,7)а убывает с убыванием параметра 7 > До.
ЛЕММА 3.8. Для любого данного вектора а € И", а*Л1 (0, у)а является выпуклой функцией от параметра. 7 £ (А0,+оо).
ТЕОРЕМА 3.3 (ргпашке задачи (»') в вкраедэшюм случае). Пусп» вьшолнено условие (43) и для вектора а 6 Е" справедливо неравенство
иш (51)
7-»Ао+О а7
(где матрица Ri(0,i) определена в (48) при t = 0). Тогда задача (»') при 7 = Ао разрешима для вектора а. Причем од но из решений задачи (¿') (оптимальное программное управление) получается следующим образом:
u°(i) = (слабо) lim u7(l,i(i)), v°a(t) = (слабо) Hm u7(i,i(i)),
(62)
где Uy(t,x),vy(t,x) определены формулами (49). При втом
Supiaf{y[u.t»,Aol | (1),(2)} = \ Ит (с'Л(0,7)а). (53)
x) u l 7-»ао+0
В частности, если До > 0, то любое решение задачи (»') (оптимальное программное управление) при 7 = Ао определяется следующими формулами
«sw=-щ-чтттм+эдлж \
»aW = KlC(ty(R(t)X(t,\Q) + S(t,X0))c, i w
Здесь с - любой постоянный вектор в R", удовлегворянщий условию
Х(0, Ао)с = а, матрицы X(t, Ао), S(t, А0) определены соотношением
s(t,Ао) SibAo)J'
)
где Z(t, Ао) — матрица-решение уравнения Гамильтона J„dz/dt = Hi(t,\0)z, при краевом условии 2(Т,А0) = 12п и матрица #i(i,A0)
определена d (50).
Задача LQL2 поставлена в §3.1 и решена в §3.3. Полученные результаты изложены ниже. Пусть динамический объект описывается уравнениями (1) и (2) (при /(t) = 0). Предположим, что помеха v(t) принадлежит множеству V = {« 6 L^ : ¡¡«||j < 1}, начальное состояние х(0) ограничивается неравенством |х(0)| < S. Задача LQL2: Найти значение
sup supinf{J[u,«] I (1 )i(2 )\
|a|<i v «
где
т
= Ц №'G(t)x(t) + u(tymu(t))dt + ^(T)'Qx(T), (55)
и найти векторы-функции «о,» 1 «¡я, и вектор a, на которых соответственно достигаются infu (для заданных v 6 V, a € R", |a| < ¿), виру (для заданного a e R", |a| < i) и eup|a| < g. При этом
найти , Управление tig ^ называется оптимальным, со____«I __ К*)) ^ Л >* ««
ответствуюпцш наихудшеи помехе ug и 'наихудшее начальному состояшпо х(0) = а.
ТЕОРЕМА ».4 Предполож£ш, что в фушациопале (55) G(t) > О, T(i) > 0 (Vt € [О,Г]) и Q > 0. Матрицы Л(*,7), r,(i,7), ra(f,7) определены соответственно в (48). Кроме того, предполояаш, что выполнено условие
Ьт Ата1(—~L) - -00,
7-.А„+0 df
где А® определено в (45).
Тогда оптимальное управление (соответствующее "наихудшей" помехе и "наихудшему" начальному сосгояпхяо) существует и
определяется формулой
иа,га(<)=г»(<.7о )*-(<). "Наихудшая" помеха имеет вид
%(«)=**(«.*>$),
где — состояние замкнутой системы (1.1) при и = гл(1,у0)х, и = гг(<,7о)х для "наихудшего" начального ^состояния х(0) = а, число 70 определяется по уравнению = "наи-
худшее" начальное состояние а (|в| = 5) является собственным вектором матрицы Я(0,7о) относительно собственного значения Ат„(Л(0,7о)).
При этом для функционала качества (55) имеем формулу вир - вир 5иГ№«/]|(1),(2)} = 5(Ат(1«(Л(0,7о))г2 + 7о).
В §3.5 поставлена и решена задача оптимизации по Ноо-критерию. Пусть динамический объект описывается уравнением (1) (при /(<) = 0) с начальным состоянием
х(0) = 0. (56)
Выход системы описывается уравнением .
* = £,(<)*+ ,£>г(<)и. (57)
Пусть Тги — оператор, отображающий функц ию и в функцию г для заданной функции« = и(*,г).
Управление и(*,г) называется допустимым, если уравнение (1) с заданным начальным условием (56) при и = и(<, х) и любом
фиксированном v(i) 6 L^ имеет единственное абсолютно непрерывное решение s(i) G Ь^ и выполнено условие u(i,x(i)) б Ljm\ а также если оператор Tzv — ограниченный.
Задтса оптимизации по Ноо-крятерикх Для заданного положительного числа найти допустимый регулятор й(<,я), такой, что при и = u(t, х)
Введем следующие обозначения:
( -D\DX А' \
R(t) =:Шс(0)(Я), 5(f) =: А- Цр^уЧ"Я,
X(t) — решение матричного уравнения dX/di = S(t)X с краевым условием Х(Т) = /».
па ( ~DiD* А" )
Л00(<,7)=:Шс(°)(Я00(<,7))1
где 7 — любое положительное число такое, что матрица Roo(t, у) существует.
Определим оператор А на Lj *, число До:
(ЖХО = ТО* г1 J* X(rYJHr)C(r)v(T)dr,
В АЧГ-Ч'А - (А*С + С*А),
^"-inf ЩЬ.«)}, (58)
1|®||а=1
ТЕОРЕМА 3.5. Предположим, что3 Я2(<)*#2(<) > О, 1),(0*2)2(0 = 0 (VI6 [О,Г)). Тогда
1) Для того, чтобы существовал допустимый регулятор «(<, х) такой, что ||2г»||оо < (^ —заданное число) необходимо и достаточно, чтобы (I > Ао, где число Ар определено в (58).
2) Для любого числа у (Ао < у < ц) следующий регулятор с параметром у
й7(<,«) = -(О2(О*02(ОГЬ('ГЛоо(<,7К
допустимый и обеспечивает выполнение условия ||2ги||оо < И-
Публикация по теме диссертации:
(1) Чаш. Янчжоу. Синтез оптимальных управлений в линейно-квадратичной дифференциальной игре для нестационарной системы (конечный временной интервал)// Встн. СПб. ун-та. Сер.1. 1994. Вьш 4 (N0.22).
3Первое условие наложено для того, чтобы задача была несингулярной, второе—просто для удобства исследования (т. е. аналогичное утверждение справедливо и в общем случае^.