Методы улучшения, основанные на локальной аппроксимации множеств достижимости и линеаризации тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Гончарова, Елена Владимировна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Иркутск
МЕСТО ЗАЩИТЫ
|
||||
1995
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
ГОСУДАРСТВЕННЫЙ КОМИТЕТ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО ВЫСШЕМУ ОБРАЗОВАНИЮ ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Р Г В О Д На правах рукописи
' * СЕН 1995
ГОНЧАРОВА Елена Владимировна
МЕТОДЫ УЛУЧШЕНИЯ, ОСНОВАННЫЕ НА ЛОКАЛЬНОЙ АППРОКСИМАЦИИ МНОЖЕСТВ ДОСТИЖИМОСТИ И ЛИНЕАРИЗАЦИИ
01.01.09 - математическая кябермгтнка
Автореферат
диссертанта па сспсганпв ученой степени кандидата фяг'лиэ-ыатеиатпческих наук
ИГ-:уге". - 1?5Г.
Работа выполнена в Иркутской вычислительном центре СО РАН.
Научный руководитель -Официальные онлонеяты •
Ведущая организация
кандидат физико-математическая H*yi с.ях. В.А. Батурин, доктор физико-математических наук, профессор А.И. Москаясшю, кандидат физико-математических наук доцент Г.В. Сидоренко. Институт программных систем РАН, г. Переелавль-Залесский.
Защита состоится 1995 г. в_часов на заседании
Совета Д063.32.04 по защите диссертаций на соискание ученой степени доктора наук в Иркутском государственном университете по адресу: 684003, Иркутск, бул. Гагарина, 20,1-й корпус ИГУ.
С диссертацией можно ознакомиться в библиотеке Иркутского государственного университета (бул. Гагарина, 24).
Автореферат разослан * & " 1995 г.
УчеЛый секретарь Совет»
к.ф.-м'.в., допеят
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Во многих областях науки и техники возникают разнообразные задачи оптимального управления.
К настоящему времени довольно хорошо развит теоретический аппарат исследования, получены необходимые и достаточные условия оптимальности для различных классов задач. Однако на практике, при анализе сложных эколого-экономических, биологических и др. процессов приходится, в основном, иметь дело не с точными, а с приближенными решениями, которые получаются на современных ЭВМ в результате работы вычислительных алгоритмов. Каждый из этих алгоритмов, как правило, связан с тем или иным общим теоретическим подходом в оптпмалыгом управлении, как то: принцип максимума Л.С. Понтрягина, достаточные условия оптимальности Р. Беллмана, В.Ф. Кротона, и т.д., и рассчитан на решение определенного класса задач. Поскольку не существует универсального алгоритма, построение новых зффестлалых методов приближенного решения задач оптимального управления остается актуальной проблемой.
Для приложений часто важно также то, чтобы на последовательности, генерируемой методом, функционал строго убывал, т.е. чтобы алгоритм на каждой итерации решал задачу улучшения.
Наиболее желаемой формой решения задачи оптимального управления, как известно, является форма синтеза управления, которая позволяет выбирать управляющий параметр наилучшим образом в зависимости от. текущего состояния объекта.. Однако, известные методы улучшения, основанные на достаточных условиях В.Ф. Кротова пли условиях Беллмана, хотя и получают решение в форме приближенного синтеза, но являются зачастую сложными в алгоритмической реализации. Например, они содержат этап интегрирования матричного уравнения Ркккатн, решение которого может кэ существовать на всем отрезке. Эти трудности преодолеваются в настояодай
С другой стороны, представляется актуальным также ебщпй поляоД
3
к построению методов, связанный с приближенным локальным представлением множеств достижимости управляемых систем, позволяющий учитывать концевые ограничения. Сочетание различных методов улучшения с техникой линеаризации, развиваемой в работе,"может дать новые эффективные вычислительные алгоритмы.
Целью работы является разработка новых методов приближенного решения задач оптимального управления, основанных на локальном представлении множеств достижимости и на линеаризации управляемых систем, а также построение вычислительных алгоритмов улучшения.
Научная новизна. Основные результаты являются новыми. В работе обоснована релаксационшстъ построенных методов; установлена связь с необходимыми условиям» оптимальности. Доказаны теоремы о редукции задачи улучшения для нелинейных систем к соответствующей задаче для систем специального вида, близких по своим свойствам к линейным. Рассмотрен случай непрерывных и дискретных (в том числе, со смешанными ограничениями) управляемых систем.
Практическая и теоретическая значимость. Алгоритмы улучшения, построенные в работе, могут быть использованы для приближенного решения сложных практических задач оптимального управления, при исследовании многих технических, эколого-экономических, биологических и других моделей. Теоретическое значение работы состоит в следующем. Во-первых, на основе предложенной локальной аппроксимации множеств достижимости могут быть построены методы улучшения для задач со сложными концевыми или фазовыми ограничениями. Во-вторых, результаты о редукции, полученные в работе, в комбинации с известными приближенными методами, ориентированными на решение задач оптимального управления для линейных систем, могут в будущем привести к созданию новых процедур улучшения.
Апробация работы. По материалам диссертации были сделаны ж> клады на Третьей и Пятой конференциях молодых ученых ИГУ < Иркутск, 19§5, 1987), Всесоюзном семинаре "Динамика пелинейчы.ч ч|»>
*
цессов управления" (Таллинн, 1987), Всероссийской научной школе "Компьютерная логика, алгебра и интеллектуальное управление. Проблемы анализа устойчивости развития и стратегической стабильности" (Иркутск, 1994), семинарах кафедры теории систем ИГУ и ИрВЦ СО РАН.
Публикации. По теме диссертации опубликовано 5 работ.
Структура и объем работы. Диссертация изложена на 75 страницах текста, выполненных в системе ЮТ]зХ(12р1), и состоит из введения, трех глав, заключения и списка литературы, включающего 91 наименование.
СОДЕРЖАНИЕ РАБОТЫ
Во введении приведен обзор литературы по приближенным мет-дам решения задач оптимального управления и рассмотрены особенности методов последовательного улучшения, развиваемых в диссертации. Кратко изложено содержание работы.
Первая глава носит вспомогательный характер.
В § 1.1 содержится постановка задачи оптимального управления и связанной с ней задачи улучшения, & также сформулированы утверждения, являющиеся идейной основой методов.
Пусть задана управляемая система1
*№-/(«.*(«).«(*)). «ет-1»в,«1), (1)
*(*о) - *о, (2)
»»(<) 6 Р(<), 4 (3)
где и :Т -+ П1г измеримая, а * ! Т Л* абсолютно непрерывная функции.
1 Здесь (упереди фчриу» * тепрел »<• пакет от сутрмп, вфешмв я яаюфмт»
в
Совокупность V пар (х(-), «(•))» подчиненных условиям (1) - (3). будем называть множеством допустимых управляемой системы. Предполагаем, что Т> не пусто. Обозначим через /Y(to, ®о5 г) шншество достижимости системы (1) - (3) п момент г из точки Хо и KCHeiií tQ.
Рассмотрим задачу о поиске минимума функционала
/(*(•),»(•))-F(««i)) (4)
lia множестве V.
Введем функцию <р : Г х ¡Rn —* IR такую, что для ягобой абсолютно непрерывна^ функции г ;Т -+ Ма справедлив о itcschctbo
V>(«,x(s)) - vj(<,s(1)) = J' (v4(r,*(r))i(r) + vt(r,í(r))) dr, é, t € T,
и следующие конструкция
H(t,x,p) « sup p'ü, V(t,i) = {/(*,*,«) : и € (5)
•evo,*)
W(t,x,p) = {«; € V(í,i): p'w = H(t,xiP)}.
Обозначим через t) множество достижимости в момент вре-
мени t дифференциального включении
®(г) = у.
Следующая теорема является идейной основой предлагаемых методов.
° Теорема I.1 Предположим, что при всех у е Шп множество не пусто, а также при всех ((,:с) £ Гх Шп справедливы равенства
W(<,*,vMM)) + v>tM = o< <6)
<p(i0,x)* ||z-*o||. (7)
'си. Кагстигггаба Г.И. Вермирчшние luMciniiit на дпя/шичпхие системы. - Ирку гсх: Илд-во ftjníyt. Ufa, ьТЗ.
в
Если ц 6 Ш.п является точкой минимума функции Р на множестве X = {х € 2В* : <р{и,х) = 0}, то всякое решение дифференциального включения
¿ем>(<,
*(<1) = ч,
определенное на отрезке Т, является траекторией, соответствующей оптимальному управлению в задаче (1) - (4).
Уравнение (б) в теории управления обычно называют уравнением Беллмана.
В § 1.2 приведены необходимые сведения из теории матричных дифференциальных уравнений, в частности, условия существования и свойства решения матричного уравнения Риккатп.
Заключительный параграф первой главы посвящен доказательству теоремы А.Ф. Филиппова для управляемых систем с липшнцегоЗ правой частью. Как особенности приведенного доказательства, отличающие его от оригинального результата для дифференциальных включений,3 отметим его алгоритмический характер, что использовано нами в третьей главе при рассмотрении задачи улучшения для дискретных систем со смешанными ограничениями, а такие наллчпо способа выбора предельной управляющзй функции.
Вторая глава посвящена разработке метода улучшения, основанного на локальной аппроксимации множеств достижимости и построению вычислительных алгоритмов.
Рассматривая задачу (1) - (4), теперь мы будем считать функции х(-) кусочно гладкими, ы(-) кусочно непрерывными. В дальнейших* предполагаем, что функция /; ТхПРхЛГ Ш* кусочно непрерывна по * и дважды непрерывно дифференцируема по (х, и); F : Шп -*Ш дважды непрерывно дифференцируема.
' 'см. Фпхвие» А.Ф. Классически» )1Ш1ам ¿«¡^еугячизониэ ¡7««я«*кв с «я«|»я*чмг6 четью. - Пест*. МГУ. Ор.1. Маггиетгк«, «темп», 1Ш, К 5, с 1»-?в.
Т
Пить Kui«it лемент т' - i«'(•),u'(-)) € V■ Предлагаемый тод улучшенмя управляемого процесса т' по функционалу / cocí а приближенном локальном представлении множества достижиис <?(fo»*o;fi) системы (1) - (3) с помощью решения уравнений Б< мана с определенным начальным условием и в последующем пер де к конечномерной задаче минимизации некоторой пепомогатель функции на полученной аппроксимации. Управляемый процесс т' (*"(-)»ulí(*))» улучшающий элемент т1 (т.е. I(m¡1) < 1{т1)), за строатм в соответствии с теоремой 1.
К фазовому вектору x(t) системы (1) - (3) присоединим допол гелшую переменную r°(t), удовяетьоряющую уравнению
rn - ~ {д(и~ н'иЩи - ц'(0) + Ü - ffW* - - *'»»),
*°(<о) = О,
i tenapaMCJO р « (fl. 1Д. Функция х°:Т~*Ш предполагается куш гладкой.
Выпишем ^инструкции (5) для расширенной системы (11 (3), '8|. Именно, положим
iЬ^
H(t,v,f>, «)« tffit,т.,и) + -• u'U)Y(u- u'h),
£
Щ1,и,Р)= вир H{t,y,p,u).
ъ((Ш)
Пусть для расширенной системы (1) (3), Í8Í. (9) ........i n>r ■ <|>у
цкя V, являющаяся решением уравнения Ксл л мана (ч •»■ттч vr.
вяем
!1у-Ы1. fí-- (о") 1
Будем предполагать, что у и v>t имеют прои та'чп."■ по i/ ;м цн-г
го порядка включительно, непрерывные нгюл\. ••< и< щи'^ии. ч, ni,
»
сет, конечного числа плоскостей I - гоня!. * фучкцщ Ц\\ у р) >фсренцируема до второго поряд*л.
Звепя параметр е > 0 и раскладывая но формуле I ••йлс.ри вп..ро|-ч ядка левую часть уравнения Беллмана и соответствующее началь
условие (10) в окрег.|кости гочки у/(*) = ^^ I ? Г, иы
щем следующее приближенное представление функции
<р(1 г° -*'(»))'<г(!)(» Л«/]
!сь (т(-) есть решение матричного уравнения Риккахи
- <тНФ4«,У1(П,р'{1))а, (И)
! - " циничная п х п-матрии» Поскольку
х, "НхФ, не зависят от хп, а уравнение (II) не содержит
оизвсщных функции Н по V'0. то при рассмотрении уравнения ккати мм мочгем положить
Щит.*) = вир НЦ,х,ф,и), (12)
«6(/(0
-*'№*- *'«)))- из)
)И этом производные функции Н будут падсчитыватьсл в точке
*'(<), О)-
Рассмотрим многообразие
5(.') =■ € И"" : «" - - »'(«»»'»(«О {* ~ *'(«1>)>»
I котором будем минимизировать вспомогательную функцию
П(Х, *°) - оР(*) + (1 - а)«0, (14)
9
Обозначим через («*(а),г°*(а)) решение этой задачи. Определим новое управление «£'(•) в форме
«¿'(О-«(«,*.(*)). «6 Г, "(15)
где й(*,г) - й(г,г,<т(Щх - ®/(<)))- приближенный синтез оптимального управления, й(1,х,ф) = аг§шах1|£(/(()Я((,а;,^,и), а «„(•) есть решение системы
* = /(*, г, й(М)), (16)
*(«,) = *». (17)
В результате алгоритм улучшения содержит следующие основные этапы.
Пусть задано некоторое начальное приближение т1 = (г'(-),и'(-)) С
V.
1. Фиксируем с > 0, 0 <Е (0,1} и решаем на отрезке [(0,(1] матричное уравнение Риккати
<7 = -Н1Я - - - аН^с, (18)
при условии
<т((о) = е_1£\ (19)
гае функция К определена равенствами (12), (13), а ее производные исшсчнтываются в точке (1,ас'(<),0).
Л. Возьмем 0 < а < 1 я найдем (х*(о),х°*(а)) как точку минимума функции (14) на множестве 5(х;).
3. Интегрируем в обратном времени на систему (16), (17). Обо-
значим ее решение через £«(•)•
4. Определим и^( ) по формуле (15) и найдем *"{■) как рошет»:
системы (1), (2) с управлением и1а'{-).
ю
5. Прсвсргш условие F{x'J(t¡)) < F(x'{ti)). Если оно нарушено, то, уменьшая а, поэторвем пп. 2-4 алгоритма. В противной слутао принимаем управляемый процесс тп = («"(')»uä(')) 6 t> за козое приближение.
Процесс итераций заканчивается, если I(m") « /(т1) с принятой точностью.
Для того чтобы повысить эффективность алгоритма, в п. 5 можно предусмотреть решение задачи одномерной минимизации по а.
В § 2.2 доказана теорема об улучшении.
Предварительно введем следующие конструкции. Для допустимого управляемого процесса (х'(-), «'(•)) обозначим через E(¿) и Ф(|) фундаментальные матрицы решений линейных дифференциальных уравнений <'
х = А{Х)х,
н
х - C(t)x ■
соответственно, где •
C(t)d±'A(t) + B(t)vr(tym
ß(0 ='/«(*. «'(О.«'**))-
Положим .
. 9(t) = £ S(t)S-l(r)B(r)ü,(r,zl(r))9(r) dr. (20)
Теорема 8. Пусть управляемый процесс (s'(-), «'(•)) 6 V такой, что функция «(<,•) непрерывна вместе со своей производной н выполнено условие
íí(«'(t,)) m)ff'x(ti) F.ts%)) > о,
и
где матраца Ф(<0 определена равенством (20), а ?(•) являете* решением матричного уравнения Риккати (18), (19).
Тогда для элемента (хп(-), u"(-)) G V, построенного с помощью алгоритма имеет место неравенство -
/(»"(.).«"(•))</(*'(•).«'(•)).
В || 2.3, 2.4 рассмотрен случай, когда U(t) = ET, либо ul{t) лежи! во внутренности множества U(t), te Т. Тогда функцию и = u(t,x) ковяо вскать sas решение уравнения
Д(<,г,«МО(х - *'(<)) -д(и- *'(<)) = 0. (211
При этом оказывается, что
Производные функции H в точке (<, x'(t), 0) также легко вычисля ются. Алгоритм улучшения может быть конкретизирован.
1. Фиксируя с > 0 и g € (о, 1), решаем на отрезке ¡¿o,fi] матричнм
уравнение Риккати
Ь - -(1 - д)Е - A'(t)a - oA(t) - -oB(t)Il'(l)o,
9
с начальным условием
ff(t0) = £~XE.
2. Выбирая 0 < о < 1, найдем точку х'{а) из условия
aFt{z) + (1 - а)а(и) (х - *'(<,)) «
3. Находим функцию u = û(l,x) как решение урапнгния Г..М
4. Проинтегрируем в обратном временя на (foi'i) систему (10),- (17) и
обозначим ее решение через ха(-). .
5. Половши «¿'(О - ü(i,ia(J)) я проверим условие «"(С) €
int U(t), I € Т. $сли оно нарушено, уменьшая а, повторяем im. 2 - 4 алгоритма, иначе переходам к п. в.
в. Найдем *"(•) как решение системы (1), (2) с управлением *»(•).
7. Проверяем условие F(i"(<i)) < F(xl(1i)). Если ояо нарушено, то, уменьшая а, повторяем пл. 2 - в алгоритма. В противном случае принимаем управляемый процесс т" = («¿,(,)»ввГ(')) € V за новое приближение.
Процесс итераций заканчивается, если 1{т") « /(т') с принятой точностью.
!
Обозначим через Я*(1,х,р,и) функцию Поптрягяяа управляемой системы (1) - (3). Установлена следующая связь алгоритма улучшения с необходимым условием оптимальности.
Теорема 3. Пусть допустимый управляемый процесс (х'(-);и'(-)) такой, что на подмножестве Т положительной меры нарушено равенство
я:м'(оУ(оУ«))=о>
где р'(-) удовлетворяет сопряженной системе
p'(t) = -//;(«, *'«)У(0У(0), p'(h) -
Тогда элемент (х'(-),и'(-)) улучшается приведенным выше ал горит
MI1M.
Работоспособность алгоритмов подтверждена тестовыми примера ми.
IM
В rr^TE-et rcase приведены результаты о редукции задач«» улушо uas Е££ для непрерывных, тая и ллг дискретных систем к ссотбст-ствугэщам згдг.нагл для систем специального вида, блкзшш по емки саа&схвш к линейным. -
Скач&ка р&сшг.трквается дискретная управляемая система
*(1 + 1) = /(*,*(<),«(*)), ' (22)
*(0) « *в, (23)
u(i) ei/(i,x(t)), <€Т = {0,1.....N}t (24)
сод множеством допустимых V которой, понимается совокупность пар дискретных функций (г(-), и(-))» х : Т -* El*, и : Т 28", удшшгтеорЕЮщах для всех ( б Т соотношениям (22) - (24).
Овредаяиы на множестве V функционал 1{х(-),и(-)) = F{x(N)), FSt.
Мы предполагаем выполненными следующие условия:
1е множество U(t,-r) с ЯГ компактно для всех t 6 Т, z 6 Шл\
2° отображение /(<,•,•) непрерывно и имеет частные производные /„ Д для веет t € Г, ас € JR*. « e f(<,i);
3° дяя каждой тройки векторов х, у € А", u € U(t,z) найдется i?6 U(tty) такой, что
где k > 0 не зависят от с, у, и;
4° существует константа Л/ > 0 такая, что при любых t 6 Т, у 6 2R\ ti 6 U(t,t), v е U(t,u) справедливо неравенство
||/(1, в, и) - /(*, V,t>) - /«(<,*,«)(* - Ii) ~ /.(«.*.«)(и - v)|| <
и
5° функция F непрерывно дифференцируема, и ее производная ограничена: ||F,(x)|| < L для всех х; L > 0.
На самом деле условия 3° — 5° можАо предполагать выполненным!! лишь для х, у из множества достижимости системы (22) -(24).
Пусть m1 =s (i7( •),«'(•)) - некоторый допустимый управляемый процесс. Обозначим через (А) задачу улучшения функционала 7 на множестве î>, т.е. задачу нахождения управляемого процесса т'1 = («"( ). «"( )) такого, что 1{т") < Цт'). Пря 0 < а < 1 мы будем рассматривать аналогичную задачу (В„) для функционала
= oF(î(JV)) + (l -o)i°(N), » = Е JR,+l, на множестве 'Допустимых Vf управляемой системы
x(t +1) - х'« + l) = A(t) (x(t) - «'(<)) + B(t) (u(t) - u'(t)),
/« + 1) = *°(0 + II*«) - «*C0!l* + II««) ~ «'(Oll*.
x(0) = xo, x"(0) = 0, u(i)€tf«,x(t)).
Здесь A(t) = MI,»'(«).«'(<)), m = M<, *'«),"'«)), «er. В работе описана процедура, позволяющая свести задачу (А) к задаче улучшения (Ва).
Для пары дискретных функций (хо(-), щ(-)), хо(0) = xo, tio(i) С t € ï\ по индукции построим хт:Т~* ДГ, ит:Т ВТ, um{t) е U{t,xm(t))f t G Г, m = 0,1,..., так что
xm+,(i + 1) = /(«,xm«),um(0). *m+i(0) e *o,
um+,(l) = arg min J|*m+i(« + 1) - /«,xm+i«),tt)||.
Будем говорить, что пара (xm( ), «„(•)) получена из (хо(-).«о(-)) с помощью процедуры !F{m), m = l»2,—
Доказана теорема, являющаяся дискретным аналогом теоремы А.Ф.
Филишмва для управляемых систем.
1Г>
Георема 4 Пусть пара дискретных функций (i(•)»«(•)) такова, что *(0) « «0, щО е ('ii.i(i)), (E T, а (*(•),«(•)) получена из («(•),0( )) с помощью процедуры Тогда x(t) является
решением системы (22),(23) с управлением u(t) Ç U(t,x(t)), i € Г, и удовлетворяет неравенству
11« t) - *(|)|| < h'fit - S - 1), t e T, #»0
где p{t) « + 1) - f(i,£(i),a(<))||, tç {0,1,...,ЛГ- 1},а к > 0 взято из условия
С помощью теоремы 4 получен следующий результат о редукции.
Георема 5. Пусть ос ([ (0,1) удовлетворяет неравенству
wcfc^-i < Lz_?
а
где M, L, к - константы из условий 3° - 5°, и управляемый процесс ($(•),е D„ m - (*<'>)/ улучшает (»'(•),и'(-)), у'(|) =
(•»).«еГ, в задаче (Ва). Тогда элемент (х"(-),«"(•)) е О,
полученный из (£(•»,«(•)) с помощью процедуры F(N), улучшает элемент (r;(),ur()) в задаче (А).
В § 3.1 рассмотрен более простой случай, когда V(t,x) = U(t) для. всех х € Ж", ( € Г, а функция /(<,-,•) дважды непрерывно дифференцируема в каждой точке (х, и). Константы M, L, к выбираются путем оцёниваиия множества достижимости системы (22) -(24). В указанной ситуации процедура ^(N) может быть упрощена, ,и теорема о редукции принимает следующий вид.
Теорема 6. Пусть пара (Р(-).в(')) € 1>„ 0(<) « (/оф) » улучшает (у7! ),«^ )). y'W - (Î0(<)). t € г, в задаче (В„) при 0 < в < I, '
выбранном из условия
MLkH-i < ine
а
Тогда управляемый процесс (х"{),иг'{)), где
«"(<) = arg mm 1И<+1)- /(*,«(«), «»)||, ** <0.1 - 1).
а х/1(-), х/7(0) = г0, — решение системы (22) с управлением и/7( ), улучшает элемент (х'(-),«'(•)) в задаче (Л).
Заметим, что утверждение теоремы останется справедливым, если в качестве ип(-) выбирать управление fl(-). Однако эти два пути приводят к разным управляемым процессам, улучшающим (*'(•),«'(•)).
Результат о редукции проиллюстрирован на примере.
В § 3.3 исследуется задача улучшения функционала (4) на множестве допустимых непрерывной управляемой системы (1) - (3) при следующих предположениях:
1° многозначное отображение U : 7 -» W принимает непустые замкнутые значения и измеримо;
2П функция / измерима по I и непрерывно дифференцируема по (*, и);
3" для почти всех I € Т, всех у € Шяч и H{t) имеет место неравенство
ИМ«,«) -/(*.v,«)ll<*№- v)>.
где суммируемая функция > 0 не завися! от выбора х, у, и:
•1" ли* почти верх t Р 7, вггх г, у € 17?\ м, « f /'111 справедливо неравенство
||/(/, г, и) - t. у, V) - Д|I. г, ii)(J" - у) - Mt, x, u)(u - <
< mt)(\w -pü' + ii« - «и'),
ел'* функция ЛЛМ > О < yntr< ттчгно ограничена;
5° F : Ht* -* SI — непрерывно дифференцируемая функция, и ее производная ограничена, ||i]f(x)|| < L для всех х G Шл\ L > 0.
Отметим, что условия 3°—5° можно предполагать выполненными лишь для х, у, принадлежащих множеству достижимости системы (1) - (3).
Зафиксировав элемент (x'i-),«7^)) 6 0, построим вспомогательную систему
Д±(<) = A(t)&z(t) + B(t)Av(i), (25)
¿°(0 = ||Дх(01|, + ||Ди(1)||2, (26)
Дх(<о) = 0, г°(10) = 0, (27)
«(0 G U(i), (28)
где As(i) = xM-z'it), А«(<) - u(0-«'(0. A(i) - /«(<,*'('). u'(f)), 2?(<) = Л0,х'(<), «'(<)), te T.
Под задачей (Л) мы понимаем задачу улучшения функционала I на множестве V допустимых управляемых процессов системы (1) -(3), а под задачей (Ва) - аналогичную задачу для функционала Ja,
JM-)M-))=<*F(*(t,)) + (1 -a)z%), y(t) m ( ) , t e Г,
па множестве допустимых Vp системы (25) - (28). Пусть
/?(0 = |ехр(-/Ч(зК»), ter.
Доказана следующая теорема.
Теорема 7. Предположим, что or G (0,1) удовлетворяет неравенств; M(t)<ß(t)^-
для почти всех < G Т, и процесс (&(•)-<»(•)) € Т>р, 0) = ( i улучшает (»'(О. «'(*))." (* q^) » < € Г, в задаче (Ва).
1S
Тогда управляемый процесс {*"(•),гдй u"(I) = ü(1),
zn(t) является решением системы (I), (2) с управлением «"(<), 1учшает элемент (х,(>), в задаче (А).
Параграф завершается построением алгоритма улучшения, ггредста-1ятщего собой комбинацию метода главы 2 п теоремы 7, для случая, )гда U(t) = SV, либо u'(t) € int V(t), t € Т.
Как и в главе 2, управляемый процесс (х(-),и(-)) в дальнейшем штаем допустимым, если функция х : Т —ь Шп является кусочно гадкой, я п :Т -+ Ш.г кусочно непрерывной. Предполагается, что иожестяо V не пусто. Усилим условия 2° - 8°, предположив, что унклия / кусочно непрерывна по t, дважды непрерывно диффгрея-груема по (г, и), л ее частные производные первгго я второго поряд-i ограничены некоторой константой ЛГ > 0, а функция F: 2Й* -* Ш заяды непрерывно дифференцируема и ее первая пройзэодп&я огра-гаеиа числом L > 0.
Сформулируем теперь алгоритм улучшения, включающий В себя в 1честве одного из этапов линеаризацию исходной системы. •
Пусть задано начальное приближение т' = (ар'(>), «'(•)). € V,
\t) е ¡nt u(t), t € т.
Фиксируя е>0 и д 6 (0,1|, решаем на отрезке [<o>'i] матричное уравнение Риккати
G = (1 - д)Е - Л'(<)9 - вД(*) - ~QB{t)B'{t)e,
9
с начальным условием
Выбирая '0 < а < 1, 0 < Л < 1, найдем точку х = х'(а) как решение уравнения
aXFx{x) + (1 - o)0(t,)(* - *'(!,» = 0.
3. Интегрируем в обратной времени иа [t0,i|] систему
«О-МО
Д«(<1>-*'(«)-«'(«О, z«,) = -(1 ~2Л)аЕ,
где Д*(<) = *(<) - *'(<)• Обозначим ее решение через y(t
(т)'
4. Положим
п проверим условие u"(t) 6 int 1/(0» * Е Т. Если оно наруш* уменьшал а, повторяем шт. 2 - 4 алгоритма, иначе переходи п. 5.
6. Найдем *"(•). интегрируя систему (1), (2) с управлением и"(-
б. Проверяем условие F{xn(ti)) < F(z'(ti)). Если оно нарушено, уменьшаем а и Л и повторяем пп. 2 - 5 алгоритма. В против; случае принимаем управляемый процесс т" = (х1,(-),ип(-)) е за новое приближение.
Процесс итераций заканчивается, если I(m") « /(mi) с прин* точностью.
Получен аналогичный теореме 3 результат о том, что послед -алгоритм улучшает любой допустимый управляемый процесс т («'(•), и'(>))( не удовлетворяющий на множестве положительной м< условию стационарности функции Поитрягииа системы (1) - (3).
На основе теорем о рудукц** могут быть построены и другие ш ритмы улучшения как для непрерывных, так и для дискретных сип
20
I ямшючвиии кратко сформулированы основные результаты рабо-
1о теме диссертации опубликованы, следующие работы:
л
Батурин D.A., Хангуровл Е.В. Метод улучшения, основанный на оценке множества достижимости. - В кн.: Новые методы улучшения управляемых процессов. - Новосибирск:Наука, 198?. -с. 83-88.
Батурин В.А., Хангурова Б.В. Метод приближенного решения задач оптимального управления на основе оценок множества достижимости. // Всесоюзный семинар "Динамика нелинейных Процессов управления", Таллинн, 1987. - с. 120.
Батурин В.А., Гончарова Б.В. Метод последовательного улучшении для линейных управляемых систем. Ц Всероссийская научная школа "Компьютерная логика, алгебра п интеллектуальное управление. Проблемы анализа устойчивости развития п стратегической стабильности". - Иркутск, 1994. - т. 2. - с. 3-19.
Гончарова Е.В. Редукция задачи улучшения управляемого процесса для дискретных систем. - Автоматика и телемеханика, N 9, 1994. - с. 34-39.
Гончпровп Б.В. Дискретные управляемые системы со смешанными ограничениями. // Всероссийская научная школа "Компьютерная логика, алгебра и интеллектуальное управление. Проблемы п нал im упойчивт ш ралиития и стратегической стабильности". Иркутск, 19Я4. I. 2. - с. 38-45.
г